봄날의차
2022. 12. 30. 16:34
https://colab.research.google.com/drive/11evecIRKCYy8R6m3cHOcIJWqMmXWMIJw#scrollTo=cVZYsBQhEhdN
Google Colaboratory Notebook
Run, share, and edit Python notebooks
colab.research.google.com
# 데이터분석 절차
# 1) 문제 정의 및 가설 설정하기 → 2) 데이터 분석 기본 세팅 하기 → 3) 데이터 분석하기 → 4) 분석 결과 시각화 하기 → 5) 최종 결론 내리기
# (1) Pandas 라이브러리 불러오기
# (2) 피마 인디언 당뇨병 파일 불러오기
# (3) 데이터 앞부분 확인 하기
# (4) 데이터가 null인 데이터 출력하기
# (5) 데이터가 null인 데이터 제거 하기
# (6) 상관관계 분석하기
# (7) Outcome 상관관계 계수가 1인 요소 제외하고 출력하기
# (8) matplotlib으로 시각화 하기
# (9) 바 그래프로 변경하기
import pandas as pd
diabetes = pd.read_table('diabetes.csv',sep=',')
diabetes.head()
print(diabetes.isnull().sum())
dianetes = diabetes.dropna()
corr = dianetes.corr(method='pearson')
corr = corr[corr.Outcome!=1]
corr
import matplotlib.pyplot as plt
corr['Outcome'].plot()
corr['Outcome'].plot.bar()
plot = corr['Outcome'].plot.bar()
plot
#x축 레이블 45도 회전하기
plot = corr['Outcome'].plot.bar()
plt.xticks(rotation=45)