평균 (Mean)
데이터들의 합 / 데이터 개수
중간값 (Median)
오름차순 정렬한 다음,
홀 수개 일 때는 가운데 값
짝 수개 일 때는 가운데 두 값을 더 한 다음 나누기 2한 결과값
*평균에 비해서 잘 못 된 값에 대한 영향을 적게 받는 특성을 가짐
상관 계수 (Correlation Coefficient)
X와 Y의 상관관계를 수치화
Pearson Correlation Coefficient
-1 ~ 1 까지의 값을 가지는 상관 계수
0 -> 1 : 정관계 방향, 1에 가까울수록 연관성 높음
0 -> -1 : 역관계 방향, -1에 가까울수록 연관성 높음
%matplotlib inline
import pandas as pd
import seaborn as sb
df = pd.read_csv('exam.csv', index_col=0)
sb.heatmap(df.corr(), annot=True) #히트맵 그리기, 숫자도 표시
반응형
'학습 log (이론) > python' 카테고리의 다른 글
'데이터 분석 2' (0) | 2020.03.10 |
---|---|
'데이터 분석' (0) | 2020.03.05 |
'Seaborn' (0) | 2020.03.04 |
'시각화' (0) | 2020.03.03 |
'pandas' 데이터 프레임 (0) | 2020.03.01 |