본문 바로가기
학습 log (이론)/python

'통계 분석'

by abbear25 2020. 3. 4.

평균 (Mean)

데이터들의 합 / 데이터 개수

 

중간값 (Median)

오름차순 정렬한 다음,

홀 수개 일 때는 가운데 값

짝 수개 일 때는 가운데 두 값을 더 한 다음 나누기 2한 결과값

*평균에 비해서 잘 못 된 값에 대한 영향을 적게 받는 특성을 가짐

 

상관 계수 (Correlation Coefficient)

X와 Y의 상관관계를 수치화

 

Pearson Correlation Coefficient

-1 ~ 1 까지의 값을 가지는 상관 계수

0 -> 1  : 정관계 방향, 1에 가까울수록 연관성 높음

0 -> -1 : 역관계 방향, -1에 가까울수록 연관성 높음

%matplotlib inline
import pandas as pd
import seaborn as sb

df = pd.read_csv('exam.csv', index_col=0)
sb.heatmap(df.corr(), annot=True) #히트맵 그리기, 숫자도 표시
반응형

'학습 log (이론) > python' 카테고리의 다른 글

'데이터 분석 2'  (0) 2020.03.10
'데이터 분석'  (0) 2020.03.05
'Seaborn'  (0) 2020.03.04
'시각화'  (0) 2020.03.03
'pandas' 데이터 프레임  (0) 2020.03.01