분산1 기술통계량 훑어보기 for EDA 기술 통계량에서 흔히 다루는 개념들에 대해서 알아보자. 평균 : 중심 = 대표값 표준편차 : 퍼짐을 나타내는 정도 = 산포 = 다름 분산 : 다름의 평균 값 samples : 1, 2, 8, 9 평균 : (1+2+8+9)/4 = 5 분산 : ((1-5)^2 + (2-5)^2 + (8-5)^2 + (9-5)^2 ) / (n-1) 표준편차(s) : root (분산) => 평균과 평균적으로 이정도의 편차를 보이고 있다라고 해석한다. 이상치가 있을 경우에 위의 방식대로 표본의 특징을 나타내는 것은 매우 위험하다. 분산이나 표준편차를 구할때, 편차들의 합에 자유도 만큼으로 나눠준다. 자유도(df : degree of freedom)는 데이터의 갯수(n)일 수도 있고, n-1일 수도 있음 자유도란? (Degree .. 2019. 7. 16. 이전 1 다음