KMOOC 통계학의 이해1 3주차-1

최대 1 분 소요

수치를 이용한 자료정리

중심위치

  • 가장 많이 사용되는 중심위치 통계값은 평균

표본평균(sample mean)

  • 표본평균은 표본의 합을 표본크기로 나눈 값

  • 평균은 무게중심과도 같고, 편차(deviation)의 합은 0이다.

표본비율(sample proportion)

  • i번째 관측값이 어떤 범주에 속하면 xi의 값을 1, 속하지 않으면 0으로 표시
  • 표본비율 = 표본평균

이상점(outlier)

  • 대부분의 관측값으로부터 멀리 떨어져 있는 일부 관측 값
  • 이상점의 포함 여부에 따라 표본평균의 값에 차이가 크게 나는 경향이 있음
    => 이상점에 robust하지 않음
  • 대체 통계값 : 중앙값, 절사 평균, 최빈값 등

가중평균(weighted mean)

  • 예 : A 상품 700 투자 -> 28% 이익 / B 상품 300 투자 -> 28% 손실
    • 수익 = 700 * 0.28 + 300 * (-0.28) = 112
    • (평균수익률) = 112/(700+300) = 0.112 = 11.2%

기하평균(geometric mean)

  • 예 : 1인당 총소득 1985년 209만원, 2015년 3093.5만원이라고 할 때
    연평균 증가율
    • 3093.5/209 = 14.80 = (1+R)**30
    • 1+R = 14.8**1/30 = 1.094 => R = 0.094(9.4%)

조화평균(harmonic mean)

  • 예 : 절반을 60km/h 로 달리고, 나머지 절반을 40km/h 로 달렸을 때 평균 속력
    • 절반 거리 = y 걸린 시간 = (t1,t2) 라 할 때,
    • 평균속력 = 2y/t1+t2 = 2y/(y/60 + y/40) = 48km/h

    사진과 글은 KMOOC 사이트에서 숙명여대의 여인권 교수님의 [통계학의 이해1] 수업자료를 바탕으로 했습니다.

댓글남기기