KMOOC 통계학의 이해1 2주차-3
수치자료 정리
수치자료에 대한 도수분포표(Frequency table)
- 자료의 값이 몇 개로 한정된 경우에는 값을 범주로 처리
- 자료를 범주화하고 도수분포표를 작성
범주화
- 계급의 수와 경계값 결정
- 계급의 수 결정
- 제곱근 방법, Sturges 공식, Rice 공식 등
- 자료의 특성을 고려해 분석자가 결정
- 계급의 경계 : 간격과 시작점과 끝점 지정
- 기본적으로 동일간격 – 자료의 구조와 설명을 고려해 선택
그래프를 이용한 자료정리
점도표(dot plot)
- 각 관측값의 위치에 점을 표시하고 같은 관측값이 있는 경우 위로 누적
히스토그램(histogram)
- 히스토그램은 수치자료 특히 연속자료의 분포형태를 표시
- 히스토그램 vs. 막대그래프 : 구간이 같다면 차이가 없고, 다르다면 차이가 존재
- 계급의 상대도수를 사각형의 면적으로 표시 => 전체면적 = 1
- 높이 = 상대도수 / 계급구간길이 = 밀도(density)
사진과 글은 KMOOC 사이트에서 숙명여대의 여인권 교수님의 [통계학의 이해1] 수업자료를 바탕으로 했습니다.
댓글남기기