중심경향의 측정치 ?
자료 분포의 중심이 되어, 전체 자료를 대표하는 대표값을 말한다.
이런 대표값에는 산술평균, 중앙치, 최빈치 등이 있다.
산술평균
산술평균은 우리가 흔히 말하는 평균(average, mean)을 말한다.
아래는 3-1반과 3-2반의 수학점수를 산술평균 내는 예제다
가중평균
산술평균은 각 개별치가 똑같이 중요하다는 가정에서 사용할 수 있다.
그러나 만약 각 개별치의 중요도에 차이가 발생하면, 어떻게 평균을 구해야 하는가
이런 경우에 가중평균을 사용하면 된다.
위 3-1반, 3-2반 자료에서 구성원의수에 가중치를 부여해서 가중평균을 구해보자
아래와 같이 수학점수의 가중평균을 구할 수 있다.
중앙치(Median)
변수의 값들을 크기의 순서로 배열 했을때, 정확히 한가운데 위치하는 관찰치를 의미한다.
중앙치를 구하는 순서는 아래와 같다
- 자료의 크기를 순서로 정리
- 자료의수가 n개 일때
- n이 홀수면 (n+1)/2 번째 관찰치가 중앙값
- n이 짝수면 n/2 ~ n/2 + 1 번째 자료를 평균하여 중앙치를 구한다.
최빈치(Mode)
자료중에서 발생하는 도수가 가장 많은 관찰치를 말한다. 최빈값이라고도 표현한다.
통계분석에서 평균이 가장 자주 사용되는 이유는?
- 중앙치와 최빈치는 자료의 전체가 아니고, 일부만을 이용하여 구하는데 비해서, 평균은 자료의 크기와 도수까지 고려하여 자료의 정보를 가장 많이 활용하고 있음
- 중앙치와 최빈치는 수학적 연산이 불가능하지만, 평균은 연산이 가능하다.
평균의 오류, 평균의 함정은?
자료에 극단적인 이상치(Outlier)가 있는 경우에, 큰 영향을 받는다
예들 들어서 이건희 회장을 포함하여, 직장인의 평균 월급을 구하면 이상하게 나올것이다.
이런 경우는 중앙치를 활용하는게 좋다.
'기초통계' 카테고리의 다른 글
상관관계분석, 회귀분석 (0) | 2017.02.06 |
---|---|
산포도의 측정치 (0) | 2016.12.15 |
도수분포표 (0) | 2016.12.15 |
측정척도의 형태 (0) | 2016.12.15 |
통계학 자료의 종류 (0) | 2016.12.15 |