중심경향의 측정치 ?

자료 분포의 중심이 되어, 전체 자료를 대표하는 대표값을 말한다.

이런 대표값에는 산술평균, 중앙치, 최빈치 등이 있다.

 

산술평균

산술평균은 우리가 흔히 말하는 평균(average, mean)을 말한다.

아래는 3-1반과 3-2반의 수학점수를 산술평균 내는 예제다

 

 

가중평균

산술평균은 각 개별치가 똑같이 중요하다는 가정에서 사용할 수 있다.

그러나 만약 각 개별치의 중요도에 차이가 발생하면, 어떻게 평균을 구해야 하는가

이런 경우에 가중평균을 사용하면 된다.

 

위 3-1반, 3-2반 자료에서 구성원의수에 가중치를 부여해서 가중평균을 구해보자

아래와 같이 수학점수의 가중평균을 구할 수 있다.

 

 

중앙치(Median)

변수의 값들을 크기의 순서로 배열 했을때, 정확히 한가운데 위치하는 관찰치를 의미한다.

중앙치를 구하는 순서는 아래와 같다

  • 자료의 크기를 순서로 정리
  • 자료의수가 n개 일때
    • n이 홀수면 (n+1)/2 번째 관찰치가 중앙값
    • n이 짝수면 n/2 ~ n/2 + 1 번째 자료를 평균하여 중앙치를 구한다.

최빈치(Mode)

자료중에서 발생하는 도수가 가장 많은 관찰치를 말한다. 최빈값이라고도 표현한다.

 

통계분석에서 평균이 가장 자주 사용되는 이유는?

 

  • 중앙치와 최빈치는 자료의 전체가 아니고, 일부만을 이용하여 구하는데 비해서, 평균은 자료의 크기와 도수까지 고려하여 자료의 정보를 가장 많이 활용하고 있음
  • 중앙치와 최빈치는 수학적 연산이 불가능하지만, 평균은 연산이 가능하다.

평균의 오류, 평균의 함정은?

자료에 극단적인 이상치(Outlier)가 있는 경우에, 큰 영향을 받는다

예들 들어서 이건희 회장을 포함하여, 직장인의 평균 월급을 구하면 이상하게 나올것이다.

이런 경우는 중앙치를 활용하는게 좋다.

 

 

 

 

 

 

 

 

 

 

 

 

'기초통계' 카테고리의 다른 글

상관관계분석, 회귀분석  (0) 2017.02.06
산포도의 측정치  (0) 2016.12.15
도수분포표  (0) 2016.12.15
측정척도의 형태  (0) 2016.12.15
통계학 자료의 종류  (0) 2016.12.15

+ Recent posts