중심경향의 측정치 ?

자료 분포의 중심이 되어, 전체 자료를 대표하는 대표값을 말한다.

이런 대표값에는 산술평균, 중앙치, 최빈치 등이 있다.

 

산술평균

산술평균은 우리가 흔히 말하는 평균(average, mean)을 말한다.

아래는 3-1반과 3-2반의 수학점수를 산술평균 내는 예제다

 

 

가중평균

산술평균은 각 개별치가 똑같이 중요하다는 가정에서 사용할 수 있다.

그러나 만약 각 개별치의 중요도에 차이가 발생하면, 어떻게 평균을 구해야 하는가

이런 경우에 가중평균을 사용하면 된다.

 

위 3-1반, 3-2반 자료에서 구성원의수에 가중치를 부여해서 가중평균을 구해보자

아래와 같이 수학점수의 가중평균을 구할 수 있다.

 

 

중앙치(Median)

변수의 값들을 크기의 순서로 배열 했을때, 정확히 한가운데 위치하는 관찰치를 의미한다.

중앙치를 구하는 순서는 아래와 같다

  • 자료의 크기를 순서로 정리
  • 자료의수가 n개 일때
    • n이 홀수면 (n+1)/2 번째 관찰치가 중앙값
    • n이 짝수면 n/2 ~ n/2 + 1 번째 자료를 평균하여 중앙치를 구한다.

최빈치(Mode)

자료중에서 발생하는 도수가 가장 많은 관찰치를 말한다. 최빈값이라고도 표현한다.

 

통계분석에서 평균이 가장 자주 사용되는 이유는?

 

  • 중앙치와 최빈치는 자료의 전체가 아니고, 일부만을 이용하여 구하는데 비해서, 평균은 자료의 크기와 도수까지 고려하여 자료의 정보를 가장 많이 활용하고 있음
  • 중앙치와 최빈치는 수학적 연산이 불가능하지만, 평균은 연산이 가능하다.

평균의 오류, 평균의 함정은?

자료에 극단적인 이상치(Outlier)가 있는 경우에, 큰 영향을 받는다

예들 들어서 이건희 회장을 포함하여, 직장인의 평균 월급을 구하면 이상하게 나올것이다.

이런 경우는 중앙치를 활용하는게 좋다.

 

 

 

 

 

 

 

 

 

 

 

 

'기초통계' 카테고리의 다른 글

상관관계분석, 회귀분석  (0) 2017.02.06
산포도의 측정치  (0) 2016.12.15
도수분포표  (0) 2016.12.15
측정척도의 형태  (0) 2016.12.15
통계학 자료의 종류  (0) 2016.12.15

도수분포표란?

수집된 자료에서 유사한 성질이나 크기의 값들을 몇개의 계급으로 그룹핑하고 각 계급에 해당하는 측정치의 도수를 기록하는 통계표를 말한다.

 

도수분포표의 그래프

도수분포표 자체보다는 그래프로 표현하면 자료의 특성을 파악하기가 더 쉽다.

질적자료의 경우는 파이차트가 있고, 양적자료의 경우는 히스토그램, 꺽은선그래프, 누적백분율곡선 등이 있다.

히스토그램 같은 경우는 질적자료와 양적자료 양쪽에 많이 사용된다.

 

도수분포표 활용

예를 들어서 서울 30대 여성의 한달간 영화관람 회수 자료가 수집이 되었다.

영화관람 횟수가 0회 ~ 4회 사이에서 다양하게 측정이 되었다고 가정해보자.  

자료를 어떻게 표현해야 한눈에 시각화가 가능할까?  이럴때 도수분포표를 활용하면 된다.

아래 표에서 계급은 영화관람횟수가 되겠다

도수는 계급의 횟수다 (영화관람을 1번한 서울 30대 여성은 6명이라는 의미)  

상대도수는  계급도수 / 도수누적의 비율이고, 누적도수는 도수를 누적한 값이된다.  

누적상대도수는 상대도수를 누적한 값이다.

 

출처: excel 활용 통계학

 

그럼 도수분포표를 활용하여 시각화를 해보자

막대그래프로 표현을 해보니, 한달간 3회 관람하는 여성이 가장 많다는것을 쉽게 확인 할 수 있다.  

 

 

출처: excel 활용 통계학

 

자료의 특성을 표현하고 시각화 하는데, 도수분포표는 매우 유용한것을 알 수 있다.

'기초통계' 카테고리의 다른 글

산포도의 측정치  (0) 2016.12.15
중심경향의 측정치  (0) 2016.12.15
측정척도의 형태  (0) 2016.12.15
통계학 자료의 종류  (0) 2016.12.15
모집단과 표본  (0) 2016.12.15

자료의 형태는 제공하는 정보의 수준에 따라서 4가지로 구분

 

- 명목자료

- 서열자료

- 구간자료

- 비율자료

 

 

명목척도

측정 대상을 상화배타적인 범주나 종류에 따라 분류하는 방법으로 명목척도를 측정한 자료를 명목자료라고 한다.

예: 성별, 출신지, 전공등

 

서열척도

측정대상을 상호배타적으로 분류 하지만, 측정결과의 서열 순서를 매겨주는 것으로 순위척도 라고도 한다.

예: 학년, 계급, 선호도등

 

구간척도

특정대상을 범주에 따라 분류하고, 서열순서를 매긴다는것은 서열척도와 동일하지만 서열을 나타내는 숫자간의 간격이 산술적 의미를 갖는것에서 서열척도와 다르다

예) 온도, 지능지수, 양궁경기의 점수

 

비율척도

명목척도, 서열척도, 구간척도가 갖는 특성을 포함하는데, 절대적 원점을 갖기 때문에 상대적 크기의 비교나 절대적 크기의 비율을 반영한다

예: 시간, 길이, 무게등

    역도선수가 100kg를 들고, 일반인이 50kg을 들었다면,  역도선수가 일반인보다 2배의 무게를 들었다고 말할 수 있다.

 

자료의 비교

명목척도, 서열척도, 구간척도, 비율척도의 관계

 

 

 

연습문제

다음과 같은 자료를 수집하기 위해서는 어떤 형태의 측정정도를 사용해야 하는가?

 

전화 지역코드: 명목

우리 가족의 연령: 비율

주민등록번호: 명목

응급실의 처리시간: 비율

포츈500에 나타난 기업의 순위: 서열

지능지수: 구간

수학능력점수: 구간

혈압: 구간

대학생의 학년: 서열

온도: 구간

군대의 계급: 서열

우편번호: 명목

학번: 명목

출생연도: 구간  

축구선수의 등번호: 명목

종합주가지수: 구간

호봉에 따른 공무원의 봉급: 구간

올림픽 순위: 서열

신용카드의 비밀번호: 명목

마라톤 선수들의 골인순서: 서열

영종도 공항의 실내온도: 구간

계좌번호: 명목

혈액형: 명목

주소: 명목

호주 오픈에 출전하는 테니스 선수의 시드: 서열

 S&P 신용등급: 서열

 

 

 

 

 

 

 

'기초통계' 카테고리의 다른 글

중심경향의 측정치  (0) 2016.12.15
도수분포표  (0) 2016.12.15
통계학 자료의 종류  (0) 2016.12.15
모집단과 표본  (0) 2016.12.15
통계학이란 무엇인가? 통계학의 분류는?  (0) 2016.12.15

+ Recent posts