범주(category)별로 빈도(frequency)만이 주어진 범주형 데이터의 분석은 일반적으로 카이제곱 분포를 이용한 검정법을 적용
아이템의 사용여부와 활성여부에 연관성이 있는가 ?
귀무가설(H0) : 연관성이 없다
대립가설(H1) : 연관성이 있다
tmp <- textConnection("is_active is_use user_cnt
활성 미사용 29519
활성 사용 5414
이탈 미사용 27521
이탈 사용 4580
")
x <- read.table(tmp, header=TRUE)
close.connection(tmp)
head(x)
t <- xtabs(user_cnt~is_active+is_use, data=x)
apply(t,1,sum)
apply(t,2,sum)
#P-VALUE > 0.05 귀무가설 기각, 대립가설 지지
summary(t)