한 모비율에 대한 추론
$$ X \sim B(n, p)\\Z=\frac{X-np}{\sqrt{n\hat{p}(1-\hat{p})}}=\frac{\hat{p}-p}{\sqrt{\hat{p}(1-\hat{p}/n)}}\sim N(0, 1) $$
두 모비율의 차에 대한 추론
$$ X_1 \sim B(n_1, p_1), X_2 \sim B(n_2, p_2)\\H_0:p_1=p_2\\Z=\frac{\hat{p_1}-\hat{p_2}}{\sqrt{\hat{p}(1-\hat{p}) \left (\frac{1}{n_1}+\frac{1}{n_2} \right ) }} \ \ \ \ \left( \hat{p}=\frac{X_1+X_2}{n_1+n_2}\right) $$
동질성 검정
A라는 환경이 변화하면서 그 안 요소들의 비율이 변하는가?
독립성 검정
A라는 환경과 B라는 환경이 서로 독립적으로 영향을 주는가?
table 함수
x = table(df[c('length', 'supp')])
# length, supp 종류별로 몇개씩 있는지 개수 테이블 만드는 함수
chisq.test
chisq.test(x)
# H_0 : 각 row의 비율들이 동일하다(서로 독립이다)