$$ \rho=\rm{Corr}\it(X, Y)=\frac{\rm Cov \it(X, Y)}{\rm Var \it (X) \rm Var \it (Y)} $$
상관관계 유무에 관한 검정
귀무가설 $H_0:\rho=0$
검정통계량 $T=\frac{\sqrt{n-2}r}{\sqrt{1-r^2}}$
확인 함수들
plot(x, y) : graph로 시각화
cor(x, y) : 상관계수 계산
cor.test(x, y) : 상관관계 유무에 관한 검정
# alternative : two.sided(default), greater, less
설명변수가 1개인, 설명변수와 반응변수 사이에 직선관계가 있는 모형
적합함수, 분산분석표 출력함수
fit <- lm(y ~ x) : y = a+bx 꼴에서 각 계수들을 찾아줌
summary(fit) : 잔차 통계량, 추정된 계수들의 통계적 유의성 검정결과,
결정계수(R^2), 회귀모형 유의성 검정(F-검정) 통계량 정리
anovat(fit) : 분산분석표 출력(F-검정의 결과 확인용)
그래프를 통해 잔차들의 분포를 확인
plot(fit)
# 주로 첫 번째와 두 번째 그래프를 활용
설명변수가 2개 이상일 때 회귀분석
fit <- lm(y ~ x1+x2+x3)
predict(fit, data)
# 회귀식을 가지고 예측값을 구하기