R-포아송 회귀
포아송 회귀에는 반응 변수가 소수가 아닌 개수 형식 인 회귀 모델이 포함됩니다. 예를 들어 축구 경기 시리즈의 출생 수 또는 승리 수입니다. 또한 반응 변수의 값은 포아송 분포를 따릅니다.
푸 아송 회귀에 대한 일반적인 수학 방정식은 다음과 같습니다.
log(y) = a + b1x1 + b2x2 + bnxn.....
다음은 사용 된 매개 변수에 대한 설명입니다.
y 반응 변수입니다.
a 과 b 숫자 계수입니다.
x 예측 변수입니다.
포아송 회귀 모델을 만드는 데 사용되는 함수는 다음과 같습니다. glm() 함수.
통사론
기본 구문 glm() 푸 아송 회귀에서 함수는-
glm(formula,data,family)
다음은 위의 기능에서 사용되는 매개 변수에 대한 설명입니다.
formula 변수 간의 관계를 나타내는 기호입니다.
data 이러한 변수의 값을 제공하는 데이터 세트입니다.
family모델의 세부 사항을 지정하는 R 객체입니다. Logistic Regression의 경우 값은 'Poisson'입니다.
예
모직 유형 (A 또는 B)과 장력 (낮음, 중간 또는 높음)이 직기 당 뒤틀림 횟수에 미치는 영향을 설명하는 내장 데이터 세트 "뒤틀림"이 있습니다. 휴식 횟수 인 응답 변수로 "중단"을 고려해 봅시다. 양모 "유형"과 "장력"은 예측 변수로 간주됩니다.
Input Data
input <- warpbreaks
print(head(input))
위 코드를 실행하면 다음과 같은 결과가 생성됩니다.
breaks wool tension
1 26 A L
2 30 A L
3 54 A L
4 25 A L
5 70 A L
6 52 A L
회귀 모델 생성
output <-glm(formula = breaks ~ wool+tension, data = warpbreaks,
family = poisson)
print(summary(output))
위 코드를 실행하면 다음과 같은 결과가 생성됩니다.
Call:
glm(formula = breaks ~ wool + tension, family = poisson, data = warpbreaks)
Deviance Residuals:
Min 1Q Median 3Q Max
-3.6871 -1.6503 -0.4269 1.1902 4.2616
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) 3.69196 0.04541 81.302 < 2e-16 ***
woolB -0.20599 0.05157 -3.994 6.49e-05 ***
tensionM -0.32132 0.06027 -5.332 9.73e-08 ***
tensionH -0.51849 0.06396 -8.107 5.21e-16 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
(Dispersion parameter for poisson family taken to be 1)
Null deviance: 297.37 on 53 degrees of freedom
Residual deviance: 210.39 on 50 degrees of freedom
AIC: 493.06
Number of Fisher Scoring iterations: 4
요약에서 예측 변수가 반응 변수에 미치는 영향을 고려하기 위해 마지막 열에서 p- 값이 0.05 미만인지 확인합니다. 장력 유형 M과 H를 갖는 울 유형 B는 브레이크 횟수에 영향을 미칩니다.