R - Hồi quy Poisson

Hồi quy Poisson liên quan đến các mô hình hồi quy trong đó biến phản hồi ở dạng số đếm chứ không phải số phân số. Ví dụ, đếm số lần sinh hoặc số trận thắng trong một loạt trận đấu bóng đá. Ngoài ra, giá trị của các biến phản hồi cũng tuân theo phân phối Poisson.

Phương trình toán học tổng quát cho hồi quy Poisson là:

log(y) = a + b1x1 + b2x2 + bnxn.....

Sau đây là mô tả về các tham số được sử dụng:

  • y là biến phản hồi.

  • ab là các hệ số số.

  • x là biến dự báo.

Hàm được sử dụng để tạo mô hình hồi quy Poisson là glm() chức năng.

Cú pháp

Cú pháp cơ bản cho glm() hàm trong hồi quy Poisson là -

glm(formula,data,family)

Sau đây là mô tả về các tham số được sử dụng trong các hàm trên:

  • formula là biểu tượng trình bày mối quan hệ giữa các biến.

  • data là tập dữ liệu đưa ra giá trị của các biến này.

  • familylà đối tượng R để chỉ định các chi tiết của mô hình. Giá trị của nó là 'Poisson' cho hồi quy logistic.

Thí dụ

Chúng tôi có bộ dữ liệu tích hợp sẵn "sợi dọc" mô tả ảnh hưởng của loại len (A hoặc B) và độ căng (thấp, trung bình hoặc cao) đối với số lượng sợi dọc bị đứt trên mỗi khung dệt. Chúng ta hãy coi "break" là biến phản hồi là một số lần ngắt. "Loại" và "độ căng" len được lấy làm biến dự báo.

Input Data

input <- warpbreaks
print(head(input))

Khi chúng tôi thực thi đoạn mã trên, nó tạo ra kết quả sau:

breaks   wool  tension
1     26       A     L
2     30       A     L
3     54       A     L
4     25       A     L
5     70       A     L
6     52       A     L

Tạo mô hình hồi quy

output <-glm(formula = breaks ~ wool+tension, data = warpbreaks,
   family = poisson)
print(summary(output))

Khi chúng tôi thực thi đoạn mã trên, nó tạo ra kết quả sau:

Call:
glm(formula = breaks ~ wool + tension, family = poisson, data = warpbreaks)

Deviance Residuals: 
    Min       1Q     Median       3Q      Max  
  -3.6871  -1.6503  -0.4269     1.1902   4.2616  

Coefficients:
            Estimate Std. Error z value Pr(>|z|)    
(Intercept)  3.69196    0.04541  81.302  < 2e-16 ***
woolB       -0.20599    0.05157  -3.994 6.49e-05 ***
tensionM    -0.32132    0.06027  -5.332 9.73e-08 ***
tensionH    -0.51849    0.06396  -8.107 5.21e-16 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

(Dispersion parameter for poisson family taken to be 1)

    Null deviance: 297.37  on 53  degrees of freedom
Residual deviance: 210.39  on 50  degrees of freedom
AIC: 493.06

Number of Fisher Scoring iterations: 4

Trong phần tóm tắt, chúng tôi tìm kiếm giá trị p trong cột cuối cùng nhỏ hơn 0,05 để xem xét tác động của biến dự báo lên biến phản hồi. Như đã thấy, loại len B có loại căng M và H có ảnh hưởng đến số lần đứt.