Tại sao tỷ lệ cược đăng nhập được mô hình như một hàm tuyến tính?
Tôi nghĩ rằng tôi đã có câu trả lời, tuy nhiên, tôi muốn có một số xác nhận rằng tôi không thiếu bất cứ điều gì ở đây. Loại này hỏi điều tương tự, nhưng tôi muốn kiểm tra lại.
Hồi quy logistic có thể được thúc đẩy thông qua các mô hình tuyến tính tổng quát .
Về bản chất, GLM nói rằng chúng tôi lập mô hình giá trị kỳ vọng được chuyển đổi (“được liên kết” có thể nói là) $\mu$ của một biến $Y$các hiệp biến / đặc trưng đã cho dưới dạng một hàm tuyến tính. Hãy gọi hàm liên kết$g()$. Trong trường hợp của mô hình hồi quy tuyến tính cổ điển, hàm này sẽ đơn giản là hàm nhận dạng. Nếu$Y$ là nhị phân, giá trị mong đợi bằng $p = P(Y = 1)$. Trong mô hình hồi quy logistic, chúng tôi lập mô hình tỷ lệ cược log dưới dạng một hàm tuyến tính:
$$ \log\left(\frac{p}{1-p}\right) = \beta_0 + \beta_1x_1 + \dots + \beta_Kx_K$$
Vì vậy, giả định là tỷ lệ cược log được mô tả đầy đủ bằng một hàm tuyến tính. Tuy nhiên, hàm logit rõ ràng không phải là một hàm tuyến tính . Tuy nhiên, nó được xấp xỉ một cách hợp lý bởi một hàm tuyến tính nếu chúng ta cắt ngắn phạm vi xác suất thành một cái gì đó như$0.05 < p < 0.95$.
Câu hỏi: tại sao chúng tôi mô hình tỷ lệ cược đăng nhập như một hàm tuyến tính khi nó là phi tuyến tính đối với các xác suất nhỏ và lớn?
Câu trả lời của tôi là vì chúng tôi quan tâm đến giá trị kỳ vọng, chúng tôi giả định (!) Rằng phạm vi xác suất liên quan mà chúng tôi đang cố gắng ước tính không chứa những xác suất “cực đoan” này. Do đó, về bản chất, chúng ta chỉ đơn giản là bỏ qua tính phi tuyến.
Chính xác?
Trả lời
Một nhận xét được biến thành một câu trả lời:
Bạn có vẻ đang nhầm lẫn giữa hai điều: (1) "Đăng nhập" là phi tuyến tính $p$(2) giả sử rằng logit của p là tuyến tính trong đồng biến. Điểm đầu tiên không liên quan đến điểm thứ hai trừ khi bằng cách nào đó bạn tin rằng bản thân các xác suất phải phụ thuộc tuyến tính vào các hiệp biến, điều này có lẽ thậm chí còn vô lý hơn khi xét rằng p phải nằm trong [0,1].
Cách tốt nhất để xem tại sao hồi quy logistic lại có ý nghĩa là cố gắng lập mô hình xác suất $p$ như là một chức năng của $x = (x_1\dots,x_{K})$. Bạn nhanh chóng nhận ra rằng có lẽ bạn cần một số loại chuyển đổi hạn chế các giá trị ở$[0,1]$ và một số suy nghĩ có thể dẫn đến một mô hình như $$ p = \phi(\beta^T x) $$ Ở đâu $\phi(\cdot)$ là một chức năng từ $\mathbb R$ đến $[0,1]$. Một ví dụ sẽ là$\phi = \text{logit}^{-1}$dẫn đến hồi quy logistic. Một ví dụ khác là$\phi = $ CDF của phân phối chuẩn chuẩn dẫn đến hồi quy Probit, v.v.
Bạn luôn có thể làm cho mô hình phức tạp hơn bằng cách giả sử $p = \phi( P_\beta(x))$ Ở đâu $P_\beta(x)$ là một đa thức trong $x$ của độ cao hơn 1.
Trường hợp logit cũng có cách giải thích sau: Cho phép quan sát nhị phân là $Y$ với mật độ (tức là PMF) $p(y) = p^{y} (1-p)^{1-y}$ cho $y \in \{0,1\}$. Đây là một họ theo cấp số nhân$$ p(y) = \exp( y \theta - \log(1 +e^{\theta})) $$ với thông số chuẩn / tự nhiên $\theta = \log\frac{p}{1-p}$. Hồi quy logistic giả định tham số chuẩn này là tuyến tính trong các hiệp biến.
Việc xem xét tương tự như điểm 1 ở trên là mô hình hóa một tham số nhận các giá trị trong $[0,\infty)$ chẳng hạn như một tỷ lệ $\lambda$. Sau đó, một lần nữa, mô hình đầu tiên tự nhiên là$\lambda = \phi(\beta^T x)$ Ở đâu $\phi(\cdot)$ bản đồ $\mathbb R$ đến $[0,\infty)$ và một sự lựa chọn tự nhiên cho $\phi$ Là $\phi(x) = e^x$.