लॉग ऑड्स को एक रैखिक फ़ंक्शन के रूप में क्यों बनाया गया है?
मुझे लगता है कि मेरे पास पहले से ही जवाब है, हालांकि, मैं कुछ पुष्टि की कामना करता हूं कि मैं यहां कुछ भी याद नहीं कर रहा हूं। इस तरह की एक ही बात पूछता है, लेकिन मैं दोबारा जांच करना चाहता हूं।
लॉजिस्टिक रिग्रेशन को सामान्यीकृत रैखिक मॉडल के माध्यम से प्रेरित किया जा सकता है ।
जीएलएम, संक्षेप में, कहते हैं कि हम प्रतिरूपित ("जुड़ा हुआ है" तो बोलने के लिए) अपेक्षित मूल्य को मॉडल करते हैं $\mu$ एक चर का $Y$एक रैखिक समारोह के रूप में दिए गए covariates / सुविधाएँ। चलो लिंक फ़ंक्शन को कॉल करते हैं$g()$। शास्त्रीय रैखिक प्रतिगमन मॉडल के मामले में यह फ़ंक्शन केवल पहचान फ़ंक्शन होगा। अगर$Y$ बाइनरी है, अपेक्षित मूल्य के बराबर है $p = P(Y = 1)$। लॉजिस्टिक रिग्रेशन मॉडल में, हम लॉग-ऑड्स को एक लीनियर फ़ंक्शन के रूप में मॉडल करते हैं :
$$ \log\left(\frac{p}{1-p}\right) = \beta_0 + \beta_1x_1 + \dots + \beta_Kx_K$$
तो यह धारणा है कि लॉग-ऑड्स को एक रैखिक फ़ंक्शन द्वारा पर्याप्त रूप से वर्णित किया गया है। हालाँकि, लॉग फ़ंक्शन, स्पष्ट रूप से एक रैखिक फ़ंक्शन नहीं है । फिर भी, यह यथोचित रूप से एक रैखिक फ़ंक्शन द्वारा अनुमानित किया जाता है यदि हम संभावना रेंज को कुछ इस तरह से काटते हैं$0.05 < p < 0.95$।
प्रश्न: हम लॉग-ऑड्स को एक लीनियर फंक्शन के रूप में क्यों दर्शाते हैं जब यह छोटी और बड़ी संभावनाओं के लिए अरेखीय होता है?
मेरा उत्तर यह होगा कि चूंकि हम अपेक्षित मूल्य में रुचि रखते हैं, इसलिए हम मानते हैं (!) कि हम जिस संभावित संभावनाओं का अनुमान लगाने की कोशिश कर रहे हैं, उसमें ये "चरम" संभावनाएँ नहीं हैं। इसलिए, संक्षेप में, हम केवल अशुद्धता को अनदेखा करते हैं।
सही बात?
जवाब
एक टिप्पणी एक जवाब में बदल गई:
आप दो चीजों को भ्रमित करते हुए प्रतीत होते हैं: (1) "लॉजिट" में ग़ैर-मौजूद होना $p$(2) यह मानते हुए कि कोविरेट्स में p का लॉग रैखिक है। पहले बिंदु का दूसरे बिंदु पर कोई असर नहीं पड़ता है जब तक कि किसी तरह आप यह नहीं मानते कि संभावनाएं स्वयं को रैखिक रूप से सहसंयोजकों पर निर्भर होना चाहिए, जो कि शायद यह भी अधिक बेतुका है कि उस पी को [0,1] में रहना है।
लॉजिस्टिक प्रतिगमन क्यों समझ में आता है यह देखने का सबसे अच्छा तरीका संभावना को मॉडल करने का प्रयास करना है $p$ के एक समारोह के रूप में $x = (x_1\dots,x_{K})$। आप जल्दी से महसूस करते हैं कि शायद आपको किसी प्रकार के परिवर्तन की आवश्यकता है जो मूल्यों को प्रतिबंधित करता है$[0,1]$ और कुछ विचार जैसे मॉडल को जन्म दे सकते हैं $$ p = \phi(\beta^T x) $$ कहां है $\phi(\cdot)$ से एक समारोह है $\mathbb R$ सेवा मेरे $[0,1]$। एक उदाहरण होगा$\phi = \text{logit}^{-1}$जिसके कारण लॉजिस्टिक रिग्रेशन होता है। एक और उदाहरण है$\phi = $ मानक सामान्य वितरण का सीडीएफ जो प्रोबिट रिग्रेशन की ओर जाता है, और इसी तरह।
आप हमेशा मान कर मॉडल को और अधिक जटिल बना सकते हैं $p = \phi( P_\beta(x))$ कहां है $P_\beta(x)$ में एक बहुपद है $x$ 1 से अधिक की डिग्री।
लॉगिट मामले में निम्नलिखित व्याख्या भी है: बाइनरी अवलोकन करें $Y$ घनत्व के साथ (जैसे, पीएमएफ) $p(y) = p^{y} (1-p)^{1-y}$ के लिये $y \in \{0,1\}$। यह एक घातीय परिवार है$$ p(y) = \exp( y \theta - \log(1 +e^{\theta})) $$ विहित / प्राकृतिक पैरामीटर के साथ $\theta = \log\frac{p}{1-p}$। लॉजिस्टिक रिग्रेशन इस कैनोनिकल पैरामीटर को कोवरिएट्स में रैखिक मान लेता है।
बिंदु 1 से ऊपर एक समान विचार एक पैरामीटर मॉडलिंग में जाता है जो मान लेता है $[0,\infty)$ इस तरह की दर $\lambda$। फिर, फिर से, एक प्राकृतिक पहला मॉडल है$\lambda = \phi(\beta^T x)$ कहां है $\phi(\cdot)$ नक्शे $\mathbb R$ सेवा मेरे $[0,\infty)$ और के लिए एक प्राकृतिक विकल्प $\phi$ है $\phi(x) = e^x$।