कॉक्सपीएच में इवेंट समूह में उच्च-विचरण अवशिष्ट
मैं एक कॉक्स आनुपातिक खतरे वाले मॉडल को फिट करने के लिए आर और कॉक्सफ () का उपयोग कर रहा हूं। जब मैं उपयोग करके अवशिष्ट अवशिष्टों की साजिश करता हूं
ggcoxdiagnostics(fit, type = "deviance", linear.predictions = FALSE)
वे एक मामूली नकारात्मक पूर्वाग्रह प्रकट करते हैं।

यदि मैं अपना डेटा ऐसे छाँटता हूं, जिसमें जिन व्यक्तियों की कोई घटना थी, उन्हें अंत में एक साथ समूहीकृत किया जाता है, तो मैं ध्यान देता हूं कि टीयर अवशिष्ट में बहुत अधिक भिन्नता है, और लगता है कि थोड़ा सा सकारात्मक पूर्वाग्रह है:

मैं उसी प्रभाव को देख सकता हूं type="dfbeta
। स्कोनफेल्ड अवशिष्ट ठीक दिखते हैं, और एक चर (पी = 0.038) को छोड़कर गैर-महत्वपूर्ण हैं। क्या यह अपेक्षित है?
जवाब
यह पृष्ठ कॉक्स मॉडल के लिए विभिन्न प्रकार के अवशेषों का एक संक्षिप्त सारांश प्रदान करता है। जैसा कि यह कहता है:
मार्टिंगेल अवशिष्टों के विपरीत, अवशिष्ट अवशिष्टों का अर्थ 0 के आसपास केंद्रित होता है, जिससे उन्हें आउटेलर्स की तलाश में मार्टिंगेल अवशिष्टों की तुलना में व्याख्या करना काफी आसान हो जाता है।
ताकि आपके डेटा में "वे एक मामूली नकारात्मक पूर्वाग्रह" दिखाई दें, एक ऑप्टिकल भ्रम हो सकता है। (जांचें कि ggcoxdiagnostics
प्लॉट ने किसी तरह से y- अक्ष को काट नहीं दिया है।)
बहिर्मुखी अवशेषों को खोजने के लिए डीवियन अवशिष्ट का उपयोग सबसे अच्छा होता है। हां, आपके पास अवशिष्टों की एक विस्तृत श्रृंखला है (लेकिन कम से कम इन भूखंडों पर) कोई भी ऐसा नहीं है जो दूसरों की तुलना में अपमानजनक रूप से बदतर है।
लिंक किया गया पृष्ठ भी इंगित करता है:
एक सकारात्मक रूप से मूल्यवान अवशिष्ट अवशिष्ट एक अवलोकन का संकेत है जिससे घटना भविष्यवाणी की तुलना में जल्दी हुई; नकारात्मक रूप से मूल्यवान अवशिष्ट के लिए यह वाक्य सही है।
सेंसर किए गए मामलों में केवल उन घटनाओं को पाया जा सकता है जो बाद में भविष्यवाणी की गई हैं। आपके दूसरे प्लॉट में, सेंसर किए गए मामलों के लिए अवशिष्ट अवशिष्ट इस प्रकार सभी नकारात्मक हैं। घटनाओं के साथ मामलों, इसके विपरीत, घटना समय ज्ञात है ताकि उनके अवशिष्ट सकारात्मक या नकारात्मक हो सकें। इस आवश्यकता के साथ कि अवशिष्ट अवशिष्ट 0 है, आपको उस भूखंड का सामान्य आकार मिलता है।