डिफरेंशियल जीन एक्सप्रेशन एनालिसिस के बाद हीटमैप्स में बैच इफेक्ट को हटाना

Aug 15 2020

मैं एक डेटासेट पर काम कर रहा हूं जिसमें प्रत्येक समूह की पहली प्रतिकृति एक बैच है और दूसरी प्रतिकृति दूसरे बैच में है। PCAप्लॉट की जाँच करने और PC1 में बैच प्रभाव देखने के बाद , मैंने removeBatchEffectअपने काउंट डेटा से बैच इफेक्ट को घटाने के लिए लिम्मा से फ़ंक्शन का उपयोग किया । फिर, PCA का उपयोग करने से मुझे एक ऐसा प्लॉट मिलता है जो लगता नहीं है कि कोई स्पष्ट बैच प्रभाव बचा है! हालांकि, विभेदक जीन विश्लेषण के लिए बैच प्रभाव सुधार का उपयोग नहीं करने की सलाह दी जाती है लेकिन निर्माण में समूह चर के साथ बैच चर का उपयोग करें model.matrix। तो, मैंने ऐसा किया, भाग गयाlimma/voomसामान्यीकृत गणना पर, और अलग-अलग व्यक्त जीन निकाले जाते हैं। हालाँकि, जब मैं डीईजी से हीटमैप बनाने की कोशिश कर रहा हूं, तब भी मैं देखता हूं कि अलग-अलग बैचों के नमूने एक ही नमूने के प्रतिकृति के क्लस्टरिंग को देखने के बजाय, अलग-अलग क्लस्टर किए जाते हैं। तो, मेरा सवाल यह है कि क्या मुझे removeBatchEffectडीईजी से गिनती के आंकड़ों का उपयोग करना चाहिए और फिर हीटमैप के लिए रूपांतरित डेटासेट का उपयोग करना चाहिए या इसे ठीक करने का एक और तरीका है?

जवाब

5 ATpoint Aug 16 2020 at 23:58

यह वास्तव में सच है कि DE विश्लेषण के लिए किसी को मूल गणना में परिवर्तन से बचने के लिए सूत्र में बैच को शामिल करना चाहिए। फिर भी, सब कुछ के लिए जैसे कि हीटमैप्स का साजिश रचने का उपयोग removeBatchEffectsपूरी तरह से ठीक है और (कम से कम मेरे लिए) एक मानक और अच्छी तरह से स्वीकृत प्रक्रिया है। यह अनिवार्य रूप से मायने नहीं रखता है कि आप जो डाउनस्ट्रीम उपयोग करते हैं उसके लिए बैच प्रभाव के लिए सही उपयोग करें। परिणाम शायद समान होंगे। Combat-SeqSva पैकेज से RB-seq के लिए विशेष रूप से ComBat का एक हालिया अनुकूलन है (जो मुझे समझ में आता है) डेटा के पूर्णांक-गणना प्रकृति के साथ बेहतर व्यवहार करता है। यह कच्चे मायने रखता है पर चल रही है और कुख्यात ऋणात्मक मानों कि दोनों के साथ समय पर होने से बचा जाता है limmaऔर CombatComBat-Seqअपने कच्चे काउंट पर आवेदन करने के बाद आप उन्हें किनारे (या किसी भी उपकरण की तरह) के साथ सामान्य रूप से सामान्य कर सकते हैं और फिर हीटमैप बना सकते हैं। ले देखhttps://github.com/zhangyuqing/ComBat-seq। डे परिणाम अभी भी सामान्य डीई पाइपलाइन से बैच के साथ आना चाहिए जैसा कि कोवरिएट के रूप में ऊपर चर्चा की गई है।