Rimozione dell'effetto batch nelle mappe di calore dopo l'analisi dell'espressione genica differenziale

Aug 15 2020

Sto lavorando su un set di dati in cui la prima replica di ogni gruppo è un batch e la seconda replica è in un secondo batch. Dopo aver controllato la PCAtrama e visto l'effetto batch in PC1, ho usato la removeBatchEffectfunzione di limma per sottrarre l'effetto batch dai miei dati di conteggio. Quindi, l'uso di PCA mi dà una trama che non sembra avere alcun effetto batch apparente rimasto! Tuttavia, si consiglia di non utilizzare la correzione dell'effetto batch per l'analisi genica differenziale, ma di utilizzare la variabile batch insieme alla variabile gruppo nella costruzione del file model.matrix. Quindi l'ho fatto, sono scappatolimma/voomsui conteggi normalizzati ed estratti di geni differenzialmente espressi. Tuttavia, quando provo a creare una mappa termica dai DEG, vedo ancora che i campioni di lotti diversi sono raggruppati separatamente, invece di vedere il raggruppamento dei replicati dello stesso campione. Quindi, la mia domanda è se dovrei utilizzare removeBatchEffecti dati di conteggio dei DEG e quindi utilizzare il set di dati trasformato per le mappe di calore o c'è un altro modo per risolvere questo problema?

Risposte

5 ATpoint Aug 16 2020 at 23:58

È infatti vero che per l'analisi DE si dovrebbe includere un batch nella formula per evitare di modificare i conteggi originali. Tuttavia, per tutto il resto, come la stampa di mappe di calore, l'uso di removeBatchEffectsè perfettamente a posto e (almeno per me) una procedura standard e ben accettata. In sostanza, non importa cosa si utilizza per correggere l'effetto batch per i conteggi che si utilizzano a valle. I risultati saranno probabilmente simili. Combat-Seqdal pacchetto sva c'è un recente adattamento di ComBat specifico per RNA-seq che (da quello che ho capito) si occupa meglio della natura del conteggio intero dei dati. Questo opera su conteggi grezzi ed evita i famigerati valori negativi che si verificano a volte con entrambi limmae Combat. Dopo aver applicato ComBat-Seqi conteggi grezzi, puoi normalizzarli come al solito con edgeR (o qualsiasi strumento che ti piace) e quindi creare le mappe di calore. Vederehttps://github.com/zhangyuqing/ComBat-seq. I risultati DE dovrebbero comunque provenire dalla normale pipeline DE con batch come covariata come discusso sopra.