Rimozione dell'effetto batch nelle mappe di calore dopo l'analisi dell'espressione genica differenziale
Sto lavorando su un set di dati in cui la prima replica di ogni gruppo è un batch e la seconda replica è in un secondo batch. Dopo aver controllato la PCA
trama e visto l'effetto batch in PC1, ho usato la removeBatchEffect
funzione di limma per sottrarre l'effetto batch dai miei dati di conteggio. Quindi, l'uso di PCA mi dà una trama che non sembra avere alcun effetto batch apparente rimasto! Tuttavia, si consiglia di non utilizzare la correzione dell'effetto batch per l'analisi genica differenziale, ma di utilizzare la variabile batch insieme alla variabile gruppo nella costruzione del file model.matrix
. Quindi l'ho fatto, sono scappatolimma/voom
sui conteggi normalizzati ed estratti di geni differenzialmente espressi. Tuttavia, quando provo a creare una mappa termica dai DEG, vedo ancora che i campioni di lotti diversi sono raggruppati separatamente, invece di vedere il raggruppamento dei replicati dello stesso campione. Quindi, la mia domanda è se dovrei utilizzare removeBatchEffect
i dati di conteggio dei DEG e quindi utilizzare il set di dati trasformato per le mappe di calore o c'è un altro modo per risolvere questo problema?
Risposte
È infatti vero che per l'analisi DE si dovrebbe includere un batch nella formula per evitare di modificare i conteggi originali. Tuttavia, per tutto il resto, come la stampa di mappe di calore, l'uso di removeBatchEffects
è perfettamente a posto e (almeno per me) una procedura standard e ben accettata. In sostanza, non importa cosa si utilizza per correggere l'effetto batch per i conteggi che si utilizzano a valle. I risultati saranno probabilmente simili. Combat-Seq
dal pacchetto sva c'è un recente adattamento di ComBat specifico per RNA-seq che (da quello che ho capito) si occupa meglio della natura del conteggio intero dei dati. Questo opera su conteggi grezzi ed evita i famigerati valori negativi che si verificano a volte con entrambi limma
e Combat
. Dopo aver applicato ComBat-Seq
i conteggi grezzi, puoi normalizzarli come al solito con edgeR (o qualsiasi strumento che ti piace) e quindi creare le mappe di calore. Vederehttps://github.com/zhangyuqing/ComBat-seq. I risultati DE dovrebbero comunque provenire dalla normale pipeline DE con batch come covariata come discusso sopra.