Removendo Efeito de Lote em Mapas de Calor após Análise de Expressão Gênica Diferencial
Estou trabalhando em um conjunto de dados em que a primeira replicação de cada grupo é um lote e a segunda replicação em um segundo lote. Depois de verificar o PCA
gráfico e ver o efeito do lote no PC1, usei a removeBatchEffect
função de limma para subtrair o efeito do lote dos meus dados de contagem. Então, usar o PCA me dá um gráfico que não parece ter nenhum efeito de lote aparente! No entanto, é recomendado não usar correção de efeito de lote para análise diferencial de genes, mas usar a variável de lote junto com a variável de grupo na construção do model.matrix
. Então, eu fiz isso, corrilimma/voom
nas contagens normalizadas e extraiu genes diferencialmente expressos. No entanto, quando estou tentando fazer um mapa de calor dos DEGs, ainda vejo que as amostras de lotes diferentes são agrupadas separadamente, em vez de ver o agrupamento de réplicas da mesma amostra. Portanto, minha pergunta é se devo usar removeBatchEffect
os dados de contagem de DEGs e, em seguida, usar o conjunto de dados transformado para mapas de calor ou se há outra maneira de corrigir isso?
Respostas
É verdade que, para a análise DE, deve-se incluir lote na fórmula para evitar a alteração das contagens originais. Ainda assim, para tudo o mais, como traçar mapas de calor, o uso de removeBatchEffects
é perfeitamente aceitável e (pelo menos para mim) um procedimento padrão e bem aceito. Essencialmente, não importa o que você usa para corrigir o efeito de lote para as contagens que você usa downstream. Os resultados provavelmente serão semelhantes. Combat-Seq
do pacote sva é uma adaptação recente de ComBat especificamente para RNA-seq que (pelo que entendi) lida melhor com a natureza de contagem de inteiros dos dados. Isso opera em contagens brutas e evita os valores negativos infames que acontecem às vezes com limma
e Combat
. Depois de aplicar ComBat-Seq
em suas contagens brutas, você pode normalizá-las como de costume com edgeR (ou qualquer ferramenta de sua preferência) e então fazer os mapas de calor. Vejohttps://github.com/zhangyuqing/ComBat-seq. Os resultados de DE ainda devem vir do pipeline de DE normal com lote como covariável, conforme discutido acima.