Eliminación del efecto de lote en mapas de calor después del análisis de expresión genética diferencial

Aug 15 2020

Estoy trabajando en un conjunto de datos en el que la primera réplica de cada grupo es un lote y la segunda réplica está en un segundo lote. Después de verificar el PCAgráfico y ver el efecto por lotes en PC1, utilicé la removeBatchEffectfunción de limma para restar el efecto por lotes de mis datos de recuento. Luego, usar PCA me da una trama que no parece tener ningún efecto de lote aparente. Sin embargo, se recomienda no utilizar la corrección del efecto por lotes para el análisis diferencial de genes, sino utilizar la variable por lotes junto con la variable de grupo al construir el model.matrix. Entonces, hice eso, corrílimma/voomen los recuentos normalizados y extraídos genes expresados ​​diferencialmente. Sin embargo, cuando intento hacer un mapa de calor a partir de los DEG, todavía veo que las muestras de diferentes lotes se agrupan por separado, en lugar de ver la agrupación de réplicas de la misma muestra. Entonces, mi pregunta es si debería usar removeBatchEffectlos datos de recuento de DEG y luego usar el conjunto de datos transformado para mapas de calor o hay otra forma de solucionar esto.

Respuestas

5 ATpoint Aug 16 2020 at 23:58

De hecho, es cierto que para el análisis DE se debe incluir el lote en la fórmula para evitar cambiar los recuentos originales. Aún así, para todo lo demás, como trazar mapas de calor, el uso de removeBatchEffectsestá perfectamente bien y (al menos para mí) es un procedimiento estándar y bien aceptado. Básicamente, no importa lo que utilice para corregir el efecto de lote de los recuentos que utilice en sentido descendente. Los resultados probablemente serán similares. Combat-Seqdel paquete sva es una adaptación reciente de ComBat específicamente para RNA-seq que (según tengo entendido) trata mejor la naturaleza de recuento de números enteros de los datos. Esto opera con recuentos brutos y evita los infames valores negativos que ocurren a veces con limmay Combat. Después de aplicar ComBat-Seqsus conteos sin procesar, puede normalizarlos como de costumbre con edgeR (o cualquier herramienta que desee) y luego hacer los mapas de calor. Verhttps://github.com/zhangyuqing/ComBat-seq. Los resultados de DE aún deben provenir de la tubería de DE normal con el lote como covariable como se discutió anteriormente.