Eliminación del efecto de lote en mapas de calor después del análisis de expresión genética diferencial
Estoy trabajando en un conjunto de datos en el que la primera réplica de cada grupo es un lote y la segunda réplica está en un segundo lote. Después de verificar el PCA
gráfico y ver el efecto por lotes en PC1, utilicé la removeBatchEffect
función de limma para restar el efecto por lotes de mis datos de recuento. Luego, usar PCA me da una trama que no parece tener ningún efecto de lote aparente. Sin embargo, se recomienda no utilizar la corrección del efecto por lotes para el análisis diferencial de genes, sino utilizar la variable por lotes junto con la variable de grupo al construir el model.matrix
. Entonces, hice eso, corrílimma/voom
en los recuentos normalizados y extraídos genes expresados diferencialmente. Sin embargo, cuando intento hacer un mapa de calor a partir de los DEG, todavía veo que las muestras de diferentes lotes se agrupan por separado, en lugar de ver la agrupación de réplicas de la misma muestra. Entonces, mi pregunta es si debería usar removeBatchEffect
los datos de recuento de DEG y luego usar el conjunto de datos transformado para mapas de calor o hay otra forma de solucionar esto.
Respuestas
De hecho, es cierto que para el análisis DE se debe incluir el lote en la fórmula para evitar cambiar los recuentos originales. Aún así, para todo lo demás, como trazar mapas de calor, el uso de removeBatchEffects
está perfectamente bien y (al menos para mí) es un procedimiento estándar y bien aceptado. Básicamente, no importa lo que utilice para corregir el efecto de lote de los recuentos que utilice en sentido descendente. Los resultados probablemente serán similares. Combat-Seq
del paquete sva es una adaptación reciente de ComBat específicamente para RNA-seq que (según tengo entendido) trata mejor la naturaleza de recuento de números enteros de los datos. Esto opera con recuentos brutos y evita los infames valores negativos que ocurren a veces con limma
y Combat
. Después de aplicar ComBat-Seq
sus conteos sin procesar, puede normalizarlos como de costumbre con edgeR (o cualquier herramienta que desee) y luego hacer los mapas de calor. Verhttps://github.com/zhangyuqing/ComBat-seq. Los resultados de DE aún deben provenir de la tubería de DE normal con el lote como covariable como se discutió anteriormente.