Suppression de l'effet de lot dans les cartes thermiques après l'analyse de l'expression différentielle des gènes
Je travaille sur un ensemble de données dans lequel la première réplique de chaque groupe est un lot et la deuxième réplique est dans un deuxième lot. Après avoir vérifié le PCA
tracé et vu l'effet de lot dans PC1, j'ai utilisé la removeBatchEffect
fonction de limma pour soustraire l'effet de lot de mes données de comptage. Ensuite, utiliser PCA me donne un tracé qui ne semble plus avoir d'effet de lot apparent! Cependant, il est recommandé de ne pas utiliser la correction d'effet de lot pour l'analyse différentielle des gènes, mais d'utiliser la variable de lot avec la variable de groupe dans la construction du model.matrix
. Alors j'ai fait ça, j'ai courulimma/voom
sur les comptes normalisés, et extrait les gènes différentiellement exprimés. Cependant, lorsque j'essaie de créer une carte thermique à partir des DEG, je vois toujours que les échantillons de différents lots sont regroupés séparément, au lieu de voir le regroupement des répliques du même échantillon. Donc, ma question est de savoir si je devrais utiliser removeBatchEffect
les données de comptage des DEG, puis utiliser l'ensemble de données transformé pour les cartes thermiques ou s'il existe un autre moyen de résoudre ce problème?
Réponses
Il est en effet vrai que pour l'analyse DE, il faut inclure le lot dans la formule pour éviter de modifier les dénombrements d'origine. Pourtant, pour tout le reste, comme le traçage des cartes thermiques, l'utilisation de removeBatchEffects
est parfaitement bien et (du moins pour moi) une procédure standard et bien acceptée. Peu importe ce que vous utilisez pour corriger l'effet de lot pour les comptages que vous utilisez en aval. Les résultats seront probablement similaires. Combat-Seq
du package sva est une adaptation récente de ComBat spécifiquement pour RNA-seq qui (d'après ce que je comprends) traite mieux de la nature du nombre entier des données. Cela fonctionne sur des décomptes bruts et évite les infâmes valeurs négatives qui se produisent parfois avec limma
et Combat
. Après avoir appliqué ComBat-Seq
vos comptages bruts, vous pouvez les normaliser comme d'habitude avec edgeR (ou n'importe quel outil de votre choix), puis créer les cartes thermiques. Voirhttps://github.com/zhangyuqing/ComBat-seq. Les résultats DE doivent toujours provenir du pipeline DE normal avec le lot comme covariable, comme indiqué ci-dessus.