Suppression de l'effet de lot dans les cartes thermiques après l'analyse de l'expression différentielle des gènes

Aug 15 2020

Je travaille sur un ensemble de données dans lequel la première réplique de chaque groupe est un lot et la deuxième réplique est dans un deuxième lot. Après avoir vérifié le PCAtracé et vu l'effet de lot dans PC1, j'ai utilisé la removeBatchEffectfonction de limma pour soustraire l'effet de lot de mes données de comptage. Ensuite, utiliser PCA me donne un tracé qui ne semble plus avoir d'effet de lot apparent! Cependant, il est recommandé de ne pas utiliser la correction d'effet de lot pour l'analyse différentielle des gènes, mais d'utiliser la variable de lot avec la variable de groupe dans la construction du model.matrix. Alors j'ai fait ça, j'ai courulimma/voomsur les comptes normalisés, et extrait les gènes différentiellement exprimés. Cependant, lorsque j'essaie de créer une carte thermique à partir des DEG, je vois toujours que les échantillons de différents lots sont regroupés séparément, au lieu de voir le regroupement des répliques du même échantillon. Donc, ma question est de savoir si je devrais utiliser removeBatchEffectles données de comptage des DEG, puis utiliser l'ensemble de données transformé pour les cartes thermiques ou s'il existe un autre moyen de résoudre ce problème?

Réponses

5 ATpoint Aug 16 2020 at 23:58

Il est en effet vrai que pour l'analyse DE, il faut inclure le lot dans la formule pour éviter de modifier les dénombrements d'origine. Pourtant, pour tout le reste, comme le traçage des cartes thermiques, l'utilisation de removeBatchEffectsest parfaitement bien et (du moins pour moi) une procédure standard et bien acceptée. Peu importe ce que vous utilisez pour corriger l'effet de lot pour les comptages que vous utilisez en aval. Les résultats seront probablement similaires. Combat-Seqdu package sva est une adaptation récente de ComBat spécifiquement pour RNA-seq qui (d'après ce que je comprends) traite mieux de la nature du nombre entier des données. Cela fonctionne sur des décomptes bruts et évite les infâmes valeurs négatives qui se produisent parfois avec limmaet Combat. Après avoir appliqué ComBat-Seqvos comptages bruts, vous pouvez les normaliser comme d'habitude avec edgeR (ou n'importe quel outil de votre choix), puis créer les cartes thermiques. Voirhttps://github.com/zhangyuqing/ComBat-seq. Les résultats DE doivent toujours provenir du pipeline DE normal avec le lot comme covariable, comme indiqué ci-dessus.