Удаление эффекта партии в тепловых картах после анализа дифференциальной экспрессии генов

Aug 15 2020

Я работаю над набором данных, в котором первая реплика каждой группы - это одна партия, а вторая реплика - вторая. Проверив PCAграфик и увидев эффект партии на ПК1, я использовал removeBatchEffectфункцию от limma, чтобы вычесть эффект партии из моих данных подсчета. Затем использование PCA дает мне график, который, похоже, не имеет явного эффекта пакетной обработки! Однако рекомендуется не использовать пакетную коррекцию эффекта для дифференциального анализа генов, а использовать пакетную переменную вместе с групповой переменной при построении model.matrix. Итак, я сделал это, побежалlimma/voomпо нормализованным подсчетам и экстрагированным дифференциально экспрессируемым генам. Однако, когда я пытаюсь создать тепловую карту из DEG, я все еще вижу, что образцы из разных партий сгруппированы отдельно, вместо того, чтобы видеть кластеризацию реплик одного и того же образца. Итак, у меня вопрос: следует ли мне использовать removeBatchEffectдля подсчета данные из DEG, а затем использовать преобразованный набор данных для тепловых карт, или есть другой способ исправить это?

Ответы

5 ATpoint Aug 16 2020 at 23:58

Это действительно правда, что для анализа DE необходимо включить партию в формулу, чтобы избежать изменения исходных подсчетов. Тем не менее, для всего остального, такого как построение тепловых карт, использование removeBatchEffectsсовершенно нормально и (по крайней мере, для меня) стандартная и общепринятая процедура. По сути, не имеет значения, что вы используете для коррекции пакетного эффекта для счетчиков, которые вы используете в нисходящем направлении. Результаты, вероятно, будут аналогичными. Combat-Seqиз пакета sva - это недавняя адаптация ComBat специально для RNA-seq, которая (насколько я понимаю) лучше справляется с целочисленным характером данных. Это работает с необработанными счетчиками и позволяет избежать печально известных отрицательных значений, которые иногда случаются с обоими limmaи Combat. После применения ComBat-Seqк необработанным счетчикам вы можете нормализовать их, как обычно, с помощью edgeR (или любого другого инструмента, который вам нравится), а затем создать тепловые карты. Увидетьhttps://github.com/zhangyuqing/ComBat-seq. Результаты DE по-прежнему должны поступать из обычного конвейера DE с партией как ковариантной, как обсуждалось выше.