Удаление эффекта партии в тепловых картах после анализа дифференциальной экспрессии генов
Я работаю над набором данных, в котором первая реплика каждой группы - это одна партия, а вторая реплика - вторая. Проверив PCA
график и увидев эффект партии на ПК1, я использовал removeBatchEffect
функцию от limma, чтобы вычесть эффект партии из моих данных подсчета. Затем использование PCA дает мне график, который, похоже, не имеет явного эффекта пакетной обработки! Однако рекомендуется не использовать пакетную коррекцию эффекта для дифференциального анализа генов, а использовать пакетную переменную вместе с групповой переменной при построении model.matrix
. Итак, я сделал это, побежалlimma/voom
по нормализованным подсчетам и экстрагированным дифференциально экспрессируемым генам. Однако, когда я пытаюсь создать тепловую карту из DEG, я все еще вижу, что образцы из разных партий сгруппированы отдельно, вместо того, чтобы видеть кластеризацию реплик одного и того же образца. Итак, у меня вопрос: следует ли мне использовать removeBatchEffect
для подсчета данные из DEG, а затем использовать преобразованный набор данных для тепловых карт, или есть другой способ исправить это?
Ответы
Это действительно правда, что для анализа DE необходимо включить партию в формулу, чтобы избежать изменения исходных подсчетов. Тем не менее, для всего остального, такого как построение тепловых карт, использование removeBatchEffects
совершенно нормально и (по крайней мере, для меня) стандартная и общепринятая процедура. По сути, не имеет значения, что вы используете для коррекции пакетного эффекта для счетчиков, которые вы используете в нисходящем направлении. Результаты, вероятно, будут аналогичными. Combat-Seq
из пакета sva - это недавняя адаптация ComBat специально для RNA-seq, которая (насколько я понимаю) лучше справляется с целочисленным характером данных. Это работает с необработанными счетчиками и позволяет избежать печально известных отрицательных значений, которые иногда случаются с обоими limma
и Combat
. После применения ComBat-Seq
к необработанным счетчикам вы можете нормализовать их, как обычно, с помощью edgeR (или любого другого инструмента, который вам нравится), а затем создать тепловые карты. Увидетьhttps://github.com/zhangyuqing/ComBat-seq. Результаты DE по-прежнему должны поступать из обычного конвейера DE с партией как ковариантной, как обсуждалось выше.