Menghilangkan Efek Batch dalam Peta Panas setelah Analisis Ekspresi Gen Diferensial

Aug 15 2020

Saya sedang mengerjakan kumpulan data di mana replikasi pertama dari setiap grup adalah satu batch dan replikasi kedua ada di batch kedua. Setelah memeriksa PCAplot dan melihat efek batch di PC1, saya menggunakan removeBatchEffectfungsi dari limma untuk mengurangi efek batch dari data hitungan saya. Kemudian, menggunakan PCA memberi saya plot yang tampaknya tidak memiliki efek batch yang tersisa! Namun, disarankan untuk tidak menggunakan koreksi efek batch untuk analisis gen diferensial tetapi menggunakan variabel batch bersama dengan variabel grup dalam membangun model.matrix. Jadi, saya melakukan itu, larilimma/voompada hitungan yang dinormalisasi, dan gen yang diekspresikan secara berbeda. Namun, ketika saya mencoba membuat peta panas dari DEG, saya masih melihat bahwa sampel dari batch yang berbeda dikelompokkan secara terpisah, alih-alih melihat pengelompokan ulangan dari sampel yang sama. Jadi, pertanyaan saya adalah apakah saya harus menggunakan removeBatchEffectdata hitungan dari DEG dan kemudian menggunakan kumpulan data yang diubah untuk peta panas atau ada cara lain untuk memperbaikinya?

Jawaban

5 ATpoint Aug 16 2020 at 23:58

Memang benar bahwa untuk analisis DE seseorang harus memasukkan batch ke dalam rumus untuk menghindari perubahan jumlah asli. Namun, untuk hal lain seperti merencanakan peta panas, penggunaan removeBatchEffectsbaik-baik saja dan (setidaknya bagi saya) prosedur standar dan diterima dengan baik. Pada dasarnya tidak masalah apa yang Anda gunakan untuk mengoreksi efek batch untuk hitungan yang Anda gunakan di hilir. Hasilnya mungkin akan serupa. Combat-Seqdari paket sva adalah adaptasi terbaru dari ComBat khusus untuk RNA-seq yang (dari apa yang saya pahami) lebih baik berkaitan dengan sifat data integer-count. Ini beroperasi pada hitungan mentah dan menghindari nilai negatif terkenal yang kadang-kadang terjadi dengan limmadan Combat. Setelah menerapkan ComBat-Seqjumlah mentah Anda, Anda dapat menormalkannya seperti biasa dengan edgeR (atau alat apa pun yang Anda suka) dan kemudian membuat peta panas. Lihathttps://github.com/zhangyuqing/ComBat-seq. Hasil DE masih harus berasal dari pipeline DE normal dengan batch sebagai kovariat seperti yang dibahas di atas.