Menghilangkan Efek Batch dalam Peta Panas setelah Analisis Ekspresi Gen Diferensial
Saya sedang mengerjakan kumpulan data di mana replikasi pertama dari setiap grup adalah satu batch dan replikasi kedua ada di batch kedua. Setelah memeriksa PCA
plot dan melihat efek batch di PC1, saya menggunakan removeBatchEffect
fungsi dari limma untuk mengurangi efek batch dari data hitungan saya. Kemudian, menggunakan PCA memberi saya plot yang tampaknya tidak memiliki efek batch yang tersisa! Namun, disarankan untuk tidak menggunakan koreksi efek batch untuk analisis gen diferensial tetapi menggunakan variabel batch bersama dengan variabel grup dalam membangun model.matrix
. Jadi, saya melakukan itu, larilimma/voom
pada hitungan yang dinormalisasi, dan gen yang diekspresikan secara berbeda. Namun, ketika saya mencoba membuat peta panas dari DEG, saya masih melihat bahwa sampel dari batch yang berbeda dikelompokkan secara terpisah, alih-alih melihat pengelompokan ulangan dari sampel yang sama. Jadi, pertanyaan saya adalah apakah saya harus menggunakan removeBatchEffect
data hitungan dari DEG dan kemudian menggunakan kumpulan data yang diubah untuk peta panas atau ada cara lain untuk memperbaikinya?
Jawaban
Memang benar bahwa untuk analisis DE seseorang harus memasukkan batch ke dalam rumus untuk menghindari perubahan jumlah asli. Namun, untuk hal lain seperti merencanakan peta panas, penggunaan removeBatchEffects
baik-baik saja dan (setidaknya bagi saya) prosedur standar dan diterima dengan baik. Pada dasarnya tidak masalah apa yang Anda gunakan untuk mengoreksi efek batch untuk hitungan yang Anda gunakan di hilir. Hasilnya mungkin akan serupa. Combat-Seq
dari paket sva adalah adaptasi terbaru dari ComBat khusus untuk RNA-seq yang (dari apa yang saya pahami) lebih baik berkaitan dengan sifat data integer-count. Ini beroperasi pada hitungan mentah dan menghindari nilai negatif terkenal yang kadang-kadang terjadi dengan limma
dan Combat
. Setelah menerapkan ComBat-Seq
jumlah mentah Anda, Anda dapat menormalkannya seperti biasa dengan edgeR (atau alat apa pun yang Anda suka) dan kemudian membuat peta panas. Lihathttps://github.com/zhangyuqing/ComBat-seq. Hasil DE masih harus berasal dari pipeline DE normal dengan batch sebagai kovariat seperti yang dibahas di atas.