การลบ Batch Effect ใน Heatmaps หลังจากการวิเคราะห์การแสดงออกของยีนที่แตกต่างกัน

Aug 15 2020

ฉันกำลังทำงานกับชุดข้อมูลซึ่งการจำลองครั้งแรกของแต่ละกลุ่มเป็นหนึ่งชุดและการจำลองครั้งที่สองอยู่ในชุดที่สอง หลังจากตรวจสอบPCAพล็อตและดูเอฟเฟกต์แบทช์ใน PC1 ฉันใช้removeBatchEffectฟังก์ชันจากลิมมาเพื่อลบเอฟเฟกต์แบทช์ออกจากข้อมูลการนับของฉัน จากนั้นการใช้ PCA ทำให้ฉันมีพล็อตที่ดูเหมือนจะไม่มีเอฟเฟกต์ชุดที่ชัดเจนเหลืออยู่เลย! อย่างไรก็ตามไม่แนะนำให้ใช้การแก้ไขผลแบบแบทช์สำหรับการวิเคราะห์ยีนที่แตกต่างกัน แต่ให้ใช้ตัวแปรแบทช์ร่วมกับตัวแปรกลุ่มในการสร้างmodel.matrix. ฉันทำอย่างนั้นวิ่งlimma/voomในการนับปกติและแยกยีนที่แสดงออกมา อย่างไรก็ตามเมื่อฉันพยายามสร้างแผนที่ความร้อนจาก DEG ฉันยังคงเห็นว่าตัวอย่างจากแบทช์ที่แตกต่างกันนั้นถูกรวมกลุ่มแยกกันแทนที่จะเห็นการรวมกลุ่มของข้อมูลจำลองของตัวอย่างเดียวกัน ดังนั้นคำถามของฉันคือฉันควรใช้removeBatchEffectกับข้อมูลการนับจาก DEG หรือไม่แล้วใช้ชุดข้อมูลที่แปลงแล้วสำหรับแผนที่ความร้อนหรือมีวิธีอื่นในการแก้ไขปัญหานี้หรือไม่

คำตอบ

5 ATpoint Aug 16 2020 at 23:58

เป็นความจริงที่ว่าสำหรับการวิเคราะห์ DE ควรรวมแบทช์ไว้ในสูตรเพื่อหลีกเลี่ยงการเปลี่ยนจำนวนเดิม อย่างไรก็ตามสำหรับทุกสิ่งทุกอย่างเช่นการวางแผนการใช้แผนที่ความร้อนremoveBatchEffectsนั้นดีอย่างสมบูรณ์แบบและ (อย่างน้อยสำหรับฉัน) เป็นขั้นตอนมาตรฐานและเป็นที่ยอมรับ โดยพื้นฐานแล้วไม่สำคัญว่าคุณจะใช้อะไรในการแก้ไขสำหรับเอฟเฟกต์ชุดงานสำหรับการนับที่คุณใช้ดาวน์สตรีม ผลลัพธ์อาจจะใกล้เคียงกัน Combat-Seqจากแพ็คเกจ sva เป็นการดัดแปลงล่าสุดของ ComBat โดยเฉพาะสำหรับ RNA-seq ซึ่ง (จากสิ่งที่ฉันเข้าใจ) เกี่ยวข้องกับลักษณะการนับจำนวนเต็มของข้อมูลได้ดีกว่า นี้ดำเนินการในข้อหาดิบและหลีกเลี่ยงค่าลบที่น่าอับอายที่เกิดขึ้นในช่วงเวลาที่มีทั้งและlimma Combatหลังจากใช้ComBat-Seqกับจำนวนดิบของคุณแล้วคุณสามารถทำให้เป็นปกติได้ตามปกติด้วย edgeR (หรือเครื่องมือใด ๆ ที่คุณต้องการ) จากนั้นสร้างแผนที่ความร้อน ดูhttps://github.com/zhangyuqing/ComBat-seq. ผลลัพธ์ของ DE ยังคงมาจากท่อ DE ปกติที่มีแบทช์เป็นโควาเรียตตามที่กล่าวไว้ข้างต้น