차동 유전자 발현 분석 후 히트 맵에서 배치 효과 제거

Aug 15 2020

각 그룹의 첫 번째 복제가 하나의 배치이고 두 번째 복제가 두 번째 배치에있는 데이터 세트를 작업 중입니다. PCA플롯을 확인하고 PC1에서 배치 효과를 확인한 후 removeBatchEffectlimma의 함수를 사용 하여 카운트 데이터에서 배치 효과를 뺍니다. 그런 다음 PCA를 사용하면 명백한 배치 효과가 남아 있지 않은 것처럼 보이는 플롯이 제공됩니다! 그러나 차등 유전자 분석을 위해 배치 효과 보정을 사용하지 않는 것이 좋지만 배치 변수를 그룹 변수와 함께 사용하여 model.matrix. 그래서 내가했고limma/voom정규화 된 카운트에, 그리고 차별적으로 발현 된 유전자를 추출했습니다. 그러나 DEG에서 히트 맵을 만들려고 할 때 동일한 샘플의 복제 클러스터링을 보는 대신 다른 배치의 샘플이 개별적으로 클러스터링되는 것을 볼 수 있습니다. 그래서 내 질문은 removeBatchEffectDEG의 카운트 데이터를 사용한 다음 히트 맵에 변환 된 데이터 세트를 사용해야하는지 아니면이 문제를 해결할 다른 방법 이 있는지 여부입니다 .

답변

5 ATpoint Aug 16 2020 at 23:58

DE 분석의 경우 원래 개수 변경을 방지하기 위해 공식에 배치를 포함해야한다는 것은 사실입니다. 그래도 히트 맵 플로팅과 같은 다른 모든 작업 removeBatchEffects은 완벽하게 괜찮으며 (적어도 나에게는) 표준적이고 잘 받아 들여진 절차입니다. 다운 스트림에서 사용하는 카운트의 배치 효과를 수정하기 위해 사용하는 것은 본질적으로 중요하지 않습니다. 결과는 비슷할 것입니다. Combat-Seqsva 패키지에서 가져온 ComBat은 특히 RNA-seq에 대한 최근 적응으로 (내가 이해하는 바에서) 데이터의 정수 수 특성을 더 잘 처리합니다. 이것은 원시 카운트에서 작동하며 limma및 둘 다에서 발생하는 악명 높은 음수 값을 방지합니다 Combat. ComBat-Seq원시 카운트에 적용한 후 edgeR (또는 원하는 도구)을 사용하여 평소와 같이 정규화 한 다음 히트 맵을 만들 수 있습니다. 보다https://github.com/zhangyuqing/ComBat-seq. DE 결과는 위에서 설명한대로 공변량으로 배치를 사용하는 일반 DE 파이프 라인에서 가져와야합니다.