Usuwanie efektu partii w mapach termicznych po analizie różnicowej ekspresji genów
Pracuję nad zbiorem danych, w którym pierwsza replika każdej grupy to jedna partia, a druga replika znajduje się w drugiej partii. Po sprawdzeniu PCA
wykresu i zobaczeniu efektu partii w PC1, użyłem removeBatchEffect
funkcji z limmy, aby odjąć efekt partii od moich danych zliczania. Następnie użycie PCA daje mi fabułę, która nie wydaje się mieć żadnego widocznego efektu wsadu! Zaleca się jednak, aby nie używać korekcji efektu partii do różnicowej analizy genów, ale używać zmiennej partii wraz ze zmienną grupy w konstruowaniu model.matrix
. Więc zrobiłem to, pobiegłemlimma/voom
na znormalizowanych liczbach i wyodrębniono geny o różnej ekspresji. Jednak kiedy próbuję utworzyć mapę cieplną z DEG, nadal widzę, że próbki z różnych partii są grupowane osobno, zamiast widzieć skupienia powtórzeń tej samej próbki. Moje pytanie brzmi więc, czy powinienem użyć removeBatchEffect
danych zliczania z DEG, a następnie użyć przekształconego zestawu danych dla map ciepła, czy jest inny sposób, aby to naprawić?
Odpowiedzi
Prawdą jest, że w przypadku analizy DE należy uwzględnić partię we wzorze, aby uniknąć zmiany pierwotnych liczebności. Jednak w przypadku wszystkich innych czynności, takich jak kreślenie map ciepła, użycie removeBatchEffects
jest całkowicie w porządku i (przynajmniej dla mnie) jest to standardowa i dobrze przyjęta procedura. Zasadniczo nie ma znaczenia, czego użyjesz, aby skorygować efekt wsadowy dla zliczeń używanych poniżej. Wyniki prawdopodobnie będą podobne. Combat-Seq
z pakietu sva to niedawna adaptacja ComBat specjalnie dla RNA-seq, która (z tego, co rozumiem) lepiej radzi sobie z naturą danych o liczbie całkowitej. Działa to na surowych liczbach i pozwala uniknąć niesławnych wartości ujemnych, które występują czasami w przypadku obu limma
i Combat
. Po zastosowaniu ComBat-Seq
na surowych licznikach możesz normalizować je jak zwykle za pomocą edgeR (lub dowolnego narzędzia, które lubisz), a następnie tworzyć mapy cieplne. Widziećhttps://github.com/zhangyuqing/ComBat-seq. Wyniki DE nadal powinny pochodzić z normalnego potoku DE z partią jako współzmienną, jak omówiono powyżej.