GWAS MAC filter Интерпретация

Aug 19 2020

Я выполняю GWAS-анализ и пытаюсь понять влияние фильтра подсчета минорных аллелей. Установка фильтра на 1% дала мне этот график, и я смущен теми же значениями -log10 p около ~ 3,8, которые показывают странную картину (много точек в одной строке с тем же значением).

Если я увеличу фильтр до 6%, точки в строке исчезнут, но я потеряю также некоторые важные SNP:

Образец составляет около 77000 позиций SNP (ячмень), не импортированных из GWAS (все NaN удалены). GWAS был проведен с 200 образцами фенотипа.

Как интерпретировать точки в строке?

Ответы

1 winni2k Aug 21 2020 at 14:21

Похоже, для некоторых образцов генотипирование не удалось. Из операции неясно, контролировалось ли качество данных генотипирования, но я бы рекомендовал выполнить контроль качества образцов.

На заметку: в человеческих gwas с вмененными snps я ожидал увидеть кластеры значимых snps как признак того, что значимые snps не являются артефактом. В опе есть несколько одиночных значимых snps. Это может быть признаком того, что эти важные snps являются артефактами. Есть также некоторые snps, которые образуют кластеры и поэтому выглядят более многообещающими.