Interpretazione del filtro MAC GWAS
Sto eseguendo un'analisi GWAS e cerco di capire l'influenza del filtro del conteggio degli alleli minori.Impostare il filtro all'1% mi ha dato questo grafico e sono confuso sugli stessi valori -log10 p intorno a ~ 3,8 che mostra uno strano schema (molti punti in una riga con lo stesso valore).

Se alzo il filtro al 6% i punti in una linea scompaiono ma perdo anche alcuni SNP significativi:

I campioni sono circa 77000 posizioni SNP (orzo), non imputate da GWAS (tutti i NaN rimossi). GWAS è stato eseguito con 200 campioni di fenotipo.
Come interpretare i punti in una linea?
Risposte
Sembra che la genotipizzazione non sia riuscita per alcuni campioni. Non è chiaro dall'operazione se i dati di genotipizzazione siano stati controllati per la qualità, ma consiglierei di eseguire il controllo di qualità del campione.
Una nota a margine: nei gwas umani con snps imputati, mi aspetterei di vedere grappoli di snps significativi come segno che gli snps significativi non sono un artefatto. Nell'operazione ci sono alcuni singoli snps significativi. Questo potrebbe essere un segno che quegli snp significativi sono artefatti. Ci sono anche alcuni snps che formano cluster e quindi sembrano più promettenti.