Fattori di compressione quando il conteggio è inferiore a 25: ForCats R [duplicato]

Aug 24 2020

Ho un Racefattore che ha 34 livelli. Poiché i conteggi in molti livelli sono inferiori a 20, desidero comprimerli in un'unica categoria: "Altro". Nota che ho già "Other"un livello.

Vedo la documentazione per fct_collapse()quando specifichi i livelli che vuoi comprimere in uno, ma non sono sicuro di come implementare count() < 20in questo. Forse a, case_whenma non sono sicuro di come.

Risposte

BastiánOleaHerrera Aug 24 2020 at 22:58

È possibile utilizzare fct_lump(f=factor, prop=0.05, other_level=“Other”)per comprimere i livelli che rappresentano meno di una percentuale specifica del totale. È inoltre possibile utilizzare ninvece di propper specificare la quantità esatta di livelli che si desidera, ad esempio, 9 per ottenere 9 livelli + "Altro".