Fattori di compressione quando il conteggio è inferiore a 25: ForCats R [duplicato]
Aug 24 2020
Ho un Race
fattore che ha 34 livelli. Poiché i conteggi in molti livelli sono inferiori a 20, desidero comprimerli in un'unica categoria: "Altro". Nota che ho già "Other"
un livello.
Vedo la documentazione per fct_collapse()
quando specifichi i livelli che vuoi comprimere in uno, ma non sono sicuro di come implementare count() < 20
in questo. Forse a, case_when
ma non sono sicuro di come.
Risposte
BastiánOleaHerrera Aug 24 2020 at 22:58
È possibile utilizzare fct_lump(f=factor, prop=0.05, other_level=“Other”)
per comprimere i livelli che rappresentano meno di una percentuale specifica del totale. È inoltre possibile utilizzare n
invece di prop
per specificare la quantità esatta di livelli che si desidera, ad esempio, 9 per ottenere 9 livelli + "Altro".