カウントが25未満の場合の折りたたみ係数:ForCats R [重複]

Aug 24 2020

私が持っているRace34個のレベルを持っている要因を。多くのレベルのカウントは20未満なので、「その他」という1つのカテゴリにまとめたいと思います。私はすでに"Other"1つのレベルとして持っていることに注意してください。

fct_collapse()1つにまとめたいレベルを指定しているときに、のドキュメントが表示されますがcount() < 20、これを実装する方法がわかりません。たぶんcase_whenですが、どうすればいいのかわかりません。

回答

BastiánOleaHerrera Aug 24 2020 at 22:58

を使用fct_lump(f=factor, prop=0.05, other_level=“Other”)して、全体の特定のパーセンテージ未満を表すレベルを折りたたむことができます。n代わりにpropを使用して、必要なレベルの正確な量を指定することもできます。たとえば、9で9レベル+「その他」を取得します。