ナイーブベイズ分母の説明

Aug 21 2020

以前に解決された投稿に出くわし、フォローアップがありましたが、評判が50未満であるため、コメントできませんでした。基本的に、ナイーブベイズの分母を計算することに興味があります。

ナイーブベイズの特徴は独立していると想定されているので、計算できますか? $p(x) = p(x_{1})p(x_{2})...p(x_{n})$ または、この式を使用する必要がありますか $$p(\mathbf{x}) = \sum_k p(C_k) \ p(\mathbf{x} \mid C_k)$$ 条件付き独立性の仮定で$$ p(\mathbf{x} \mid C_k) = \Pi_{i} \, p(x_i \mid C_k) $$

私の質問は、両方の計算方法で同じp(x)が得られるかどうかです。

元の質問へのリンク: https://datascience.stackexchange.com/posts/69699/edi

編集**:申し訳ありませんが、機能には完全な独立性ではなく、条件付きの独立性があると思います。したがって、使用するのは正しくありません$p(x) = p(x_{1})p(x_{2})...p(x_{n})$

最後に、確率を見つけるために分母は実際には必要ないことを理解していますが、好奇心から質問しています。

回答

1 Erwan Aug 21 2020 at 05:24

計算方法 $p(x)$ 確かに:

$$p(x) = \sum_k p(C_k) \ p(x| C_k)$$

一般的には計算する必要があるので $p(C_k,x)$ (分子)すべての $k$、これらすべてを合計するのは簡単です $k$値。確かに、製品を使用することは正しくありません。

最後に、確率を見つけるために分母は実際には必要ないことを理解していますが、好奇心から質問しています。

限界の計算 $p(x)$ 最も可能性の高いクラスを見つけるために必要ではありません $C_k$ 理由:

$$argmax_k(\{ p(C_k|x) \}) = argmax_k(\{ p(C_k,x) \})$$

ただし、実際には事後確率を見つける必要があります $p(C_k | x)$、それが分母を計算することがしばしば役立つ理由です $p(x)$ を手に入れるために $p(C_k | x)$特に、実際の確率を出力したい場合。