Как это апостериорное вычисление было рассчитано через маргинализацию?

Aug 20 2020

Я читаю статью, и в ней есть очень простая генеративная модель, которая представлена ​​этим

.

Однако они вычисляют апостериорный P (A | X) способом, которого я не понимаю. Это не похоже на переформулировку правила Байеса, но, возможно, я ошибаюсь. Я вероятный нуб, так что мог бы быть.

. Они имеют маргинализацию по W, но я не понимаю, как это приводит к задней части. Как они вывели эту формулу? Как это работает?

Таким же образом они затем вычисляют апостериорную P (W | X)

. Это выглядит похоже, но идентично, потому что теперь они маргинализируются по сравнению с A, включая p (A), тогда как раньше при маргинализации по W не было задействовано p (W). Это тот же метод?

Я изучал маргинализацию и не могу собрать воедино. Точно так же я знаком с правилом Байеса, но не понимаю, как оно здесь используется. Может ли кто-нибудь помочь мне с объяснением?

Спасибо!

Ответы

2 GrahamKemp Aug 20 2020 at 09:24

Начнем с правила Байеса, но используем символ пропорциональности ($\propto$), а не равенство ($=$). (Константа пропорциональности, конечно, равна$\mathsf P(X=x)^{-1}$.)

$$\begin{align}\mathsf P(A\mid X=x)&=\mathsf P(X=x,A)/\mathsf P(X=x)\\[1ex]&\propto \mathsf P(X=x,A)\end{align}$$

Далее, по закону полной вероятности.

$$\begin{align}\mathsf P(A\mid X=x)&\propto\sum_{W}\mathsf P(X=x,W,A)\end{align}$$

Остальное - это факторизация из DAG и распределение общего фактора.

$$\begin{align}\mathsf P(A\mid X=x)&\propto\sum_{W}\mathsf P(X=x\mid W)\mathsf P(W\mid A)\mathsf P(A)\\[1ex]&\propto\mathsf P(A)\sum_{W}\mathsf P(X=x\mid W)\mathsf P(W\mid A)\end{align}$$


И аналогично

$$\begin{align}\mathsf P(W\mid X=x)&=\mathsf P(X=x,W)/\mathsf P(X=x)\\&\propto \mathsf P(X=x,W)\\&\propto \sum_A\mathsf P(X=x,W,A)\\&\propto\sum_A\mathsf P(X=x\mid W)\mathsf P(W\mid A)\mathsf P(A)\end{align}$$