Как это апостериорное вычисление было рассчитано через маргинализацию?
Я читаю статью, и в ней есть очень простая генеративная модель, которая представлена этим

Однако они вычисляют апостериорный P (A | X) способом, которого я не понимаю. Это не похоже на переформулировку правила Байеса, но, возможно, я ошибаюсь. Я вероятный нуб, так что мог бы быть.

Таким же образом они затем вычисляют апостериорную P (W | X)

Я изучал маргинализацию и не могу собрать воедино. Точно так же я знаком с правилом Байеса, но не понимаю, как оно здесь используется. Может ли кто-нибудь помочь мне с объяснением?
Спасибо!
Ответы
Начнем с правила Байеса, но используем символ пропорциональности ($\propto$), а не равенство ($=$). (Константа пропорциональности, конечно, равна$\mathsf P(X=x)^{-1}$.)
$$\begin{align}\mathsf P(A\mid X=x)&=\mathsf P(X=x,A)/\mathsf P(X=x)\\[1ex]&\propto \mathsf P(X=x,A)\end{align}$$
Далее, по закону полной вероятности.
$$\begin{align}\mathsf P(A\mid X=x)&\propto\sum_{W}\mathsf P(X=x,W,A)\end{align}$$
Остальное - это факторизация из DAG и распределение общего фактора.
$$\begin{align}\mathsf P(A\mid X=x)&\propto\sum_{W}\mathsf P(X=x\mid W)\mathsf P(W\mid A)\mathsf P(A)\\[1ex]&\propto\mathsf P(A)\sum_{W}\mathsf P(X=x\mid W)\mathsf P(W\mid A)\end{align}$$
И аналогично
$$\begin{align}\mathsf P(W\mid X=x)&=\mathsf P(X=x,W)/\mathsf P(X=x)\\&\propto \mathsf P(X=x,W)\\&\propto \sum_A\mathsf P(X=x,W,A)\\&\propto\sum_A\mathsf P(X=x\mid W)\mathsf P(W\mid A)\mathsf P(A)\end{align}$$