È vero che la parola prior dovrebbe essere usata solo con variabili casuali latenti?

Aug 24 2020

Io penso che qualsiasi distribuzione marginale su una variabile casuale possa essere chiamata distribuzione di probabilità a priori.

È vero?

O è falso perché la variabile casuale in esame potrebbe non essere una variabile casuale latente e il termine prior dovrebbe essere usato rigorosamente con le distribuzioni marginali solo su una variabile casuale latente?

Risposte

9 Xi'an Aug 24 2020 at 13:26

Il termine precedente (così come posteriore ) è solitamente riservato alle distribuzioni definite in un framework bayesiano su oggetti che non sono considerati variabili casuali da altri approcci inferenziali, vale a dire parametri . I modelli a variabili latenti sono più spesso definiti al di fuori della dicotomia bayesiana / non bayesiana e la distribuzione della variabile latente dipende generalmente dai parametri, quindi è anche condizionata alla realizzazione di questi parametri in un quadro bayesiano. Poiché è una questione di terminologia, non c'è vero o falso (o giusto o sbagliato) per chiamare una distribuzione marginale a precedente, ma questo può confondere allo stesso modo bayesiani e non bayesiani.

6 HaotianChen Aug 24 2020 at 16:33

Prima di rispondere alla tua domanda, spieghiamo innanzitutto una mentalità bayesiana di base.

Nella statistica bayesiana, tutto è una variabile casuale, l'unica differenza tra queste variabili casuali è se sono osservate o nascoste . Dì ad esempio se credi$X$ segue una distribuzione definita da $\theta$, denota $$ X \sim P(X|\theta) $$ Dove $\theta$è il parametro della distribuzione, dal punto di vista bayesiano è anche una variabile casuale. Di solito in questo caso variabile casuale$X$ è osservato e $\theta$ non lo è e vuoi dedurre / imparare / valutare $\theta$in base alle tue osservazioni. In tali situazioni non c'è questione di "precedente", "marginale" o "posteriore"

Il termine "precedente", "marginale" o "posteriore" è importante quando credi $\theta$ segue qualche altra distribuzione $$ \theta \sim P(\theta|\gamma) $$Quindi chiamiamo questa "altra distribuzione" la precedente , più specificamente è la distribuzione piror per$\theta$. Tra tutte e tre le variabili casuali$X$, $\theta$ e $\gamma$, generalmente $X$ e $\gamma$ sono osservati, $\theta$ non lo è e vuoi stimare $\theta$ basato sull'osservato $X$ e $\gamma$. Quindi sì, il termine "precedente" di solito è su variabili casuali nascoste, ovviamente puoi credere che esista una distribuzione precedente per$\theta$anche quando viene osservato, ma di solito nessuno lo fa (perché qualcuno dovrebbe stimare qualcosa che è già osservato?). E se non puoi osservare$\gamma$, puoi anche supporre $\gamma$ segue una distribuzione definita da un'altra variabile casuale $\eta$, poi $P(\gamma | \eta)$ sarà il priore per $\gamma$. Spero che questo risponda alla tua domanda in merito a "precedente".

Parliamo ora di "marginale". Nell'esempio precedente le persone solitamente interessate alla distribuzione di$X$ (mentre $\theta$ è nascosto), dato $\gamma$, la distribuzione $$ X \sim P(X|\gamma) $$si chiama "distribuzione marginale". Il termine "marginale" deriva dal fatto che$P(X|\gamma)$ si acquisisce emarginando $\theta$ dalla distribuzione congiunta: $$ p(X|\gamma) = \int_\theta p(X|\theta)p(\theta|\gamma) $$