¿Por qué deberíamos sumar / restar 1 en el cálculo del valor p?

Aug 16 2020

He visto esta ecuación para calcular el valor p después de una prueba de Monte-Carlo.

\ begin {ecuación} P_ {superior} = \ frac {NGE + 1} {N_ {carreras} + 1} \ quad \ quad P_ {inferior} = \ frac {NLE + 1} {N_ {carreras} + 1} \ fin {ecuación}

Fuente: https://www.biomedware.com/files/documentation/clusterseer/MCR/Monte_Carlo.htm

donde Nruns es el número total de simulaciones de Monte Carlo, NGE es el número de simulaciones para las cuales la estadística fue mayor o igual que la estadística observada, y NLE es el número de simulaciones para las cuales la estadística fue menor o igual que la observada estadística.

En esta ecuación, se agrega 1 al numerador y al denominador porque "el estadístico observado se incluye en la distribución de referencia".

Preguntas:

  1. ¿Qué significa exactamente esto y por qué debemos sumar / restar 1?

  2. Incluso si no sumo / resto uno, todavía obtengo un valor p significativo. Por tanto, ¿cuál es estadísticamente correcto?

Tiene alguna idea sobre esto? ¡Apreciaré cualquier ayuda!

Respuestas

1 CMSnoob Aug 18 2020 at 02:54

En general, para el cálculo del valor p, primero producimos una distribución del estadístico de prueba e integramos la distribución desde el estadístico de prueba "observado" hasta el infinito (digamos para el valor p superior). Considere la imagen de abajo. Hay dos hipótesis que se están probando por algún valor.$\mu=1$ y $\mu=0$. Primero, la integral desde el valor observado hasta el infinito se calcula para los histogramas azul y rojo. Entonces el valor p será la integral del histograma rojo dividido por el azul.

En su caso, en lugar de la integral, se toma directamente el número total de eventos (de MC) y el +1 corresponde a la incorporación del estadístico de prueba observado en ese número total.