¿Por qué deberíamos sumar / restar 1 en el cálculo del valor p?
He visto esta ecuación para calcular el valor p después de una prueba de Monte-Carlo.
\ begin {ecuación} P_ {superior} = \ frac {NGE + 1} {N_ {carreras} + 1} \ quad \ quad P_ {inferior} = \ frac {NLE + 1} {N_ {carreras} + 1} \ fin {ecuación}
Fuente: https://www.biomedware.com/files/documentation/clusterseer/MCR/Monte_Carlo.htm
donde Nruns es el número total de simulaciones de Monte Carlo, NGE es el número de simulaciones para las cuales la estadística fue mayor o igual que la estadística observada, y NLE es el número de simulaciones para las cuales la estadística fue menor o igual que la observada estadística.
En esta ecuación, se agrega 1 al numerador y al denominador porque "el estadístico observado se incluye en la distribución de referencia".
Preguntas:
¿Qué significa exactamente esto y por qué debemos sumar / restar 1?
Incluso si no sumo / resto uno, todavía obtengo un valor p significativo. Por tanto, ¿cuál es estadísticamente correcto?
Tiene alguna idea sobre esto? ¡Apreciaré cualquier ayuda!
Respuestas
En general, para el cálculo del valor p, primero producimos una distribución del estadístico de prueba e integramos la distribución desde el estadístico de prueba "observado" hasta el infinito (digamos para el valor p superior). Considere la imagen de abajo. Hay dos hipótesis que se están probando por algún valor.$\mu=1$ y $\mu=0$. Primero, la integral desde el valor observado hasta el infinito se calcula para los histogramas azul y rojo. Entonces el valor p será la integral del histograma rojo dividido por el azul.

En su caso, en lugar de la integral, se toma directamente el número total de eventos (de MC) y el +1 corresponde a la incorporación del estadístico de prueba observado en ese número total.