Dlaczego powinniśmy dodawać / odejmować 1 w obliczeniach wartości p?

Aug 16 2020

Widziałem to równanie do obliczania wartości p po teście Monte-Carlo.

\ begin {equation} P_ {upper} = \ frac {NGE + 1} {N_ {działa} + 1} \ quad \ quad P_ {dolny} = \ frac {NLE + 1} {N_ {działa} + 1} \ koniec {equation}

Źródło: https://www.biomedware.com/files/documentation/clusterseer/MCR/Monte_Carlo.htm

gdzie Nruns to całkowita liczba symulacji Monte Carlo, NGE to liczba symulacji, dla których statystyka była większa lub równa obserwowanej statystyce, a NLE to liczba symulacji, dla których statystyka była niższa lub równa obserwowanej Statystyczny.

W tym równaniu do licznika i mianownika dodaje się 1, ponieważ „obserwowana statystyka jest zawarta w rozkładzie odniesienia”.

Pytania:

  1. Co to dokładnie oznacza i dlaczego powinniśmy dodawać / odejmować 1?

  2. Nawet jeśli nie dodam / nie odejmę jedności, nadal otrzymuję znaczącą wartość p. Zatem który z nich jest poprawny statystycznie?

Jakieś przemyślenia na ten temat? Będę wdzięczny za każdą pomoc!

Odpowiedzi

1 CMSnoob Aug 18 2020 at 02:54

Ogólnie, w celu obliczenia wartości p, najpierw tworzymy rozkład statystyki testowej i integrujemy rozkład od „obserwowanej” statystyki testowej do nieskończoności (powiedzmy dla górnej wartości p). Spójrz na poniższy obrazek. Istnieją dwie hipotezy testowane pod kątem pewnej wartości$\mu=1$ i $\mu=0$. Najpierw oblicza się całkę od wartości obserwowanej do nieskończoności dla histogramów niebieskiego i czerwonego. Wtedy wartość p będzie całką z czerwonego histogramu podzieloną przez niebieską.

W twoim przypadku zamiast całki całkowita liczba zdarzeń (MC) jest brana bezpośrednio, a +1 odpowiada włączeniu obserwowanej statystyki testowej do tej całkowitej liczby.