Distribuzione del numero di prove richieste per la prima occorrenza dell'evento 50 S contenenti almeno un SSSSS.

Aug 19 2020

Considera prove indipendenti ripetute di due risultati S (successo) o F (fallimento) con probabilità $p$ e $q$, rispettivamente. Determina la distribuzione del numero di prove richieste per la prima occorrenza dell'evento 50 S contenente almeno un SSSSS, cioè, in totale 50 successi e i 5 successi successivi dovrebbero verificarsi almeno una volta.

I miei sforzi:

Permettere $M_n$ essere il numero di prove richieste per la prima occorrenza del totale $n$ S. Lo abbiamo calcolato $P(M_n=k)={k-1\choose n-1}p^{n}q^{k-n}$. Permettere$N_n$ essere il numero di prove richieste per la prima occorrenza del totale $n$S contenente almeno un SSSSS. Poi$P(N_n=k)=0$ Se $n<5$. Vogliamo determinare la distribuzione di$N_{50}$.

Condizione sui seguenti possibili eventi iniziali:

  1. A1: I primi cinque risultati erano Fxxxx (con probabilità $q$ ), x = S o F,
  2. A2: I primi cinque risultati sono stati SFxxx (con probabilità $pq$ ),
  3. A3: I primi cinque risultati erano SSFxx (con probabilità $p^2q$),
  4. A4: I primi cinque risultati erano SSSFx (con probabilità $p^3q$),
  5. A5: I primi cinque risultati erano SSSSF (con probabilità $p^4q$),
  6. A6: I primi cinque risultati erano SSSSS (con probabilità $p^5$).

Nota che $P(A_1)+P(A_2)+P(A_3)+P(A_4) +P(A_5)+P(A_6)=1$.

Permettere $k>5$.

Nel caso 1, $P(N_n=k∣\text{first result was F})=P(N_n=k−1)$ perché non abbiamo compiuto alcun progresso verso $n$ S contenente SSSSS con il primo risultato, e ora ci sono $k−1$ prove rimanenti da ottenere $n$ S contenente SSSSS.

Nel caso 2, $P(N_n=k∣\text{first two results were SF})=P(N_{n-1}=k−2)$. Anche se non abbiamo compiuto alcun progresso verso SSSSS con i primi due risultati, abbiamo una S e c'è$(n-1)$S rimanenti. Adesso ci sono$k−2$ prove rimanenti da ottenere $(n-1)$ S contenente SSSSS.

Nel caso 3, $P(N_n=k∣\text{first three results were SSF})=P(N_{n-2} =k−3)$. Anche se non abbiamo fatto alcun progresso verso SSSSS con i primi tre risultati, ma abbiamo due S e ci sono$(n-2)$S rimanenti. Adesso ci sono$k−3$ prove rimanenti da ottenere $(n-2)$ S contenente SSSSS.

Nel caso 4, $P(N_n=k∣\text{first four results were SSSF})=P(N_{n-3} =k−4)$. Anche se non abbiamo compiuto alcun progresso verso SSSSS con i primi quattro risultati, abbiamo tre S e c'è$(n-3)$S rimanenti. Adesso ci sono$k−4$ prove rimanenti da ottenere $(n-3)$ S contenente SSSSS.

Nel caso 5, $P(N_n=k∣\text{first five results were SSSSF})=P(N_{n-4} =k−5)$. Anche se non abbiamo fatto alcun progresso verso SSSSS con i primi cinque risultati, ma abbiamo quattro S e c'è$(n-4)$S rimanenti. Adesso ci sono$k−5$ prove rimanenti da ottenere $(n-4)$ S contenente SSSSS.

Nel caso 6, $P(N_n=k\mid\text{first five results were SSSSS})=P(M_{n-5}=k−5)$. Abbiamo già SSSSS. Non dobbiamo più preoccuparci di SSSSS. Dobbiamo solo arrivare$(n-5)$S e abbiamo finito. Adesso ci sono$k−5$ prove rimanenti da ottenere $(n-5)$ S.

Se metti tutto insieme usando la Legge della Probabilità Totale $$P(N_n =k)=P(N_n =k\mid A_1)P(A_1)+P(N_n =k\mid A_2)P(A_2)+ +\cdots+P(N_n =k\mid A_6)P(A_6),$$ dove $A_1, A_2, A_3, \ldots, A_6$ sono i 6 possibili eventi iniziali, quindi ottieni la formula ricorsiva per $k> 5$,

$$P(N_n =k)=qP(N_n =k−1)+pqP(N_{n-1} =k−2)+p^2qP(N_{n-2} =k−3) +\cdots+ p^4qP(N_{n-4} =k−5)+p^5P(M_{n-5}=k−5)$$

Sono sulla strada giusta? Alcune cose strane accadono quando ho provato a calcolare il caso base$P(N_5=k)$. Per favore dimmi cos'è$P(N_5=k)$ e aiutami a verificare la relazione ricorsiva per $P(N_6=k)$.

Risposte

2 MarkusScheuer Sep 05 2020 at 19:15

Questa risposta è un approccio basato sulla funzione generatrice basato sul metodo dei cluster Goulden-Jackson . Mostreremo per$5\leq r\leq k$: \ begin {align *} \ color {blue} {P (M_r = k)} & \ color {blue} {= \ left (\ sum_ {j \ geq 1} (- 1) ^ {j + 1} \ binom {k-r + 1} {j} \ binom {k-5j} {kr} \ right.} \\ & \ qquad \ color {blue} {\ left .- \ sum_ {j \ geq 1} (- 1) ^ {j + 1} \ binom {kr} {j} \ binom {k-1-5j} {k-1-r} \ right) p ^ rq ^ {kr}} \ tag {1} \ end {align *} dove le somme in (1) sono finite da allora$\binom{s}{t}=0$ per integrale $0<s<t$.

Primo passo: una funzione generatrice

Consideriamo l'insieme di parole di lunghezza $k\geq 0$ costruito da un alfabeto $$\mathcal{V}=\{S,F\}$$ e il set $B=\{SSSSS\}$di parolacce , che non possono far parte delle parole che stiamo cercando in una prima fase. Deriveremo una funzione generatrice$G(z)$ dove $[z^k]G(z)$, il coefficiente di $z^k$ di $G(z)$ fornisce il numero di parole binarie di lunghezza $k$ che non contengono $SSSSS$.

Dal momento che vogliamo che il numero di parole che fanno contengono$SSSSS$, prendiamo la funzione generatrice di tutte le parole binarie che è $1+2z+4z^2+8z^3+\cdots = \frac{1}{1-2z}$ e sottrarre $G(z)$da. In questo modo otteniamo$H(z) = \frac{1}{1-2z}-G(z)$.

Secondo il documento (p.7) la funzione generatrice $G(z)$ è \ begin {align *} G (z) = \ frac {1} {1-dz- \ text {weight} (\ mathcal {C})} \ tag {2} \ end {align *} con$d=|\mathcal{V}|=2$, la dimensione dell'alfabeto e $\mathcal{C}$il numeratore di peso delle parolacce con \ begin {align *} \ text {weight} (\ mathcal {C}) = \ text {weight} (\ mathcal {C} [SSSSS]) \ end {align *}

Calcoliamo in base al foglio \ begin {align *} \ text {weight} (\ mathcal {C} [S ^ 5]) & = - z ^ 5-z \ cdot \ text {weight} (\ mathcal {C} [S ^ 5]) - \ cdots-z ^ 4 \ cdot \ text {weight} (\ mathcal {C} [S ^ 5]) \ tag {3} \\ \ end {align *}

e ottieni \ begin {align *} \ text {weight} (\ mathcal {C}) = \ text {weight} (\ mathcal {C} [S ^ 5]) = - \ frac {z ^ 5 (1-z )} {1-z ^ 5} \ end {align *}

Segue da (2) e (3):

\ begin {align *} G (z) & = \ frac {1} {1-dz- \ text {weight} (\ mathcal {C})} \\ & = \ frac {1} {1-2z + \ frac {z ^ 5 (1-z)} {1-z ^ 5}} \\ & = \ frac {1-z ^ 5} {1-2z + z ^ 6} \ tag {4} \\ \ end { allineare*}

Da (4) otteniamo \ begin {align *} H (z) = \ frac {1} {1-2z} - \ frac {1 + z ^ 5} {1-2z + z ^ 6} \ tag {5 } \ end {align *}

Secondo passo: un affinamento

Poiché stiamo cercando il numero di parole valide di lunghezza $k$ che contengono $50 S$ resp. $r\geq 5$ S in generale, abbiamo bisogno di un affinamento di $H(z)$ per tenere traccia del numero di successi $S$. Per fare ciò contrassegniamo i successi con$s$.

Otteniamo da (3) \ begin {align *} \ text {weight} (\ mathcal {C} [S ^ 5]) & = - (sz) ^ 5- (sz) \ text {weight} (\ mathcal { C} [S ^ 5]) - \ cdots- (sz) ^ 4 \ text {weight} (\ mathcal {C} [S ^ 5]) \ end {align *} e ottieni \ begin {align *} \ text {weight} (\ mathcal {C}) = - \ frac {(sz) ^ 5 (1-sz)} {1- (sz) ^ 5} \ end {align *}

Usando questo peso generalizzato otteniamo una funzione generatrice $H(z;s)$ \ begin {align *} H (z; s) & = \ frac {1} {1- (1 + s) z} - \ frac {1} {1- (1 + s) z + \ frac {(sz) ^ 5 (1-sz)} {1- (sz) ^ 5}} \\ & = \ frac {1} {1- (1 + s) z} - \ frac {1- (sz) ^ 5} { 1- (1 + s) z + s ^ 5z ^ 6} \ end {align *}

Terzo passo: parole che terminano con successo $S$.

Il coefficiente $[s^rz^k]H(z;s)$ fornisce il numero di parole di lunghezza $k$ contenente esattamente $r$ S con piste a S di lunghezza $5$, ma non necessariamente con una S alla fine. Per forzare ciò sottraiamo le parole di lunghezza$k$ che contengono esattamente $r$ S e S piste di S di lunghezza $5$ e terminare con $F$.

In questo modo otteniamo finalmente la funzione di generazione desiderata \ begin {align *} \ color {blue} {H (z; s) (1-z)} & \ color {blue} {= \ frac {1-z} {1 - (1 + s) z} - \ frac {\ left (1- (sz) ^ 5 \ right) (1-z)} {1- (1 + s) z + s ^ 5z ^ 6}} \ tag {6} \\ & = s ^ 5z ^ 5 + (s + f) s ^ 5z ^ 6 + \ left (s ^ 2 + 3sf + f ^ 2 \ right) s ^ 5z ^ 7 \\ & \ qquad + \ sinistra (s ^ 3 + 5s ^ 2f + 5sf ^ 2 + f ^ 3 \ right) s ^ 5z ^ 8 \\ & \ qquad + \ left (s ^ 4 + 7s ^ 3f + \ color {blue} {12} s ^ 2f ^ 2 + 7sf ^ 3 + f ^ 4 \ right) s ^ 5z ^ 9 + \ cdots \ end {align *} dove l'ultima riga è stata calcolata con l'aiuto di Wolfram Alpha.

Notare che i coefficienti della serie corrispondono alle voci della tabella dichiarate da @GCab.

Guardando ad esempio al coefficiente contrassegnato in blu $12$ di $s^7f^2z^9$ questo dà il numero di parole di lunghezza $9$ contenente $7$ S almeno una serie di $5$S e termina con S. Queste parole sono \ begin {align *} \ color {blue} {SSSSS} SFFS & \ qquad SSFF \ color {blue} {SSSSS} \\ \ color {blue} {SSSSS} FSFS e \ qquad SFSF \ color {blue} {SSSSS} \\ \ color {blue} {SSSSS} FFSS e \ qquad SFFS \ color {blue} {SSSSS} \\ SF \ color {blue} {SSSSS} FS e \ qquad FSSF \ color {blue} { SSSSS} \\ FS \ color {blue} {SSSSS} FS & \ qquad FSFS \ color {blue} {SSSSS} \\ F \ color {blue} {SSSSS} FSS & \ qquad FFSS \ color {blue} {SSSSS} \ end {align *} dove viene eseguito il file più a destra$5$ S è contrassegnata in blu.

Coefficienti di $H(z;s)(1-z)$:

Infine calcoliamo i coefficienti di $H(z;s)(1-z)$. Cominciamo con

\ begin {align *} [s ^ rz ^ k] H (z; s) & = [s ^ rz ^ k] \ frac {1} {1- (1 + s) z} - [s ^ rz ^ k ] \ frac {1} {1- (1 + s) z + \ frac {(sz) ^ 5 (1- (sz))} {1- (sz) ^ 5}} \\ & = [s ^ rz ^ k] \ frac {1} {1- (1 + s) z} - [s ^ rz ^ k] \ frac {1- (sz) ^ 5} {1- (1 + s) z + s ^ 5z ^ 6} \ end {align *}

All'inizio la parte facile:

\ begin {align *} \ color {blue} {[s ^ rz ^ k] \ frac {1} {1- (1 + s) z}} = [s ^ rz ^ k] \ sum_ {j = 0} ^ {\ infty} (1 + s) ^ jz ^ j = [s ^ r] (1 + s) ^ k \, \, \ color {blue} {= \ binom {k} {r}} \ tag { 7} \ end {align *}

Ora la parte un po 'allungata. Otteniamo

\ begin {align *} \ color {blue} {[s ^ rz ^ k]} & \ color {blue} {\ frac {1} {1- (1 + s) z + s ^ 5z ^ 6}} \ \ & = [s ^ rz ^ k] \ sum_ {j = 0} ^ \ infty \ left ((1 + s) zs ^ 5z ^ 6 \ right) ^ j \\ & = [s ^ rz ^ k] \ sum_ {j = 0} ^ \ infty z ^ j \ left ((1 + s) -s ^ 5z ^ 5 \ right) ^ j \\ & = [s ^ r] \ sum_ {j = 0} ^ k [ z ^ {kj}] \ sum_ {l = 0} ^ j \ binom {j} {l} (- 1) ^ ls ^ {5l} z ^ {5l} (1 + s) ^ {jl} \ tag { 8} \\ & = [s ^ r] \ sum_ {j = 0} ^ k [z ^ j] \ sum_ {l = 0} ^ {kj} \ binom {kj} {l} (- 1) ^ ls ^ {5l} z ^ {5l} (1 + s) ^ {kjl} \ tag {9} \\ & = [s ^ r] \ sum_ {j = 0} ^ {\ left \ lfloor k / 5 \ right \ rfloor} [z ^ {5j}] \ sum_ {l = 0} ^ {k-5j} \ binom {k-5j} {l} (- 1) ^ ls ^ {5l} z ^ {5l} (1 + s) ^ {k-5j-l} \ tag {10} \\ & = [s ^ r] \ sum_ {j = 0} ^ {\ left \ lfloor k / 5 \ right \ rfloor} \ binom {k -5j} {j} (- 1) ^ js ^ {5j} (1 + s) ^ {k-6j} \ tag {11} \\ & = \ sum_ {j = 0} ^ {\ min \ {\ sinistra \ lfloor k / 5 \ right \ rfloor, \ left \ lfloor r / 5 \ right \ rfloor \}} (- 1) ^ j \ binom {k-5j} {j} [s ^ {r-5j}] (1 + s) ^ {k-6j} \\ & = \ sum_ {j \ geq 0} (- 1) ^ j \ binom {k-5j} {j} \ binom {k-6j} {r-5j } \ tag {12} \\ & \, \, \ color {blue} {= \ sum_ {j \ geq 0} (- 1) ^ j \ binom {kr} {j} \ binom {k-5j} { kr}} \ tag {13} \ end {align *}

Commento:

  • In (8) applichiamo la regola $[z^s]z^tA(z)=[z^{s-t}]A(z)$. Abbiamo anche impostato il limite superiore della somma esterna su$k$ poiché altri valori non contribuiscono al coefficiente di $z^k$.

  • In (9) cambiamo l'ordine di sommatoria della somma esterna $j \to k-j$.

  • In (10) osserviamo che dobbiamo prendere multipli di $5$ solo dell'indice $j$ a causa del termine $z^{5l}$.

  • In (11) selezioniamo il coefficiente di $z^{5j}$.

  • In (12) selezioniamo il coefficiente di $s^{r-5j}$.

  • In (13) usiamo l'identità binomiale \ begin {align *} \ binom {k-5j} {j} \ binom {k-6j} {r-6j} & = \ frac {(k-5j)!} { j!} \, \ frac {1} {(r-6j)! (krj)!} \\ & = \ frac {1} {j! (r-6j)!} \, \ frac {(k-5j )!} {(kr)!} = \ binom {r-5j} {j} \ binom {k-5j} {kr} \ end {align *}

e segue da (6) e (13): \ begin {align *} [s ^ rz ^ k] & \ frac {1- (sz) ^ 5} {1- (1 + s) z + s ^ 5z ^ 6} \\ & = \ left ([s ^ rz ^ k] - [s ^ {r-5} z ^ {k-5}] \ right) \ frac {1} {1- (1 + s) z + s ^ 5z ^ 6} \\ & = \ sum_ {j \ geq 0} (- 1) ^ j \ binom {kr} {j} \ binom {k-5j} {kr} - \ sum_ {j \ geq 0} (- 1) ^ j \ binom {kr} {j} \ binom {k-5-5j} {kr} \\ & = \ binom {k} {r} + \ sum_ {j \ geq 1} \ binom {kr} {j} \ binom {k-5j} {kr} + \ sum_ {j \ geq 1} (- 1) ^ j \ binom {kr} {j-1} \ binom {k-5j} {kr} \\ & = \ binom {k} {r} + \ sum_ {j \ geq 1} (- 1) ^ j \ binom {k-r + 1} {j} \ binom {k-5j} { kr} \ tag {14} \ end {align *}

e otteniamo \ begin {align *} \ color {blue} {[s ^ rz ^ k] H (z; s)} & = [s ^ rz ^ k] \ frac {1} {1- (1 + s ) z} - [s ^ rz ^ k] \ frac {1- (sz) ^ 5} {1- (1 + s) z + s ^ 5z ^ 6} \\ & \, \, \ color {blue} {= \ sum_ {j \ geq 1} (- 1) ^ {j + 1} \ binom {k-r + 1} {j} \ binom {k-5j} {kr}} \ tag {15} \ end {allineare*}

Ultimo passaggio: mettere tutto insieme

Consideriamo il caso (interessante) $5\leq r\leq k$solo. Prendendo i risultati da (6) e (15) possiamo ora scrivere i coefficienti di$H(z;s)(1-z)$ come

\ begin {align *} [s ^ rz ^ k] & H (z; s) (1-z) \\ & = [s ^ rz ^ k] H (z; s) - [s ^ rz ^ {k- 1}] H (z; s) \\ & = \ sum_ {j \ geq 1} (- 1) ^ {j + 1} \ binom {k-r + 1} {j} \ binom {k-5j} {kr} \\ & \ qquad- \ sum_ {j \ geq 1} (- 1) ^ {j + 1} \ binom {kr} {j} \ binom {k-1-5j} {k-1-r } \ end {align *} e segue l'affermazione (1).

1 GCab Sep 03 2020 at 22:33

a) Il tuo approccio per dedurre la ricorrenza è corretto, il problema è fissare le condizioni iniziali appropriate e i limiti di validità.

b) Allo scopo di risolverlo chiaramente dobbiamo procedere come segue.

Data una sequenza di prove di Bernoulli, con probabilità di successo $p$ (fallimento $q=(1-p)$), consentitemi di rappresentarlo con una stringa binaria $1 = $ successo, $0 =$fallimento in modo da mantenere la congruenza con altri post a cui collegherò.
Per lo stesso motivo e per mettere la tua ricorrenza con condizioni iniziali adeguate, permettimi di cambiare le tue denominazioni e di riflettere

le stringhe binarie di lunghezza $n$, avendo $m$ zeri e $s$quelli, compreso uno che è fissato alla fine della stringa;
andiamo anche in generale e consideriamo percorsi di durata consecutiva$r$.

Indichiamo come $$ P(s,r,n) = N_c (s,r,n)\, p^{\,s } q^{\,n - s} $$ la probabilità che in una stringa di lunghezza $n$, con totale $s$ e terminando con uno, potrebbero esserci sequenze consecutive di lunghezza $r$ o maggiore.

Ora la tua ricorrenza si legge $$ \eqalign{ & P(s,r,n) = q\,P(s,r,n - 1) + pq\,P(s - 1,r,n - 2) + p^{\,2} q\,P(s - 1,r,n - 2) + \cr & + \cdots + p^{\,4} q\,P(s - r + 1,r,n - r) + \left( \matrix{ n - 1 - r \hfill \cr s - 1 - r \hfill \cr} \right)p^{\,s} q^{\,n - s} \cr} $$

Notare che ogni termine è un polinomio omogeneo in $p^s\, q^{n-s}$, quindi non abbiamo bisogno di portarli in giro e possiamo concentrarci proficuamente sul numero di stringhe fornite da $N_c$, questo è $$ \bbox[lightyellow] { \eqalign{ & N_c (s,r,n) = \cr & = \left\{ {\matrix{ 1 & {\left| \matrix{ \;0 \le r \le s \hfill \cr \;1 \le s = n \hfill \cr} \right.} \cr {\sum\limits_{k = 0}^{r - 1} {N_c (s - k,r,n - 1 - k)} + \binom{ n - r - 1 }{ s - r - 1 } } & {\left| \matrix{ \;0 \le r \le s \hfill \cr \;1 \le s < n \hfill \cr} \right.} \cr 0 & {{\rm otherwise}} \cr } } \right. \cr} } \tag{1}$$

Per quanto riguarda le condizioni,

  • il caso $s=n$ non è stato trattato nella costruzione e deve essere aggiunto;
  • a causa di quello in ultima posizione, $s$ deve essere maggiore di $1$;
  • i restanti sono evidenti.

La ricorrenza di cui sopra è stata verificata con calcolo diretto per i valori più piccoli dei parametri.
Esempio:

c) La ricorrenza (1) può essere risolta in forma chiusa come somma finita.

Considera infatti le stringhe di questo tipo

Il loro numero totale è $\binom{n}{s}$ e quelli che hanno una corsa di lunghezza $r$ o maggiore sono $N_c (s+1,r, n+1)$. Pertanto, il complemento di$N_c$ rappresenterà le stringhe della stessa architettura, che hanno funzionato fino a $r-1$.

Il numero di stringhe composte come sopra ma esclusa l'ultima, che ha tratti di lunghezza fino a $r-1$ è dato da $$ N_b (s,r - 1,m + 1) $$ dove $$ N_b (s,r,m)\quad \left| {\;0 \leqslant \text{integers }s,m,r} \right.\quad = \sum\limits_{\left( {0\, \leqslant } \right)\,\,k\,\,\left( { \leqslant \,\frac{s}{r+1}\, \leqslant \,m} \right)} {\left( { - 1} \right)^k \binom{m}{k} \binom { s + m - 1 - k\left( {r + 1} \right) } { s - k\left( {r + 1} \right)}\ } $$ come spiegato in vari post, si riferiscono principalmente a questo ea quest'altro .

Ma a causa della presenza di quello alla fine, dobbiamo sottrarre da quanto sopra le stringhe che terminano con zero più $ r-1$ quelli, dando una corsa finale di $r$.
Questi sono $$ N_b (s-r+1,r - 1,m ) $$ e lo concludiamo $$ \bbox[lightyellow] { \eqalign{ & N_c (s + 1,r,n + 1) = N_c (s + 1,r,s + m + 1) = \cr & = \left( \matrix{ s + m \cr s \cr} \right) - N_b (s,r - 1,m + 1) + N_b (s - r + 1,r - 1,m) = \cr & = \left( \matrix{ n \cr s \cr} \right) - N_b (s,r - 1,n - s + 1) + N_b (s - r + 1,r - 1,n - s) \quad \left| {\;0 \le s,r,m} \right. \cr} } \tag{2}$$

$N_b$è più presente in letteratura, ha molte relazioni ricorrenti e un semplice ogf. Per non rendere la risposta troppo lunga, non sto entrando nei dettagli.

d) Riassumendo $n$.

Considerare le corde composte come mostrato nello schizzo al par. c) sopra.

Il loro numero totale è $\binom {s+m}{s} = \binom {n}{s}$ e ognuno ha la stessa probabilità $p^{s+1}\, q^m = p^{s+1}\, q^{n-s}$.

Mantenere $n$ fisso e sommando $s$ noi abbiamo $$ \sum\limits_{\left( {0\, \le } \right)\,s\,\left( { \le \,n} \right)} {\binom{ n }{ s } p^{\,s + 1} q^{\,n - s} } = p\left( {p + q} \right)^{\,n} = p $$ il che è ovvio, poiché se aggiungiamo le stringhe complementari che terminano con zero otteniamo $(p+q)^{n+1} =1$.

Mantenere invece $s$ fisso e sommato $n$, che significa sommare $m$, dà $$ \eqalign{ & \sum\limits_{\left( {0\, \le \,s\, \le } \right)\,n\,} {\binom{ n }{s} p ^{\,s + 1} q^{\,n - s} } = \sum\limits_{\left( {0\, \le } \right)\,\,m\,} {\binom{ s + m }{m} p^{\,s + 1} q^{\,m} } = \cr & = p^{\,s + 1} \sum\limits_{\left( {0\, \le } \right)\,\,m\,} {\binom{ - s - 1 }{m} \left( { - 1} \right)^{\,m} q^{\,m} } = {{p^{\,s + 1} } \over {\left( {1 - q} \right)^{\,s + 1} }} = 1 \cr} $$ che è la distribuzione binomiale negativa .

Poiché, per il suo significato combinatorio, abbiamo $$ \left\{ \matrix{ 0 \le N_c (s + 1,r,n + 1) \le N_c (s + 1,r - 1,n + 1) \le \binom{n }{ s } \hfill \cr N_c (s + 1,s + 2,n + 1) = 0 \hfill \cr N_c (s + 1,s + 1,n + 1) = 1 \hfill \cr N_c (s + 1,1,n + 1) = \binom{n }{ s } \hfill \cr N_c (s + 1,0,n + 1) = \binom{n }{ s } \hfill \cr } \right. $$ poi $$ 0 \le P_c (s + 1,r,p) = \sum\limits_{\left( {0\, \le \,s\, \le } \right)\,n\,} {N_c (s + 1,r,n + 1)p^{\,s + 1} q^{\,n - s} } \le 1 \quad \left| \matrix{ \,0 \le s \hfill \cr \;0 \le r \le s + 1 \hfill \cr \;0 < p < 1 \hfill \cr} \right. $$ converge (anche se lentamente) e dato$s,p$, è un CDF in formato$(s+1-r)$ (eventualmente con un ulteriore spostamento del supporto).

Sfortunatamente, per quanto ne so, la somma in $n$ di $N_c$ (e di $N_b$) non ha una forma chiusa: re. a questo post già citato .
È comunque possibile calcolare, da (2), un double ogf se si è interessati.

bonez001 Sep 06 2020 at 06:43

Potrebbe esserci un approccio più semplice.

Sia N il numero di prove e P (N) la sua probabilità date le condizioni di cui sopra, allora:

$$P(N) = \sum_{S \in S'} p^5\prod_{j \in S} q^{j} p_{j}$$ dove S 'è tutte le partizioni intere (e le loro altre possibili permutazioni senza elementi duplicati ripetuti) di N-50 inclusi gli zeri con lunghezza fissa 45 e N> = 50.

E in generale, se si vuole trovare la distribuzione di N dato che ci sono in M ​​successi e la presenza di m successi successivi, allora:

$$P(N) = \sum_{S \in S'} p^m \prod_{j \in S} q^{j} p_{j}$$

dove S 'sono tutte le partizioni intere (e le loro altre possibili permutazioni senza elementi duplicati ripetuti) di NM compresi gli zeri con lunghezza fissa Nm e N> = M.

PS Non è una soluzione chiusa ma è abbastanza utile e migliore della simulazione.