Distribución del número de ensayos necesarios para la primera aparición del evento 50 S que contiene al menos un SSSSS.

Aug 19 2020

Considere ensayos independientes repetidos de dos resultados S (éxito) o F (fracaso) con probabilidades $p$ y $q$, respectivamente. Determine la distribución del número de ensayos requeridos para la primera ocurrencia del evento 50 S que contiene al menos un SSSSS, es decir, 50 éxitos en total y los 5 éxitos sucesivos deben ocurrir al menos una vez.

Mis esfuerzos:

Dejar $M_n$ sea ​​el número de ensayos necesarios para la primera aparición de $n$ S. Hemos calculado que $P(M_n=k)={k-1\choose n-1}p^{n}q^{k-n}$. Dejar$N_n$ sea ​​el número de ensayos necesarios para la primera aparición de $n$S que contiene al menos un SSSSS. Entonces$P(N_n=k)=0$ Si $n<5$. Queremos determinar la distribución de$N_{50}$.

Condición sobre los siguientes posibles eventos iniciales:

  1. A1: Los primeros cinco resultados fueron Fxxxx (con probabilidad $q$ ), x = S o F,
  2. A2: Los primeros cinco resultados fueron SFxxx (con probabilidad $pq$ ),
  3. A3: Los primeros cinco resultados fueron SSFxx (con probabilidad $p^2q$),
  4. A4: Los primeros cinco resultados fueron SSSFx (con probabilidad $p^3q$),
  5. A5: Los primeros cinco resultados fueron SSSSF (con probabilidad $p^4q$),
  6. A6: Los primeros cinco resultados fueron SSSSS (con probabilidad $p^5$).

Tenga en cuenta que $P(A_1)+P(A_2)+P(A_3)+P(A_4) +P(A_5)+P(A_6)=1$.

Dejar $k>5$.

En el caso 1, $P(N_n=k∣\text{first result was F})=P(N_n=k−1)$ porque simplemente no hemos avanzado en $n$ S que contiene SSSSS con el primer resultado, y ahora hay $k−1$ pruebas restantes para obtener $n$ S que contiene SSSSS.

En el caso 2, $P(N_n=k∣\text{first two results were SF})=P(N_{n-1}=k−2)$. Aunque no hemos hecho ningún progreso hacia SSSSS con los dos primeros resultados, pero tenemos una S y hay$(n-1)$S restantes. Están ahora$k−2$ pruebas restantes para obtener $(n-1)$ S que contiene SSSSS.

En el caso 3, $P(N_n=k∣\text{first three results were SSF})=P(N_{n-2} =k−3)$. Aunque no hemos hecho ningún progreso hacia SSSSS con los primeros tres resultados, pero tenemos dos S y hay$(n-2)$S restantes. Están ahora$k−3$ pruebas restantes para obtener $(n-2)$ S que contiene SSSSS.

En el caso 4, $P(N_n=k∣\text{first four results were SSSF})=P(N_{n-3} =k−4)$. Aunque no hemos hecho ningún progreso hacia SSSSS con los primeros cuatro resultados, pero tenemos tres S y hay$(n-3)$S restantes. Están ahora$k−4$ pruebas restantes para obtener $(n-3)$ S que contiene SSSSS.

En el caso 5, $P(N_n=k∣\text{first five results were SSSSF})=P(N_{n-4} =k−5)$. Aunque no hemos hecho ningún progreso hacia SSSSS con los primeros cinco resultados, tenemos cuatro S y hay$(n-4)$S restantes. Están ahora$k−5$ pruebas restantes para obtener $(n-4)$ S que contiene SSSSS.

En el caso 6, $P(N_n=k\mid\text{first five results were SSSSS})=P(M_{n-5}=k−5)$. Ya tenemos SSSSS. Ya no tenemos que preocuparnos por SSSSS. Solo necesitamos conseguir$(n-5)$S y hemos terminado. Están ahora$k−5$ pruebas restantes para obtener $(n-5)$ S.

Si pones todo junto usando la Ley de Probabilidad Total $$P(N_n =k)=P(N_n =k\mid A_1)P(A_1)+P(N_n =k\mid A_2)P(A_2)+ +\cdots+P(N_n =k\mid A_6)P(A_6),$$ dónde $A_1, A_2, A_3, \ldots, A_6$ son los 6 posibles eventos iniciales, entonces obtienes la fórmula recursiva para $k> 5$,

$$P(N_n =k)=qP(N_n =k−1)+pqP(N_{n-1} =k−2)+p^2qP(N_{n-2} =k−3) +\cdots+ p^4qP(N_{n-4} =k−5)+p^5P(M_{n-5}=k−5)$$

¿Estoy en el camino correcto? Suceden algunas cosas extrañas cuando intenté calcular el caso base$P(N_5=k)$. Por favor dime que es$P(N_5=k)$ y ayúdame a verificar la relación recursiva para $P(N_6=k)$.

Respuestas

2 MarkusScheuer Sep 05 2020 at 19:15

Esta respuesta es un enfoque de función generadora basado en el método de agrupación de Goulden-Jackson . Mostraremos para$5\leq r\leq k$: \ begin {align *} \ color {blue} {P (M_r = k)} & \ color {blue} {= \ left (\ sum_ {j \ geq 1} (- 1) ^ {j + 1} \ binom {k-r + 1} {j} \ binom {k-5j} {kr} \ right.} \\ & \ qquad \ color {blue} {\ left .- \ sum_ {j \ geq 1} (- 1) ^ {j + 1} \ binom {kr} {j} \ binom {k-1-5j} {k-1-r} \ right) p ^ rq ^ {kr}} \ tag {1} \ end {align *} donde las sumas en (1) son finitas ya que$\binom{s}{t}=0$ para integral $0<s<t$.

Primer paso: una función generadora

Consideramos el conjunto de palabras de longitud $k\geq 0$ construido a partir de un alfabeto $$\mathcal{V}=\{S,F\}$$ y el set $B=\{SSSSS\}$de malas palabras , que no pueden formar parte de las palabras que buscamos en un primer paso. Derivaremos una función generadora$G(z)$ dónde $[z^k]G(z)$, el coeficiente de $z^k$ de $G(z)$ da el número de palabras binarias de longitud $k$ que no contienen $SSSSS$.

Como queremos que el número de palabras que hacen contiene$SSSSS$, tomamos la función generadora de todas las palabras binarias que es $1+2z+4z^2+8z^3+\cdots = \frac{1}{1-2z}$ y restar $G(z)$de eso. De esta manera conseguimos$H(z) = \frac{1}{1-2z}-G(z)$.

Según el artículo (p.7) la función generadora $G(z)$ es \ begin {align *} G (z) = \ frac {1} {1-dz- \ text {peso} (\ mathcal {C})} \ etiqueta {2} \ end {align *} con$d=|\mathcal{V}|=2$, el tamaño del alfabeto y $\mathcal{C}$el numerador de peso de las malas palabras con \ begin {align *} \ text {peso} (\ mathcal {C}) = \ text {peso} (\ mathcal {C} [SSSSS]) \ end {align *}

Calculamos de acuerdo con el documento \ begin {align *} \ text {peso} (\ mathcal {C} [S ^ 5]) & = - z ^ 5-z \ cdot \ text {peso} (\ mathcal {C} [S ^ 5]) - \ cdots-z ^ 4 \ cdot \ text {peso} (\ mathcal {C} [S ^ 5]) \ etiqueta {3} \\ \ end {align *}

y obtén \ begin {align *} \ text {peso} (\ mathcal {C}) = \ text {peso} (\ mathcal {C} [S ^ 5]) = - \ frac {z ^ 5 (1-z )} {1-z ^ 5} \ end {align *}

Se deduce de (2) y (3):

\ begin {align *} G (z) & = \ frac {1} {1-dz- \ text {peso} (\ mathcal {C})} \\ & = \ frac {1} {1-2z + \ frac {z ^ 5 (1-z)} {1-z ^ 5}} \\ & = \ frac {1-z ^ 5} {1-2z + z ^ 6} \ tag {4} \\ \ end { alinear*}

De (4) obtenemos \ begin {align *} H (z) = \ frac {1} {1-2z} - \ frac {1 + z ^ 5} {1-2z + z ^ 6} \ tag {5 } \ end {alinear *}

Segundo paso: un refinamiento

Dado que estamos buscando el número de palabras válidas de longitud $k$ que contienen $50 S$ resp. $r\geq 5$ S en general, necesitamos un refinamiento de $H(z)$ para realizar un seguimiento del número de éxitos $S$. Para ello marcamos los éxitos con$s$.

Obtenemos de (3) \ begin {align *} \ text {peso} (\ mathcal {C} [S ^ 5]) & = - (sz) ^ 5- (sz) \ text {peso} (\ mathcal { C} [S ^ 5]) - \ cdots- (sz) ^ 4 \ text {peso} (\ mathcal {C} [S ^ 5]) \ end {align *} y obtén \ begin {align *} \ text {peso} (\ mathcal {C}) = - \ frac {(sz) ^ 5 (1-sz)} {1- (sz) ^ 5} \ end {align *}

Usando este peso generalizado obtenemos una función generadora $H(z;s)$ \ begin {align *} H (z; s) & = \ frac {1} {1- (1 + s) z} - \ frac {1} {1- (1 + s) z + \ frac {(sz) ^ 5 (1-sz)} {1- (sz) ^ 5}} \\ & = \ frac {1} {1- (1 + s) z} - \ frac {1- (sz) ^ 5} { 1- (1 + s) z + s ^ 5z ^ 6} \ end {align *}

Tercer paso: palabras que terminan con éxito $S$.

El coeficiente $[s^rz^k]H(z;s)$ da el número de palabras de longitud $k$ conteniendo exactamente $r$ S con tramos S de longitud $5$, pero no necesariamente con una S al final. Para forzar esto restamos las palabras de longitud$k$ que contienen exactamente $r$ S y S-carreras de S de longitud $5$ y terminar con $F$.

De esta manera obtenemos finalmente la función generadora deseada \ begin {align *} \ color {blue} {H (z; s) (1-z)} & \ color {blue} {= \ frac {1-z} {1 - (1 + s) z} - \ frac {\ left (1- (sz) ^ 5 \ right) (1-z)} {1- (1 + s) z + s ^ 5z ^ 6}} \ etiqueta {6} \\ & = s ^ 5z ^ 5 + (s + f) s ^ 5z ^ 6 + \ left (s ^ 2 + 3sf + f ^ 2 \ right) s ^ 5z ^ 7 \\ & \ qquad + \ izquierda (s ^ 3 + 5s ^ 2f + 5sf ^ 2 + f ^ 3 \ right) s ^ 5z ^ 8 \\ & \ qquad + \ left (s ^ 4 + 7s ^ 3f + \ color {azul} {12} s ^ 2f ^ 2 + 7sf ^ 3 + f ^ 4 \ right) s ^ 5z ^ 9 + \ cdots \ end {align *} donde la última línea se calculó con la ayuda de Wolfram Alpha.

Tenga en cuenta que los coeficientes de la serie se corresponden con las entradas de la tabla indicadas por @GCab.

Mirando, por ejemplo, el coeficiente marcado en azul $12$ de $s^7f^2z^9$ esto da el número de palabras de longitud $9$ conteniendo $7$ S al menos una corrida de $5$S y terminan en S. Estas palabras son \ begin {align *} \ color {blue} {SSSSS} SFFS & \ qquad SSFF \ color {blue} {SSSSS} \\ \ color {blue} {SSSSS} FSFS & \ qquad SFSF \ color {azul} {SSSSS} \\ \ color {azul} {SSSSS} FFSS & \ qquad SFFS \ color {azul} {SSSSS} \\ SF \ color {azul} {SSSSS} FS & \ qquad FSSF \ color {azul} { SSSSS} \\ FS \ color {blue} {SSSSS} FS & \ qquad FSFS \ color {blue} {SSSSS} \\ F \ color {blue} {SSSSS} FSS & \ qquad FFSS \ color {blue} {SSSSS} \ end {align *} donde la ejecución más a la derecha de$5$ S está marcado en azul.

Coeficientes de $H(z;s)(1-z)$:

Finalmente calculamos los coeficientes de $H(z;s)(1-z)$. Empezamos con

\ begin {align *} [s ^ rz ^ k] H (z; s) & = [s ^ rz ^ k] \ frac {1} {1- (1 + s) z} - [s ^ rz ^ k ] \ frac {1} {1- (1 + s) z + \ frac {(sz) ^ 5 (1- (sz))} {1- (sz) ^ 5}} \\ & = [s ^ rz ^ k] \ frac {1} {1- (1 + s) z} - [s ^ rz ^ k] \ frac {1- (sz) ^ 5} {1- (1 + s) z + s ^ 5z ^ 6} \ end {align *}

Al principio, la parte fácil:

\ begin {align *} \ color {blue} {[s ^ rz ^ k] \ frac {1} {1- (1 + s) z}} = [s ^ rz ^ k] \ sum_ {j = 0} ^ {\ infty} (1 + s) ^ jz ^ j = [s ^ r] (1 + s) ^ k \, \, \ color {azul} {= \ binom {k} {r}} \ tag { 7} \ end {align *}

Ahora la parte algo alargada. Obtenemos

\ begin {align *} \ color {blue} {[s ^ rz ^ k]} & \ color {blue} {\ frac {1} {1- (1 + s) z + s ^ 5z ^ 6}} \ \ & = [s ^ rz ^ k] \ sum_ {j = 0} ^ \ infty \ left ((1 + s) zs ^ 5z ^ 6 \ right) ^ j \\ & = [s ^ rz ^ k] \ sum_ {j = 0} ^ \ infty z ^ j \ left ((1 + s) -s ^ 5z ^ 5 \ right) ^ j \\ & = [s ^ r] \ sum_ {j = 0} ^ k [ z ^ {kj}] \ sum_ {l = 0} ^ j \ binom {j} {l} (- 1) ^ ls ^ {5l} z ^ {5l} (1 + s) ^ {jl} \ tag { 8} \\ & = [s ^ r] \ sum_ {j = 0} ^ k [z ^ j] \ sum_ {l = 0} ^ {kj} \ binom {kj} {l} (- 1) ^ ls ^ {5l} z ^ {5l} (1 + s) ^ {kjl} \ etiqueta {9} \\ & = [s ^ r] \ sum_ {j = 0} ^ {\ left \ lfloor k / 5 \ right \ rfloor} [z ^ {5j}] \ sum_ {l = 0} ^ {k-5j} \ binom {k-5j} {l} (- 1) ^ ls ^ {5l} z ^ {5l} (1 + s) ^ {k-5j-l} \ etiqueta {10} \\ & = [s ^ r] \ sum_ {j = 0} ^ {\ left \ lfloor k / 5 \ right \ rfloor} \ binom {k -5j} {j} (- 1) ^ js ^ {5j} (1 + s) ^ {k-6j} \ etiqueta {11} \\ & = \ sum_ {j = 0} ^ {\ min \ {\ \ lfloor k / 5 \ right \ rfloor, \ left \ lfloor r / 5 \ right \ rfloor \}} (- 1) ^ j \ binom {k-5j} {j} [s ^ {r-5j}] (1 + s) ^ {k-6j} \\ & = \ sum_ {j \ geq 0} (- 1) ^ j \ binom {k-5j} {j} \ binom {k-6j} {r-5j } \ etiqueta {12} \\ & \, \, \ color {azul} {= \ sum_ {j \ geq 0} (- 1) ^ j \ binom {kr} {j} \ binom {k-5j} { kr}} \ etiqueta {13} \ end {align *}

Comentario:

  • En (8) aplicamos la regla $[z^s]z^tA(z)=[z^{s-t}]A(z)$. También establecemos el límite superior de la suma externa a$k$ ya que otros valores no contribuyen al coeficiente de $z^k$.

  • En (9) cambiamos el orden de suma de la suma externa $j \to k-j$.

  • En (10) observamos que tenemos que tomar múltiplos de $5$ solo del índice $j$ debido al término $z^{5l}$.

  • En (11) seleccionamos el coeficiente de $z^{5j}$.

  • En (12) seleccionamos el coeficiente de $s^{r-5j}$.

  • En (13) usamos la identidad binomial \ begin {align *} \ binom {k-5j} {j} \ binom {k-6j} {r-6j} & = \ frac {(k-5j)!} { j!} \, \ frac {1} {(r-6j)! (krj)!} \\ & = \ frac {1} {j! (r-6j)!} \, \ frac {(k-5j )!} {(kr)!} = \ binom {r-5j} {j} \ binom {k-5j} {kr} \ end {align *}

y se sigue de (6) y (13): \ begin {align *} [s ^ rz ^ k] & \ frac {1- (sz) ^ 5} {1- (1 + s) z + s ^ 5z ^ 6} \\ & = \ left ([s ^ rz ^ k] - [s ^ {r-5} z ^ {k-5}] \ right) \ frac {1} {1- (1 + s) z + s ^ 5z ^ 6} \\ & = \ sum_ {j \ geq 0} (- 1) ^ j \ binom {kr} {j} \ binom {k-5j} {kr} - \ sum_ {j \ geq 0} (- 1) ^ j \ binom {kr} {j} \ binom {k-5-5j} {kr} \\ & = \ binom {k} {r} + \ sum_ {j \ geq 1} \ binom {kr} {j} \ binom {k-5j} {kr} + \ sum_ {j \ geq 1} (- 1) ^ j \ binom {kr} {j-1} \ binom {k-5j} {kr} \\ & = \ binom {k} {r} + \ sum_ {j \ geq 1} (- 1) ^ j \ binom {k-r + 1} {j} \ binom {k-5j} { kr} \ etiqueta {14} \ end {align *}

y obtenemos \ begin {align *} \ color {blue} {[s ^ rz ^ k] H (z; s)} & = [s ^ rz ^ k] \ frac {1} {1- (1 + s ) z} - [s ^ rz ^ k] \ frac {1- (sz) ^ 5} {1- (1 + s) z + s ^ 5z ^ 6} \\ & \, \, \ color {azul} {= \ sum_ {j \ geq 1} (- 1) ^ {j + 1} \ binom {k-r + 1} {j} \ binom {k-5j} {kr}} \ etiqueta {15} \ end {alinear*}

Último paso: poner todo junto

Consideramos el caso (interesante) $5\leq r\leq k$solamente. Tomando los resultados de (6) y (15) ahora podemos escribir los coeficientes de$H(z;s)(1-z)$ como

\ begin {align *} [s ^ rz ^ k] & H (z; s) (1-z) \\ & = [s ^ rz ^ k] H (z; s) - [s ^ rz ^ {k- 1}] H (z; s) \\ & = \ sum_ {j \ geq 1} (- 1) ^ {j + 1} \ binom {k-r + 1} {j} \ binom {k-5j} {kr} \\ & \ qquad- \ sum_ {j \ geq 1} (- 1) ^ {j + 1} \ binom {kr} {j} \ binom {k-1-5j} {k-1-r } \ end {align *} y el reclamo (1) sigue.

1 GCab Sep 03 2020 at 22:33

a) Su enfoque para deducir la recurrencia es correcto, el problema es fijar las condiciones iniciales apropiadas y los límites de validez.

b) Con el fin de resolver eso, claramente debemos proceder de la siguiente manera.

Dada una secuencia de ensayos de Bernoulli, con probabilidad de éxito $p$ (fracaso $q=(1-p)$), permítame representar eso mediante una cadena binaria $1 = $ éxito, $0 =$falla para mantener la congruencia con otras publicaciones a las que voy a vincular.
Por la misma razón y para poner su recurrencia con las condiciones iniciales adecuadas, permítame cambiar sus denominaciones y considerar

las cadenas binarias de longitud $n$, teniendo $m$ ceros y $s$unos, incluido uno que se fija al final de la cuerda;
también suelte 'general y considere la ejecución de consecutivos de longitud$r$.

Lo indicamos como $$ P(s,r,n) = N_c (s,r,n)\, p^{\,s } q^{\,n - s} $$ la probabilidad de que en una cadena de longitud $n$, con total $s$ unos y terminando con uno, puede haber corridas de unos consecutivos de longitud $r$ o mayor.

Ahora tu recurrencia lee $$ \eqalign{ & P(s,r,n) = q\,P(s,r,n - 1) + pq\,P(s - 1,r,n - 2) + p^{\,2} q\,P(s - 1,r,n - 2) + \cr & + \cdots + p^{\,4} q\,P(s - r + 1,r,n - r) + \left( \matrix{ n - 1 - r \hfill \cr s - 1 - r \hfill \cr} \right)p^{\,s} q^{\,n - s} \cr} $$

Tenga en cuenta que cada término es un polinomio homogéneo en $p^s\, q^{n-s}$, por lo que no necesitamos traerlos y podemos concentrarnos de manera rentable en el número de cadenas dadas por $N_c$, es decir $$ \bbox[lightyellow] { \eqalign{ & N_c (s,r,n) = \cr & = \left\{ {\matrix{ 1 & {\left| \matrix{ \;0 \le r \le s \hfill \cr \;1 \le s = n \hfill \cr} \right.} \cr {\sum\limits_{k = 0}^{r - 1} {N_c (s - k,r,n - 1 - k)} + \binom{ n - r - 1 }{ s - r - 1 } } & {\left| \matrix{ \;0 \le r \le s \hfill \cr \;1 \le s < n \hfill \cr} \right.} \cr 0 & {{\rm otherwise}} \cr } } \right. \cr} } \tag{1}$$

Respecto a las condiciones,

  • el caso $s=n$ no se cubrió en la construcción y debe agregarse;
  • por el que está en última posición, $s$ será mayor que $1$;
  • los restantes son obvios.

La recurrencia anterior se ha verificado con cálculo directo para los valores más pequeños de los parámetros.
Ejemplo:

c) La recurrencia (1) se puede resolver en forma cerrada como suma finita.

Considere, de hecho, las cadenas de este tipo

Su número total es $\binom{n}{s}$ y los que tienen una racha de largo $r$ o mayores son $N_c (s+1,r, n+1)$. Por tanto, el complemento de$N_c$ representará las cadenas de la misma arquitectura, que se ejecutan hasta $r-1$.

El número de cuerdas compuestas como arriba pero excluyendo la última, que tienen una longitud de hasta $r-1$ es dado por $$ N_b (s,r - 1,m + 1) $$ dónde $$ N_b (s,r,m)\quad \left| {\;0 \leqslant \text{integers }s,m,r} \right.\quad = \sum\limits_{\left( {0\, \leqslant } \right)\,\,k\,\,\left( { \leqslant \,\frac{s}{r+1}\, \leqslant \,m} \right)} {\left( { - 1} \right)^k \binom{m}{k} \binom { s + m - 1 - k\left( {r + 1} \right) } { s - k\left( {r + 1} \right)}\ } $$ como se explica en varios posts, se refieren principalmente a este y a este otro .

Pero debido a la presencia del uno al final, tenemos que deducir de lo anterior las cadenas que terminan en cero más $ r-1$ unos, dando una corrida final de $r$.
Estos son $$ N_b (s-r+1,r - 1,m ) $$ y concluimos que $$ \bbox[lightyellow] { \eqalign{ & N_c (s + 1,r,n + 1) = N_c (s + 1,r,s + m + 1) = \cr & = \left( \matrix{ s + m \cr s \cr} \right) - N_b (s,r - 1,m + 1) + N_b (s - r + 1,r - 1,m) = \cr & = \left( \matrix{ n \cr s \cr} \right) - N_b (s,r - 1,n - s + 1) + N_b (s - r + 1,r - 1,n - s) \quad \left| {\;0 \le s,r,m} \right. \cr} } \tag{2}$$

$N_b$está más presente en la literatura, tiene muchas relaciones recurrentes y un simple ogf. Para no hacer la respuesta demasiado larga, no voy a entrar en más detalles.

d) Sumando $n$.

Considere las cuerdas compuestas como se muestra en el esquema del párr. c) arriba.

Su número total es $\binom {s+m}{s} = \binom {n}{s}$ y cada uno tiene la misma probabilidad $p^{s+1}\, q^m = p^{s+1}\, q^{n-s}$.

Acuerdo $n$ fijo, y sumando $s$ obtenemos $$ \sum\limits_{\left( {0\, \le } \right)\,s\,\left( { \le \,n} \right)} {\binom{ n }{ s } p^{\,s + 1} q^{\,n - s} } = p\left( {p + q} \right)^{\,n} = p $$ lo cual es obvio, ya que si sumamos las cadenas complementarias que terminan en cero obtenemos $(p+q)^{n+1} =1$.

Manteniendo en cambio $s$ fijo y sumando $n$, lo que significa sumar $m$, da $$ \eqalign{ & \sum\limits_{\left( {0\, \le \,s\, \le } \right)\,n\,} {\binom{ n }{s} p ^{\,s + 1} q^{\,n - s} } = \sum\limits_{\left( {0\, \le } \right)\,\,m\,} {\binom{ s + m }{m} p^{\,s + 1} q^{\,m} } = \cr & = p^{\,s + 1} \sum\limits_{\left( {0\, \le } \right)\,\,m\,} {\binom{ - s - 1 }{m} \left( { - 1} \right)^{\,m} q^{\,m} } = {{p^{\,s + 1} } \over {\left( {1 - q} \right)^{\,s + 1} }} = 1 \cr} $$ que es la distribución binomial negativa .

Dado que, por su significado combinatorio, tenemos $$ \left\{ \matrix{ 0 \le N_c (s + 1,r,n + 1) \le N_c (s + 1,r - 1,n + 1) \le \binom{n }{ s } \hfill \cr N_c (s + 1,s + 2,n + 1) = 0 \hfill \cr N_c (s + 1,s + 1,n + 1) = 1 \hfill \cr N_c (s + 1,1,n + 1) = \binom{n }{ s } \hfill \cr N_c (s + 1,0,n + 1) = \binom{n }{ s } \hfill \cr } \right. $$ entonces $$ 0 \le P_c (s + 1,r,p) = \sum\limits_{\left( {0\, \le \,s\, \le } \right)\,n\,} {N_c (s + 1,r,n + 1)p^{\,s + 1} q^{\,n - s} } \le 1 \quad \left| \matrix{ \,0 \le s \hfill \cr \;0 \le r \le s + 1 \hfill \cr \;0 < p < 1 \hfill \cr} \right. $$ converge (aunque lentamente), y dado$s,p$, es un CDF en$(s+1-r)$ (en caso de un nuevo desplazamiento del soporte).

Desafortunadamente, según mi conocimiento, la suma en $n$ de $N_c$ (y de $N_b$) no tiene una forma cerrada: re. a esta publicación ya citada .
Sin embargo, es posible calcular, a partir de (2), un doble ogf si está interesado.

bonez001 Sep 06 2020 at 06:43

Podría haber un enfoque más simple.

Sea N el número de ensayos y P (N) su probabilidad dadas las condiciones anteriores, entonces:

$$P(N) = \sum_{S \in S'} p^5\prod_{j \in S} q^{j} p_{j}$$ donde S 'son todas las particiones enteras (y sus otras posibles permutaciones sin elementos duplicados repetidos) de N-50, incluidos ceros con una longitud fija de 45 y N> = 50.

Y en general, si se quiere encontrar la distribución de N dado que hay en M éxitos y la presencia de m éxitos sucesivos, entonces:

$$P(N) = \sum_{S \in S'} p^m \prod_{j \in S} q^{j} p_{j}$$

donde S 'son todas las particiones enteras (y sus otras posibles permutaciones sin elementos duplicados repetidos) de NM que incluyen ceros con longitud fija Nm y N> = M.

PD: No es una solución cerrada, pero es lo suficientemente útil y mejor que la simulación.