Tomar al azar $51$números del conjunto 1, 2,…, 159. Encuentra la varianza de su suma. [duplicar]

Nov 30 2020

Tomamos al azar $51$ números de 159 números naturales $1,...,159$sin reemplazo. Dejar$\alpha$ser una variable aleatoria igual a la suma de los números seleccionados. Encuentra la varianza de$\alpha$.

Primero, necesito entender algo sobre $\alpha$distribución. Hay totalmente$$C^{51}_{159} = \frac{159!}{51!108!}$$tipos de sumas. Muchos de ellos son iguales, porque$$\sum_{i=1}^{51}i = 1326\leq\alpha\leq\sum_{i=109}^{159}i=6834$$ Consecuencia, quiero saber cuántos subconjuntos de $51$ los números tienen la suma igual a $N$, dónde $1362\leq N\leq6834$. Estoy atrapado aquí porque no sé cómo hacerlo.

Respuestas

4 NeatMath Dec 01 2020 at 21:50

Reemplace 51 y 159 con $n, M$respectivamente. Tenemos un vector$\mathbf{x}_{n\times 1}$ que sigue una distribución multivariante, y $\alpha = \sum_{i=1}^n x_i$ dónde $x_i$ es el $i^{th}$ componente de $\mathbf x$.

Entonces, por simetría, $E(\alpha)=E(\sum x_i)=\sum_i E(x_i) =nE(x_1)= \frac{n(M+1)}{2}$.

$$E(\alpha^2)=E\left(\sum_i x_i\right)^2 = E\left(\sum_i x_i^2\right)+E\left(\sum_{i\neq j} x_i x_j \right)$$

De nuevo por simetría $$ E\left(\sum_i x_i^2\right)=nE(x_1^2)=\frac 16 n(M+1)(2M+1) $$

$$ E\left(\sum_{i\neq j} x_i x_j \right)=(n^2-n)E(x_1 x_2)=\frac{n^2-n}{M^2-M}\sum_{i\ne j}ij = \frac{n^2-n}{M^2-M}\left(\left(\frac{M(M+1)}{2}\right)^2 - \frac{M(M+1)(2M+1)}{6}\right) \\= \frac{1}{12} (n^2-n)(M+1)(3M+2) $$

Por lo tanto $$\text{var } \alpha = E(\alpha^2) - (E(\alpha))^2 = \cdots = 73440$$

1 BruceET Nov 30 2020 at 17:03

Comentario: puede obtener una aproximación razonable a$Var(\alpha)$por simulación. En la simulación, supongo que los 51 números se seleccionan sin reemplazo.

set.seed(2020)
alpha = replicate(10^5, sum(sample(1:159, 51)))
summary(alpha)
   Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
   2915    3897    4081    4081    4266    5275 

Observe que entre las 100.000 muestras que sumé, todos los totales están entre los dos números que menciona en su pregunta.

var(alpha)
[1] 74069.39
sd(alpha)
[1] 272.1569

Un histograma de los valores simulados de $\alpha$ parece aproximadamente normal, por lo que muestro la densidad normal que mejor se ajusta junto con el histograma.

hist(alpha, prob=T, col="skyblue2")
 curve(dnorm(x, mean(alpha), sd(alpha)), add=T, col="red")

Con reemplazo, la variación es algo mayor. (De nuevo aquí la distribución de$\alpha$parece aproximadamente normal; histograma no mostrado.)

set.seed(1130)
alpha = replicate(10^6, sum(sample(1:159, 51, rep=T)))
summary(alpha)
   Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
   2593    3859    4080    4080    4302    5590 
var(alpha)
[1] 107274.7

Posible solución: si considera que la población tiene los números del 1 al 159, entonces la población tiene una varianza de 2120, y la suma de una muestra aleatoria con reemplazo debe tener una varianza 51 veces mayor, que es 108,120, lo que parece estar de acuerdo con la simulación resultado dentro del margen de error de simulación.

var(1:159)
[1] 2120
51*var(1:159)
[1] 108120