Tomar al azar $51$números del conjunto 1, 2,…, 159. Encuentra la varianza de su suma. [duplicar]
Tomamos al azar $51$ números de 159 números naturales $1,...,159$sin reemplazo. Dejar$\alpha$ser una variable aleatoria igual a la suma de los números seleccionados. Encuentra la varianza de$\alpha$.
Primero, necesito entender algo sobre $\alpha$distribución. Hay totalmente$$C^{51}_{159} = \frac{159!}{51!108!}$$tipos de sumas. Muchos de ellos son iguales, porque$$\sum_{i=1}^{51}i = 1326\leq\alpha\leq\sum_{i=109}^{159}i=6834$$ Consecuencia, quiero saber cuántos subconjuntos de $51$ los números tienen la suma igual a $N$, dónde $1362\leq N\leq6834$. Estoy atrapado aquí porque no sé cómo hacerlo.
Respuestas
Reemplace 51 y 159 con $n, M$respectivamente. Tenemos un vector$\mathbf{x}_{n\times 1}$ que sigue una distribución multivariante, y $\alpha = \sum_{i=1}^n x_i$ dónde $x_i$ es el $i^{th}$ componente de $\mathbf x$.
Entonces, por simetría, $E(\alpha)=E(\sum x_i)=\sum_i E(x_i) =nE(x_1)= \frac{n(M+1)}{2}$.
$$E(\alpha^2)=E\left(\sum_i x_i\right)^2 = E\left(\sum_i x_i^2\right)+E\left(\sum_{i\neq j} x_i x_j \right)$$
De nuevo por simetría $$ E\left(\sum_i x_i^2\right)=nE(x_1^2)=\frac 16 n(M+1)(2M+1) $$
$$ E\left(\sum_{i\neq j} x_i x_j \right)=(n^2-n)E(x_1 x_2)=\frac{n^2-n}{M^2-M}\sum_{i\ne j}ij = \frac{n^2-n}{M^2-M}\left(\left(\frac{M(M+1)}{2}\right)^2 - \frac{M(M+1)(2M+1)}{6}\right) \\= \frac{1}{12} (n^2-n)(M+1)(3M+2) $$
Por lo tanto $$\text{var } \alpha = E(\alpha^2) - (E(\alpha))^2 = \cdots = 73440$$
Comentario: puede obtener una aproximación razonable a$Var(\alpha)$por simulación. En la simulación, supongo que los 51 números se seleccionan sin reemplazo.
set.seed(2020)
alpha = replicate(10^5, sum(sample(1:159, 51)))
summary(alpha)
Min. 1st Qu. Median Mean 3rd Qu. Max.
2915 3897 4081 4081 4266 5275
Observe que entre las 100.000 muestras que sumé, todos los totales están entre los dos números que menciona en su pregunta.
var(alpha)
[1] 74069.39
sd(alpha)
[1] 272.1569
Un histograma de los valores simulados de $\alpha$ parece aproximadamente normal, por lo que muestro la densidad normal que mejor se ajusta junto con el histograma.

hist(alpha, prob=T, col="skyblue2")
curve(dnorm(x, mean(alpha), sd(alpha)), add=T, col="red")
Con reemplazo, la variación es algo mayor. (De nuevo aquí la distribución de$\alpha$parece aproximadamente normal; histograma no mostrado.)
set.seed(1130)
alpha = replicate(10^6, sum(sample(1:159, 51, rep=T)))
summary(alpha)
Min. 1st Qu. Median Mean 3rd Qu. Max.
2593 3859 4080 4080 4302 5590
var(alpha)
[1] 107274.7
Posible solución: si considera que la población tiene los números del 1 al 159, entonces la población tiene una varianza de 2120, y la suma de una muestra aleatoria con reemplazo debe tener una varianza 51 veces mayor, que es 108,120, lo que parece estar de acuerdo con la simulación resultado dentro del margen de error de simulación.
var(1:159)
[1] 2120
51*var(1:159)
[1] 108120