Prendre au hasard $51$nombres de l'ensemble 1, 2,…, 159. Trouvez la variance de leur somme. [dupliquer]
Nous prenons au hasard $51$ nombres de 159 entiers naturels $1,...,159$sans remplacement. Laisser$\alpha$être une variable aléatoire égale à la somme des nombres sélectionnés. Trouvez la variance de$\alpha$.
Premièrement, j'ai besoin de comprendre quelque chose sur $\alpha$destribution. Il y a totalement$$C^{51}_{159} = \frac{159!}{51!108!}$$types de sommes. Beaucoup d'entre eux sont égaux, car$$\sum_{i=1}^{51}i = 1326\leq\alpha\leq\sum_{i=109}^{159}i=6834$$ Par conséquent, je veux savoir combien de sous-ensembles de $51$ les nombres ont la somme égale à $N$, où $1362\leq N\leq6834$. Je suis coincé ici parce que je ne sais pas comment faire.
Réponses
Remplacez 51 et 159 par $n, M$respectivement. Nous avons un vecteur$\mathbf{x}_{n\times 1}$ qui suit une distribution multivariée, et $\alpha = \sum_{i=1}^n x_i$ où $x_i$ est le $i^{th}$ composant de $\mathbf x$.
Puis, par symétrie, $E(\alpha)=E(\sum x_i)=\sum_i E(x_i) =nE(x_1)= \frac{n(M+1)}{2}$.
$$E(\alpha^2)=E\left(\sum_i x_i\right)^2 = E\left(\sum_i x_i^2\right)+E\left(\sum_{i\neq j} x_i x_j \right)$$
Encore une fois par symétrie $$ E\left(\sum_i x_i^2\right)=nE(x_1^2)=\frac 16 n(M+1)(2M+1) $$
$$ E\left(\sum_{i\neq j} x_i x_j \right)=(n^2-n)E(x_1 x_2)=\frac{n^2-n}{M^2-M}\sum_{i\ne j}ij = \frac{n^2-n}{M^2-M}\left(\left(\frac{M(M+1)}{2}\right)^2 - \frac{M(M+1)(2M+1)}{6}\right) \\= \frac{1}{12} (n^2-n)(M+1)(3M+2) $$
Par conséquent $$\text{var } \alpha = E(\alpha^2) - (E(\alpha))^2 = \cdots = 73440$$
Commentaire: vous pouvez obtenir une approximation raisonnable de$Var(\alpha)$par simulation. Dans la simulation, je suppose que les 51 numéros sont sélectionnés sans remplacement.
set.seed(2020)
alpha = replicate(10^5, sum(sample(1:159, 51)))
summary(alpha)
Min. 1st Qu. Median Mean 3rd Qu. Max.
2915 3897 4081 4081 4266 5275
Notez que parmi les 100 000 échantillons que j'ai additionnés, tous les totaux se situent entre les deux chiffres que vous mentionnez dans votre question.
var(alpha)
[1] 74069.39
sd(alpha)
[1] 272.1569
Un histogramme des valeurs simulées de $\alpha$ semble à peu près normal, donc je montre la densité normale la mieux ajustée avec l'histogramme.

hist(alpha, prob=T, col="skyblue2")
curve(dnorm(x, mean(alpha), sd(alpha)), add=T, col="red")
Avec le remplacement, la variance est un peu plus grande. (Ici encore, la distribution de$\alpha$semble à peu près normal; histogramme non illustré.)
set.seed(1130)
alpha = replicate(10^6, sum(sample(1:159, 51, rep=T)))
summary(alpha)
Min. 1st Qu. Median Mean 3rd Qu. Max.
2593 3859 4080 4080 4302 5590
var(alpha)
[1] 107274.7
Solution possible: si vous considérez que la population est de 1 à 159, alors la population a une variance de 2120, et la somme d'un échantillon aléatoire avec remplacement devrait avoir une variance 51 fois plus grande, qui est 108,120, ce qui semble concorder résultat dans la marge d'erreur de simulation.
var(1:159)
[1] 2120
51*var(1:159)
[1] 108120