Prendre au hasard $51$nombres de l'ensemble 1, 2,…, 159. Trouvez la variance de leur somme. [dupliquer]

Nov 30 2020

Nous prenons au hasard $51$ nombres de 159 entiers naturels $1,...,159$sans remplacement. Laisser$\alpha$être une variable aléatoire égale à la somme des nombres sélectionnés. Trouvez la variance de$\alpha$.

Premièrement, j'ai besoin de comprendre quelque chose sur $\alpha$destribution. Il y a totalement$$C^{51}_{159} = \frac{159!}{51!108!}$$types de sommes. Beaucoup d'entre eux sont égaux, car$$\sum_{i=1}^{51}i = 1326\leq\alpha\leq\sum_{i=109}^{159}i=6834$$ Par conséquent, je veux savoir combien de sous-ensembles de $51$ les nombres ont la somme égale à $N$, où $1362\leq N\leq6834$. Je suis coincé ici parce que je ne sais pas comment faire.

Réponses

4 NeatMath Dec 01 2020 at 21:50

Remplacez 51 et 159 par $n, M$respectivement. Nous avons un vecteur$\mathbf{x}_{n\times 1}$ qui suit une distribution multivariée, et $\alpha = \sum_{i=1}^n x_i$$x_i$ est le $i^{th}$ composant de $\mathbf x$.

Puis, par symétrie, $E(\alpha)=E(\sum x_i)=\sum_i E(x_i) =nE(x_1)= \frac{n(M+1)}{2}$.

$$E(\alpha^2)=E\left(\sum_i x_i\right)^2 = E\left(\sum_i x_i^2\right)+E\left(\sum_{i\neq j} x_i x_j \right)$$

Encore une fois par symétrie $$ E\left(\sum_i x_i^2\right)=nE(x_1^2)=\frac 16 n(M+1)(2M+1) $$

$$ E\left(\sum_{i\neq j} x_i x_j \right)=(n^2-n)E(x_1 x_2)=\frac{n^2-n}{M^2-M}\sum_{i\ne j}ij = \frac{n^2-n}{M^2-M}\left(\left(\frac{M(M+1)}{2}\right)^2 - \frac{M(M+1)(2M+1)}{6}\right) \\= \frac{1}{12} (n^2-n)(M+1)(3M+2) $$

Par conséquent $$\text{var } \alpha = E(\alpha^2) - (E(\alpha))^2 = \cdots = 73440$$

1 BruceET Nov 30 2020 at 17:03

Commentaire: vous pouvez obtenir une approximation raisonnable de$Var(\alpha)$par simulation. Dans la simulation, je suppose que les 51 numéros sont sélectionnés sans remplacement.

set.seed(2020)
alpha = replicate(10^5, sum(sample(1:159, 51)))
summary(alpha)
   Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
   2915    3897    4081    4081    4266    5275 

Notez que parmi les 100 000 échantillons que j'ai additionnés, tous les totaux se situent entre les deux chiffres que vous mentionnez dans votre question.

var(alpha)
[1] 74069.39
sd(alpha)
[1] 272.1569

Un histogramme des valeurs simulées de $\alpha$ semble à peu près normal, donc je montre la densité normale la mieux ajustée avec l'histogramme.

hist(alpha, prob=T, col="skyblue2")
 curve(dnorm(x, mean(alpha), sd(alpha)), add=T, col="red")

Avec le remplacement, la variance est un peu plus grande. (Ici encore, la distribution de$\alpha$semble à peu près normal; histogramme non illustré.)

set.seed(1130)
alpha = replicate(10^6, sum(sample(1:159, 51, rep=T)))
summary(alpha)
   Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
   2593    3859    4080    4080    4302    5590 
var(alpha)
[1] 107274.7

Solution possible: si vous considérez que la population est de 1 à 159, alors la population a une variance de 2120, et la somme d'un échantillon aléatoire avec remplacement devrait avoir une variance 51 fois plus grande, qui est 108,120, ce qui semble concorder résultat dans la marge d'erreur de simulation.

var(1:159)
[1] 2120
51*var(1:159)
[1] 108120