Zufällig nehmen $51$Zahlen aus der Menge 1, 2,…, 159. Finden Sie die Varianz ihrer Summe. [Duplikat]
Wir nehmen zufällig $51$ Zahlen aus 159 natürlichen Zahlen $1,...,159$ohne Ersatz. Lassen$\alpha$eine Zufallsvariable sein, die der Summe der ausgewählten Zahlen entspricht. Finden Sie die Varianz von$\alpha$.
Erstens muss ich etwas verstehen $\alpha$Verteilung. Es gibt total$$C^{51}_{159} = \frac{159!}{51!108!}$$Arten von Summen. Viele von ihnen sind gleich, weil$$\sum_{i=1}^{51}i = 1326\leq\alpha\leq\sum_{i=109}^{159}i=6834$$ Folglich möchte ich wissen, wie viele Teilmengen von $51$ Zahlen haben die Summe gleich $N$, wo $1362\leq N\leq6834$. Ich stecke hier fest, weil ich nicht weiß, wie ich es machen soll.
Antworten
Ersetzen Sie 51 und 159 durch $n, M$beziehungsweise. Wir haben einen Vektor$\mathbf{x}_{n\times 1}$ welches einer multivariaten Verteilung folgt, und $\alpha = \sum_{i=1}^n x_i$ wo $x_i$ ist der $i^{th}$ Bestandteil von $\mathbf x$.
Dann durch Symmetrie, $E(\alpha)=E(\sum x_i)=\sum_i E(x_i) =nE(x_1)= \frac{n(M+1)}{2}$.
$$E(\alpha^2)=E\left(\sum_i x_i\right)^2 = E\left(\sum_i x_i^2\right)+E\left(\sum_{i\neq j} x_i x_j \right)$$
Wieder durch Symmetrie $$ E\left(\sum_i x_i^2\right)=nE(x_1^2)=\frac 16 n(M+1)(2M+1) $$
$$ E\left(\sum_{i\neq j} x_i x_j \right)=(n^2-n)E(x_1 x_2)=\frac{n^2-n}{M^2-M}\sum_{i\ne j}ij = \frac{n^2-n}{M^2-M}\left(\left(\frac{M(M+1)}{2}\right)^2 - \frac{M(M+1)(2M+1)}{6}\right) \\= \frac{1}{12} (n^2-n)(M+1)(3M+2) $$
Deshalb $$\text{var } \alpha = E(\alpha^2) - (E(\alpha))^2 = \cdots = 73440$$
Kommentar: Sie können eine vernünftige Annäherung an erhalten$Var(\alpha)$durch Simulation. In der Simulation gehe ich davon aus, dass die 51 Nummern ersatzlos ausgewählt werden.
set.seed(2020)
alpha = replicate(10^5, sum(sample(1:159, 51)))
summary(alpha)
Min. 1st Qu. Median Mean 3rd Qu. Max.
2915 3897 4081 4081 4266 5275
Beachten Sie, dass unter den 100.000 Stichproben, die ich summiert habe, alle Summen zwischen den beiden Zahlen liegen, die Sie in Ihrer Frage erwähnt haben.
var(alpha)
[1] 74069.39
sd(alpha)
[1] 272.1569
Ein Histogramm der simulierten Werte von $\alpha$ sieht ungefähr normal aus, daher zeige ich die am besten passende normale Dichte entlang des Histogramms.

hist(alpha, prob=T, col="skyblue2")
curve(dnorm(x, mean(alpha), sd(alpha)), add=T, col="red")
Beim Austausch ist die Varianz etwas größer. (Auch hier die Verteilung von$\alpha$scheint ungefähr normal zu sein; Histogramm nicht gezeigt.)
set.seed(1130)
alpha = replicate(10^6, sum(sample(1:159, 51, rep=T)))
summary(alpha)
Min. 1st Qu. Median Mean 3rd Qu. Max.
2593 3859 4080 4080 4302 5590
var(alpha)
[1] 107274.7
Mögliche Lösung: Wenn Sie die Population als die Zahlen 1 bis 159 betrachten, hat die Population eine Varianz 2120, und die Summe einer Zufallsstichprobe mit Ersatz sollte eine 51-mal so große Varianz haben, die 108.120 beträgt, was mit der simulierten zu stimmen scheint Ergebnis innerhalb der Grenze des Simulationsfehlers.
var(1:159)
[1] 2120
51*var(1:159)
[1] 108120