Pegue aleatoriamente $51$números do conjunto 1, 2,…, 159. Encontre a variação de sua soma. [duplicado]

Nov 30 2020

Nós pegamos aleatoriamente $51$ números de 159 números naturais $1,...,159$Sem substituição. Deixei$\alpha$ser uma variável aleatória igual à soma dos números selecionados. Encontre a variação de$\alpha$.

Em primeiro lugar, preciso entender algo sobre $\alpha$destruição. Existem totalmente$$C^{51}_{159} = \frac{159!}{51!108!}$$tipos de somas. Muitos deles são iguais, porque$$\sum_{i=1}^{51}i = 1326\leq\alpha\leq\sum_{i=109}^{159}i=6834$$ Conseqüentemente, quero saber quantos subconjuntos de $51$ números têm soma igual a $N$, Onde $1362\leq N\leq6834$. Estou preso aqui porque não sei como fazer.

Respostas

4 NeatMath Dec 01 2020 at 21:50

Substitua 51 e 159 por $n, M$respectivamente. Temos um vetor$\mathbf{x}_{n\times 1}$ que segue uma distribuição multivariada, e $\alpha = \sum_{i=1}^n x_i$ Onde $x_i$ é o $i^{th}$ componente de $\mathbf x$.

Então, por simetria, $E(\alpha)=E(\sum x_i)=\sum_i E(x_i) =nE(x_1)= \frac{n(M+1)}{2}$.

$$E(\alpha^2)=E\left(\sum_i x_i\right)^2 = E\left(\sum_i x_i^2\right)+E\left(\sum_{i\neq j} x_i x_j \right)$$

De novo por simetria $$ E\left(\sum_i x_i^2\right)=nE(x_1^2)=\frac 16 n(M+1)(2M+1) $$

$$ E\left(\sum_{i\neq j} x_i x_j \right)=(n^2-n)E(x_1 x_2)=\frac{n^2-n}{M^2-M}\sum_{i\ne j}ij = \frac{n^2-n}{M^2-M}\left(\left(\frac{M(M+1)}{2}\right)^2 - \frac{M(M+1)(2M+1)}{6}\right) \\= \frac{1}{12} (n^2-n)(M+1)(3M+2) $$

Portanto $$\text{var } \alpha = E(\alpha^2) - (E(\alpha))^2 = \cdots = 73440$$

1 BruceET Nov 30 2020 at 17:03

Comentário: você pode obter uma aproximação razoável para$Var(\alpha)$por simulação. Na simulação, presumo que os 51 números sejam selecionados sem substituição.

set.seed(2020)
alpha = replicate(10^5, sum(sample(1:159, 51)))
summary(alpha)
   Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
   2915    3897    4081    4081    4266    5275 

Observe que, entre as 100.000 amostras que somei, todos os totais estão entre os dois números que você mencionou em sua pergunta.

var(alpha)
[1] 74069.39
sd(alpha)
[1] 272.1569

Um histograma dos valores simulados de $\alpha$ parece aproximadamente normal, então mostro a densidade normal de melhor ajuste junto com o histograma.

hist(alpha, prob=T, col="skyblue2")
 curve(dnorm(x, mean(alpha), sd(alpha)), add=T, col="red")

Com a substituição, a variação é um pouco maior. (Novamente aqui a distribuição de$\alpha$parece aproximadamente normal; histograma não mostrado.)

set.seed(1130)
alpha = replicate(10^6, sum(sample(1:159, 51, rep=T)))
summary(alpha)
   Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
   2593    3859    4080    4080    4302    5590 
var(alpha)
[1] 107274.7

Solução possível: se você considerar que a população tem números de 1 a 159, então a população tem variância 2120, e a soma de uma amostra aleatória com substituição deve ter variância 51 vezes maior, que é 108,120, o que parece concordar com o simulado resultado dentro da margem de erro de simulação.

var(1:159)
[1] 2120
51*var(1:159)
[1] 108120