友達がスキットルズの味を推測できる可能性

Aug 25 2020

データサイエンスの面接の準備をしています。準備中に出会った質問は次のとおりです。

あなたの友人は、味だけでスキットルズの5色を区別できると主張しています。スキットルズが特定の色になる確率は1/5です。あなたは友達にスキットルズを3つ与えると、彼は2つ正解します。あなたは彼を信じるべきですか?あなたが彼に100を与え、彼が40を正解した場合はどうなりますか?

答えはイエスだと確信しています。どちらの場合も信じるべきです。これが私の推論です:

しましょう $X_i$ 等しい指標確率変数である $1$ 私の友人が正しい場合 $i^{\text{th}}$ そう推測する $E(X_i) = 1/5$ そして $\text{Var}(X_i) = 4/25$

成功した結果の期待数は3/5と20であり、3つの推測の分散は $12/25$、したがって、2つを正しく推測すると、平均より2 SD以上高くなり、分散は $100$ 推測は $16$、したがって、それらは平均より1標準偏差を少し超えています。

私の推論が正しいかどうかは本当にわかりません。どんな種類の洞察もいただければ幸いです。

回答

4 BruceET Aug 25 2020 at 02:29

3つのうち2つが正しい最初のケースを考えてみましょう。友達が純粋に推測しているという帰無仮説の下では、正しい数は $X \sim \mathsf{Binom}(n=3, p=1/5).$ 代替案に対する帰無仮説の検定 $p > 1/5$ の大きな値に対して拒否します $X.$ したがって、結果のP値 $X = 2$ です $P(X \ge 2) = 0.104 > 0.05 = 5\%$ そしてあなたはで拒絶しないでしょう $5\%$レベル。証拠はあなたの友人が味によって色を識別することができるとあなたが信じる必要はありません。[以下のRでの計算ですが、二項PDFを使用して2つの項を合計することは難しくありません。注:友達が3つすべてを正しく理解した場合、推測するだけでその確率は次のようになります。$(1/5)^3 = 0.008$そして、あなた納得する必要があります。]

sum(dbinom(2:3, 3, 1/5))
[1] 0.104

ただし、友達が100のうち40を正解した場合、ヌル分布は次のようになります。 $X \sim \mathsf{Binom}(n=100, p=1/5)$ P値は $P(X \ge 40) \approx 0.$したがって、味によって色を判断する能力がなければ、この結果は非常にまれです。あなたはあなたの友人がある程度の能力を持っていると信じるべきです。

sum(dbinom(40:100, 40, 1/5))
[1] 1.099512e-28

の正規近似による $\mathsf{Binom}(n=100, p=1/5),$ あなたが持っている $\mu = E(X) = np = 20,\;$ $\sigma^2 =Var(X) = 16,\;$ $\sigma = SD(X) = 4.$ 次に

$$P(X \ge 40) = P(X>39.5)\\ = P\left(\frac{X - \mu}{\sigma} > \frac{39.5-20}{4} = 4.875\right)\\ \approx P(Z > 4.875) \approx 0, $$ どこ $Z$ 標準正規分布があります。

1 - pnorm(4.875)
[1] 5.440423e-07

次の図では、P値は垂直の点線の右側にあるバーの高さの(非常に小さい)合計です。赤い曲線は、近似正規分布の密度関数を示しています。