Зачем использовать Z-тест, а не T-тест для доверительного интервала доли населения?

Aug 18 2020

Зачем использовать Z-тест, а не T-тест для доверительного интервала доли населения?

Забудем на секунду о пропорциях населения. Допустим, мы помещаем доверительный интервал на среднее значение некоторой случайной величины X по генеральной совокупности. Я понимаю, что если дисперсия X известна, то мы можем провести Z-тест. В противном случае (общий случай) мы должны оценить отклонение от выборки, и поэтому мы должны провести T-тест. Насколько я понимаю, это верно ДАЖЕ, если X нормально распределен. То есть, если мы оцениваем дисперсию по выборке, выборочное распределение (не уверен, что я правильно понял эту часть) представляет собой T-распределение с n-1 степенями свободы, даже если X имеет нормальное распределение.

Почему та же логика не применима к оценке доли населения? В онлайн-учебниках [2] и видео [2] вместо этого проводится Z-тест. Я понимаю, что если размер выборки большой, биномиальное распределение может быть аппроксимировано нормальным распределением в соответствии с центральной предельной теоремой, но даже если это так, разве мы не оцениваем отклонение от выборки, подразумевая необходимость в Т-тест, а не Z-тест?

[1] https://openstax.org/books/introductory-business-statistics/pages/8-3-a-confidence-interval-for-a-population-proportion

[2] https://www.youtube.com/watch?v=owYtDtmrCoE&list=PLvxOuBpazmsOXoys_s9qkbspk_BlOtWcW

Ответы

tommik Aug 18 2020 at 14:30

в двух словах:

  • T-тест используется для оценки среднего, когда распределение населения известно как гауссовское, но с неизвестной дисперсией.

  • Тест на предложение - это тест на среднем популяции бернулли. При определенных условиях вы можете использовать Z-тест в качестве приближения, потому что ваша оценка (то есть MLE) асимптотически нормальна.