Является ли 95% специфичным для доверительного интервала?

Aug 16 2020

Я знаю ошибочное представление о том, что «95% доверительный интервал означает, что существует 95% вероятность того, что истинный параметр попадает в этот диапазон», и что правильная интерпретация состоит в том, что если вы построите, скажем, 100 этих доверительных интервалов из случайная выборка, тогда 95 доверительных интервалов должны включать истинный параметр.

В https://www.econometrics-with-r.org/5-2-cifrc.html, Вижу следующее:

Это неправильная формулировка? Кажется, говорится, что истинное значение с вероятностью 95% находится в этом конкретном доверительном интервале.

Мой второй вопрос: допустим, у вас есть один из этих 95 доверительных интервалов. Помимо использования 95% для получения Z-балла 1,96, как еще 95% проявляются в этом доверительном интервале?

Ответы

27 PedroSebe Aug 16 2020 at 11:54

Это неправильная формулировка? Кажется, говорится, что истинное значение с вероятностью 95% находится в этом конкретном доверительном интервале.

Вы должны помнить, что в частотной статистике параметр, который вы оцениваете (в вашем случае $\beta_i$, истинное значение коэффициента) рассматривается не как случайная величина, а как фиксированное действительное число. Это означает, что говорить что-то вроде "$\beta_i$ находится в интервале $[a,b]$ с участием $95\%$вероятность " , потому что$\beta_i$не является случайной величиной и поэтому не имеет распределения вероятностей. Вероятность$\beta_i$ нахождение в интервале - это либо $100\%$ (если фиксированное значение $\beta_i\in[a,b]$) или же $0\%$ (если фиксированное значение $\beta_i\notin[a,b]$)

Вот почему «95% доверительный интервал означает, что существует вероятность 95%, что истинный параметр попадает в этот диапазон» - это заблуждение.

С другой стороны, пределы доверительного интервала сами по себе являются случайными величинами, поскольку они вычисляются на основе данных выборки. Это означает, что правильно сказать "в 95% всех возможных выборок,$\beta_i$ находится в доверительном интервале 95% ". Это не означает, что $\beta_i$ имеет $95\%$вероятность попадания в определенный интервал, это означает, что доверительный интервал , который отличается для каждой выборки, имеет$95\%$ вероятность падения $\beta_i$.

Обратите внимание, что доверительный интервал будет содержать $\beta_i$с вероятностью 95% до выборки данных. После выборки границы доверительных интервалов будут просто двумя фиксированными числами, а не случайными величинами, и будет применяться то же обоснование, что и в первом абзаце. Я думаю, что следующее изображение предлагает хорошую визуализацию этой идеи:

Следовательно, использованная там формулировка действительно правильная.

Помимо использования 95% для получения Z-балла 1,96, как еще 95% проявляются в этом доверительном интервале?

Z-оценка 1,96 - единственное место, где обнаруживаются 95%. Если вы измените его на Z-оценку, соответствующую, скажем, 85%, вы получите формулу доверительного интервала 85%.

7 Stefan Aug 16 2020 at 12:43

Возможно, если перефразировать на:

" Представьте, что вы повторяете выборку в одних и тех же условиях бесконечно. Для каждого розыгрыша вы вычисляете оценку параметра и его стандартную ошибку, чтобы вычислить 95% доверительный интервал [формула на вашем рисунке]. Затем этот 95% доверительный интервал будет отражать истинный параметр совокупности в 95% случаев, если выполняются все предположения и верна нулевая гипотеза ».

Было бы в этом больше смысла?

Что касается второго вопроса, рассмотрите приведенное ниже стандартное нормальное распределение. Общая площадь под кривой равна 1. Если вы считаете уровень значимости 5% и разделите его между каждым хвостом (красные области), то у вас останется 95% в середине. Если нулевая гипотеза верна, то это та область, в которой вы не должны отвергать нулевую гипотезу, поскольку любой Z-показатель, попадающий в эту область, является правдоподобным при нулевой гипотезе. Только если ваш Z-счет попадает в красные области, вы отклоняете нулевую гипотезу, поскольку ваша выборка предоставляет существенные доказательства против нулевой гипотезы, или, другими словами, вы, вероятно, сделали открытие - ура: D

Теперь, умножая критический Z-показатель +/- 1,96 (в случае 95% достоверности) на стандартную ошибку образца, вы переводите этот 95% интервал обратно в исходную шкалу измерений. Таким образом, каждый доверительный интервал соответствует проверке гипотез на вашей шкале измерений, как предложено в последнем предложении на вашем изображении.

1 ivan866 Aug 18 2020 at 03:35

95% conf.int.означает, что существует только 5% -ная вероятность того, что фактическое эмпирическое значение выпадет за пределы этого интервала. Другими словами, вероятность ложного срабатывания 5%, если (и когда) вы рассматриваете этот диапазон как основную истину.