95 %는 어떤 방식 으로든 신뢰 구간에 특정합니까?
저는 "95 % 신뢰 구간은 실제 모수가이 범위에 속할 확률이 95 %임을 의미합니다."라는 오해를 알고 있으며, 올바른 해석은 이러한 신뢰 구간을 무작위 샘플링을 사용하면 95 개의 신뢰 구간에 참 모수를 포함해야합니다.
에 https://www.econometrics-with-r.org/5-2-cifrc.html, 다음 내용이 표시됩니다.
이 문구가 올바르지 않습니까? 실제 값이 특정 신뢰 구간에있을 확률이 95 %라고 말하는 것 같습니다.
두 번째 질문은 95 개의 신뢰 구간 중 하나가 있다고 가정합니다. 1.96 Z- 점수를 얻기 위해 95 %를 사용하는 것 외에이 신뢰 구간에서 95 %가 어떻게 나타 납니까?
답변
이 문구가 올바르지 않습니까? 실제 값이 특정 신뢰 구간에있을 확률이 95 %라고 말하는 것 같습니다.
빈도주의 통계에서 추정하는 매개 변수 (귀하의 경우 $\beta_i$상기 계수의 참값)되어 있지 않지만 고정 실수로서, 랜덤 변수로서 고려 하였다. 즉, "$\beta_i$ 간격에있다 $[a,b]$ 와 $95\%$확률 " , 왜냐하면$\beta_i$랜덤 변수가 아니므로 확률 분포가 없습니다. 확률$\beta_i$ 간격에있는 것은 $100\%$ (고정 값 인 경우 $\beta_i\in[a,b]$) 또는 $0\%$ (고정 값 인 경우 $\beta_i\notin[a,b]$)
그렇기 때문에 "95 % 신뢰 구간은 실제 모수가이 범위에 속할 확률이 95 %임을 의미합니다"가 오해입니다.
반면 신뢰 구간의 한계는 표본 데이터에서 계산되기 때문에 확률 변수입니다. 즉, "가능한 모든 샘플의 95 %에서$\beta_i$ 95 % 신뢰 구간에 있습니다. "라는 의미는 아닙니다. $\beta_i$ 있다 $95\%$특정 구간 내에있을 가능성은 각 표본에 대해 다른 신뢰 구간 이$95\%$ 넘어 질 확률 $\beta_i$.
신뢰 구간에는 $\beta_i$95 %의 확률로 이전 데이터가 샘플링된다. 표본을 추출한 후 신뢰 구간 간선은 더 이상 임의 변수가 아닌 두 개의 고정 된 숫자가되고 첫 번째 단락의 동일한 근거가 적용됩니다. 다음 이미지가이 아이디어에 대한 멋진 시각화를 제공한다고 생각합니다.
따라서 거기에 사용 된 표현은 실제로 정확합니다.
1.96 Z- 점수를 얻기 위해 95 %를 사용하는 것 외에이 신뢰 구간에서 95 %가 어떻게 나타 납니까?
1.96 Z 점수는 95 %가 나타나는 유일한 곳입니다. 예를 들어 85 %에 해당하는 Z- 점수를 변경하면 공식 85 % 신뢰 구간이됩니다.
아마도 다음과 같이 바꾸면 될 것입니다.
" 똑같은 조건에서 무기한으로 샘플링을 반복한다고 상상해보십시오. 각 그리기에 대해 모수 추정치와 표준 오차를 계산하여 95 % 신뢰 구간 [그림의 공식]을 계산합니다. 그러면이 95 % 신뢰 구간이 모든 가정이 충족되고 귀무 가설이 참인 경우 95 %의 실제 모집단 매개 변수입니다. "
그게 더 말이 되겠습니까?
두 번째 질문에 대해서는 아래의 표준 정규 분포를 고려하십시오. 곡선 아래의 총 면적은 1입니다. 유의 수준을 5 %로 간주하고이를 각 꼬리 (빨간색 영역)로 나누면 중간에 95 %가 남습니다. 귀무 가설이 참이면 귀무 가설에서 해당 영역에 해당하는 Z 점수가 그럴듯하기 때문에 귀무 가설을 기각하지 않는 영역입니다. Z 점수가 빨간색 영역에 해당하는 경우에만 샘플이 귀무 가설에 반하는 중요한 증거를 제공하거나 다른 말로 발견했을 가능성이 높기 때문에 귀무 가설을 기각합니다.
이제 +/- 1.96의 임계 Z- 점수 (95 % 신뢰도의 경우)와 샘플의 표준 오차를 곱하여이 95 % 간격을 원래 측정 스케일로 다시 변환합니다. 따라서 각 신뢰 구간은 이미지의 마지막 문장에서 제안한대로 측정 척도에 대한 가설 검정에 해당합니다.
95% conf.int.
실제 경험 값이이 간격을 벗어날 확률은 5 %에 불과합니다. 즉, 해당 범위를 기준 사실로 취급하는 경우 (그리고 언제) 오 탐지 가능성이 5 %입니다.