95% có cụ thể cho khoảng tin cậy theo bất kỳ cách nào không?
Tôi biết quan niệm sai lầm rằng "khoảng tin cậy 95% có nghĩa là có 95% khả năng thông số thực nằm trong phạm vi này" và cách giải thích đúng là nếu bạn xây dựng, chẳng hạn, 100, trong số các khoảng tin cậy này từ lấy mẫu ngẫu nhiên, thì 95 trong số khoảng tin cậy phải bao gồm tham số true.
Trong https://www.econometrics-with-r.org/5-2-cifrc.html, Tôi thấy như sau:
Có phải từ ngữ này không chính xác? Có vẻ như đang nói rằng giá trị thực có 95% cơ hội nằm trong khoảng tin cậy cụ thể đó.
Câu hỏi thứ hai của tôi là, giả sử bạn có một trong 95 khoảng tin cậy này. Ngoài việc sử dụng 95% để có điểm Z 1,96, 95% còn được biểu hiện như thế nào trong khoảng tin cậy này?
Trả lời
Có phải từ ngữ này không chính xác? Có vẻ như đang nói rằng giá trị thực có 95% cơ hội nằm trong khoảng tin cậy cụ thể đó.
Bạn phải lưu ý rằng, trong thống kê số người thường xuyên, thông số bạn đang ước tính (trong trường hợp của bạn $\beta_i$, giá trị thực của hệ số) không được coi là một biến ngẫu nhiên, mà là một số thực cố định. Điều đó có nghĩa là không đúng khi nói những điều như "$\beta_i$ đang trong khoảng thời gian $[a,b]$ với $95\%$xác suất " , bởi vì$\beta_i$không phải là một biến ngẫu nhiên và do đó không có phân phối xác suất. Xác suất của$\beta_i$ trong khoảng thời gian là $100\%$ (nếu giá trị cố định $\beta_i\in[a,b]$) hoặc là $0\%$ (nếu giá trị cố định $\beta_i\notin[a,b]$)
Đó là lý do tại sao "khoảng tin cậy 95% có nghĩa là có 95% khả năng thông số thực nằm trong phạm vi này" là một quan niệm sai lầm.
Mặt khác, các giới hạn của khoảng tin cậy chính là các biến ngẫu nhiên, vì chúng được tính toán từ dữ liệu mẫu. Điều đó có nghĩa là đúng khi nói "trong 95% tất cả các mẫu có thể,$\beta_i$ nằm trong khoảng tin cậy 95% ". Điều đó không có nghĩa là $\beta_i$ có $95\%$cơ hội nằm trong một khoảng cụ thể, có nghĩa là khoảng tin cậy , khác nhau đối với mỗi mẫu, có$95\%$ xác suất rơi xung quanh $\beta_i$.
Lưu ý rằng khoảng tin cậy sẽ chứa $\beta_i$với xác suất 95% trước khi dữ liệu được lấy mẫu. Sau khi nó được lấy mẫu, các cạnh của khoảng tin cậy sẽ chỉ là hai số cố định, không phải là các biến ngẫu nhiên nữa và áp dụng cùng một cơ sở từ đoạn đầu tiên. Tôi nghĩ rằng hình ảnh sau đây cung cấp một hình dung tốt đẹp cho ý tưởng này:
Do đó, từ ngữ được sử dụng ở đó thực sự chính xác.
Ngoài việc sử dụng 95% để có điểm Z 1,96, 95% còn được biểu hiện như thế nào trong khoảng tin cậy này?
Điểm Z 1,96 là nơi duy nhất mà 95% hiển thị. Nếu bạn thay đổi nó cho điểm Z tương ứng với 85%, bạn sẽ có khoảng tin cậy 85% của công thức.
Có lẽ nếu bạn diễn đạt lại thành:
" Hãy tưởng tượng bạn lặp lại việc lấy mẫu của mình trong cùng các điều kiện chính xác vô thời hạn. Đối với mỗi lần vẽ, bạn tính toán ước tính tham số và sai số chuẩn của nó để tính khoảng tin cậy 95% [công thức trong hình của bạn]. Sau đó, khoảng tin cậy 95% này sẽ thu tham số dân số đúng trong 95% thời gian nếu tất cả các giả thiết được đáp ứng và giả thuyết rỗng là đúng. "
Điều đó có ý nghĩa hơn không?
Đối với câu hỏi thứ hai của bạn, hãy xem xét phân phối chuẩn chuẩn dưới đây. Tổng diện tích dưới đường cong bằng 1. Nếu bạn coi mức ý nghĩa là 5% và chia nhỏ này cho mỗi đuôi (các vùng màu đỏ), thì bạn còn lại 95% ở giữa. Nếu giả thuyết rỗng là đúng thì đây là lĩnh vực mà bạn sẽ không bác bỏ giả thuyết rỗng vì bất kỳ điểm Z nào nằm trong khu vực đó đều hợp lý theo giả thuyết rỗng. Chỉ khi điểm Z của bạn rơi vào vùng màu đỏ, bạn sẽ bác bỏ giả thuyết vô hiệu, vì mẫu của bạn cung cấp bằng chứng quan trọng chống lại giả thuyết không, hay nói cách khác là bạn có thể đã khám phá ra - hooray: D
Bây giờ, bằng cách nhân điểm Z tới hạn +/- 1,96 (trong trường hợp độ tin cậy là 95%) với sai số chuẩn của mẫu, bạn đang dịch khoảng 95% này trở lại thang đo ban đầu. Vì vậy, mỗi khoảng tin cậy tương ứng với một bài kiểm tra giả thuyết trên thang đo lường của bạn như được đề xuất trong câu cuối cùng trên hình ảnh của bạn.
95% conf.int.
nghĩa là chỉ có 5% khả năng giá trị thực nghiệm nằm ngoài khoảng này. Nói cách khác, 5% khả năng dương tính giả nếu (và khi) bạn coi phạm vi đó là sự thật cơ bản.