Apakah 95% spesifik untuk interval kepercayaan dengan cara apa pun?
Saya menyadari kesalahpahaman bahwa "interval kepercayaan 95% berarti ada 95% kemungkinan bahwa parameter sebenarnya termasuk dalam kisaran ini", dan bahwa interpretasi yang benar adalah jika Anda membangun, katakanlah, 100, interval kepercayaan ini dari pengambilan sampel acak, maka 95 interval keyakinan harus menyertakan parameter sebenarnya.
Di https://www.econometrics-with-r.org/5-2-cifrc.html, Saya melihat yang berikut ini:

Apakah kata-kata ini salah? Tampaknya dikatakan bahwa nilai sebenarnya memiliki 95% peluang berada dalam interval keyakinan tertentu.
Pertanyaan kedua saya adalah, katakanlah Anda memiliki salah satu dari 95 interval kepercayaan ini. Selain menggunakan 95% untuk mendapatkan skor Z 1,96, bagaimana lagi 95% tersebut dimanifestasikan dalam interval kepercayaan ini?
Jawaban
Apakah kata-kata ini salah? Tampaknya dikatakan bahwa nilai sebenarnya memiliki 95% peluang berada dalam interval keyakinan tertentu.
Anda harus ingat bahwa, dalam statistik frequentist, parameter yang Anda perkirakan (dalam kasus Anda $\beta_i$, nilai sebenarnya dari koefisien) tidak dianggap sebagai variabel acak, tetapi sebagai bilangan riil tetap. Artinya, tidak benar mengatakan sesuatu seperti "$\beta_i$ dalam interval $[a,b]$ dengan $95\%$probabilitas " , karena$\beta_i$bukan variabel acak dan karena itu tidak memiliki distribusi probabilitas. Kemungkinan$\beta_i$ berada di interval juga $100\%$ (jika nilainya tetap $\beta_i\in[a,b]$) atau $0\%$ (jika nilainya tetap $\beta_i\notin[a,b]$)
Itulah mengapa "interval kepercayaan 95% berarti ada kemungkinan 95% bahwa parameter sebenarnya berada dalam kisaran ini" adalah kesalahpahaman.
Di sisi lain, batas interval kepercayaan itu sendiri adalah variabel acak, karena dihitung dari data sampel. Artinya benar untuk mengatakan "dalam 95% dari semua sampel yang memungkinkan,$\beta_i$ berada dalam interval kepercayaan 95% ". Itu tidak berarti bahwa $\beta_i$ memiliki $95\%$peluang berada di dalam interval tertentu, artinya interval kepercayaan yang berbeda untuk setiap sampel memiliki$95\%$ kemungkinan jatuh sekitar $\beta_i$.
Perhatikan bahwa interval kepercayaan akan mengandung $\beta_i$dengan 95% probabilitas sebelum data diambil sampelnya. Setelah diambil sampel, tepi interval kepercayaan hanya akan menjadi dua angka tetap, bukan variabel acak lagi dan alasan yang sama dari paragraf pertama berlaku. Saya pikir gambar berikut menawarkan visualisasi yang bagus untuk ide ini:

Oleh karena itu, kata-kata yang digunakan di sana sebenarnya benar.
Selain menggunakan 95% untuk mendapatkan skor Z 1,96, bagaimana lagi 95% tersebut dimanifestasikan dalam interval kepercayaan ini?
Skor Z 1,96 adalah satu-satunya tempat di mana 95% muncul. Jika Anda mengubahnya untuk skor-Z yang sesuai dengan, katakanlah, 85%, Anda akan mendapatkan rumus interval kepercayaan 85%.
Mungkin jika Anda mengubah kalimat menjadi:
" Bayangkan Anda mengulangi pengambilan sampel Anda dalam kondisi yang sama persis tanpa batas. Untuk setiap penarikan, Anda menghitung perkiraan parameter dan kesalahan standarnya untuk menghitung interval kepercayaan 95% [rumus dalam gambar Anda]. Kemudian interval kepercayaan 95% ini akan menangkap parameter populasi benar di 95% dari waktu jika semua asumsi terpenuhi dan hipotesis nol benar. "
Apakah itu lebih masuk akal?
Adapun bagi Anda pertanyaan kedua, perhatikan distribusi normal standar di bawah ini. Total area di bawah kurva sama dengan 1. Jika Anda menganggap tingkat signifikansi menjadi 5% dan membaginya di antara setiap ekor (area merah), Anda akan mendapatkan 95% di tengah. Jika hipotesis nol benar, maka ini adalah area di mana Anda tidak akan menolak hipotesis nol karena skor-Z apa pun yang termasuk dalam area itu masuk akal di bawah hipotesis nol. Hanya jika skor-Z Anda termasuk dalam area merah, Anda menolak hipotesis nol, karena sampel Anda memberikan bukti signifikan terhadap hipotesis nol, atau dengan kata lain Anda kemungkinan besar membuat penemuan - hore: D
Sekarang dengan mengalikan skor-Z kritis +/- 1,96 (dalam kasus kepercayaan 95%) dengan kesalahan standar sampel Anda menerjemahkan interval 95% ini kembali ke skala pengukuran asli. Jadi setiap interval keyakinan sesuai dengan uji hipotesis pada skala pengukuran Anda seperti yang disarankan dalam kalimat terakhir pada gambar Anda.

95% conf.int.
berarti hanya ada 5% kemungkinan bahwa nilai empiris aktual keluar dari interval ini. Dengan kata lain, 5% kemungkinan positif palsu jika (dan kapan) Anda memperlakukan rentang tersebut sebagai kebenaran dasar.