Apa Interval Keyakinan dalam Statistik?

Apr 10 2021
Sains mengharuskan kita membuat tebakan, itulah sebabnya kita memiliki interval kepercayaan.
Jika Anda melempar koin, 10 ekor berturut-turut mungkin sangat tidak mungkin. Namun setelah 10 kali lemparan, peluang mendapatkan ekor pada lemparan berikutnya tetap 50 persen. Monty Rakusen/Getty Images

Statistik adalah sedikit campuran antara matematika dan probabilitas. Inti dari statistik adalah untuk menggambarkan proses yang dapat Anda amati di dunia — ketinggian pohon ek atau kemungkinan vaksin akan bekerja untuk menangkis penyakit — tanpa harus mengukur setiap pohon ek di dunia atau memvaksinasi setiap orang sebelum memutuskan bagaimana efektif suatu obat adalah.

Karena probabilitas menggambarkan hal-hal yang melibatkan peluang, kita harus menerima bahwa proses apa pun yang kita gunakan untuk mengukur statistik, kita tidak akan pernah mendapatkan gambaran lengkapnya.

Mengapa Menggunakan Statistik?

Misalkan Anda melempar koin empat kali. Anda mendapatkan tiga kepala dan satu ekor. Tanpa menggunakan statistik, kita dapat menyimpulkan probabilitas mendapatkan kepala adalah 75 persen, di mana probabilitas sebenarnya untuk mendapatkan kepala dalam pelemparan koin adalah 1:1, atau peluang 50-50. Jika kita melakukan 40 lemparan koin sebagai gantinya, kita pasti akan lebih dekat dengan rasio 1:1 dari kepala ke ekor, dan penggunaan statistik akan mencerminkan hal ini.

"Sebagian besar statistik berkaitan dengan penalaran dari sampel - pengamatan aktual - dengan karakteristik populasi - semua pengamatan yang mungkin," kata John Drake, seorang profesor riset di Pusat Ekologi Penyakit Menular di Universitas Georgia, dalam sebuah email. "Misalnya, kita mungkin tertarik dengan tinggi pohon oak. Kita tidak bisa mengukur semua pohon oak di dunia, tapi kita bisa mengukur beberapa. Kita bisa menghitung rata-rata tinggi pohon oak dalam sampel, tapi ini akan' tidak harus sama dengan rata-rata semua pohon ek."

Interval Keyakinan

Karena kita tidak dapat mengukur semua pohon ek di dunia, ahli statistik membuat perkiraan ketinggian berdasarkan probabilitas dan semua data yang mereka miliki. Rentang ini disebut interval kepercayaan dan terdiri dari dua angka: satu yang mungkin lebih kecil dari nilai sebenarnya dan satu yang mungkin lebih besar. Nilai sebenarnya mungkin berada di antara keduanya.

"'Interval kepercayaan 95 persen' berarti bahwa 95 dari 100 kali interval kepercayaan dibangun dengan cara ini, interval akan menyertakan nilai sebenarnya," kata Drake. "Jika kita mengukur sampel pohon ek 100 kali, interval kepercayaan berdasarkan data yang dikumpulkan dalam 95 percobaan tersebut akan mencakup rata-rata populasi, atau tinggi rata-rata semua pohon ek. Jadi, interval kepercayaan adalah ukuran presisi perkiraan. Perkiraan menjadi lebih dan lebih tepat saat Anda mengumpulkan lebih banyak data. Inilah sebabnya mengapa interval kepercayaan menjadi lebih kecil karena lebih banyak data tersedia."

Jadi, interval kepercayaan membantu menunjukkan seberapa baik atau buruk perkiraan tersebut. Ketika kita melempar koin hanya empat kali, perkiraan kita sebesar 75 persen memiliki interval kepercayaan yang lebar karena ukuran sampel kita sangat kecil. Perkiraan kami dengan 40 lemparan koin akan memiliki interval kepercayaan yang jauh lebih sempit.

Arti sebenarnya dari interval kepercayaan berkaitan dengan pengulangan percobaan berulang-ulang. Dalam kasus empat lemparan koin, interval kepercayaan 95 persen berarti bahwa jika kita mengulangi percobaan pelemparan koin 100 kali, dalam 95 kali, peluang kita untuk mendapatkan kepala akan jatuh dalam interval kepercayaan itu.

Batas Statistik

Ada batasan untuk statistik. Anda harus merancang studi yang baik — statistik tidak dapat memberi tahu Anda apa pun yang tidak Anda tanyakan.

Katakanlah Anda sedang mempelajari kemanjuran vaksin, tetapi Anda tidak memasukkan anak-anak dalam penelitian Anda. Anda dapat membuat interval kepercayaan berdasarkan data yang Anda kumpulkan, tetapi itu tidak akan memberi tahu Anda apa pun tentang seberapa baik vaksin melindungi anak-anak.

“Selain memiliki data yang cukup, sampel juga harus representatif,” kata Drake. "Biasanya, ini berarti memiliki sampel acak atau sampel acak bertingkat. Dengan asumsi 1.000 peserta dalam uji coba vaksin hipotetis Anda mewakili populasi, maka masuk akal untuk menyimpulkan bahwa kemanjuran vaksin yang sebenarnya berada dalam interval kepercayaan yang dilaporkan. Jika sampel tidak representatif - jika tidak termasuk anak-anak - maka tidak ada dasar statistik untuk menarik kesimpulan tentang bagian populasi yang tidak terwakili."

Sekarang Itu Menarik:

Florence Nightingale adalah salah satu ahli statistik terpenting dalam sejarah, menggunakan ilmu yang dia rintis untuk menyelamatkan nyawa tentara selama Perang Krimea.