Menafsirkan hasil interval kepercayaan untuk set data
Saya telah membuat kumpulan data secara otomatis dan ingin mengklarifikasi interpretasi saya tentang jumlah kebisingan menggunakan interval kepercayaan.
Saya memilih sampel acak dan secara manual menganotasi sampel dan menemukan bahwa 98% label benar. Berdasarkan nilai tersebut saya kemudian menghitung interval kepercayaan pada 99% yang memberikan batas bawah 0,9614 dan batas atas 0,9949. Apakah ini berarti bahwa noise dalam keseluruhan dataset berada di antara batas bawah dan atas dan kemudian dari 0,005% menjadi 0,038%?
Jawaban
Tidak, bukan itu artinya.
Untuk satu hal, tidak jelas parameter apa yang digunakan untuk interval kepercayaan yang Anda hitung.
Bagaimanapun, beberapa kehati-hatian diperlukan dalam interpretasi interval kepercayaan (frequentist).
Dalam statistik frekuentist, interval kepercayaan adalah acak, dan parameter tempat intervalnya ditetapkan. Dalam kasus interval 99% ini berarti bahwa jika data dikumpulkan lagi, berkali-kali, dan interval kepercayaan dihitung ulang setiap kali, maka 99 kali dari 100 itu akan berisi nilai sebenarnya dari parameter tersebut. Ini adalah satu-satunya interpretasi yang benar secara teknis dari interval kepercayaan frequentist. Ini sering diartikan, salah, sebagai interval yang berisi parameter dengan probabilitas 99%, dan itu tampaknya interpretasi yang Anda gunakan.