Veri kümeleri için güven aralığı sonuçlarını yorumlama
Otomatik olarak bir veri kümesi oluşturdum ve güven aralığını kullanarak gürültü miktarı hakkındaki yorumumu netleştirmek istedim.
Rastgele bir örnek seçtim ve örneğe manuel olarak açıklama ekledim ve etiketlerin% 98'inin doğru olduğunu buldum. Bu değerlere dayanarak daha sonra% 99 güven aralığını hesapladım, bu da alt sınır 0.9614 ve üst sınır 0.9949 verdi. Bu, genel veri setindeki gürültünün alt ve üst sınırlar arasında olduğu ve ardından% 0,005 ile% 0,038 arasında olduğu anlamına mı geliyor?
Yanıtlar
Hayır, anlamı bu değil.
Öncelikle, hesapladığınız güven aralığının hangi parametre için olduğu açık değildir.
Her durumda, (sıklık) güven aralıklarının yorumlanmasında biraz özen gösterilmesi gerekir.
Sıklık istatistiklerinde, bir güven aralığı rastgeledir ve aralığın olduğu parametre sabittir. % 99 aralığı söz konusu olduğunda bu, verilerin birçok kez tekrar toplanması ve her seferinde güven aralığının yeniden hesaplanması durumunda, 100 üzerinden 99 kez parametrenin gerçek değerini içereceği anlamına gelir. Bu, sıklık güven aralığının teknik olarak doğru tek yorumudur. Genellikle,% 99 olasılıkla parametreyi içeren bir aralık olarak yanlış yorumlanır ve bu, kullandığınız yorum gibi görünür.