İstatistik, matematik ve olasılığın biraz karışımıdır . İstatistiğin amacı, dünyadaki her meşe ağacını ölçmek veya her insanı aşılamak zorunda kalmadan - meşe ağaçlarının yüksekliği veya bir aşının hastalıkları savuşturma olasılığı gibi - dünyada gözlemleyebileceğiniz süreçleri tanımlamaktır. etkili bir ilaçtır.
Olasılık, şansı içeren şeyleri tanımladığı için, ölçmek için istatistikleri hangi süreci kullanırsak kullanalım, hiçbir zaman tam resmi elde edemeyeceğimizi kabul etmeliyiz.
İstatistikler Neden Kullanılır?
Bir madeni parayı dört kez çevirdiğinizi varsayalım. Üç kafa ve bir kuyruk alırsınız. İstatistik kullanmadan tura gelme olasılığının yüzde 75 olduğu sonucuna varabiliriz, burada bir yazı turasında tura gelme olasılığı 1:1 veya 50-50 şanstır. Bunun yerine 40 yazı tura atsaydık, kesinlikle 1:1 yazı tura oranına çok daha yakın olurduk ve istatistiklerin kullanımı bunu yansıtırdı.
Georgia Üniversitesi Enfeksiyon Hastalıkları Ekolojisi Merkezi'nde araştırma profesörü olan John Drake, "İstatistiğin çoğu, bir örneklemden - gerçek gözlemlerden - popülasyonun özelliklerine - tüm olası gözlemlere kadar akıl yürütme ile ilgilidir" diyor . bir e-postada. "Meşe ağaçlarının boyuyla ilgilenebiliriz mesela. Dünyadaki tüm meşe ağaçlarını ölçemeyiz ama bazılarını ölçebiliriz. Örnekteki meşe ağaçlarının ortalama yüksekliğini hesaplayabiliriz ama bu olmaz' t mutlaka tüm meşe ağaçlarının ortalaması ile aynı olmalıdır."
Güvenilirlik aralığı
Dünyadaki tüm meşe ağaçlarını ölçemediğimiz için, istatistikçiler olasılığa ve ellerindeki tüm verilere dayalı olarak tahmini bir yükseklik aralığı buluyorlar. Bu aralığa güven aralığı denir ve iki sayıdan oluşur: biri muhtemelen gerçek değerden daha küçük ve diğeri muhtemelen daha büyüktür. Gerçek değer muhtemelen arasında bir yerdedir.
Drake, "'Yüzde 95 güven aralığı', güven aralığının bu şekilde oluşturulduğu 100 kez 95'inin aralığın gerçek değeri içereceği anlamına gelir" diyor. "Meşe ağaçlarının örneklerini 100 kez ölçtüysek, bu deneylerin 95'inde toplanan verilere dayanan güven aralığı, popülasyon ortalamasını veya tüm meşe ağaçlarının ortalama yüksekliğini içerecektir. Bu nedenle, bir güven aralığı kesinliğin bir ölçüsüdür. Daha fazla veri topladıkça tahmin giderek daha kesin hale gelir. Bu nedenle, daha fazla veri elde edildikçe güven aralıkları küçülür."
Bu nedenle, bir güven aralığı, tahminin ne kadar iyi veya kötü olduğunu göstermeye yardımcı olur. Sadece dört kez yazı tura attığımızda, örneklem büyüklüğümüz çok küçük olduğu için yüzde 75'lik tahminimiz geniş bir güven aralığına sahiptir. 40 yazı tura ile tahminimiz çok daha dar bir güven aralığına sahip olacaktır.
Bir güven aralığının gerçek anlamı, bir deneyi defalarca tekrarlamakla ilgilidir. Dört yazı tura durumunda, yüzde 95 güven aralığı, yazı tura deneyini 100 kez tekrar edersek, bunların 95'inde tura gelme olasılığımızın bu güven aralığına düşeceği anlamına gelir.
İstatistik Sınırları
İstatistiklerin sınırları vardır. İyi bir çalışma tasarlamanız gerekir - istatistikler size sormadığınız hiçbir şeyi söyleyemez.
Diyelim ki bir aşının etkinliği üzerinde çalışıyorsunuz, ancak çalışmanıza çocukları dahil etmediniz. Topladığınız verilere dayanarak bir güven aralığı belirleyebilirsiniz, ancak bu size aşının çocukları ne kadar iyi koruduğu hakkında hiçbir şey söylemez.
Drake, "Yeterli veriye sahip olmanın yanı sıra, örneğin temsili olması da gerekiyor" diyor. "Genellikle bu, rastgele bir numuneye veya tabakalı rastgele bir numuneye sahip olmak anlamına gelir. Varsayımsal aşı denemenizdeki 1000 katılımcının popülasyonu temsil ettiğini varsayarsak, aşının gerçek etkinliğinin bildirilen güven aralığında olduğu sonucuna varmak mantıklıdır. Örnek temsili değilse - çocukları içermiyorsa - nüfusun temsil edilmeyen kısmı hakkında sonuç çıkarmak için istatistiksel bir temel yoktur."
Şimdi Bu İlginç:
Florence Nightingale , Kırım Savaşı sırasında askerlerin hayatını kurtarmak için öncülük ettiği bilimi kullanarak tarihin en önemli istatistikçilerinden biriydi.