Thống kê là sự pha trộn giữa toán học và xác suất. Mục đích của thống kê là mô tả các quá trình bạn có thể quan sát trên thế giới - chiều cao của cây sồi hoặc khả năng vắc xin sẽ hoạt động để chống lại bệnh tật - mà không cần phải đo lường mọi cây sồi trên thế giới hoặc tiêm phòng cho mọi người trước khi quyết định làm thế nào hiệu quả của một loại thuốc là.
Bởi vì xác suất mô tả những thứ liên quan đến sự may rủi, chúng ta phải chấp nhận rằng bất kỳ quá trình nào chúng ta đang sử dụng số liệu thống kê để đo lường, chúng ta sẽ không bao giờ có được bức tranh đầy đủ.
Tại sao sử dụng thống kê?
Giả sử bạn lật một đồng xu bốn lần. Bạn nhận được ba đầu và một đuôi. Nếu không sử dụng số liệu thống kê, chúng tôi có thể kết luận xác suất nhận được đầu là 75 phần trăm, trong đó xác suất thực sự có được đầu trong một lần lật đồng xu là 1: 1 hoặc cơ hội 50-50. Nếu thay vào đó, chúng ta thực hiện 40 lần tung đồng xu, chúng ta chắc chắn sẽ tiến gần hơn đến tỷ lệ 1: 1 của số đầu và số sấp, và việc sử dụng các số liệu thống kê sẽ phản ánh điều này.
John Drake, giáo sư nghiên cứu tại Trung tâm Sinh thái học về Bệnh truyền nhiễm tại Đại học Georgia, cho biết: trong một email. "Ví dụ, chúng tôi có thể quan tâm đến chiều cao của cây sồi. Chúng tôi không thể đo tất cả các cây sồi trên thế giới, nhưng chúng tôi có thể đo một số. Chúng tôi có thể tính chiều cao trung bình của các cây sồi trong mẫu, nhưng điều này đã thắng" t nhất thiết phải giống với mức trung bình của tất cả các cây sồi. "
Khoảng tin cậy
Bởi vì chúng tôi không thể đo tất cả các cây sồi trên thế giới, các nhà thống kê đưa ra một phạm vi chiều cao ước tính dựa trên xác suất và tất cả dữ liệu theo ý của họ. Phạm vi này được gọi là khoảng tin cậy và nó bao gồm hai số: một có thể nhỏ hơn giá trị thực và một có thể lớn hơn. Giá trị thực có lẽ nằm ở đâu đó giữa.
Drake nói: "Khoảng tin cậy '95 phần trăm' có nghĩa là 95 trong số 100 lần khoảng tin cậy được xây dựng theo cách này, khoảng đó sẽ bao gồm giá trị thực". "Nếu chúng tôi đo các mẫu cây sồi 100 lần, khoảng tin cậy dựa trên dữ liệu thu thập được trong 95 thí nghiệm đó sẽ bao gồm trung bình dân số hoặc chiều cao trung bình của tất cả các cây sồi. Do đó, khoảng tin cậy là thước đo độ chính xác ước tính. Ước tính ngày càng chính xác hơn khi bạn thu thập nhiều dữ liệu hơn. Đây là lý do tại sao khoảng tin cậy nhỏ hơn khi có nhiều dữ liệu hơn. "
Vì vậy, khoảng tin cậy giúp cho biết mức độ tốt hay xấu của ước tính. Khi chúng tôi lật một đồng xu chỉ bốn lần, ước tính 75 phần trăm của chúng tôi có khoảng tin cậy rộng vì kích thước mẫu của chúng tôi rất nhỏ. Ước tính của chúng tôi với 40 lần tung đồng xu sẽ có khoảng tin cậy hẹp hơn nhiều.
Ý nghĩa thực tế của khoảng tin cậy liên quan đến việc lặp đi lặp lại một thử nghiệm. Trong trường hợp bốn lần lật đồng xu, khoảng tin cậy 95 phần trăm có nghĩa là nếu chúng tôi lặp lại thử nghiệm lật đồng xu 100 lần thì trong 95 lần thử nghiệm đó, xác suất nhận được đầu của chúng tôi sẽ nằm trong khoảng tin cậy đó.
Giới hạn của thống kê
Có giới hạn cho số liệu thống kê. Bạn phải thiết kế một nghiên cứu tốt - số liệu thống kê không thể cho bạn biết bất cứ điều gì bạn không hỏi.
Giả sử bạn đang nghiên cứu hiệu quả của một loại vắc-xin, nhưng bạn không đưa trẻ em vào nghiên cứu của mình. Bạn có thể đưa ra khoảng tin cậy dựa trên dữ liệu bạn thu thập được, nhưng nó sẽ không cho bạn biết bất cứ điều gì về việc vắc xin bảo vệ trẻ em tốt như thế nào.
Drake nói: “Ngoài việc có đủ dữ liệu, mẫu cũng cần phải có tính đại diện. "Thông thường, điều này có nghĩa là có một mẫu ngẫu nhiên hoặc một mẫu ngẫu nhiên phân tầng. Giả sử 1.000 người tham gia thử nghiệm vắc xin giả định của bạn là đại diện cho dân số, thì sẽ hợp lý để kết luận rằng hiệu quả thực sự của vắc xin nằm trong khoảng tin cậy được báo cáo. Nếu mẫu không đại diện - nếu không bao gồm trẻ em - thì không có cơ sở thống kê để đưa ra kết luận về phần dân số không đại diện. "
Bây giờ điều đó thật thú vị:
Florence Nightingale là một trong những nhà thống kê quan trọng nhất trong lịch sử, sử dụng khoa học mà bà đi tiên phong để cứu mạng sống của những người lính trong Chiến tranh Krym.