Có thể như thế nào$t$-thống kê được sử dụng để kiểm tra giả thuyết?

Aug 15 2020

Tôi có câu hỏi sau: Một mẫu ngẫu nhiên cỡ 25 từ phân phối chuẩn có giá trị trung bình 47 và độ lệch chuẩn 7. Dựa trên$t$-thống kê, chúng ta có thể nói rằng thông tin đã cho hỗ trợ phỏng đoán rằng giá trị trung bình của dân số là 42 không?

Tôi thực sự bối rối làm thế nào$t$-thống kê có tác dụng bác bỏ hoặc không bác bỏ một giả thuyết. Một lời giải thích sẽ thực sự hữu ích. Cảm ơn!

Trả lời

2 BruceET Aug 16 2020 at 01:35

Kiểm tra chữ T một mẫu hai mặt

Tình cờ có một tập dữ liệu bình thường với$n=25, \bar X = 57, S = 7$trong cửa sổ Phiên R của tôi.

Dữ liệu có phù hợp với thử nghiệm không? Dưới đây là tóm tắt dữ liệu, được tính toán bởi R:

summary(x)
   Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
  35.18   40.78   44.83   47.00   52.35   61.34 
length(x); sd(x)
[1] 25   # sample size n = 25
[1] 7    # sample standard deviation S = 7.0

stripchart(x, pch="|")

Dữ liệu gần như đối xứng không có ngoại lệ xa; vượt qua bài kiểm tra tính quy tắc của Shapiro-Wilk với giá trị P ở trên$0.05 = 5\%.$

shapiro.test(x)

        Shapiro-Wilk normality test

data:  x
W = 0.96136, p-value = 0.4423

Dữ liệu đủ gần với mức bình thường để thử nghiệm có giá trị.

Bản in R cho bài kiểm tra t. Do đó, đây là đầu ra từ R cho thử nghiệm t một mẫu của$H_0: \mu = 42$chống lại$H_a: \mu \ne 42.$

t.test(x, mu=42)

        One Sample t-test

data:  x
t = 3.5714, df = 24, p-value = 0.001543
alternative hypothesis: 
  true mean is not equal to 42
95 percent confidence interval:
  44.11054 49.88946
sample estimates:
mean of x 
       47 

Diễn giải đầu ra. Giá trị P là$0.0015 < 0.05 = 5\%,$vì vậy bạn sẽ từ chối$H_0$với mức ý nghĩa 5%. Bạn cũng có thể từ chối ở mức 1%.

Đầu ra cũng cho khoảng tin cậy (CI) 95%$(44.11, 49.89),$để ta có thể kết luận giá trị thực của$\mu$nằm trong khoảng đó-- không chứa$\mu = 42.$

Một cách giải thích về CI này là nó là một khoảng giả thuyết vô hiệu "không thể bác bỏ", dựa trên dữ liệu của bạn.

Thông tin chi tiết bạn nên biết về bài kiểm tra. @PeterForeman đã chỉ cho bạn cách tính thống kê T. Ngoại trừ giá trị P, bạn sẽ có thể sao chép mọi thứ khác trong đầu ra bằng tính toán thủ công.

  • Giá trị P chính xác được đưa ra trong bản in máy tính. Bằng cách nhìn vào bảng in của t, bạn sẽ có thể 'đặt trong ngoặc vuông' giá trị P. Ví dụ: bảng của tôi có các giá trị 2,467 và 3,745 trên dòng DF = 24, nằm trong khung của thống kê T 3,5714. Nhìn vào lề trên cùng của bảng, tôi thấy rằng giá trị P phải nằm trong khoảng$2(0.001) = 0.002$$2(0.0005) = 0.001,$phù hợp với giá trị từ R. [ 2S là vì đây là phép thử t 2 phía.]

  • Bạn có thể nhận được giá trị P chính xác của thử nghiệm 2 mặt này trong R hoặc phần mềm thống kê khác. Đó là xác suất của một thống kê T xa hơn$0$so với quan sát$T =3.5714.$Trong R, ở đâu ptlà phân phối CDF của Student, phép tính sau đây giúp bạn tiến rất gần đến giá trị P trong bản in. (Nếu giá trị của thống kê T được báo cáo được làm tròn, thì giá trị P có thể không khớp chính xác, nhưng chỉ một vài chữ số thập phân đầu tiên mới quan trọng đối với việc ra quyết định.)

.

2 * (1 - pt(3.5714, 24))
[1] 0.001543522
  • Để trả lời một trong những câu hỏi của bạn trong phần nhận xét: Từ bảng t đã in, bạn có thể nói rằng giá trị tới hạn để từ chối ở mức 5% là$c = 2.064.$Đó là bạn sẽ từ chối ở mức 5% của$|T| > 2.064,$nó là gì. Giá trị quan trọng cắt giảm xác suất$0.025 = 2.5\% $từ phần đuôi trên của phân phối t Student với DF = 24. Trong R, ở đâu qtlà hàm lượng tử (CDF nghịch đảo), bạn có thể nhận được giá trị tới hạn 5% như hình bên dưới. Giá trị tới hạn cho một kiểm định ở mức ý nghĩa 1% là gì?

${}$

qt(.975, 24)
[1] 2.063899

Tóm tắt đồ họa. Hình bên dưới biểu diễn hàm mật độ của phân bố t Student với 24 DF. Màu xanh dọc giống như hiển thị giá trị quan sát được của thống kê T. Giá trị P gấp đôi diện tích dưới đường cong bên phải của đường này. Các giá trị tới hạn thấp hơn và cao hơn đối với thử nghiệm ở mức 5% được hiển thị bằng các đường chấm màu cam dọc; đường màu đỏ (xa hơn) cho thử nghiệm ở mức 1%.