Bagaimana bisa $t$-statistik digunakan untuk menguji hipotesis?

Aug 15 2020

Saya punya pertanyaan berikut: Sampel acak berukuran 25 dari distribusi normal memiliki mean 47 dan standar deviasi 7. Berdasarkan $t$-statistik, dapatkah kita mengatakan bahwa informasi yang diberikan mendukung dugaan bahwa rata-rata populasi adalah 42?

Saya sangat bingung bagaimana caranya $t$-statistics berfungsi untuk menolak atau gagal menolak hipotesis. Penjelasan akan sangat membantu. Terima kasih!

Jawaban

2 BruceET Aug 16 2020 at 01:35

Uji-T Satu Sampel Dua Sisi

Kebetulan memiliki kumpulan data normal dengan $n=25, \bar X = 57, S = 7$ di jendela R Session saya.

Apakah data sesuai untuk di tes? Berikut adalah ringkasan data yang dihitung oleh R:

summary(x)
   Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
  35.18   40.78   44.83   47.00   52.35   61.34 
length(x); sd(x)
[1] 25   # sample size n = 25
[1] 7    # sample standard deviation S = 7.0

stripchart(x, pch="|")

Kira-kira data simetris tanpa pencilan jauh; lulus uji normalitas Shapiro-Wilk dengan nilai P diatas$0.05 = 5\%.$

shapiro.test(x)

        Shapiro-Wilk normality test

data:  x
W = 0.96136, p-value = 0.4423

Data cukup mendekati normal untuk di tes agar valid.

R printout untuk uji t. Jadi, berikut adalah keluaran dari R untuk uji t satu sampel$H_0: \mu = 42$ melawan $H_a: \mu \ne 42.$

t.test(x, mu=42)

        One Sample t-test

data:  x
t = 3.5714, df = 24, p-value = 0.001543
alternative hypothesis: 
  true mean is not equal to 42
95 percent confidence interval:
  44.11054 49.88946
sample estimates:
mean of x 
       47 

Interpretasi keluaran. Nilai P adalah$0.0015 < 0.05 = 5\%,$ jadi kamu akan menolak $H_0$pada tingkat signifikansi 5%. Anda juga bisa menolak di level 1%.

Outputnya juga memberikan confidence interval (CI) 95%. $(44.11, 49.89),$ sehingga kita dapat menyimpulkan nilai sebenarnya dari $\mu$berada dalam interval itu - yang tidak mengandung$\mu = 42.$

Salah satu interpretasi CI ini adalah bahwa CI ini merupakan interval hipotesis nol yang "tidak dapat ditolak", berdasarkan data Anda.

Detail yang harus Anda ketahui tentang tes ini. @PeterForeman telah menunjukkan kepada Anda cara menghitung statistik-T. Kecuali untuk nilai-P, Anda harus dapat mereproduksi semua yang lain dalam output dengan perhitungan tangan.

  • Nilai-P yang tepat diberikan dalam cetakan komputer. Dengan melihat tabel t yang dicetak , Anda harus dapat 'mengelompokkan' nilai-P. Misalnya, tabel saya memiliki nilai 2.467 dan 3.745 pada baris DF = 24, yang mengurung T-statistik 3.5714. Melihat margin atas tabel saya, saya melihat bahwa nilai-P harus berada di antara$2(0.001) = 0.002$ dan $2(0.0005) = 0.001,$yang sesuai dengan nilai dari R. [ 2S adalah karena ini adalah uji t 2 sisi.]

  • Anda bisa mendapatkan nilai P yang tepat dari pengujian 2 sisi ini di R atau perangkat lunak statistik lainnya. Ini adalah probabilitas statistik T lebih jauh dari$0$ daripada yang diamati $T =3.5714.$Di R, di mana ptCDF distribusi t Student, perhitungan berikut membuat Anda sangat dekat dengan nilai-P dalam cetakan. (Jika nilai statistik T yang dilaporkan dibulatkan, nilai-P mungkin tidak sama persis, tetapi hanya beberapa tempat desimal pertama yang penting untuk pengambilan keputusan.)

.

2 * (1 - pt(3.5714, 24))
[1] 0.001543522
  • Untuk menjawab salah satu pertanyaan Anda dalam komentar: Dari tabel t tercetak, Anda dapat mengatakan bahwa nilai kritis untuk menolak pada tingkat 5% adalah$c = 2.064.$ Artinya, Anda akan menolak pada tingkat 5% $|T| > 2.064,$yang mana itu. Kemungkinan pemotongan nilai kritis$0.025 = 2.5\% $dari ujung atas distribusi t Student dengan DF = 24. Dalam R, di mana qtadalah fungsi kuantil (CDF terbalik), Anda bisa mendapatkan nilai kritis 5% seperti yang ditunjukkan di bawah ini. Berapakah nilai kritis untuk suatu pengujian pada tingkat signifikansi 1%?

${}$

qt(.975, 24)
[1] 2.063899

Ringkasan grafis. Gambar di bawah ini menunjukkan fungsi densitas distribusi t Student dengan 24 DF. Warna biru vertikal menunjukkan nilai pengamatan dari statistik-T. Nilai-P adalah dua kali luas di bawah kurva di sebelah kanan garis ini. Nilai kritis atas dan bawah untuk pengujian pada tingkat 5% ditunjukkan oleh garis oranye putus-putus; garis merah (lebih jauh) untuk ujian pada tingkat 1%.