Statistik - Disesuaikan R-Squared

R-squared mengukur proporsi variasi dalam variabel dependen (Y) yang dijelaskan oleh variabel independen (X) untuk model regresi linier. Adjusted R-squared menyesuaikan statistik berdasarkan jumlah variabel independen dalam model. $ {R ^ 2} $ menunjukkan seberapa cocok istilah (titik data) dengan kurva atau garis. $ {R ^ 2} $ yang disesuaikan juga menunjukkan seberapa cocok istilah-istilah tersebut dengan kurva atau garis, tetapi menyesuaikan dengan jumlah istilah dalam sebuah model. Jika Anda menambahkan lebih banyak variabel yang tidak berguna ke model, r-squared yang disesuaikan akan berkurang. Jika Anda menambahkan variabel yang lebih berguna, r-kuadrat yang disesuaikan akan meningkat.

$ {R_ {adj} ^ 2} $ yang disesuaikan akan selalu kurang dari atau sama dengan $ {R ^ 2} $. Anda hanya perlu $ {R ^ 2} $ saat bekerja dengan sampel. Dengan kata lain, $ {R ^ 2} $ tidak diperlukan jika Anda memiliki data dari seluruh populasi.

Rumus

$ {R_ {adj} ^ 2 = 1 - [\ frac {(1-R ^ 2) (n-1)} {nk-1}]} $

Dimana -

  • $ {n} $ = jumlah titik dalam sampel data Anda.

  • $ {k} $ = jumlah regressor independen, yaitu jumlah variabel dalam model Anda, tidak termasuk konstanta.

Contoh

Problem Statement:

Reksa dana memiliki sampel nilai R-squared mendekati 0,5 dan tidak diragukan lagi menawarkan pengembalian risiko yang disesuaikan lebih tinggi dengan ukuran sampel 50 untuk 5 prediktor. Temukan nilai persegi R yang Disesuaikan.

Solution:

Ukuran sampel = 50 Jumlah prediktor = 5 Sampel R - kuadrat = 0.5. Gantikan kualitas dalam persamaan,

$ {R_ {adj} ^ 2 = 1 - [\ frac {(1-0,5 ^ 2) (50-1)} {50-5-1}] \\ [7pt] \, = 1 - (0,75) \ kali \ frac {49} {44}, \\ [7pt] \, = 1 - 0,8352, \\ [7pt] \, = 0,1648} $