Statystyki - skorygowane R-kwadrat

R-kwadrat mierzy odsetek zmienności zmiennej zależnej (Y) wyjaśnionej przez zmienne niezależne (X) dla modelu regresji liniowej. Skorygowane R-kwadrat dostosowuje statystykę na podstawie liczby niezależnych zmiennych w modelu. $ {R ^ 2} $ pokazuje, jak dobrze warunki (punkty danych) pasują do krzywej lub linii. Skorygowana $ {R ^ 2} $ wskazuje również, jak dobrze warunki pasują do krzywej lub linii, ale dostosowuje się do liczby terminów w modelu. Jeśli dodasz coraz więcej bezużytecznych zmiennych do modelu, skorygowany r-kwadrat zmniejszy się. Jeśli dodasz więcej użytecznych zmiennych, skorygowane r-kwadrat wzrośnie.

Skorygowana $ {R_ {adj} ^ 2} $ będzie zawsze mniejsza lub równa $ {R ^ 2} $. Do pracy z samplami potrzebujesz tylko $ {R ^ 2} $. Innymi słowy, $ {R ^ 2} $ nie jest konieczne, gdy masz dane z całej populacji.

Formuła

$ {R_ {adj} ^ 2 = 1 - [\ frac {(1-R ^ 2) (n-1)} {nk-1}]} $

Gdzie -

  • $ {n} $ = liczba punktów w twojej próbce danych.

  • $ {k} $ = liczba niezależnych regresorów, tj. liczba zmiennych w Twoim modelu, z wyłączeniem stałej.

Przykład

Problem Statement:

Fundusz ma próbną wartość R-kwadrat bliską 0,5 i bez wątpienia oferuje wyższe stopy zwrotu skorygowane o ryzyko przy wielkości próby 50 dla 5 predyktorów. Znajdź skorygowaną wartość R-kwadrat.

Solution:

Wielkość próby = 50 Liczba predyktorów = 5 Próbka R - kwadrat = 0,5. Zastąp jakości w równaniu,

$ {R_ {adj} ^ 2 = 1 - [\ frac {(1-0,5 ^ 2) (50-1)} {50-5-1}] \\ [7pt] \, = 1 - (0,75) \ czasy \ frac {49} {44}, \\ [7pt] \, = 1 - 0,8352, \\ [7pt] \, = 0,1648} $