Doğrusal Regresyonun Temelleri
Tanım
Doğrusal Regresyon, iki fenomeni ilişkilendirmemizi sağlayan bir metodolojidir. Bu yaklaşım, yeni değerleri tahmin etmek için gerçek verilere dayalı bir kuralın tanımlanmasına izin verir. Basit bir şekilde lineer regresyon gerçekleştiren algoritmalar ve paketler var, ancak perde arkasında neler olup bittiğini hemen anlayamıyoruz. Bu sunumun amacı, doğrusal regresyonun matematiksel temellerini ortaya çıkarmaktır.
Yöntem
Yöntem üç adıma ayrılabilir:
- Verilerin ilk görünümü;
- parametrelerin belirlenmesi;
- Bulunan eğri parametrelerini oluşturun.
Bu adımın amacı, verilerin yaklaşık olarak doğrusal bir davranış izleyip izlemediğini doğrulamaktır. Aksi takdirde doğrusal regresyon yöntemi uygulanmamalıdır. Aşağıdaki tarih kümesini ele alalım.
Bu verileri çizebilir ve davranışlarını kontrol edebiliriz. Aşağıdaki resimde grafiğin doğrusal bir davranış gösterdiğini görebiliriz, bu nedenle doğrusal regresyon tekniğinin uygulanması haklıdır.
Bu depoda, lineer regresyon kullanarak bir eğri uyduran bir python kodu sağladım, dediğim gibi, matematiksel temeller bastırılmıştır ve dahili olarak ne olduğu hakkında hiçbir fikrimiz yoktur. Kod aşağıdaki görüntüyü oluşturur.
parametrelerin belirlenmesi
Eğrinin a ve b parametrelerini belirlemek için en küçük kareler yöntemini kullanacağız. Bu yöntemde a ve b değerleri, Y'nin gözlenen değerleri ile X'in aynı değerleri için düzeltilmiş eğriden elde edilen değerler arasındaki farkların kareleri toplamı minimum olacak şekilde elde edilir. Matematiksel olarak bu fikir şu şekilde temsil edilebilir:
Minimum konfigürasyonu bulmak için yukarıdaki ifadeyi a ve b parametrelerine göre türetebilir ve sıfıra eşitleyebiliriz.
n'nin gözlem sayısı olduğunu bilerek, (I) ve (II) denklemlerini aşağıdaki gibi (III) ve (IV) denklemleri olarak yazabiliriz.
b parametresini belirlemek için, birinci denklemi n'ye böleriz ve ikinci denklemde yerine koymak için a'yı ayırırız:
İkinci denklemde yerine koymak:
Çizginin doğrusal katsayısı, yukarıda tanımlanan denklemle kolayca belirlenebilir:
Bu parametreleri aşağıdaki kod aracılığıyla scipy paketini kullanmadan doğrudan verilerden hesaplayabiliriz:
Ve son olarak, lineer katsayı a ve açısal katsayı b'yi elde ettikten sonra, uyum eğrisini çizebiliriz.