Sinir Ağlarının Matematiksel Yapı Taşları

Matematik, herhangi bir makine öğrenimi algoritmasında hayati önem taşır ve belirli bir şekilde tasarlanmış doğru algoritmayı elde etmek için matematiğin çeşitli temel kavramlarını içerir.

Makine öğrenimi ve veri bilimi için matematik konularının önemi aşağıda belirtilmiştir -

Şimdi, Doğal Dil İşleme açısından önemli olan makine öğreniminin temel matematiksel kavramlarına odaklanalım -

Vektörler

Vektör, sürekli veya kesikli sayılar dizisi olarak kabul edilir ve vektörlerden oluşan uzaya vektör uzayı denir. Vektörlerin uzay boyutları sonlu veya sonsuz olabilir, ancak makine öğrenimi ve veri bilimi problemlerinin sabit uzunluklu vektörlerle ilgilendiği gözlemlenmiştir.

Vektör gösterimi aşağıda belirtildiği gibi görüntülenir -

temp = torch.FloatTensor([23,24,24.5,26,27.2,23.0])
temp.size()
Output - torch.Size([6])

Makine öğreniminde çok boyutlu verilerle ilgileniyoruz. Dolayısıyla vektörler çok önemli hale gelir ve herhangi bir tahmin problem ifadesi için girdi özellikleri olarak kabul edilir.

Skaler

Skalarlar, yalnızca bir değer içeren sıfır boyutlara sahip olarak adlandırılır. PyTorch söz konusu olduğunda, sıfır boyutlu özel bir tensör içermez; dolayısıyla beyan aşağıdaki şekilde yapılacaktır -

x = torch.rand(10)
x.size()
Output - torch.Size([10])

Matrisler

Yapılandırılmış verilerin çoğu genellikle tablolar veya belirli bir matris şeklinde temsil edilir. Python scikit-learn makine öğrenimi kitaplığında kolayca bulunabilen Boston House Fiyatları adlı bir veri kümesi kullanacağız.

boston_tensor = torch.from_numpy(boston.data)
boston_tensor.size()
Output: torch.Size([506, 13])
boston_tensor[:2]
Output:
Columns 0 to 7
0.0063 18.0000 2.3100 0.0000 0.5380 6.5750 65.2000 4.0900
0.0273 0.0000 7.0700 0.0000 0.4690 6.4210 78.9000 4.9671
Columns 8 to 12
1.0000 296.0000 15.3000 396.9000 4.9800
2.0000 242.0000 17.8000 396.9000 9.1400