PyTorch - การถดถอยเชิงเส้น
ในบทนี้เราจะเน้นไปที่ตัวอย่างพื้นฐานของการนำการถดถอยเชิงเส้นโดยใช้ TensorFlow การถดถอยโลจิสติกส์หรือการถดถอยเชิงเส้นเป็นวิธีการเรียนรู้ของเครื่องที่ได้รับการดูแลสำหรับการจัดหมวดหมู่หมวดหมู่ที่ไม่ต่อเนื่อง เป้าหมายของเราในบทนี้คือการสร้างแบบจำลองที่ผู้ใช้สามารถทำนายความสัมพันธ์ระหว่างตัวแปรทำนายกับตัวแปรอิสระอย่างน้อยหนึ่งตัว
ความสัมพันธ์ระหว่างตัวแปรทั้งสองนี้ถือเป็นเส้นตรงกล่าวคือถ้า y เป็นตัวแปรตามและ x ถือเป็นตัวแปรอิสระความสัมพันธ์การถดถอยเชิงเส้นของสองตัวแปรจะมีลักษณะเหมือนสมการที่กล่าวไว้ด้านล่าง -
Y = Ax+b
ต่อไปเราจะออกแบบอัลกอริทึมสำหรับการถดถอยเชิงเส้นซึ่งช่วยให้เราเข้าใจแนวคิดสำคัญสองประการที่ระบุไว้ด้านล่าง -
- ฟังก์ชันต้นทุน
- อัลกอริทึมการสืบเชื้อสายไล่ระดับสี
การแสดงแผนผังของการถดถอยเชิงเส้นแสดงไว้ด้านล่าง
การตีความผลลัพธ์
$$ Y = ขวาน + b $$
คุณค่าของ a คือความลาดชัน
คุณค่าของ b คือ y − intercept.
r คือ correlation coefficient.
r2 คือ correlation coefficient.
มุมมองกราฟิกของสมการการถดถอยเชิงเส้นมีการกล่าวถึงด้านล่าง -
ขั้นตอนต่อไปนี้ใช้สำหรับการใช้การถดถอยเชิงเส้นโดยใช้ PyTorch -
ขั้นตอนที่ 1
นำเข้าแพ็คเกจที่จำเป็นสำหรับการสร้างการถดถอยเชิงเส้นใน PyTorch โดยใช้รหัสด้านล่าง -
import numpy as np
import matplotlib.pyplot as plt
from matplotlib.animation import FuncAnimation
import seaborn as sns
import pandas as pd
%matplotlib inline
sns.set_style(style = 'whitegrid')
plt.rcParams["patch.force_edgecolor"] = True
ขั้นตอนที่ 2
สร้างชุดการฝึกอบรมชุดเดียวโดยใช้ชุดข้อมูลดังที่แสดงด้านล่าง -
m = 2 # slope
c = 3 # interceptm = 2 # slope
c = 3 # intercept
x = np.random.rand(256)
noise = np.random.randn(256) / 4
y = x * m + c + noise
df = pd.DataFrame()
df['x'] = x
df['y'] = y
sns.lmplot(x ='x', y ='y', data = df)
ขั้นตอนที่ 3
ใช้การถดถอยเชิงเส้นกับไลบรารี PyTorch ดังที่กล่าวไว้ด้านล่าง -
import torch
import torch.nn as nn
from torch.autograd import Variable
x_train = x.reshape(-1, 1).astype('float32')
y_train = y.reshape(-1, 1).astype('float32')
class LinearRegressionModel(nn.Module):
def __init__(self, input_dim, output_dim):
super(LinearRegressionModel, self).__init__()
self.linear = nn.Linear(input_dim, output_dim)
def forward(self, x):
out = self.linear(x)
return out
input_dim = x_train.shape[1]
output_dim = y_train.shape[1]
input_dim, output_dim(1, 1)
model = LinearRegressionModel(input_dim, output_dim)
criterion = nn.MSELoss()
[w, b] = model.parameters()
def get_param_values():
return w.data[0][0], b.data[0]
def plot_current_fit(title = ""):
plt.figure(figsize = (12,4))
plt.title(title)
plt.scatter(x, y, s = 8)
w1 = w.data[0][0]
b1 = b.data[0]
x1 = np.array([0., 1.])
y1 = x1 * w1 + b1
plt.plot(x1, y1, 'r', label = 'Current Fit ({:.3f}, {:.3f})'.format(w1, b1))
plt.xlabel('x (input)')
plt.ylabel('y (target)')
plt.legend()
plt.show()
plot_current_fit('Before training')
พล็อตที่สร้างขึ้นมีดังนี้ -