หน่วยการสร้างทางคณิตศาสตร์ของโครงข่ายประสาทเทียม
คณิตศาสตร์มีความสำคัญในอัลกอริทึมการเรียนรู้ของเครื่องและรวมถึงแนวคิดหลักต่างๆของคณิตศาสตร์เพื่อให้ได้อัลกอริทึมที่ถูกต้องซึ่งออกแบบมาในลักษณะเฉพาะ
ความสำคัญของหัวข้อคณิตศาสตร์สำหรับการเรียนรู้ของเครื่องและวิทยาศาสตร์ข้อมูลมีการกล่าวถึงด้านล่าง -
ตอนนี้ให้เรามุ่งเน้นไปที่แนวคิดทางคณิตศาสตร์ที่สำคัญของการเรียนรู้ของเครื่องซึ่งมีความสำคัญจากมุมมองการประมวลผลภาษาธรรมชาติ -
เวกเตอร์
เวกเตอร์ถือเป็นอาร์เรย์ของตัวเลขซึ่งไม่ว่าจะต่อเนื่องหรือไม่ต่อเนื่องและช่องว่างที่ประกอบด้วยเวกเตอร์เรียกว่าปริภูมิเวกเตอร์ ขนาดพื้นที่ของเวกเตอร์สามารถเป็นได้ทั้งแบบ จำกัด หรือไม่สิ้นสุด แต่มีการสังเกตว่าปัญหาการเรียนรู้ของเครื่องและวิทยาศาสตร์ข้อมูลเกี่ยวข้องกับเวกเตอร์ที่มีความยาวคงที่
การแสดงเวกเตอร์จะแสดงดังที่กล่าวไว้ด้านล่าง -
temp = torch.FloatTensor([23,24,24.5,26,27.2,23.0])
temp.size()
Output - torch.Size([6])
ในการเรียนรู้ของเครื่องเราจัดการกับข้อมูลหลายมิติ ดังนั้นเวกเตอร์จึงมีความสำคัญมากและถือเป็นคุณสมบัติอินพุตสำหรับคำชี้แจงปัญหาการคาดคะเน
สเกลาร์
สเกลาร์ถูกเรียกว่ามีมิติเป็นศูนย์ที่มีเพียงค่าเดียว เมื่อพูดถึง PyTorch จะไม่รวมเทนเซอร์พิเศษที่มีขนาดศูนย์ ดังนั้นจะมีการประกาศดังนี้ -
x = torch.rand(10)
x.size()
Output - torch.Size([10])
เมทริกซ์
ข้อมูลที่มีโครงสร้างส่วนใหญ่มักแสดงในรูปแบบของตารางหรือเมทริกซ์เฉพาะ เราจะใช้ชุดข้อมูลที่เรียกว่า Boston House Prices ซึ่งพร้อมใช้งานในไลบรารี Machine Learning ของ Python scikit-learn
boston_tensor = torch.from_numpy(boston.data)
boston_tensor.size()
Output: torch.Size([506, 13])
boston_tensor[:2]
Output:
Columns 0 to 7
0.0063 18.0000 2.3100 0.0000 0.5380 6.5750 65.2000 4.0900
0.0273 0.0000 7.0700 0.0000 0.4690 6.4210 78.9000 4.9671
Columns 8 to 12
1.0000 296.0000 15.3000 396.9000 4.9800
2.0000 242.0000 17.8000 396.9000 9.1400