โครงข่ายประสาทเทียมสำหรับทุกคน

Nov 29 2022

ฉันต้องใช้งานนิทรรศการวิทยาศาสตร์ชั้นประถมศึกษาปีที่ 6 เพื่อฝึกฝนโครงข่ายประสาทเทียมอันแรกของฉันเป็นเวลานาน ครอบครัวของฉันอาศัยอยู่ในพื้นที่ชนบททางตอนเหนือของแคลิฟอร์เนีย ซึ่งเต็มไปด้วยต้นโอ๊ก ไม้แดง และพืชพื้นเมืองอื่นๆ สำหรับงานวิทยาศาสตร์ที่กำลังจะมาถึง ลูกชายของฉันตัดสินใจสร้างโมเดลแมชชีนเลิร์นนิงเพื่อระบุต้นไม้ในท้องถิ่น เราปีนเขาในบ่ายวันเสาร์เพื่อถ่ายภาพและสร้างชุดข้อมูล ในขณะที่เย็นวันเสาร์เราทำงานเกี่ยวกับแบบจำลองโครงข่ายประสาทเทียม งานวิทยาศาสตร์กำลังจะจัดขึ้นในอีกสองเดือน และฉันคิดว่าเราต้องใช้เวลานั้นในการสร้างแบบจำลองที่เหมาะสม ปรากฎว่าฉันประเมินต่ำไปมากว่าแมชชีนเลิร์นนิงกลายเป็นเรื่องง่ายและเข้าถึงได้ง่ายเพียงใด เวอร์ชัน 1 เสร็จสมบูรณ์ภายในเวลาเพียงไม่กี่ชั่วโมงด้วยความแม่นยำที่น่าประหลาดใจ เราใช้เครื่องมือ AI อันทรงพลังแบบเดียวกับห้องปฏิบัติการวิจัย AI ชั้นนำหลายแห่ง เราทำทั้งหมดบนเบราว์เซอร์และฟรี

ฉันพบโครงข่ายประสาทเทียมครั้งแรกในหลักสูตรวิทยาลัยเกี่ยวกับ AI ในช่วง ฤดูหนาวที่เรียกว่า AI ในช่วงปลายยุค 90 นี่เป็นจุดต่ำของความกระตือรือร้นสำหรับ AI โดยทั่วไป และโดยเฉพาะอย่างยิ่งตาข่ายประสาท แม้จะมีความก้าวหน้าทางทฤษฎีในช่วงทศวรรษที่ 1980 แต่การนำไปใช้ในเชิงพาณิชย์ยังมีจำกัด และห้องปฏิบัติการวิจัยค่อนข้างน้อยที่เน้นโครงข่ายประสาทเทียม ถึงกระนั้น ฉันก็ยังรู้สึกทึ่งกับแนวทางทางชีวภาพสำหรับ AI และฉันได้ทดลองกับแนวทางการฝึกอบรมและการใช้งานต่างๆ ฉันสร้างโมเดลนิวรอลเน็ตและเขียนโค้ดอัลกอริธึมการฝึกอบรมส่วนใหญ่ตั้งแต่เริ่มต้นในเสียงกระเพื่อมภาษาโปรแกรม การฝึกอบรมอาจใช้เวลาหลายชั่วโมงและไม่มีข้อมูลการฝึกอบรมมากนัก มีอยู่ช่วงหนึ่งที่ฉันเข้าร่วมห้องปฏิบัติการ AI ที่ UC San Diego เพื่อสำรวจโครงข่ายประสาทเทียมเพิ่มเติม แต่ในที่สุดฉันก็เดินหน้าต่อไป ต้องใช้เวลาอีก 15 ปี ก่อนที่โครงข่ายประสาทเทียมจะเริ่มต้นขึ้นจริงๆ และคำว่า " การเรียนรู้เชิงลึก " ก็ถูกนำมาใช้อย่างแพร่หลาย

ความสนใจในการเรียนรู้เชิงลึกเพิ่มขึ้นระหว่างปี 2555-2561

ในช่วงทศวรรษที่ผ่านมา โครงข่ายประสาทเทียมได้เข้าสู่ยุคฟื้นฟูศิลปวิทยาการใหม่ที่ขับเคลื่อนโดย GPU, คลาวด์คอมพิวติ้ง, ชุดข้อมูลขนาดใหญ่ และความก้าวหน้าอย่างต่อเนื่องในอัลกอริทึมการเรียนรู้ แอปพลิเคชั่นเชิงพาณิชย์ระเบิดแล้ว แอปพลิเคชันรวมถึงการรู้จำเสียง (Siri, Alexa), การแปล (Google Translate), การสร้างข้อความ (GPT-3 ของ OpenAI), การจดจำรูปภาพ (Tesla Autopilot, Adobe Sensei), การสร้างภาพ (Dall-E 2, Midjourney, Stable Diffusion), ใบหน้า การจดจำ (Apple Photos) การสร้างวิดีโอ (รันเวย์) และการค้นพบยา แอปพลิเคชั่นใหม่ที่น่าประทับใจที่สุดบางตัวอยู่ในgenerative AIซึ่งกำลังดำเนินไปด้วยความเร็วที่เหลือเชื่อ

กรอไปข้างหน้าอย่างรวดเร็วในช่วงสุดสัปดาห์วันขอบคุณพระเจ้าที่ผ่านมาซึ่งกระตุ้นการสังเกตบางอย่าง

ประการแรก การตั้งค่าและฝึกโมเดลแมชชีนเลิร์นนิงที่ค่อนข้างซับซ้อนนั้นเป็นเรื่องง่ายอย่างน่าอัศจรรย์ คุณไม่จำเป็นต้องเขียนโค้ดหรือมีพื้นฐานด้านแมชชีนเลิร์นนิง มี เครื่องมือแมชชีนเลิร์นนิง แบบไม่ใช้โค้ดและAutoMLมากมายที่ทำให้ขั้นตอนทั่วไปในเวิร์กโฟลว์แมชชีนเลิร์นนิงเป็นแบบอัตโนมัติ ในการต่อเวิร์กโฟลว์ของคุณเอง การมีความรู้พื้นฐานเกี่ยวกับไพธอน ซึ่งเป็นภาษายอดนิยมในชุมชนแมชชีนเลิร์นนิงจะเป็นประโยชน์ ลูกชายวัย 12 ปีของฉันเรียนรู้ภาษาไพธอนมาประมาณสองปีแล้ว ด้วยความคิดริเริ่มของเขาเอง เขาดาวน์โหลดTensorFlowซึ่งเป็นไลบรารีแมชชีนเลิร์นนิงที่สนับสนุน Google และ OpenAI และมีโมเดลตัวอย่างที่ทำงานบนแล็ปท็อปของเขาอย่างรวดเร็ว ง่ายยิ่งกว่านั้น ฉันพบ บทช่วย สอนในการจัดประเภทรูปภาพที่ใช้ TensorFlow และทำงานบนสภาพแวดล้อมColab ของ Google Colab ช่วยให้คุณสร้างโมเดลแมชชีนเลิร์นนิงในเว็บเบราว์เซอร์และดำเนินการบน GPU ของ Google ได้ฟรี โดยไม่ต้องดาวน์โหลดหรือติดตั้งแพ็กเกจใดๆ เลย มีแบบฝึกหัดมากมายและแบบจำลองที่ผ่านการฝึกอบรมล่วงหน้าให้เริ่มต้น

ประการที่สอง ปัจจัยจำกัดอัตราสำหรับการใช้เทคโนโลยีนี้คือจินตนาการสำหรับแอปพลิเคชันใหม่ในโลกแห่งความเป็นจริงและข้อมูลที่มีคุณภาพในการฝึกโมเดล ปัญหาของการจำแนกประเภทของต้นไม้ตามรูปภาพนั้นตกอยู่ภายใต้โดเมนของการจำแนกรูปภาพ เนื่องจากนี่เป็นแอปพลิเคชันทั่วไปของแมชชีนเลิร์นนิง ขั้นตอนที่ท้าทายที่สุดคือการรวบรวมชุดข้อมูลที่มีประสิทธิภาพ เราไม่พบชุดข้อมูลที่พร้อมใช้งานของต้นไม้ในท้องถิ่นที่มีชื่อกำกับอยู่ ดังนั้นเราจึงสร้างชุดข้อมูลขึ้นมาเอง การเดินป่าระยะสั้นด้วย iPhone ทำให้ได้ภาพประมาณ 250 ภาพ มันเล็กตามมาตรฐานของวันนี้ แบบจำลองการแพร่กระจายที่เสถียรล่าสุดได้รับการฝึกฝนโดยใช้ ชุดข้อมูล LAION-5B ที่เพิ่งเปิดตัว จำนวน 5.85 พันล้านภาพจากเว็บ เมื่อชุดข้อมูลกลายเป็นสาธารณะมากขึ้น อุปสรรคในการพัฒนาแบบจำลองวัตถุประสงค์พิเศษก็จะลดลง

ประการที่สาม ขณะนี้มีโซลูชันและทรัพยากรมากมายสำหรับการนำโมเดลแมชชีนเลิร์นนิงไปใช้ในการผลิต (ML Ops) เมื่อไม่กี่ปีที่ผ่านมา การฝึกโมเดลและปรับใช้ด้วยความเร็วและขนาดของเว็บเป็นเรื่องท้าทาย ทุกวันนี้ การปรับใช้โมเดลในเบราว์เซอร์ บนโทรศัพท์ บนเซิร์ฟเวอร์ หรือภายในเวิร์กโฟลว์ขององค์กรนั้นค่อนข้างง่าย

เราได้เข้าสู่ยุคทองสำหรับโครงข่ายประสาทเทียม นี่เป็นช่วงเวลาที่น่าตื่นเต้นอย่างเหลือเชื่อในการเป็นนักวิจัยด้าน AI/การเรียนรู้เชิงลึก ผู้ประกอบการด้าน AI หรือนักเรียนที่สนใจด้าน AI ขณะนี้มีแอปพลิเคชันที่สมบูรณ์พร้อมแล้ว และท่อส่งของการวิจัย AI ที่เกิดขึ้นใหม่ซึ่งจะขับเคลื่อนแอปพลิเคชันที่เป็นนวัตกรรมใหม่ในอีกหลายปีข้างหน้า การเข้าถึงเทคโนโลยีหมายความว่าคุณไม่จำเป็นต้องมีห้องปฏิบัติการวิจัยหรือเงินทุนเพื่อเข้าร่วม น่าทึ่งมากที่แนวคิดสามารถคงอยู่ได้นานหลายทศวรรษ (เช่น รถยนต์ไฟฟ้า โครงข่ายประสาทเทียม) แต่ก็ยังไม่เลิกใช้จนกว่าเงื่อนไขจะเหมาะสม