กระบวนการ MLOps ของคุณอาจเสียหาย
แม้จะมีชุดเครื่องมือ MLOps ที่สมบูรณ์แบบ แต่ทีมก็ยังประสบปัญหาในการส่งมอบผลิตภัณฑ์ ML ถ้าเครื่องมือไม่ใช่เพียงชิ้นส่วนเดียวของจิ๊กซอว์ มันจะเหลืออะไรอีก? ในโพสต์ล่าสุดของฉัน ฉันยืนยันว่าส่วนที่เหลือคือวัฒนธรรมและกระบวนการ
มาดำดิ่งสู่กระบวนการ MLOps — โดยเฉพาะอย่างยิ่ง ชิ้นส่วนพื้นฐานบางชิ้นที่ทีมส่วนใหญ่ เข้าใจผิด กระบวนการ MLOps ที่ประสบความสำเร็จมีลักษณะอย่างไร และผู้ปฏิบัติงาน ML แต่ละคนจะช่วยสร้างกระบวนการนั้นได้อย่างไร
TL;ดร
- เริ่มต้นด้วยผลิตภัณฑ์ ไม่ใช่แบบจำลอง
- สำรวจข้อมูลในการผลิตไม่ใช่ในคลังสินค้าของคุณ
- เริ่มต้นง่ายๆ — ด้วยข้อมูลและแบบจำลอง
- เป็นพันธมิตรกับวิศวกร
เริ่มต้นด้วยผลิตภัณฑ์ ML
บางทีวิธีปฏิบัติที่สำคัญที่สุดที่ทำให้โครงการ ML ประสบความสำเร็จคือการออกแบบผลิตภัณฑ์ไม่ใช่แบบจำลอง หนึ่งในหลุมพรางที่ใหญ่ที่สุดที่ฉันเคยเห็นในบริษัทต่างๆ หลายสิบแห่งคือการมอบ “โครงการ” ให้กับทีมข้อมูล แทนที่จะให้พวกเขามีส่วนร่วมในขั้นตอนการออกแบบผลิตภัณฑ์
ในการสร้างผลิตภัณฑ์ ML ที่ประสบความสำเร็จ ผู้มีส่วนได้ส่วนเสียสามคนจำเป็นต้องมีส่วนร่วมในการออกแบบผลิตภัณฑ์:
- PM / Business Stakeholder : ความสำเร็จเป็นอย่างไร?
- ML Person : อะไร (น่าจะ) เป็นไปได้กับ ML?
- วิศวกรผลิตภัณฑ์ : อะไรคือความเป็นไปได้ และอะไรคือข้อจำกัด?
ตัวอย่างบางส่วนของทีมที่จัดตำแหน่งได้ไม่ดี:
- บุคคล ML เพิ่มประสิทธิภาพเพื่อความแม่นยำของโมเดล (แทนที่จะเป็นผลลัพธ์ทางธุรกิจ!)
- โครงการเริ่มต้นที่อาจไม่สามารถแก้ไขได้ด้วย ML
- โมเดลไม่เป็นไปตามข้อจำกัดด้านประสิทธิภาพในการผลิต
- คุณลักษณะนี้เป็นสิ่งที่ท้าทายหรือเป็นไปไม่ได้ที่จะคำนวณในการผลิต
- บุคคล ML เข้าใจถึงการแลกเปลี่ยนระหว่างความถูกต้องกับเวลาสู่ตลาด
- การตรวจสอบที่สร้างขึ้นในวันที่ศูนย์เพื่อให้แน่ใจว่าผลลัพธ์ทางธุรกิจได้รับการวัดอย่างสม่ำเสมอ
- วิศวกรช่วยให้บุคลากร ML เข้าใจภาพรวมของข้อมูลการผลิต
- SLA แบบจำลองมีการกำหนดและวัดผลอย่างชัดเจน
นี่คือตัวอย่างของ "การจัดตำแหน่งที่ดี" ในส่วนสุดท้าย แต่ก็สมควรได้รับส่วนของตัวเอง ผู้สร้าง ML เกือบทั้งหมดที่ฉันเห็นเริ่มโครงการ ML ด้วยการสำรวจข้อมูลที่มีอยู่ ปัญหา? โดยทั่วไปแล้วพวกเขาจะสำรวจข้อมูลที่พร้อมใช้งานสำหรับการฝึกอบรมไม่ใช่ข้อมูลที่จะพร้อมใช้งานในการผลิต
บางคนอาจถามว่า — ข้อมูลทั้งหมดสำหรับการฝึกอบรมไม่ควรมีอยู่ในระบบการผลิตใช่หรือไม่
ส่วนใหญ่แล้ว คำตอบคือใช่แต่มีเครื่องหมายดอกจันจำนวนมาก ข้อมูลนั้นใช้ได้เร็วแค่ไหน? ข้อมูลนั้นสดแค่ไหน? ข้อมูลผลิตภัณฑ์ต้องประมวลผลล่วงหน้ามากน้อยเพียงใดเพื่อให้ใช้งานได้ ใครเป็นเจ้าของข้อมูลนั้น
โครงการ ML จำนวนมากหยุดทำงานเนื่องจากปัญหาเกี่ยวกับข้อมูลการผลิต ฉันได้เห็นซ้ำแล้วซ้ำเล่าว่ามีการตัดการเชื่อมต่ออย่างมากระหว่างบุคลากร ML และวิศวกรผลิตภัณฑ์ ตัวอย่างของฟีเจอร์ที่ไม่น่ากลัว 2 รายการที่มีข้อกำหนดต่างกันอย่างมาก:
- รหัสไปรษณีย์ที่บ้านของผู้ใช้ : อาจสกปรกง่ายที่จะใช้ในการผลิต สอบถามฐานข้อมูล
- ตำแหน่งเฉลี่ยของผู้ใช้ในห้านาทีที่ผ่านมา : น่าจะเป็น PITA! ข้อมูลตำแหน่งของผู้ใช้อยู่ใน Kafka Stream? ต้องสดแค่ไหน? การรวมสตรีมเป็นเรื่องยาก! น่าจะเป็นประเด็นเทรนนิ่ง/เสริฟ สกิว!
เริ่มต้นง่ายๆ
อาจเป็นคำแนะนำ ML ที่พบบ่อยที่สุด แต่ก็เป็นคำแนะนำที่ดี เริ่มต้นด้วยวิธีง่ายๆ
การเพิ่มของฉัน — คนส่วนใหญ่จะบอกให้คุณเริ่มต้นด้วยแบบจำลอง อย่างง่าย แต่การเริ่มต้นด้วยข้อมูลอย่างง่ายก็สำคัญไม่แพ้กัน! ในการเล่นตัวอย่างด้านบน:
- ตำแหน่งเฉลี่ยของผู้ใช้ในห้านาทีที่ผ่านมา: ยาก
- ตำแหน่งล่าสุดของผู้ใช้: น่าจะง่ายกว่านี้มาก!
คุณน่าจะเทรดทุกครั้ง คุณสามารถสร้าง V2 ด้วยคุณสมบัติที่ยอดเยี่ยมกว่าได้เสมอ และการสร้างการปรับปรุงส่วนเพิ่มจะง่ายกว่าการส่งบางสิ่งที่ซับซ้อนในครั้งแรก
เป็นพันธมิตรกับวิศวกร
เป็นไปได้ว่าถ้าคุณเป็นนักวิทยาศาสตร์ด้านข้อมูล ไม่ใช่ทุกคำถามที่ระบุไว้ข้างต้นที่จะตอบได้อย่างชัดเจน เมื่อตอนที่ฉันลงมือสร้างโมเดล ML ฉันไม่รู้ว่าข้อมูลการสตรีมคืออะไร (ไม่ต้องพูดถึงวิธีคิด)
วิธีแก้ปัญหาคือการเป็นเพื่อนกับวิศวกรและทำงานร่วมกับพวกเขาตลอดการพัฒนาโมเดล ML การสร้างโครงการซอฟต์แวร์ใดๆ ไม่สามารถทำได้ในไซโล และ ML ในไซโลนั้นแย่ยิ่งกว่า วิศวกรสามารถช่วยในเรื่อง "ข้อมูลที่มีอยู่" "ฉันควรทราบข้อจำกัดใดบ้าง" "SLA ใดบ้างที่เป็นไปได้" และอื่นๆ
ทำงานกับวิศวกรตั้งแต่เนิ่นๆ และบ่อยครั้ง คุณจะสร้างโครงการได้เร็วขึ้น
บทสรุป
ขั้นตอนเหล่านี้ไม่ใช่มุมมองที่ครอบคลุมของกระบวนการ MLOps — มีชิ้นส่วนที่ต้องเคลื่อนไหวมากมายที่นำไปสู่ความสำเร็จ (การตรวจสอบโค้ด, CI/CD, การเฝ้าติดตาม, …) นี่เป็นจุดเริ่มต้น ตามที่กล่าวไว้ข้างต้นความล้มเหลวของ ML ส่วนใหญ่ที่ฉันเห็นคือปัญหาการจัดตำแหน่ง หลักเกณฑ์กระบวนการเหล่านี้มีไว้เพื่อช่วยคุณจัดทีมของคุณเพื่อความสำเร็จเป็นหลัก
คุณต้องมีรากฐานที่แข็งแกร่งเพื่อสร้างแนวปฏิบัติ MLOps ที่ยอดเยี่ยม
David Hershey เป็นนักลงทุนที่Unusual Venturesซึ่งเขาลงทุนในการเรียนรู้ของเครื่องและโครงสร้างพื้นฐานข้อมูล David เริ่มต้นอาชีพของเขาที่ Ford Motor Company ซึ่งเขาได้เริ่มทีมโครงสร้างพื้นฐาน ML ของพวกเขา เมื่อเร็วๆ นี้ เขาทำงานที่Tectonและ Dedicated AIซึ่งช่วยให้ทีม MLOps นำเทคโนโลยีเหล่านั้นมาใช้ หากคุณกำลังสร้างบริษัทโครงสร้างพื้นฐานด้านข้อมูลหรือ ML โปรดติดต่อ David บนLinkedIn