H2O - บทนำ
คุณเคยถูกขอให้พัฒนาโมเดล Machine Learning บนฐานข้อมูลขนาดใหญ่หรือไม่? โดยปกติลูกค้าจะให้ฐานข้อมูลแก่คุณและขอให้คุณคาดการณ์บางอย่างเช่นใครจะเป็นผู้ซื้อที่มีศักยภาพ หากสามารถตรวจจับกรณีฉ้อโกงได้ตั้งแต่เนิ่นๆเป็นต้นเพื่อตอบคำถามเหล่านี้งานของคุณคือพัฒนาอัลกอริทึม Machine Learning ที่จะให้คำตอบสำหรับคำถามของลูกค้า การพัฒนาอัลกอริทึม Machine Learning ตั้งแต่เริ่มต้นไม่ใช่เรื่องง่ายและเหตุใดคุณจึงควรทำเช่นนี้ในเมื่อมีไลบรารี Machine Learning ที่พร้อมใช้งานมากมายในตลาด
ทุกวันนี้คุณค่อนข้างจะใช้ไลบรารีเหล่านี้ใช้อัลกอริทึมที่ผ่านการทดสอบอย่างดีจากไลบรารีเหล่านี้และดูประสิทธิภาพ หากประสิทธิภาพไม่อยู่ในขีด จำกัด ที่ยอมรับได้คุณอาจลองปรับแต่งอัลกอริทึมปัจจุบันหรือลองวิธีอื่นโดยสิ้นเชิง
ในทำนองเดียวกันคุณอาจลองใช้อัลกอริทึมหลายชุดในชุดข้อมูลเดียวกันแล้วเลือกอัลกอริทึมที่ดีที่สุดที่ตรงตามความต้องการของลูกค้า นี่คือจุดที่ H2O มาช่วยคุณ เป็นเฟรมเวิร์ก Machine Learning แบบโอเพนซอร์สที่มีการใช้งานอัลกอริทึม ML ที่ได้รับการยอมรับอย่างกว้างขวาง คุณต้องเลือกอัลกอริทึมจากที่เก็บข้อมูลขนาดใหญ่และนำไปใช้กับชุดข้อมูลของคุณ ประกอบด้วยอัลกอริทึมทางสถิติและ ML ที่ใช้กันอย่างแพร่หลาย
หากต้องการกล่าวถึงบางส่วนในที่นี้ ได้แก่ เครื่องไล่ระดับสี (GBM) แบบจำลองเชิงเส้นทั่วไป (GLM) การเรียนรู้เชิงลึกและอื่น ๆ อีกมากมาย ไม่เพียงแค่นั้นยังรองรับฟังก์ชัน AutoML ที่จะจัดอันดับประสิทธิภาพของอัลกอริทึมต่างๆในชุดข้อมูลของคุณซึ่งจะช่วยลดความพยายามในการค้นหาโมเดลที่มีประสิทธิภาพดีที่สุด H2O ถูกใช้ทั่วโลกโดยองค์กรมากกว่า 18000 แห่งและเชื่อมต่อกับ R และ Python ได้ดีเพื่อความสะดวกในการพัฒนาของคุณ เป็นแพลตฟอร์มในหน่วยความจำที่ให้ประสิทธิภาพที่ยอดเยี่ยม
ในบทช่วยสอนนี้ก่อนอื่นคุณจะได้เรียนรู้การติดตั้ง H2O บนเครื่องของคุณด้วยตัวเลือกทั้ง Python และ R เราจะเข้าใจวิธีใช้สิ่งนี้ในบรรทัดคำสั่งเพื่อให้คุณเข้าใจสายการทำงานที่ชาญฉลาด หากคุณเป็นคนรัก Python คุณอาจใช้ Jupyter หรือ IDE อื่น ๆ ที่คุณเลือกเพื่อพัฒนาแอปพลิเคชัน H2O หากคุณชอบ R คุณอาจใช้ RStudio ในการพัฒนา
ในบทช่วยสอนนี้เราจะพิจารณาตัวอย่างเพื่อทำความเข้าใจเกี่ยวกับการทำงานกับ H2O นอกจากนี้เราจะเรียนรู้วิธีการเปลี่ยนอัลกอริทึมในโค้ดโปรแกรมของคุณและเปรียบเทียบประสิทธิภาพกับโค้ดก่อนหน้านี้ นอกจากนี้ H2O ยังมีเครื่องมือบนเว็บเพื่อทดสอบอัลกอริทึมต่างๆในชุดข้อมูลของคุณ นี้เรียกว่า Flow
บทแนะนำจะแนะนำคุณเกี่ยวกับการใช้ Flow นอกจากนี้เราจะพูดถึงการใช้ AutoML ที่จะระบุอัลกอริทึมที่มีประสิทธิภาพดีที่สุดในชุดข้อมูลของคุณ คุณไม่รู้สึกตื่นเต้นที่จะเรียนรู้ H2O? อ่านต่อ!