H2O - Giriş
Hiç devasa bir veritabanı üzerinde bir Makine Öğrenimi modeli geliştirmeniz istendi mi? Tipik olarak, müşteri size veritabanını sağlar ve sizden potansiyel alıcıların kim olacağı gibi belirli tahminlerde bulunmanızı ister; dolandırıcılık vakalarının erken tespiti olabilir. Bu soruları yanıtlamak için göreviniz, müşterinin sorgusuna yanıt verecek bir Makine Öğrenimi algoritması geliştirmek olacaktır. Sıfırdan bir Makine Öğrenimi algoritması geliştirmek kolay bir iş değildir ve piyasada çok sayıda kullanıma hazır Makine Öğrenimi kitaplığı varken bunu neden yapmalısınız?
Bu günlerde, bu kitaplıkları kullanmayı, bu kitaplıklardan iyi test edilmiş bir algoritma uygulamayı ve performansına bakmayı tercih edersiniz. Performans kabul edilebilir sınırlar içinde değilse, mevcut algoritmada ince ayar yapmaya veya tamamen farklı bir algoritma denemeye çalışırdınız.
Aynı şekilde, aynı veri kümesinde birden çok algoritma deneyebilir ve ardından müşterinin gereksinimlerini tatmin edici bir şekilde karşılayan en iyi algoritmayı seçebilirsiniz. H2O'nun kurtarmaya geldiği yer burasıdır. Yaygın olarak kabul edilen çeşitli makine öğrenimi algoritmalarının tam olarak test edilmiş uygulamalarını içeren açık kaynaklı bir Makine Öğrenimi çerçevesidir. Algoritmayı devasa deposundan almanız ve veri kümenize uygulamanız yeterlidir. En yaygın kullanılan istatistiksel ve makine öğrenimi algoritmalarını içerir.
Burada birkaçından bahsetmek gerekirse, gradyan artırılmış makineler (GBM), genelleştirilmiş doğrusal model (GLM), derin öğrenme ve çok daha fazlasını içerir. Veri kümenizdeki farklı algoritmaların performansını sıralayacak AutoML işlevini de desteklemesinin yanı sıra, en iyi performans gösteren modeli bulma çabalarınızı da azaltır. H2O, dünya çapında 18000'den fazla kuruluş tarafından kullanılmaktadır ve geliştirme kolaylığınız için R ve Python ile iyi bir şekilde arayüz oluşturur. Üstün performans sağlayan bir bellek içi platformdur.
Bu eğitimde, ilk olarak H2O'yu hem Python hem de R seçenekleriyle makinenize kurmayı öğreneceksiniz. Bunu komut satırında nasıl kullanacağımızı anlayacağız, böylece çalışmasını satır bazında anlayacaksınız. Bir Python aşığıysanız, H2O uygulamaları geliştirmek için Jupyter veya seçtiğiniz başka bir IDE'yi kullanabilirsiniz. R'yi tercih ederseniz, geliştirme için RStudio'yu kullanabilirsiniz.
Bu eğitimde, H2O ile nasıl çalışılacağını anlamak için bir örnek ele alacağız. Ayrıca, program kodunuzdaki algoritmayı nasıl değiştireceğinizi öğrenecek ve performansını öncekiyle karşılaştıracağız. H2O ayrıca veri kümenizdeki farklı algoritmaları test etmek için web tabanlı bir araç sağlar. Buna Akış denir.
Eğitim, size Flow'un kullanımını tanıtacaktır. Bunun yanı sıra, veri kümenizde en iyi performans gösteren algoritmayı belirleyecek AutoML kullanımını tartışacağız. H2O öğrenmek için heyecanlı değil misiniz? Okumaya devam et!