Eğitim testi bölümünü ne zaman yapmalıyım?

Aug 18 2020

Makine Öğrenimi'nde yeniyim. Tren testi ayrımını ne zaman yapacağım konusunda kafam karıştı.

Aşağıda verilen sıra doğru mu?

  1. Tüm verileri eğitim ve test setine bölün

  2. Eğitim verilerinden Özellikleri Çıkarın

  3. Sınıflandırma modelini eğitim verilerinden çıkarılan özelliklere uydurun

  4. 2. adımda hesaplanan aynı özellikleri test verilerinden çıkarın

  5. Modeli değerlendirmek için 3. adımdaki takılan modeli 4. adımdaki test verilerinden çıkarılan özelliklere uygulayın

Yanıtlar

6 gunes Aug 18 2020 at 21:24

Prosedürünüz genel olarak doğrudur. Daha karmaşık bir döngüde, ek işlemler doğrulama, hiper parametre optimizasyonu, özellik seçimi vb. İçerebilir.

Tipik olarak, özellik çıkarma, verilerinizi tanıdığınız, analiz ettiğiniz / özetlediğiniz ve sezgisel sonuçlar çıkardığınız keşifsel veri analizini (EDA) takip eder. EDA'da, mutlaka bir eğitim / test bölümü yapmıyorsunuz.

Yeni çıkarılan özelliklerin (örn. Etkileşim değişkenleri) model için yararlı olup olmadığını test etmek için geri bildirim döngüsünde 2-3. Adımları tekrarlarsanız, bir doğrulama adımına ihtiyacınız olacağını unutmayın.