StackingClassifier Scikit-Learn'de Çapraz Doğrulama

Aug 20 2020

Scikit-Learn StackingClassifier belgelerinde şöyle yazılmıştır:

Not estimators_tam üzerine monte edilmiştir Xsüre final_estimator_kullanan baz tahmincilerinin çapraz valide tahminler kullanılarak denetlenen cross_val_predict.

... varsayılan 5 katlı çapraz doğrulama

Sorum, neden sadece son tahmincide 5-kat çapraz doğrulama kullanalım? neden nihai tahminci tam X '(temel tahmin edicilerden elde edilen çıktı) üzerine yerleştirilmiyor?

Yanıtlar

1 RobbytheBelgian Aug 26 2020 at 13:03

Bu 2 soru içerir, her birine hitap edeceğim.

  1. Tüm sistemde çapraz doğrulama kullanabilirdik, ancak bu bizi biraz engelliyor.

Çapraz doğrulamanın amacı, modelin fazla uydurmadan verilere iyi uymasını sağlayan optimum parametreleri bulmaktır. Son tahmincimizin bunu yapması yeterlidir; tüm temel tahmin edicilerin ayarlarının ayrı ayrı hesaplanmasına gerek yoktur. Temel tahmin ediciler, bir dizi farklı parametre ayarı içerebilir, örneğin; yanı sıra farklı tipte sınıflandırıcılar. Bunlardan herhangi biri aşırı uyuma eğilimliyse, bu sorunu olmayan başkaları tarafından bu telafi edilmelidir. Nihai tahminci tüm yumurtalarını yanlış sepete koymadığı sürece, iyi olmalıyız (ve bu yüzden bunun olmadığından emin olmak için burada çapraz doğrulamaya ihtiyacımız var).

  1. Biz edecek tam eğitim setinde son tahmincisi eğitmek - Böyle sonra biz optimum parametreleri veya çapraz doğrulama kullanarak baz kestiricilerin kümesini bulmak. Adından da anlaşılacağı gibi, çapraz doğrulama yöntemi doğrulamak içindir. Nihai modeli oluşturmak için değil.