StackingClassifier Scikit-Learn'de Çapraz Doğrulama
Scikit-Learn StackingClassifier belgelerinde şöyle yazılmıştır:
Not
estimators_tam üzerine monte edilmiştirXsürefinal_estimator_kullanan baz tahmincilerinin çapraz valide tahminler kullanılarak denetlenencross_val_predict.
... varsayılan 5 katlı çapraz doğrulama
Sorum, neden sadece son tahmincide 5-kat çapraz doğrulama kullanalım? neden nihai tahminci tam X '(temel tahmin edicilerden elde edilen çıktı) üzerine yerleştirilmiyor?
Yanıtlar
Bu 2 soru içerir, her birine hitap edeceğim.
- Tüm sistemde çapraz doğrulama kullanabilirdik, ancak bu bizi biraz engelliyor.
Çapraz doğrulamanın amacı, modelin fazla uydurmadan verilere iyi uymasını sağlayan optimum parametreleri bulmaktır. Son tahmincimizin bunu yapması yeterlidir; tüm temel tahmin edicilerin ayarlarının ayrı ayrı hesaplanmasına gerek yoktur. Temel tahmin ediciler, bir dizi farklı parametre ayarı içerebilir, örneğin; yanı sıra farklı tipte sınıflandırıcılar. Bunlardan herhangi biri aşırı uyuma eğilimliyse, bu sorunu olmayan başkaları tarafından bu telafi edilmelidir. Nihai tahminci tüm yumurtalarını yanlış sepete koymadığı sürece, iyi olmalıyız (ve bu yüzden bunun olmadığından emin olmak için burada çapraz doğrulamaya ihtiyacımız var).
- Biz edecek tam eğitim setinde son tahmincisi eğitmek - Böyle sonra biz optimum parametreleri veya çapraz doğrulama kullanarak baz kestiricilerin kümesini bulmak. Adından da anlaşılacağı gibi, çapraz doğrulama yöntemi doğrulamak içindir. Nihai modeli oluşturmak için değil.