StackingClassifier Scikit-Learn의 교차 검증

Aug 20 2020

Scikit-Learn StackingClassifier 문서 에서는 다음과 같이 작성되었습니다.

를 사용하는 기본 추정기의 교차 검증 된 예측을 사용하여 훈련 되는 동안 estimators_전체에 적합합니다 .Xfinal_estimator_cross_val_predict

... 기본 5 겹 교차 검증

내 질문, 왜 최종 추정기에서만 5 겹 교차 검증을 사용합니까? 최종 추정기가 전체 X '(기본 추정기의 출력)에 적합하지 않은 이유는 무엇입니까?

답변

1 RobbytheBelgian Aug 26 2020 at 13:03

여기에는 2 개의 질문이 포함되며 각각에 대해 설명하겠습니다.

  1. 우리는 전체 시스템에서 교차 검증을 사용할 수 있지만 그것은 우리에게 너무 많은 장애가 될 것입니다.

교차 검증의 목적은 모델이 과적 합없이 데이터를 잘 맞출 수있는 최적의 매개 변수를 찾는 것입니다. 우리의 최종 추정자가이를 수행하는 것으로 충분합니다. 모든 기본 추정량의 설정을 개별적으로 파악할 필요가 없습니다. 예를 들어, 기본 추정치는 여러 가지 매개 변수 설정을 포함 할 수 있습니다. 다양한 유형의 분류기 선택. 그들 중 하나가 과적 합되는 경향이 있다면 이것은 그 문제가없는 다른 사람들에 의해 상쇄되어야합니다. 최종 추정자가 모든 계란을 잘못된 바구니에 넣지 않는 한 괜찮습니다 (그리고 이것이 발생하지 않도록 여기에서 교차 검증이 필요한 이유입니다).

  1. 우리는 것입니다 전체 학습 집합에 대한 최종 추정 훈련 - 이런 일이 발생 우리는 최적의 매개 변수 또는 교차 유효성 검사를 사용하여 기본 추정량의 세트를 찾을 수 있습니다. 이름에서 알 수 있듯이 교차 검증 은 방법을 검증하기위한 것입니다. 최종 모델을 만들기위한 것이 아닙니다.