การตรวจสอบความถูกต้องข้ามใน StackingClassifier Scikit-Learn
ในStackingClassifier
เอกสาร Scikit-Learn เขียนว่า:
ทราบว่า
estimators_
มีการติดตั้งในเต็มรูปแบบX
ในขณะที่ได้รับการฝึกฝนโดยใช้การคาดการณ์ข้ามการตรวจสอบของประมาณฐานใช้final_estimator_
cross_val_predict
... ค่าเริ่มต้นของการตรวจสอบความถูกต้องไขว้ 5 เท่า
คำถามของฉันทำไมต้องใช้การตรวจสอบความถูกต้องไขว้ 5 เท่าในเครื่องมือประมาณค่าสุดท้ายเท่านั้น เหตุใดตัวประมาณค่าสุดท้ายจึงไม่ติดตั้งบน X เต็ม '(เอาต์พุตจากตัวประมาณฐาน)
คำตอบ
ซึ่งรวมถึงคำถาม 2 ข้อฉันจะตอบคำถามแต่ละข้อ
- เราสามารถใช้การตรวจสอบความถูกต้องข้ามกับทั้งระบบได้ แต่นั่นจะทำให้เราเสียเปรียบมากเกินไป
จุดประสงค์ของการตรวจสอบความถูกต้องข้ามคือการค้นหาพารามิเตอร์ที่เหมาะสมซึ่งทำให้แบบจำลองสามารถใส่ข้อมูลได้ดีโดยไม่ต้องใส่มากเกินไป พอเพียงที่ตัวประเมินสุดท้ายของเราทำสิ่งนี้ ไม่จำเป็นต้องค้นหาการตั้งค่าของตัวประมาณพื้นฐานทั้งหมดทีละรายการ เครื่องมือประมาณค่าพื้นฐานสามารถรวมการตั้งค่าพารามิเตอร์ต่างๆได้ตัวอย่างเช่น เช่นเดียวกับตัวจำแนกประเภทต่างๆ หากคนใดคนหนึ่งมีแนวโน้มที่จะใส่อุปกรณ์มากเกินไปสิ่งนี้ควรชดเชยโดยผู้อื่นที่ไม่มีปัญหานั้น ตราบใดที่ผู้ประมาณค่าขั้นสุดท้ายไม่ได้ใส่ไข่ทั้งหมดลงในตะกร้าที่ไม่ถูกต้องเราก็น่าจะสบายดี (และนี่คือสาเหตุที่เราต้องมีการตรวจสอบความถูกต้องข้ามที่นี่เพื่อให้แน่ใจว่าสิ่งนี้จะไม่เกิดขึ้น)
- เราจะฝึกตัวประมาณค่าขั้นสุดท้ายในชุดการฝึกแบบเต็มซึ่งจะเกิดขึ้นหลังจากที่เราพบพารามิเตอร์ที่เหมาะสมหรือชุดตัวประมาณพื้นฐานโดยใช้การตรวจสอบความถูกต้องข้าม ดังที่ชื่อกล่าวว่าการตรวจสอบไขว้มีไว้สำหรับการตรวจสอบความถูกต้องของวิธีการ ไม่ใช่สำหรับการสร้างแบบจำลองขั้นสุดท้าย