การตรวจสอบความถูกต้องข้ามใน StackingClassifier Scikit-Learn

Aug 20 2020

ในStackingClassifier เอกสาร Scikit-Learn เขียนว่า:

ทราบว่าestimators_มีการติดตั้งในเต็มรูปแบบXในขณะที่ได้รับการฝึกฝนโดยใช้การคาดการณ์ข้ามการตรวจสอบของประมาณฐานใช้final_estimator_cross_val_predict

... ค่าเริ่มต้นของการตรวจสอบความถูกต้องไขว้ 5 เท่า

คำถามของฉันทำไมต้องใช้การตรวจสอบความถูกต้องไขว้ 5 เท่าในเครื่องมือประมาณค่าสุดท้ายเท่านั้น เหตุใดตัวประมาณค่าสุดท้ายจึงไม่ติดตั้งบน X เต็ม '(เอาต์พุตจากตัวประมาณฐาน)

คำตอบ

1 RobbytheBelgian Aug 26 2020 at 13:03

ซึ่งรวมถึงคำถาม 2 ข้อฉันจะตอบคำถามแต่ละข้อ

  1. เราสามารถใช้การตรวจสอบความถูกต้องข้ามกับทั้งระบบได้ แต่นั่นจะทำให้เราเสียเปรียบมากเกินไป

จุดประสงค์ของการตรวจสอบความถูกต้องข้ามคือการค้นหาพารามิเตอร์ที่เหมาะสมซึ่งทำให้แบบจำลองสามารถใส่ข้อมูลได้ดีโดยไม่ต้องใส่มากเกินไป พอเพียงที่ตัวประเมินสุดท้ายของเราทำสิ่งนี้ ไม่จำเป็นต้องค้นหาการตั้งค่าของตัวประมาณพื้นฐานทั้งหมดทีละรายการ เครื่องมือประมาณค่าพื้นฐานสามารถรวมการตั้งค่าพารามิเตอร์ต่างๆได้ตัวอย่างเช่น เช่นเดียวกับตัวจำแนกประเภทต่างๆ หากคนใดคนหนึ่งมีแนวโน้มที่จะใส่อุปกรณ์มากเกินไปสิ่งนี้ควรชดเชยโดยผู้อื่นที่ไม่มีปัญหานั้น ตราบใดที่ผู้ประมาณค่าขั้นสุดท้ายไม่ได้ใส่ไข่ทั้งหมดลงในตะกร้าที่ไม่ถูกต้องเราก็น่าจะสบายดี (และนี่คือสาเหตุที่เราต้องมีการตรวจสอบความถูกต้องข้ามที่นี่เพื่อให้แน่ใจว่าสิ่งนี้จะไม่เกิดขึ้น)

  1. เราจะฝึกตัวประมาณค่าขั้นสุดท้ายในชุดการฝึกแบบเต็มซึ่งจะเกิดขึ้นหลังจากที่เราพบพารามิเตอร์ที่เหมาะสมหรือชุดตัวประมาณพื้นฐานโดยใช้การตรวจสอบความถูกต้องข้าม ดังที่ชื่อกล่าวว่าการตรวจสอบไขว้มีไว้สำหรับการตรวจสอบความถูกต้องของวิธีการ ไม่ใช่สำหรับการสร้างแบบจำลองขั้นสุดท้าย