รวมความน่าจะเป็นของโมเดลหลายคลาสหลายแบบ

Aug 18 2020

สมมติว่าฉันมีแบบจำลองหลายคลาส (A และ B) สองแบบที่คาดการณ์ว่าชุดอินพุตเป็นของหนึ่งใน 5 คลาสหรือไม่ การคาดคะเนแต่ละแบบคือความน่าจะเป็นที่รวมเป็น 1 ดังตัวอย่างลองนึกภาพต่อไปนี้:

+---------+---------+---------+--------+
|         | Model A | Model B | Result |
+---------+---------+---------+--------+
| Class 1 | 0.2     | 0.4     | ?      |
+---------+---------+---------+--------+
| Class 2 | 0.3     | 0.3     | ?      |
+---------+---------+---------+--------+
| Class 3 | 0.15    | 0.2     | ?      |
+---------+---------+---------+--------+
| Class 4 | 0.25    | 0.05    | ?      |
+---------+---------+---------+--------+
| Class 5 | 0.1     | 0.05    | ?      |
+---------+---------+---------+--------+

ฉันจะรวมความน่าจะเป็นเหล่านี้ให้เป็นความน่าจะเป็นเดียวที่ยังคงรวมเป็นหนึ่งได้อย่างไร

คำตอบ

4 StephanKolassa Aug 18 2020 at 15:25

แนวทางที่ง่ายที่สุดคือเพียงใช้ค่าเฉลี่ยของการคาดการณ์สำหรับแต่ละชั้นเรียน คุณสามารถใช้น้ำหนัก

สมมติว่าโมเดลแรกให้การคาดการณ์ $p_1, \dots, p_5$ และที่สองให้ $q_1, \dots, q_5$. แล้ว

$$\sum_{i=1}^5 p_i=\sum_{i=1}^5 q_i = 1.$$

รับน้ำหนักเท่าไหร่ก็ได้ $0<w<1$กำหนดการทำนายแบบรวมโดย $r_i := wp_i+(1-w)q_i$. แล้ว

$$ \sum_{i=1}^5 r_i = \sum_{i=1}^5\big(wp_i+(1-w)q_i\big) = w\sum_{i=1}^5 p_i+(1-w)\sum_{i=1}^5 q_i = w+(1-w) = 1. $$

ดังนั้นการคาดการณ์ของคุณจึงสรุปได้อีกครั้งเป็น 1 ซึ่งใช้ได้กับตัวแยกประเภทมากกว่าสองตัว

ในฐานะน้ำหนักคุณสามารถใช้ประสิทธิภาพที่ผ่านมาของตัวแยกประเภททั้งสองของคุณได้ หรือหาค่าเฉลี่ยที่ไม่ได้ถ่วงน้ำหนัก$w=\frac{1}{2}$ซึ่งมักจะดีกว่าการพยายามประมาณน้ำหนักที่ "เหมาะสมที่สุด" ( Claeskens et al., 2016, IJF )

หรือคุณสามารถใช้วิธีการอื่นใดเพื่อรวมการคาดการณ์ของคุณและปรับเปลี่ยนผลลัพธ์ใหม่หลังจากนั้นเพื่อรวมเป็น 1