複数のマルチクラスモデルの確率を組み合わせる

Aug 18 2020

入力のセットが5つのクラスの1つに属するかどうかを予測する2つのマルチクラスモデル(AとB)があるとします。各モデルの予測は、合計が1になる確率です。例として、次のことを想像してください。

+---------+---------+---------+--------+
|         | Model A | Model B | Result |
+---------+---------+---------+--------+
| Class 1 | 0.2     | 0.4     | ?      |
+---------+---------+---------+--------+
| Class 2 | 0.3     | 0.3     | ?      |
+---------+---------+---------+--------+
| Class 3 | 0.15    | 0.2     | ?      |
+---------+---------+---------+--------+
| Class 4 | 0.25    | 0.05    | ?      |
+---------+---------+---------+--------+
| Class 5 | 0.1     | 0.05    | ?      |
+---------+---------+---------+--------+

これらの確率を1つの確率にまとめて、合計が1になるようにするにはどうすればよいですか?

回答

4 StephanKolassa Aug 18 2020 at 15:25

最も簡単なアプローチは、各クラスの予測の平均を取ることです。おもりが使えます。

最初のモデルが予測を与えると仮定します $p_1, \dots, p_5$ そして2番目は与える $q_1, \dots, q_5$。次に

$$\sum_{i=1}^5 p_i=\sum_{i=1}^5 q_i = 1.$$

任意の体重を取る $0<w<1$、によって結合された予測を定義します $r_i := wp_i+(1-w)q_i$。次に

$$ \sum_{i=1}^5 r_i = \sum_{i=1}^5\big(wp_i+(1-w)q_i\big) = w\sum_{i=1}^5 p_i+(1-w)\sum_{i=1}^5 q_i = w+(1-w) = 1. $$

したがって、予測の合計は再び1になります。これは3つ以上の分類器でも機能します。

重みとして、2つの分類器の過去のパフォーマンスを使用できます。または、重み付けされていない平均を取る、$w=\frac{1}{2}$、これは「最適な」重みを推定しようとするよりも優れていることがよくあります(Claeskens et al。、2016、IJF)。

または、他の方法を使用して予測を組み合わせ、後で結果を再正規化して合計を1にすることもできます。