калибровка оценок классификатора: изотоническая регрессия

Aug 19 2020

Я исследую подход изотонической регрессии для калибровки оценок с помощью классификатора.

Если я правильно понял, делаем следующее. Во-первых, мы получаем калибровочный график (или кривую надежности), который представляет собой средние предсказанные значения по сравнению с долей положительных результатов. Затем мы хотим, чтобы «доля положительных результатов» была неубывающей функцией «средних предсказанных значений», что осуществляется с помощью изотонической регрессии.

Вот мое замешательство: почему в некоторых случаях «доля положительных результатов» не является неубывающей функцией? Например, здесь: калиброванный корпус - это не возрастающая функция. Сюжет взят из

https://www.svds.com/classifiers2/

Можно найти и другие примеры с той же проблемой. Я прочитал оригинал статьи

Б. Задрозный и К. Элькан. Преобразование оценок классификатора в точные оценки вероятности нескольких классов.

В их результатах откалиброванная функция монотонна.

Ответы

1 SextusEmpiricus Aug 21 2020 at 15:13

Вы можете получить подобные расхождения, когда модель, используемая для подгонки, не точно отражает истинную модель.

Например, когда вы подбираете данные, которые следуют квадратичной зависимости с линейной кривой, тогда вы увидите, что график остатков показывает некоторую тенденцию к изменению переоценки / занижения. Нечто подобное может произойти с графиком вероятностей (который является своего рода графиком остатков предсказанного и наблюдаемого графика).

Затем мы хотим, чтобы «доля положительных результатов» была неубывающей функцией «средних предсказанных значений», что осуществляется с помощью изотонической регрессии.

Это неправильное представление изотонической регрессии.

В вашем случае изотонической регрессии также нет гарантии, что остатки следуют монотонному тренду. Это подогнанное значение вероятности, которое представляет собой монотонную возрастающую / убывающую функцию (как функцию некоторого параметра-предиктора).

Данные и никакие остатки не должны монотонно увеличиваться / уменьшаться. Кроме того, наблюдаемая функция подогнанного не обязательно должна быть монотонной функцией.

Например, если у вас уменьшение $p$ ближе к концу монотонная регрессия может переоценить эти последние значения (потому что это вызовет меньшую ошибку для других значений), и вы получите уменьшение графика наблюдаемого по сравнению с прогнозируемым.

(или представьте, как монотонная регрессия будет соответствовать синусоиде)

Мы можем проиллюстрировать это поведение на ясном примере.

Скажем, у нас есть распределенные данные Бернулли, где логит вероятности является квадратичной функцией. И скажем, что мы подгоняем этот логит линейной функцией вместо квадратичной.

Вы можете себе представить, что линейная кривая будет варьироваться с переоценкой и недооценкой параметра вероятности.

Для примера из кода ниже

$$p_{true} = \text{logistic}(8+6x+x^2) = \frac{1}{1+e^{-8-6x-x^2}} $$

это будет выглядеть так, когда мы выберем 10 тысяч точек с $-4<x<4$:

Здесь вы видите изменяющуюся картину переоценки / недооценки, когда мы подгоняем квадратичную кривую к прямой.

Не похоже, что нам подходит прямая линия, потому что это логистическая функция, примененная к прямой линии. Итак, здесь мы строим логит вероятностей:

Мы также можем построить кривую зависимости прогнозируемого параметра от истинного параметра вероятности.

Приведенный выше график не такой, как ваш, это не разделенные данные, но он показывает, что кривая может быть неубывающей.

В случае с биннированными наблюдаемыми данными, которые являются стохастическими, вы можете получить дополнительные вариации / шум, которые могут привести к тому, что кривая не будет уменьшаться.