Gamma GLM: perché log-link è più comune del canonical link
"Il collegamento canonico di Gamma GLM è $g(x)=1/x$spesso non è molto pratico. Log-link è più appropriato nella maggior parte dei casi. "Una ragione che mi viene in mente è che log-link lo assicura$\mu$, la media è sempre maggiore di zero. (per favore correggimi se sbaglio.) Ma credo che ci siano altre considerazioni.
Allora perché le persone scelgono spesso il log-link rispetto a quello canonico? È correlato al fatto che$\log$ la trasformazione stabilizza la varianza dei dati?
Risposte
Una bella domanda. Vedo i seguenti motivi:
Un collegamento log produce un modello moltiplicativo sulla scala originale ed è quindi facile da interpretare. Questo non è vero per il collegamento canonico del Gamma GLM.
Nel prezzo dell'assicurazione, l'importo previsto del reclamo $E(L)$ è spesso scomposto in $E(L) = E(F)E(S)$, dove $F$ è la frequenza dei reclami e $S$l'altezza del reclamo. Se entrambi$E(F)$ e $E(S)$ sono modellati da GLM con log link, i coefficienti di entrambi i modelli possono essere facilmente combinati per determinare gli effetti sulla perdita attesa $E(L)$.
Il mancato utilizzo del collegamento canonico introduce un bias di previsione sulla scala originale, ovvero la previsione media differisce dalla risposta media. Questo sarebbe un motivo contro il collegamento al registro. Tuttavia, nella mia esperienza, questo bias è piccolo con il collegamento log e può essere facilmente risolto da un fattore di correzione moltiplicativo.