Aggiunta di distribuzioni esponenziali e funzione di maggior verosimiglianza
Stime di un'officina $\alpha$minuti per cambiare l'olio di un'auto. Il tempo effettivamente necessario$X$ varia in $X\geq \alpha$ed è diverso tra ogni cliente. Possiamo supporre che questo tempo possa essere descritto da una variabile esponenzialmente casuale. Quindi la variabile casuale X ha il seguente PDF
$$f_X(x):=\begin{cases}e^{\alpha -x} &x\geq \alpha \\ 0 & \text{else}\end{cases}$$
cioè $X=\alpha + Z$ mentre $Z\sim exp(1)$.
Stimare $\alpha$, abbiamo misurato il tempo necessario per un cambio olio di 10 clienti:
$$4.2 \quad 3.1 \quad 3.6 \quad 4.5 \quad 5.1 \quad 7.6 \quad 4.4 \quad 3.5 \quad 3.8 \quad 4.3$$
da cui si ricava la media empirica $\bar{x}_{10}=4.41$.
Calcola lo strumento di stima della massima verosimiglianza. Nota che non puoi derivare la funzione di verosimiglianza).
Soluzione La funzione di verosimiglianza è data da
$$\begin{align} L(\alpha;x_1,\dots,x_n)&=\prod_{i=1}^nf_\alpha(x_i)=\prod_{i=1}^ne^{\alpha -x_i}1_{[\alpha, \infty)}(x_i)\\ &=exp\bigg(n\alpha-\sum_{i=1}^nx_i\bigg)\cdot \prod_{i=1}^n 1_{[\alpha,\infty)}(x_i)\\ &=exp\bigg(n\alpha-\sum_{i=1}^nx_i\bigg)\cdot \bigg(\min_{1\leq i \leq n} x_i\bigg)\\ &=\begin{cases}\exp(n\alpha-\sum_{i=1}^n x_i) & \alpha \leq \min_{1\leq i \leq n} x_i \\ 0 & \text{else}\end{cases} \end{align}$$
mentre
$$1_A(x)=\begin{cases}1 & x\in A \\ 0 & \text{else}\end{cases}$$
Per massimizzare la funzione di verosimiglianza, dobbiamo scegliere $\alpha$ il più grande possibile ma non può essere più grande di $\min_{1\leq i \leq n} x_i$. Quindi otteniamo il seguente strumento di stima della massima verosimiglianza
$$\hat{\alpha}=\min_{1\leq i \leq n} x_i \quad \text{ or as a random variable} \quad \hat{\alpha}=\min_{1\leq i \leq n} X_i$$
Domanda: ora ottengo il calcolo, ciò su cui sono confuso è il PDF. Se ti dicessi che abbiamo una variabile casuale$X=\alpha + Z$ con $Z\sim exp(1)$, come otterresti il PDF sopra?
Anche perché sono un po 'confuso riguardo al PDF, non capisco bene perché stiamo cercando un estimatore per $\alpha$ cioè non posso vederlo $\alpha$ rappresenta il parametro nella nostra distribuzione.
Risposte
Richiama questo $$Z \sim \operatorname{Exponential}(1)$$ implica $$f_Z(z) = e^{-z} \mathbb 1(z \ge 0).$$ Adesso molla $X = g(Z) = \alpha + Z$ per qualche parametro $\alpha$. Poi$Z = g^{-1}(X) = X - \alpha$, e $dg^{-1}/dx = 1$. Così$$f_X(x) = f_Z(g^{-1}(x)) \left|\frac{dg^{-1}}{dx}\right| = e^{-(x-\alpha)} \mathbb 1 (x-\alpha \ge 0) = e^{\alpha-x} \mathbb 1(x \ge \alpha),$$come affermato. Ma questo è davvero troppo formale. Se capisci che il supporto di$Z$ è acceso $[0, \infty)$, poi $\alpha + Z$ sposta semplicemente il supporto su $[\alpha, \infty)$e non fa nient'altro alla densità. Quindi tutto ciò che stai facendo è una trasformazione della posizione per la distribuzione esponenziale quando aggiungi un parametro fisso$\alpha$.
Per quanto riguarda l'altra tua domanda, $\alpha$è infatti un parametro, perché è una quantità fissa nel nostro modello che rappresenta la quantità minima di tempo per riparare un veicolo, ma ci rimane sconosciuta. Osservando un campione, stiamo tentando di fare un'inferenza sul suo vero valore, che ci interessa. Non ci sono altri parametri nel modello da stimare. Potresti pensare che vogliamo stimare il tempo medio di servizio, ma ci è già stato detto$\operatorname{E}[Z] = 1$, quindi $$\operatorname{E}[X] = \operatorname{E}[\alpha + Z] = \alpha + 1.$$Quindi, la conoscenza del tempo di servizio medio è indicativo del tempo di servizio minimo. Questo perché il modello che stiamo usando già specifica$\operatorname{E}[Z] = 1$e non aggiunge parametri aggiuntivi; ma sicuramente potremmo considerare una situazione più generale, diciamo$$\operatorname{E}[Z] = \theta, \\ f_Z(z) = \frac{1}{\theta} e^{-z/\theta} \mathbb 1(z \ge 0),$$ che è una distribuzione esponenziale con parametro medio $\theta$ (o, equivalentemente, rate $1/\theta$). Se ci interessa solo fare inferenze su$\alpha$, poi $\theta$sarebbe considerato un parametro di disturbo e la media campionaria come stimatore per$\alpha$ sarebbe "contaminato" da $\theta$. Come costruiremmo uno stimatore adatto per$\alpha$ quando $\theta$ è anche sconosciuto?