Suma de distribuciones exponenciales y función de mayor probabilidad
Estimaciones de una tienda de coches $\alpha$minutos para cambiar el aceite de un coche. El tiempo real necesario$X$ varía en $X\geq \alpha$y es diferente entre cada cliente. Podemos suponer que este tiempo se puede describir mediante una variable aleatoria exponencial. Entonces la variable aleatoria X tiene el siguiente PDF
$$f_X(x):=\begin{cases}e^{\alpha -x} &x\geq \alpha \\ 0 & \text{else}\end{cases}$$
es decir $X=\alpha + Z$ mientras $Z\sim exp(1)$.
Para estimar $\alpha$, medimos el tiempo necesario para un cambio de aceite de 10 clientes:
$$4.2 \quad 3.1 \quad 3.6 \quad 4.5 \quad 5.1 \quad 7.6 \quad 4.4 \quad 3.5 \quad 3.8 \quad 4.3$$
de donde obtenemos la media empírica $\bar{x}_{10}=4.41$.
Calcule el estimador de máxima verosimilitud. Tenga en cuenta que no puede derivar la función de probabilidad).
Solución La función de verosimilitud está dada por
$$\begin{align} L(\alpha;x_1,\dots,x_n)&=\prod_{i=1}^nf_\alpha(x_i)=\prod_{i=1}^ne^{\alpha -x_i}1_{[\alpha, \infty)}(x_i)\\ &=exp\bigg(n\alpha-\sum_{i=1}^nx_i\bigg)\cdot \prod_{i=1}^n 1_{[\alpha,\infty)}(x_i)\\ &=exp\bigg(n\alpha-\sum_{i=1}^nx_i\bigg)\cdot \bigg(\min_{1\leq i \leq n} x_i\bigg)\\ &=\begin{cases}\exp(n\alpha-\sum_{i=1}^n x_i) & \alpha \leq \min_{1\leq i \leq n} x_i \\ 0 & \text{else}\end{cases} \end{align}$$
mientras
$$1_A(x)=\begin{cases}1 & x\in A \\ 0 & \text{else}\end{cases}$$
Para maximizar la función de verosimilitud, debemos elegir $\alpha$ tan grande como sea posible, pero no puede ser más grande que $\min_{1\leq i \leq n} x_i$. Entonces obtenemos el siguiente estimador de máxima verosimilitud
$$\hat{\alpha}=\min_{1\leq i \leq n} x_i \quad \text{ or as a random variable} \quad \hat{\alpha}=\min_{1\leq i \leq n} X_i$$
Pregunta: Ahora entiendo el cálculo, lo que me confunde es el PDF. Si te dijera que tenemos una variable aleatoria$X=\alpha + Z$ con $Z\sim exp(1)$, ¿cómo obtendrías el PDF anterior?
Además, como estoy un poco confundido con el PDF, no entiendo realmente por qué estamos buscando un estimador para $\alpha$ es decir, no puedo ver eso $\alpha$ representa el parámetro en nuestra distribución.
Respuestas
Recordar que $$Z \sim \operatorname{Exponential}(1)$$ implica $$f_Z(z) = e^{-z} \mathbb 1(z \ge 0).$$ Ahora deja $X = g(Z) = \alpha + Z$ para algún parámetro $\alpha$. Luego$Z = g^{-1}(X) = X - \alpha$y $dg^{-1}/dx = 1$. Así$$f_X(x) = f_Z(g^{-1}(x)) \left|\frac{dg^{-1}}{dx}\right| = e^{-(x-\alpha)} \mathbb 1 (x-\alpha \ge 0) = e^{\alpha-x} \mathbb 1(x \ge \alpha),$$como se afirma. Pero esto es demasiado formal. Si entiende que el apoyo de$Z$ Está encendido $[0, \infty)$, luego $\alpha + Z$ simplemente cambia el soporte a $[\alpha, \infty)$y no hace nada más a la densidad. Entonces, todo lo que está haciendo es una transformación de ubicación para la distribución exponencial cuando agrega algún parámetro fijo$\alpha$.
En cuanto a tu otra pregunta, $\alpha$es de hecho un parámetro, porque es una cantidad fija en nuestro modelo que representa la cantidad mínima de tiempo para reparar un vehículo, pero permanece desconocida para nosotros. Al observar una muestra, intentamos hacer una inferencia sobre su verdadero valor, lo que nos interesa. No hay otros parámetros en el modelo que podamos estimar. Es posible que esté pensando que queremos estimar el tiempo medio de servicio, pero ya nos dijeron$\operatorname{E}[Z] = 1$, por lo tanto $$\operatorname{E}[X] = \operatorname{E}[\alpha + Z] = \alpha + 1.$$Por lo tanto, el conocimiento del tiempo medio de servicio es informativo del tiempo mínimo de servicio. Esto se debe a que el modelo que estamos usando ya especifica$\operatorname{E}[Z] = 1$y no agrega parámetros adicionales; pero seguramente podríamos considerar una situación más general, digamos$$\operatorname{E}[Z] = \theta, \\ f_Z(z) = \frac{1}{\theta} e^{-z/\theta} \mathbb 1(z \ge 0),$$ que es una distribución exponencial con parámetro medio $\theta$ (o equivalentemente, tasa $1/\theta$). Si solo estamos interesados en hacer inferencias sobre$\alpha$, luego $\theta$se consideraría un parámetro molesto , y la media muestral como un estimador de$\alpha$ estaría "contaminado" por $\theta$. ¿Cómo construiríamos un estimador adecuado para$\alpha$ cuando $\theta$ también es desconocido?