Adição de Distribuições Exponenciais e Função de Mais Verossimilhança

Aug 19 2020

Estimativas de uma oficina $\alpha$minutos para mudar o óleo de um carro. O tempo real necessário$X$ varia em $X\geq \alpha$e é diferente entre cada cliente. Podemos supor que este tempo pode ser descrito por uma variável exponencialmente aleatória. Portanto, a variável aleatória X tem o seguinte PDF

$$f_X(x):=\begin{cases}e^{\alpha -x} &x\geq \alpha \\ 0 & \text{else}\end{cases}$$

ie $X=\alpha + Z$ enquanto que $Z\sim exp(1)$.

Estimar $\alpha$, medimos o tempo necessário para uma troca de óleo de 10 clientes:

$$4.2 \quad 3.1 \quad 3.6 \quad 4.5 \quad 5.1 \quad 7.6 \quad 4.4 \quad 3.5 \quad 3.8 \quad 4.3$$

de onde obtemos a média empírica $\bar{x}_{10}=4.41$.

Calcule o Estimador de Máxima Verossimilhança. Observe que você não pode derivar a Função de Verossimilhança).

Solução A função de probabilidade é dada por

$$\begin{align} L(\alpha;x_1,\dots,x_n)&=\prod_{i=1}^nf_\alpha(x_i)=\prod_{i=1}^ne^{\alpha -x_i}1_{[\alpha, \infty)}(x_i)\\ &=exp\bigg(n\alpha-\sum_{i=1}^nx_i\bigg)\cdot \prod_{i=1}^n 1_{[\alpha,\infty)}(x_i)\\ &=exp\bigg(n\alpha-\sum_{i=1}^nx_i\bigg)\cdot \bigg(\min_{1\leq i \leq n} x_i\bigg)\\ &=\begin{cases}\exp(n\alpha-\sum_{i=1}^n x_i) & \alpha \leq \min_{1\leq i \leq n} x_i \\ 0 & \text{else}\end{cases} \end{align}$$

enquanto que

$$1_A(x)=\begin{cases}1 & x\in A \\ 0 & \text{else}\end{cases}$$

Para maximizar a função de verossimilhança, precisamos escolher $\alpha$ o maior possível, mas não pode ser maior do que $\min_{1\leq i \leq n} x_i$. Assim, obtemos o seguinte Estimador de Máxima Verossimilhança

$$\hat{\alpha}=\min_{1\leq i \leq n} x_i \quad \text{ or as a random variable} \quad \hat{\alpha}=\min_{1\leq i \leq n} X_i$$

Pergunta: Agora que faço o cálculo, estou confuso com o PDF. Se eu te dissesse que temos uma variável aleatória$X=\alpha + Z$ com $Z\sim exp(1)$, como você obteria o PDF acima?

Além disso, porque estou um pouco confuso sobre o PDF, realmente não entendo por que estamos procurando um estimador para $\alpha$ ou seja, eu não consigo ver isso $\alpha$ representa o parâmetro em nossa distribuição.

Respostas

1 heropup Aug 19 2020 at 04:11

Lembre-se disso $$Z \sim \operatorname{Exponential}(1)$$ implica $$f_Z(z) = e^{-z} \mathbb 1(z \ge 0).$$ Agora deixe $X = g(Z) = \alpha + Z$ para algum parâmetro $\alpha$. Então$Z = g^{-1}(X) = X - \alpha$e $dg^{-1}/dx = 1$. portanto$$f_X(x) = f_Z(g^{-1}(x)) \left|\frac{dg^{-1}}{dx}\right| = e^{-(x-\alpha)} \mathbb 1 (x-\alpha \ge 0) = e^{\alpha-x} \mathbb 1(x \ge \alpha),$$conforme reivindicado. Mas isso é muito formal. Se você entende que o apoio de$Z$ está ligado $[0, \infty)$, então $\alpha + Z$ simplesmente muda o suporte para $[\alpha, \infty)$e nada mais faz com a densidade. Então, tudo o que você está fazendo é uma transformação de localização para a distribuição exponencial ao adicionar algum parâmetro fixo$\alpha$.

Quanto à sua outra pergunta, $\alpha$é na verdade um parâmetro, porque é uma quantidade fixa em nosso modelo que representa o tempo mínimo para fazer a manutenção de um veículo, mas permanece desconhecida para nós. Ao observar uma amostra, estamos tentando fazer uma inferência sobre seu verdadeiro valor, o que nos interessa. Não há outros parâmetros no modelo para estimarmos. Você pode estar pensando que queremos estimar o tempo médio de serviço, mas já fomos informados$\operatorname{E}[Z] = 1$, conseqüentemente $$\operatorname{E}[X] = \operatorname{E}[\alpha + Z] = \alpha + 1.$$Portanto, o conhecimento do tempo médio de serviço é informativo do tempo mínimo de serviço. Isso ocorre porque o modelo que estamos usando já especifica$\operatorname{E}[Z] = 1$e não adiciona parâmetros adicionais; mas certamente poderíamos considerar uma situação mais geral, digamos$$\operatorname{E}[Z] = \theta, \\ f_Z(z) = \frac{1}{\theta} e^{-z/\theta} \mathbb 1(z \ge 0),$$ que é uma distribuição exponencial com parâmetro médio $\theta$ (ou de forma equivalente, taxa $1/\theta$) Se estamos apenas interessados ​​em fazer inferências sobre$\alpha$, então $\theta$seria considerado como um parâmetro incômodo , e a média da amostra como um estimador para$\alpha$ seria "contaminado" por $\theta$. Como construiríamos um estimador adequado para$\alpha$ quando $\theta$ também é desconhecido?