Добавление экспоненциальных распределений и функции наибольшего правдоподобия

Aug 19 2020

Оценки автомастерской $\alpha$минут на замену масла в авто. Фактическое необходимое время$X$ варьируется в $X\geq \alpha$и отличается для каждого клиента. Можно предположить, что это время можно описать экспоненциально случайной величиной. Итак, случайная величина X имеет следующий PDF

$$f_X(x):=\begin{cases}e^{\alpha -x} &x\geq \alpha \\ 0 & \text{else}\end{cases}$$

т.е. $X=\alpha + Z$ в то время как $Z\sim exp(1)$.

Оценить $\alpha$, мы измерили время, необходимое для замены масла у 10 клиентов:

$$4.2 \quad 3.1 \quad 3.6 \quad 4.5 \quad 5.1 \quad 7.6 \quad 4.4 \quad 3.5 \quad 3.8 \quad 4.3$$

из которого мы получаем эмпирическое среднее $\bar{x}_{10}=4.41$.

Вычислите оценку максимального правдоподобия. Обратите внимание, что вы не можете получить функцию правдоподобия).

Решение Функция правдоподобия определяется выражением

$$\begin{align} L(\alpha;x_1,\dots,x_n)&=\prod_{i=1}^nf_\alpha(x_i)=\prod_{i=1}^ne^{\alpha -x_i}1_{[\alpha, \infty)}(x_i)\\ &=exp\bigg(n\alpha-\sum_{i=1}^nx_i\bigg)\cdot \prod_{i=1}^n 1_{[\alpha,\infty)}(x_i)\\ &=exp\bigg(n\alpha-\sum_{i=1}^nx_i\bigg)\cdot \bigg(\min_{1\leq i \leq n} x_i\bigg)\\ &=\begin{cases}\exp(n\alpha-\sum_{i=1}^n x_i) & \alpha \leq \min_{1\leq i \leq n} x_i \\ 0 & \text{else}\end{cases} \end{align}$$

в то время как

$$1_A(x)=\begin{cases}1 & x\in A \\ 0 & \text{else}\end{cases}$$

Чтобы максимизировать функцию правдоподобия, нам нужно выбрать $\alpha$ как можно больше, но не может быть больше, чем $\min_{1\leq i \leq n} x_i$. Таким образом, мы получаем следующую оценку максимального правдоподобия

$$\hat{\alpha}=\min_{1\leq i \leq n} x_i \quad \text{ or as a random variable} \quad \hat{\alpha}=\min_{1\leq i \leq n} X_i$$

Вопрос: Теперь я получил расчет, что меня смущает, так это PDF. Если бы я сказал вам, что у нас есть случайная величина$X=\alpha + Z$ с участием $Z\sim exp(1)$, как получить этот PDF-файл?

Кроме того, поскольку я немного запутался в PDF-файле, я действительно не понимаю, почему мы ищем оценщик для $\alpha$ т.е. я не вижу этого $\alpha$ представляет параметр в нашем распределении.

Ответы

1 heropup Aug 19 2020 at 04:11

Напомним, что $$Z \sim \operatorname{Exponential}(1)$$ подразумевает $$f_Z(z) = e^{-z} \mathbb 1(z \ge 0).$$ Теперь позвольте $X = g(Z) = \alpha + Z$ для какого-то параметра $\alpha$. потом$Z = g^{-1}(X) = X - \alpha$, и $dg^{-1}/dx = 1$. Таким образом$$f_X(x) = f_Z(g^{-1}(x)) \left|\frac{dg^{-1}}{dx}\right| = e^{-(x-\alpha)} \mathbb 1 (x-\alpha \ge 0) = e^{\alpha-x} \mathbb 1(x \ge \alpha),$$как заявлено. Но это действительно слишком формально. Если вы понимаете, что поддержка$Z$ на $[0, \infty)$, тогда $\alpha + Z$ просто перекладывает поддержку на $[\alpha, \infty)$и больше ничего не делает с плотностью. Итак, все, что вы делаете, это преобразование местоположения для экспоненциального распределения при добавлении некоторого фиксированного параметра.$\alpha$.

Что касается вашего другого вопроса, $\alpha$на самом деле является параметром, потому что это фиксированная величина в нашей модели, которая представляет минимальное время для обслуживания транспортного средства, но остается нам неизвестной. Наблюдая за образцом, мы пытаемся сделать вывод об его истинной ценности, которая нас интересует. Других параметров модели для оценки нет. Вы могли подумать, что мы хотим оценить среднее время обслуживания, но нам уже сказали$\operatorname{E}[Z] = 1$, следовательно $$\operatorname{E}[X] = \operatorname{E}[\alpha + Z] = \alpha + 1.$$Таким образом, знание среднего времени обслуживания информативно для минимального времени обслуживания. Это потому, что модель, которую мы используем, уже определяет$\operatorname{E}[Z] = 1$и не добавляет никаких дополнительных параметров; но, конечно, мы могли бы рассмотреть более общую ситуацию, скажем$$\operatorname{E}[Z] = \theta, \\ f_Z(z) = \frac{1}{\theta} e^{-z/\theta} \mathbb 1(z \ge 0),$$ которое является экспоненциальным распределением со средним параметром $\theta$ (или, что то же самое, оценить $1/\theta$). Если нас интересуют только выводы о$\alpha$, тогда $\theta$будет рассматриваться как мешающий параметр , а выборочное среднее - как оценка для$\alpha$ будет "заражен" $\theta$. Как бы мы построили подходящую оценку для$\alpha$ когда $\theta$ тоже неизвестно?