Ajout des distributions exponentielles et de la fonction la plus vraisemblable
Estimations d'un atelier automobile $\alpha$minutes pour changer l'huile d'une voiture. Le temps réel nécessaire$X$ varie en $X\geq \alpha$et est différent entre chaque client. Nous pouvons supposer que ce temps peut être décrit par une variable exponentiellement aléatoire. Ainsi, la variable aléatoire X a le PDF suivant
$$f_X(x):=\begin{cases}e^{\alpha -x} &x\geq \alpha \\ 0 & \text{else}\end{cases}$$
c'est à dire $X=\alpha + Z$ tandis que $Z\sim exp(1)$.
Estimer $\alpha$, nous avons mesuré le temps nécessaire pour une vidange d'huile de 10 clients:
$$4.2 \quad 3.1 \quad 3.6 \quad 4.5 \quad 5.1 \quad 7.6 \quad 4.4 \quad 3.5 \quad 3.8 \quad 4.3$$
à partir de laquelle nous obtenons la moyenne empirique $\bar{x}_{10}=4.41$.
Calculez l'estimateur du maximum de vraisemblance. Notez que vous ne pouvez pas dériver la fonction de vraisemblance).
Solution La fonction de vraisemblance est donnée par
$$\begin{align} L(\alpha;x_1,\dots,x_n)&=\prod_{i=1}^nf_\alpha(x_i)=\prod_{i=1}^ne^{\alpha -x_i}1_{[\alpha, \infty)}(x_i)\\ &=exp\bigg(n\alpha-\sum_{i=1}^nx_i\bigg)\cdot \prod_{i=1}^n 1_{[\alpha,\infty)}(x_i)\\ &=exp\bigg(n\alpha-\sum_{i=1}^nx_i\bigg)\cdot \bigg(\min_{1\leq i \leq n} x_i\bigg)\\ &=\begin{cases}\exp(n\alpha-\sum_{i=1}^n x_i) & \alpha \leq \min_{1\leq i \leq n} x_i \\ 0 & \text{else}\end{cases} \end{align}$$
tandis que
$$1_A(x)=\begin{cases}1 & x\in A \\ 0 & \text{else}\end{cases}$$
Pour maximiser la fonction de vraisemblance, nous devons choisir $\alpha$ aussi grand que possible mais il ne peut pas être plus grand que $\min_{1\leq i \leq n} x_i$. Nous obtenons donc l'estimateur du maximum de vraisemblance suivant
$$\hat{\alpha}=\min_{1\leq i \leq n} x_i \quad \text{ or as a random variable} \quad \hat{\alpha}=\min_{1\leq i \leq n} X_i$$
Question: Maintenant, j'obtiens le calcul, ce qui me trouble, c'est le PDF. Si je vous disais que nous avons une variable aléatoire$X=\alpha + Z$ avec $Z\sim exp(1)$, comment obtiendriez-vous le PDF ci-dessus?
Aussi parce que je suis un peu confus au sujet du PDF, je ne comprends pas vraiment pourquoi nous recherchons un estimateur pour $\alpha$ ie je ne peux pas voir ça $\alpha$ représente le paramètre dans notre distribution.
Réponses
Rappeler que $$Z \sim \operatorname{Exponential}(1)$$ implique $$f_Z(z) = e^{-z} \mathbb 1(z \ge 0).$$ Maintenant, laisse $X = g(Z) = \alpha + Z$ pour certains paramètres $\alpha$. ensuite$Z = g^{-1}(X) = X - \alpha$, et $dg^{-1}/dx = 1$. Donc$$f_X(x) = f_Z(g^{-1}(x)) \left|\frac{dg^{-1}}{dx}\right| = e^{-(x-\alpha)} \mathbb 1 (x-\alpha \ge 0) = e^{\alpha-x} \mathbb 1(x \ge \alpha),$$comme revendiqué. Mais c'est vraiment trop formel. Si vous comprenez que le soutien de$Z$ est sur $[0, \infty)$, puis $\alpha + Z$ déplace simplement le support vers $[\alpha, \infty)$et ne fait rien d'autre à la densité. Donc, tout ce que vous faites est une transformation d'emplacement pour la distribution exponentielle lorsque vous ajoutez un paramètre fixe$\alpha$.
Quant à votre autre question, $\alpha$est en fait un paramètre, car c'est une quantité fixe dans notre modèle qui représente le temps minimum pour entretenir un véhicule, mais elle nous reste inconnue. En observant un échantillon, nous essayons de faire une inférence sur sa vraie valeur, ce qui nous intéresse. Il n'y a pas d'autres paramètres du modèle que nous devons estimer. Vous pensez peut-être que nous voulons estimer le temps de service moyen, mais on nous le dit déjà$\operatorname{E}[Z] = 1$, Par conséquent $$\operatorname{E}[X] = \operatorname{E}[\alpha + Z] = \alpha + 1.$$Ainsi, la connaissance du temps de service moyen est informative du temps de service minimum. En effet, le modèle que nous utilisons spécifie déjà$\operatorname{E}[Z] = 1$et n'ajoute aucun paramètre supplémentaire; mais nous pourrions sûrement envisager une situation plus générale, disons$$\operatorname{E}[Z] = \theta, \\ f_Z(z) = \frac{1}{\theta} e^{-z/\theta} \mathbb 1(z \ge 0),$$ qui est une distribution exponentielle avec paramètre moyen $\theta$ (ou équivalent, taux $1/\theta$). Si nous voulons seulement faire des inférences sur$\alpha$, puis $\theta$serait considéré comme un paramètre de nuisance , et la moyenne de l'échantillon comme un estimateur pour$\alpha$ serait "contaminé" par $\theta$. Comment pourrions-nous construire un estimateur approprié pour$\alpha$ quand $\theta$ est également inconnu?