Générer l'intuition de fonction
J'essaie de comprendre l'utilisation des fonctions génératrices. J'ai compris qu'on pouvait compresser une séquence en une fonction génératrice, de sorte que chaque coefficient du polynôme qu'elle génère soient les éléments de la séquence. Mais je ne comprends pas ce que changent les entrées?
Disons que nous avons la fonction génératrice: $$G(x)=\sum^\infty_{k=0} p_k x^k$$
Que se passe-t-il lorsque nous attribuons des valeurs différentes à $x$, qu'est-ce qui change intuitivement? Je pensais que$x^k$ terme était là pour coder l'emplacement du coefficient dans la séquence, car nous ne pouvons pas ajouter $p_ax^a$ et $p_bx^b$ si $ a \neq b$, de sorte que les termes restent hétérogènes. Mais j'ai vu que pour une distribution de probabilité la propriété$G(1)=1$Doit tenir. Est-ce le seul cas où il est utile de donner une valeur à x?
Merci beaucoup d'avance pour les explications.
Réponses
Si $X$ est une variable aléatoire discrète prenant des valeurs dans les entiers non négatifs $\{0,1, \dots\}$, alors la fonction génératrice de probabilité de $X$ est défini comme:
$$\color{blue}{\displaystyle G(z)=\mathbb{E} \left(z^{X}\right)=\sum_{x=0}^{\infty }p(x)\;z^{x}}$$
où $p$ est la fonction de masse de probabilité de $X$. Le choix de$z$ au lieu de $x$est simplement lié à l'idée que ce que nous faisons est une transformation en z .
Remarquez dans ce qui suit que $z$ agit comme une corde à linge pour accrocher les valeurs d'intérêt, qui sont récupérées après différenciation et évaluation à $0$ pour récupérer le PMF, ou à $1$pour les moments, respectivement. Cette magie se produit grâce au fait que$z$ soit devient $0$ dans toute la queue des termes (PMF), ou $1.$ Mais dans les deux cas, il n'est pas lié à la variable aléatoire et ne fournit aucune information - c'est l'équivalent d'une variable fictive.
CARACTÉRISTIQUES:
- IL VOUS DONNE DES PROBABILITÉS en différenciant:
$$\color{blue}{\large p_i = \left. \frac{1}{i!}\quad\frac{d^i \, G(z)}{dx^i} \right|_{z=0}=\frac{1}{i!} \;G^{(i)}\;(0)}$$
$G\,(1)=1$ car $$\displaystyle\sum_{i=0}^\infty p_i \; 1^i=1$$
Premier différentiel
$$G^{(1)}(z) =\frac{d}{dz}\mathbb E\left[z^X\right]=\mathbb E\left[X\,z^{X-1}\right]$$
Le premier différentiel évalué à $1$ vous donne la moyenne: $$G^{(1)}(1) =\left.\mathbb E\left[X\,z^{X-1}\right]\right|_{z=1}=\mathbb E\left[X\quad1^{X-1}\right]= \mathbb E[X].$$
La seconde dérivée évaluée à $1$ est le momment factoriel et n'est PAS la variance, car le second terme n'est pas au carré.
$$\begin{align}G^{(2)}\;(1) &=\frac{d^2}{dz^2}\; \left.\mathbb E\left[z^X\right]\right|_{z=1}\\[2ex]&=\mathbb E\left[X\;(X-1)\;z^{X-2}\right]\\[2ex]&=\mathbb E\left[X\;(X-1)\right]\\[2ex]&=\mathbb E\left [X^2-X\right ]\\[2ex]&=\mathbb E\left[X^2\right] - \mathbb E\left[X\right]\end{align}$$
- Généralisant donc le $i$-ème dérivé évalué à $1$ est le $i$-ème moment factoriel:
$$G^{(i)}\;(1)= \mathbb E\left[X\;(X-1)\;\cdots\;(X-i+1)\right]$$
- Pour obtenir la variance,
$$\begin{align}\sigma^2 &= \mathbb E\left[X^2\right]-\mathbb E\left[X\right]^2 \\[2ex] &=G^{(2)}\;(1)+G^{(1)}\;(1)-\left[G^{(1)}\;(1)\right]^2 \end{align}$$
- Nous pouvons obtenir des moments bruts en différenciant le pgf et en le multipliant par $z$:
$$\mathbb E\left[X^i\right]= \left. \left( z\;\left(\frac{d}{dz}\right)^i \; G(z)\right)\right|_{z=1}$$