Statistiques - Kurtosis
Le degré de queue d'une distribution est mesuré par kurtosis. Il nous indique dans quelle mesure la distribution est plus ou moins sujette aux valeurs aberrantes (plus lourdes ou à queue claire) que la distribution normale. Trois types de courbes différents, gracieuseté d'Investopedia, sont présentés comme suit -
Il est difficile de discerner différents types d'aplatissement à partir des graphiques de densité (panneau de gauche) car les queues sont proches de zéro pour toutes les distributions. Mais les différences dans les queues sont faciles à voir dans les graphiques quantiles-quantiles normaux (panneau de droite).
La courbe normale est appelée courbe mésokurtique. Si la courbe d'une distribution est plus sujette à des valeurs aberrantes (ou à queue plus lourde) qu'une courbe normale ou mésokurtique, elle est alors appelée courbe leptokurtique. Si une courbe est moins sujette à des valeurs aberrantes (ou à queue plus claire) qu'une courbe normale, elle est appelée courbe platykurtique. Le kurtosis est mesuré par des moments et est donné par la formule suivante -
Formule
$ {\ beta_2 = \ frac {\ mu_4} {\ mu_2}} $
Où -
$ {\ mu_4 = \ frac {\ sum (x- \ bar x) ^ 4} {N}} $
Plus la valeur de \ beta_2 est élevée, plus la courbe est crête ou leptokurtique. Une courbe normale a une valeur de 3, un leptokurtic a \ beta_2 supérieur à 3 et platykurtic a \ beta_2 inférieur à 3.
Exemple
Problem Statement:
Les données sur les salaires journaliers de 45 ouvriers d'une usine sont données. Calculez \ beta_1 et \ beta_2 en utilisant le moment de la moyenne. Commentez les résultats.
Salaire (Rs.) | Nombre de travailleurs |
---|---|
100-200 | 1 |
120-200 | 2 |
140-200 | 6 |
160-200 | 20 |
180-200 | 11 |
200-200 | 3 |
220-200 | 2 |
Solution:
Salaire (Rs.) |
Nombre de travailleurs (f) |
Mi-pt m |
m - $ {\ frac {170} {20}} $ d |
$ {fd} $ | $ {fd ^ 2} $ | $ {fd ^ 3} $ | $ {fd ^ 4} $ |
---|---|---|---|---|---|---|---|
100-200 | 1 | 110 | -3 | -3 | 9 | -27 | 81 |
120-200 | 2 | 130 | -2 | -4 | 8 | -16 | 32 |
140-200 | 6 | 150 | -1 | -6 | 6 | -6 | 6 |
160-200 | 20 | 170 | 0 | 0 | 0 | 0 | 0 |
180-200 | 11 | 190 | 1 | 11 | 11 | 11 | 11 |
200-200 | 3 | 210 | 2 | 6 | 12 | 24 | 48 |
220-200 | 2 | 230 | 3 | 6 | 18 | 54 | 162 |
$ {N = 45} $ | $ {\ sum fd = 10} $ | $ {\ sum fd ^ 2 = 64} $ | $ {\ sum fd ^ 3 = 40} $ | $ {\ sum fd ^ 4 = 330} $ |
Puisque les écarts ont été pris à partir d'une moyenne supposée, nous calculons donc d'abord les moments sur l'origine arbitraire, puis les moments sur la moyenne. Moments sur l'origine arbitraire '170'
Moments sur la moyenne
À partir de la valeur du mouvement autour de la moyenne, nous pouvons maintenant calculer $ {\ beta_1} $ et $ {\ beta_2} $:
D'après les calculs ci-dessus, on peut conclure que $ {\ beta_1} $, qui mesure l'asymétrie, est presque nul, indiquant ainsi que la distribution est presque symétrique. $ {\ beta_2} $ qui mesure le kurtosis, a une valeur supérieure à 3, ce qui implique que la distribution est leptokurtique.