Статистика - эксцесс
Степень хвостичности распределения измеряется эксцессом. Он говорит нам, в какой степени распределение более или менее подвержено выбросам (более тяжелым или легким хвостом), чем нормальное распределение. Три разных типа кривых, любезно предоставленные Investopedia, показаны следующим образом:
На графиках плотности (левая панель) трудно различить различные типы эксцесса, потому что хвосты близки к нулю для всех распределений. Но различия в хвостах легко увидеть на обычных графиках квантиль-квантиль (правая панель).
Нормальная кривая называется мезокуртической кривой. Если кривая распределения более склонна к выбросам (или имеет более тяжелый хвост), чем нормальная или мезокуртическая кривая, то ее называют лептокуртической кривой. Если кривая менее склонна к выбросам (или имеет более легкий хвост), чем нормальная кривая, она называется платикуртической кривой. Эксцесс измеряется моментами и определяется по следующей формуле -
Формула
$ {\ beta_2 = \ frac {\ mu_4} {\ mu_2}} $
Где -
$ {\ mu_4 = \ frac {\ sum (x- \ bar x) ^ 4} {N}} $
Чем больше значение \ beta_2, тем больше пик или лептокуртичность кривой. Нормальная кривая имеет значение 3, лептокуртика имеет значение \ beta_2 больше 3, а пластиковая кривая имеет значение \ beta_2 меньше 3.
пример
Problem Statement:
Приведены данные о дневной заработной плате 45 рабочих завода. Вычислите \ beta_1 и \ beta_2, используя момент относительно среднего. Прокомментируйте результаты.
Заработная плата (рупии) | Количество рабочих |
---|---|
100-200 | 1 |
120-200 | 2 |
140-200 | 6 |
160-200 | 20 |
180-200 | 11 |
200-200 | 3 |
220-200 | 2 |
Solution:
Заработная плата (рупии) |
Количество рабочих (ж) |
Средняя точка м |
m - $ {\ frac {170} {20}} $ d |
$ {fd} $ | $ {fd ^ 2} $ | $ {fd ^ 3} $ | $ {fd ^ 4} $ |
---|---|---|---|---|---|---|---|
100-200 | 1 | 110 | -3 | -3 | 9 | -27 | 81 год |
120-200 | 2 | 130 | -2 | -4 | 8 | -16 | 32 |
140-200 | 6 | 150 | -1 | -6 | 6 | -6 | 6 |
160-200 | 20 | 170 | 0 | 0 | 0 | 0 | 0 |
180-200 | 11 | 190 | 1 | 11 | 11 | 11 | 11 |
200-200 | 3 | 210 | 2 | 6 | 12 | 24 | 48 |
220-200 | 2 | 230 | 3 | 6 | 18 | 54 | 162 |
$ {N = 45} $ | $ {\ sum fd = 10} $ | $ {\ sum fd ^ 2 = 64} $ | $ {\ sum fd ^ 3 = 40} $ | $ {\ sum fd ^ 4 = 330} $ |
Поскольку отклонения были взяты от предполагаемого среднего значения, мы сначала вычисляем моменты относительно произвольного начала, а затем моменты относительно среднего. Моменты о произвольном происхождении '170'
Моменты о среднем
Теперь, исходя из значения движения относительно среднего, мы можем вычислить $ {\ beta_1} $ и $ {\ beta_2} $:
Из приведенных выше вычислений можно сделать вывод, что $ {\ beta_1} $, который измеряет асимметрию, почти равен нулю, что указывает на то, что распределение почти симметрично. $ {\ beta_2} $, который измеряет эксцесс, имеет значение больше 3, что означает лептокуртичность распределения.