สถิติ - Kurtosis
ระดับความเอียงของการกระจายวัดโดย kurtosis มันบอกให้เราทราบถึงขอบเขตที่การแจกแจงนั้นมีแนวโน้มที่จะผิดปกติ (หนักกว่าหรือเบา) มากกว่าการแจกแจงแบบปกติ เส้นโค้งสามประเภทที่ได้รับความอนุเคราะห์จาก Investopedia แสดงดังต่อไปนี้ -
เป็นการยากที่จะแยกแยะความแตกต่างของ kurtosis จากพล็อตความหนาแน่น (แผงด้านซ้าย) เนื่องจากหางอยู่ใกล้กับศูนย์สำหรับการแจกแจงทั้งหมด แต่ความแตกต่างของหางนั้นสามารถมองเห็นได้ง่ายในแปลงควอนไทล์ - ควอนไทล์ปกติ (แผงด้านขวา)
เส้นโค้งปกติเรียกว่าเส้นโค้งเมโสเคอร์ติก ถ้าเส้นโค้งของการแจกแจงมีแนวโน้มที่จะผิดปกติมากกว่า (หรือหางที่หนักกว่า) มากกว่าเส้นโค้งปกติหรือเส้นโค้งแบบ mesokurtic ก็จะเรียกว่าเส้นโค้งเลปโตเคิร์ต ถ้าเส้นโค้งมีแนวโน้มที่ผิดปกติน้อยกว่า (หรือหางที่อ่อนกว่า) กว่าเส้นโค้งปกติจะเรียกว่าเป็นเส้นโค้งแบบ platykurtic Kurtosis วัดโดยช่วงเวลาและกำหนดโดยสูตรต่อไปนี้ -
สูตร
$ {\ beta_2 = \ frac {\ mu_4} {\ mu_2}} $
ที่ไหน -
$ {\ mu_4 = \ frac {\ sum (x- \ bar x) ^ 4} {N}} $
ยิ่งค่าของ \ beta_2 มีค่าสูงสุดหรือ leptokurtic เส้นโค้งมากขึ้น เส้นโค้งปกติมีค่าเท่ากับ 3 leptokurtic มี \ beta_2 มากกว่า 3 และ platykurtic มี \ beta_2 น้อยกว่า 3
ตัวอย่าง
Problem Statement:
มีการให้ข้อมูลค่าแรงรายวันของคนงาน 45 คนของโรงงาน คำนวณ \ beta_1 และ \ beta_2 โดยใช้ช่วงเวลาเกี่ยวกับค่าเฉลี่ย แสดงความคิดเห็นเกี่ยวกับผลลัพธ์
ค่าจ้าง (Rs.) | จำนวนคนงาน |
---|---|
100-200 | 1 |
120-200 | 2 |
140-200 | 6 |
160-200 | 20 |
180-200 | 11 |
200-200 | 3 |
220-200 | 2 |
Solution:
ค่าจ้าง (Rs.) |
จำนวนคนงาน (f) |
ช่วงกลาง ม |
ม - $ {\ frac {170} {20}} $ d |
$ {fd} $ | $ {fd ^ 2} $ | $ {fd ^ 3} $ | $ {fd ^ 4} $ |
---|---|---|---|---|---|---|---|
100-200 | 1 | 110 | -3 | -3 | 9 | -27 | 81 |
120-200 | 2 | 130 | -2 | -4 | 8 | -16 | 32 |
140-200 | 6 | 150 | -1 | -6 | 6 | -6 | 6 |
160-200 | 20 | 170 | 0 | 0 | 0 | 0 | 0 |
180-200 | 11 | 190 | 1 | 11 | 11 | 11 | 11 |
200-200 | 3 | 210 | 2 | 6 | 12 | 24 | 48 |
220-200 | 2 | 230 | 3 | 6 | 18 | 54 | 162 |
$ {N = 45} $ | $ {\ sum fd = 10} $ | $ {\ sum fd ^ 2 = 64} $ | $ {\ sum fd ^ 3 = 40} $ | $ {\ sum fd ^ 4 = 330} $ |
เนื่องจากค่าเบี่ยงเบนถูกนำมาจากค่าเฉลี่ยสมมติดังนั้นเราจึงคำนวณช่วงเวลาเกี่ยวกับจุดกำเนิดโดยพลการก่อนจากนั้นจึงคำนวณช่วงเวลาเกี่ยวกับค่าเฉลี่ย ช่วงเวลาเกี่ยวกับต้นกำเนิดโดยพลการ '170'
ช่วงเวลาเกี่ยวกับค่าเฉลี่ย
จากค่าของการเคลื่อนที่เกี่ยวกับค่าเฉลี่ยตอนนี้เราสามารถคำนวณ $ {\ beta_1} $ และ $ {\ beta_2} $:
จากการคำนวณข้างต้นสรุปได้ว่า $ {\ beta_1} $ ซึ่งวัดความเบ้เกือบเป็นศูนย์จึงแสดงว่าการแจกแจงเกือบจะสมมาตร $ {\ beta_2} $ ซึ่งวัดความเคอร์โทซิสมีค่ามากกว่า 3 จึงหมายความว่าการแจกแจงเป็นโรคเลปโตคูร์ติค