สถิติ - การแจกแจงปกติ

การแจกแจงแบบปกติคือการจัดเรียงของชุดข้อมูลที่ค่าส่วนใหญ่คลัสเตอร์อยู่ตรงกลางของช่วงและส่วนที่เหลือจะลดลงอย่างสมมาตรไปทางสุดขั้ว ความสูงเป็นตัวอย่างง่ายๆของบางสิ่งที่เป็นไปตามรูปแบบการแจกแจงปกติ: คนส่วนใหญ่มีความสูงโดยเฉลี่ยจำนวนคนที่สูงและเตี้ยกว่าค่าเฉลี่ยจะค่อนข้างเท่ากันและจำนวนคนที่น้อยมาก (และยังคงเทียบเท่ากันโดยประมาณ) ก็มีมากเช่นกัน สูงหรือสั้นมากนี่คือตัวอย่างของเส้นโค้งการแจกแจงปกติ:

การแสดงภาพกราฟิกของการแจกแจงแบบปกติบางครั้งเรียกว่าเส้นโค้งเบลล์เนื่องจากรูปร่างบาน รูปร่างที่แม่นยำอาจแตกต่างกันไปตามการกระจายของประชากร แต่จุดสูงสุดจะอยู่ตรงกลางเสมอและเส้นโค้งจะสมมาตรเสมอ ในการแจกแจงแบบปกติโหมดค่าเฉลี่ยและค่ามัธยฐานจะเหมือนกันทั้งหมด

สูตร

$ {y = \ frac {1} {\ sqrt {2 \ pi}} e ^ {\ frac {- (x - \ mu) ^ 2} {2 \ sigma}}} $

ที่ไหน -

  • $ {\ mu} $ = ค่าเฉลี่ย

  • $ {\ sigma} $ = ค่าเบี่ยงเบนมาตรฐาน

  • $ {\ pi \ ประมาณ 3.14159} $

  • $ {e \ ประมาณ 2.71828} $

ตัวอย่าง

Problem Statement:

การสำรวจเวลาเดินทางในแต่ละวันได้ผลลัพธ์เหล่านี้ (เป็นนาที):

26 33 65 28 34 55 25 44 50 36 26 37 43 62 35 38 45 32 28 34

ค่าเฉลี่ยคือ 38.8 นาทีและค่าเบี่ยงเบนมาตรฐานคือ 11.4 นาที แปลงค่าเป็น z - คะแนนและเตรียมกราฟการแจกแจงปกติ

Solution:

สูตรสำหรับ z-score ที่เราใช้:

$ {z = \ frac {x - \ mu} {\ sigma}} $

ที่ไหน -

  • $ {z} $ = "z-score" (คะแนนมาตรฐาน)

  • $ {x} $ = ค่าที่จะทำให้เป็นมาตรฐาน

  • $ {\ mu} $ = mean

  • $ {\ sigma} $ = ค่าเบี่ยงเบนมาตรฐาน

ในการแปลง 26:

ลบค่าเฉลี่ยก่อน: 26-38.8 = -12.8,

จากนั้นหารด้วย Standard Deviation: -12.8 / 11.4 = -1.12

ดังนั้น 26 คือ -1.12 ค่าเบี่ยงเบนมาตรฐานจากค่าเฉลี่ย

นี่คือ Conversion สามรายการแรก

ค่าเดิม การคำนวณ คะแนนมาตรฐาน (คะแนน z)
26 (26-38.8) / 11.4 = -1.12
33 (33-38.8) / 11.4 = -0.51
65 (65-38.8) / 11.4 = -2.30 น
... ... ...

และที่นี่พวกเขาแสดงภาพกราฟิก: