Python - การวัดความแปรปรวน

ในทางสถิติความแปรปรวนเป็นการวัดว่าค่าในชุดข้อมูลอยู่ห่างจากค่าเฉลี่ยเพียงใด กล่าวอีกนัยหนึ่งก็คือบ่งชี้ว่าค่าต่างๆกระจายไปเพียงใด วัดโดยใช้ค่าเบี่ยงเบนมาตรฐาน วิธีอื่น ๆ ที่ใช้กันทั่วไปคือการเบ้

ทั้งสองอย่างนี้คำนวณโดยใช้ฟังก์ชันที่มีอยู่ในไลบรารีแพนด้า

การวัดค่าเบี่ยงเบนมาตรฐาน

ค่าเบี่ยงเบนมาตรฐานคือรากที่สองของความแปรปรวน ความแปรปรวนคือค่าเฉลี่ยของความแตกต่างกำลังสองของค่าในชุดข้อมูลจากค่าเฉลี่ย ใน python เราคำนวณค่านี้โดยใช้ฟังก์ชัน std () จากไลบรารีแพนด้า

import pandas as pd

#Create a Dictionary of series
d = {'Name':pd.Series(['Tom','James','Ricky','Vin','Steve','Smith','Jack',
   'Lee','Chanchal','Gasper','Naviya','Andres']),
   'Age':pd.Series([25,26,25,23,30,25,23,34,40,30,25,46]),
   'Rating':pd.Series([4.23,3.24,3.98,2.56,3.20,4.6,3.8,3.78,2.98,4.80,4.10,3.65])}

#Create a DataFrame
df = pd.DataFrame(d)

# Calculate the standard deviation
print df.std()

มัน output มีดังนี้ -

Age       7.265527
Rating    0.661628
dtype: float64

การวัดความเบ้

ใช้เพื่อตรวจสอบว่าข้อมูลสมมาตรหรือเบ้ ถ้าดัชนีอยู่ระหว่าง -1 ถึง 1 การแจกแจงจะสมมาตร หากดัชนีไม่เกิน -1 ดัชนีจะเบ้ไปทางซ้ายและถ้ามีค่าอย่างน้อย 1 แสดงว่าเบ้ไปทางขวา

import pandas as pd

#Create a Dictionary of series
d = {'Name':pd.Series(['Tom','James','Ricky','Vin','Steve','Smith','Jack',
   'Lee','Chanchal','Gasper','Naviya','Andres']),
   'Age':pd.Series([25,26,25,23,30,25,23,34,40,30,25,46]),
   'Rating':pd.Series([4.23,3.24,3.98,2.56,3.20,4.6,3.8,3.78,2.98,4.80,4.10,3.65])}

#Create a DataFrame
df = pd.DataFrame(d)
print df.skew()

มัน output มีดังนี้ -

Age       1.443490
Rating   -0.153629
dtype: float64

ดังนั้นการกระจายของการให้คะแนนอายุจึงสมมาตรในขณะที่การแจกแจงอายุจะเบ้ไปทางขวา