अजगर - केंद्रीय प्रवृत्ति को मापने

गणितीय रूप से केंद्रीय प्रवृत्ति का अर्थ है एक डेटा सेट के मूल्यों के स्थान के केंद्र या वितरण को मापना। यह डेटा सेट में डेटा के औसत मूल्य का एक विचार देता है और यह भी एक संकेत है कि डेटा सेट में मूल्यों का व्यापक रूप से प्रसार कैसे होता है। बदले में मौजूदा डेटा सेट में एक नए इनपुट फिटिंग के अवसरों का मूल्यांकन करने में मदद करता है और इसलिए सफलता की संभावना है।

केंद्रीय प्रवृत्ति के तीन मुख्य उपाय हैं जिनकी गणना पंडों पायथन पुस्तकालय में विधियों का उपयोग करके की जा सकती है।

  • माध्य - यह डेटा का औसत मूल्य है जो मूल्यों की संख्या के साथ मूल्यों के योग का एक विभाजन है।

  • माध्य - यह वितरण में मध्य मूल्य है जब मूल्यों को आरोही या अवरोही क्रम में व्यवस्थित किया जाता है।

  • मोड - यह एक वितरण में सबसे अधिक होने वाला मूल्य है।

मीन और मेडियन की गणना

इन मूल्यों की गणना करने के लिए पांडा के कार्यों का सीधा उपयोग किया जा सकता है।

import pandas as pd

#Create a Dictionary of series
d = {'Name':pd.Series(['Tom','James','Ricky','Vin','Steve','Smith','Jack',
   'Lee','Chanchal','Gasper','Naviya','Andres']),
   'Age':pd.Series([25,26,25,23,30,29,23,34,40,30,51,46]),
   'Rating':pd.Series([4.23,3.24,3.98,2.56,3.20,4.6,3.8,3.78,2.98,4.80,4.10,3.65])}

#Create a DataFrame
df = pd.DataFrame(d)
print "Mean Values in the Distribution"
print df.mean()
print "*******************************"
print "Median Values in the Distribution"
print df.median()

आईटी इस output इस प्रकार है -

Mean Values in the Distribution
Age       31.833333
Rating     3.743333
dtype: float64
*******************************
Median Values in the Distribution
Age       29.50
Rating     3.79
dtype: float64

गणना मोड

मोड वितरण में उपलब्ध है या नहीं हो सकता है, यह इस बात पर निर्भर करता है कि डेटा निरंतर है या क्या ऐसे मान हैं जिनमें अधिकतम फ़्रिक्वेंसी है। हम मोड का पता लगाने के लिए नीचे एक सरल वितरण लेते हैं। यहां हमारे पास एक मूल्य है जो वितरण में अधिकतम आवृत्ति है।

import pandas as pd

#Create a Dictionary of series
d = {'Name':pd.Series(['Tom','James','Ricky','Vin','Steve','Smith','Jack',
   'Lee','Chanchal','Gasper','Naviya','Andres']),
   'Age':pd.Series([25,26,25,23,30,25,23,34,40,30,25,46])}
#Create a DataFrame
df = pd.DataFrame(d)

print df.mode()

आईटी इस output इस प्रकार है -

Age      Name
0   25.0    Andres
1    NaN  Chanchal
2    NaN    Gasper
3    NaN      Jack
4    NaN     James
5    NaN       Lee
6    NaN    Naviya
7    NaN     Ricky
8    NaN     Smith
9    NaN     Steve
10   NaN       Tom
11   NaN       Vin