पायथन पंडों - विज़ुअलाइज़ेशन
बेसिक प्लॉटिंग: प्लॉट
सीरीज़ और डेटाफ़्रेम पर यह कार्यक्षमता बस के आसपास एक साधारण आवरण है matplotlib libraries plot() तरीका।
import pandas as pd
import numpy as np
df = pd.DataFrame(np.random.randn(10,4),index=pd.date_range('1/1/2000',
periods=10), columns=list('ABCD'))
df.plot()
आईटी इस output इस प्रकार है -
यदि सूचकांक में दिनांक शामिल हैं, तो यह कॉल करता है gct().autofmt_xdate() उपरोक्त चित्रण में दिखाए अनुसार x- अक्ष को प्रारूपित करना।
हम एक कॉलम बनाम दूसरे का उपयोग करके प्लॉट कर सकते हैं x तथा y कीवर्ड।
प्लॉटिंग विधियाँ डिफ़ॉल्ट रेखा प्लॉट के अलावा कुछ मुट्ठी भर प्लॉट शैलियों की अनुमति देती हैं। इन तरीकों को कीवर्ड तर्क के रूप में प्रदान किया जा सकता हैplot()। इनमें शामिल हैं -
- बार भूखंडों के लिए बार या बाराह
- हिस्टोग्राम के लिए हिस्ट
- बॉक्सप्लॉट के लिए बॉक्स
- क्षेत्र भूखंडों के लिए 'क्षेत्र'
- तितर बितर भूखंडों के लिए 'बिखराव'
बार प्लाट
आइए अब देखते हैं कि एक बार बनाने से एक बार प्लॉट क्या है। निम्नलिखित तरीके से एक बार प्लॉट बनाया जा सकता है -
import pandas as pd
import numpy as np
df = pd.DataFrame(np.random.rand(10,4),columns=['a','b','c','d')
df.plot.bar()
आईटी इस output इस प्रकार है -
स्टैक्ड बार प्लॉट का निर्माण करने के लिए, pass stacked=True -
import pandas as pd
df = pd.DataFrame(np.random.rand(10,4),columns=['a','b','c','d')
df.plot.bar(stacked=True)
आईटी इस output इस प्रकार है -
क्षैतिज बार भूखंड प्राप्त करने के लिए, का उपयोग करें barh विधि -
import pandas as pd
import numpy as np
df = pd.DataFrame(np.random.rand(10,4),columns=['a','b','c','d')
df.plot.barh(stacked=True)
आईटी इस output इस प्रकार है -
हिस्टोग्राम
हिस्टोग्राम का उपयोग करके प्लॉट किया जा सकता है plot.hist()तरीका। हम डिब्बे की संख्या निर्दिष्ट कर सकते हैं।
import pandas as pd
import numpy as np
df = pd.DataFrame({'a':np.random.randn(1000)+1,'b':np.random.randn(1000),'c':
np.random.randn(1000) - 1}, columns=['a', 'b', 'c'])
df.plot.hist(bins=20)
आईटी इस output इस प्रकार है -
प्रत्येक स्तंभ के लिए अलग-अलग हिस्टोग्राम बनाने के लिए, निम्नलिखित कोड का उपयोग करें -
import pandas as pd
import numpy as np
df=pd.DataFrame({'a':np.random.randn(1000)+1,'b':np.random.randn(1000),'c':
np.random.randn(1000) - 1}, columns=['a', 'b', 'c'])
df.diff.hist(bins=20)
आईटी इस output इस प्रकार है -
छोटे भूखंड
बॉक्सप्लॉट कॉलिंग खींची जा सकती है Series.box.plot() तथा DataFrame.box.plot(), या DataFrame.boxplot() प्रत्येक स्तंभ के भीतर मूल्यों के वितरण की कल्पना करना।
उदाहरण के लिए, यहाँ एक बॉक्सप्लॉट है, जो [0,1) पर एक समान यादृच्छिक चर के 10 अवलोकनों के पाँच परीक्षणों का प्रतिनिधित्व करता है।
import pandas as pd
import numpy as np
df = pd.DataFrame(np.random.rand(10, 5), columns=['A', 'B', 'C', 'D', 'E'])
df.plot.box()
आईटी इस output इस प्रकार है -
क्षेत्र का प्लॉट
का उपयोग कर क्षेत्र की साजिश बनाई जा सकती है Series.plot.area() या DataFrame.plot.area() तरीकों।
import pandas as pd
import numpy as np
df = pd.DataFrame(np.random.rand(10, 4), columns=['a', 'b', 'c', 'd'])
df.plot.area()
आईटी इस output इस प्रकार है -
स्कैटर प्लॉट
का उपयोग करके स्कैटर प्लॉट बनाया जा सकता है DataFrame.plot.scatter() तरीकों।
import pandas as pd
import numpy as np
df = pd.DataFrame(np.random.rand(50, 4), columns=['a', 'b', 'c', 'd'])
df.plot.scatter(x='a', y='b')
आईटी इस output इस प्रकार है -
पाई चार्ट
पाई चार्ट का उपयोग करके बनाया जा सकता है DataFrame.plot.pie() तरीका।
import pandas as pd
import numpy as np
df = pd.DataFrame(3 * np.random.rand(4), index=['a', 'b', 'c', 'd'], columns=['x'])
df.plot.pie(subplots=True)
आईटी इस output इस प्रकार है -