पायथन - बॉक्स प्लॉट्स

Boxplots एक माप है कि डेटा सेट में डेटा को कितनी अच्छी तरह से वितरित किया गया है। यह डेटा को तीन चतुर्थक में विभाजित करता है। यह ग्राफ डेटा सेट में न्यूनतम, अधिकतम, औसत, पहली चतुर्थक और तीसरी चतुर्थक का प्रतिनिधित्व करता है। यह उनमें से प्रत्येक के लिए बॉक्सप्लॉट खींचकर डेटा सेट में डेटा के वितरण की तुलना करने में भी उपयोगी है।

एक बॉक्स प्लॉट खींचना

बॉक्सप्लॉट को प्रत्येक कॉलम के भीतर मूल्यों के वितरण की कल्पना करने के लिए Series.box.plot () और DataFrame.box.plot (), या DataFrame.boxplot () कॉल करके तैयार किया जा सकता है।

उदाहरण के लिए, यहाँ एक बॉक्सप्लॉट है, जो [0,1) पर एक समान यादृच्छिक चर के 10 अवलोकनों के पाँच परीक्षणों का प्रतिनिधित्व करता है।

import pandas as pd
import numpy as np
df = pd.DataFrame(np.random.rand(10, 5), columns=['A', 'B', 'C', 'D', 'E'])
df.plot.box(grid='True')

आईटी इस output इस प्रकार है -