प्लॉटली - डिस्टलॉट्स डेंसिटी प्लॉट और एरर बार प्लॉट
इस अध्याय में, हम डिस्टलॉट्स, घनत्व प्लॉट और एरर बार प्लॉट के बारे में विस्तार से समझेंगे। हमें डिस्टलोट्स के बारे में जानने के द्वारा शुरू करते हैं।
Distplots
डिस्टलॉट फिगर फैक्ट्री संख्यात्मक डेटा के सांख्यिकीय अभ्यावेदन का एक संयोजन प्रदर्शित करता है, जैसे कि हिस्टोग्राम, कर्नेल घनत्व आकलन या सामान्य वक्र, और गलीचा साजिश।
डिस्टलॉट को निम्नलिखित 3 घटकों के सभी या किसी भी संयोजन से बनाया जा सकता है -
- histogram
- वक्र: (ए) कर्नेल घनत्व अनुमान या (बी) सामान्य वक्र, और
- गलीचा की साजिश
figure_factory मॉड्यूल है create_distplot() फ़ंक्शन जिसे hist_data नामक एक अनिवार्य पैरामीटर की आवश्यकता होती है।
निम्नलिखित कोड एक हिस्टोग्राम, एक केडी प्लॉट और एक गलीचा प्लॉट से मिलकर एक बुनियादी डिस्टप्लॉट बनाता है।
x = np.random.randn(1000)
hist_data = [x]
group_labels = ['distplot']
fig = ff.create_distplot(hist_data, group_labels)
iplot(fig)
ऊपर उल्लिखित कोड का आउटपुट निम्नानुसार है -
घनत्व प्लॉट
घनत्व प्लॉट डेटा से अनुमानित हिस्टोग्राम का एक सुचारू, निरंतर संस्करण है। अनुमान के सबसे सामान्य रूप के रूप में जाना जाता हैkernel density estimation (KDE)। इस विधि में, प्रत्येक व्यक्तिगत डेटा बिंदु पर एक निरंतर वक्र (कर्नेल) खींचा जाता है और इन सभी वक्रों को फिर एक एकल घनत्व घनत्व अनुमान बनाने के लिए एक साथ जोड़ा जाता है।
create_2d_density() मॉड्यूल में कार्य करते हैं plotly.figure_factory._2d_density 2 डी घनत्व भूखंड के लिए एक आंकड़ा वस्तु देता है।
हिस्टोग्राम डेटा पर 2D घनत्व प्लॉट का उत्पादन करने के लिए निम्नलिखित कोड का उपयोग किया जाता है।
t = np.linspace(-1, 1.2, 2000)
x = (t**3) + (0.3 * np.random.randn(2000))
y = (t**6) + (0.3 * np.random.randn(2000))
fig = ff.create_2d_density( x, y)
iplot(fig)
नीचे दिए गए कोड का आउटपुट दिया गया है।
एरर बार प्लॉट
त्रुटि सलाखों डेटा में त्रुटि या अनिश्चितता का चित्रमय प्रतिनिधित्व है, और वे सही व्याख्या में सहायता करते हैं। वैज्ञानिक उद्देश्यों के लिए, दिए गए डेटा को समझने में त्रुटियों की रिपोर्टिंग महत्वपूर्ण है।
त्रुटि पट्टियाँ समस्या हल करने के लिए उपयोगी हैं क्योंकि त्रुटि पट्टियाँ माप या परिकलित मानों के एक सेट में विश्वास या सटीकता दिखाती हैं।
अधिकतर त्रुटि पट्टियाँ किसी डेटासेट की श्रेणी और मानक विचलन का प्रतिनिधित्व करती हैं। वे यह अनुमान लगाने में मदद कर सकते हैं कि माध्य मान के आसपास डेटा कैसे फैला है। बार प्लॉट, लाइन प्लॉट, स्कैटर प्लॉट इत्यादि जैसे प्लॉटों पर एरर बार उत्पन्न किए जा सकते हैं।
go.Scatter() समारोह है error_x तथा error_y गुण जो नियंत्रित करते हैं कि त्रुटि बार कैसे उत्पन्न होते हैं।
visible (boolean) - निर्धारित करता है कि त्रुटि सलाखों का यह सेट दिखाई देता है या नहीं।
प्रॉपर्टी के संभावित मूल्य हैं "percent""constant""sqrt""data"। यह त्रुटि सलाखों को उत्पन्न करने के लिए उपयोग किए जाने वाले नियम को निर्धारित करता है। यदि "प्रतिशत", बार लंबाई अंतर्निहित डेटा के प्रतिशत के अनुरूप है। इस प्रतिशत को `value` में सेट करें। यदि "sqrt", बार लंबाई अंतर्निहित डेटा के वर्ग के अनुरूप है। यदि "डेटा", बार लंबाई डेटा सेट `सरणी` के साथ सेट कर रहे हैं।
symmetricसंपत्ति सही या गलत हो सकती है। तदनुसार, त्रुटि सलाखों के दोनों दिशाओं में समान लंबाई होगी या नहीं (ऊर्ध्वाधर सलाखों के लिए ऊपर / नीचे, क्षैतिज सलाखों के लिए बाएं / दाएं।
array- प्रत्येक त्रुटि पट्टी की लंबाई के अनुसार डेटा सेट करता है। मान अंतर्निहित डेटा के सापेक्ष प्लॉट किए जाते हैं।
arrayminus - ऊर्ध्वाधर (क्षैतिज) सलाखों के लिए नीचे (बाएं) दिशा में प्रत्येक त्रुटि बार की लंबाई के अनुरूप डेटा सेट करता है। अंतर्निहित डेटा के सापेक्ष मान प्लॉट किए जाते हैं।
कोड एक स्कैटर प्लॉट पर सममित त्रुटि सलाखों को प्रदर्शित करता है -
trace = go.Scatter(
x = [0, 1, 2], y = [6, 10, 2],
error_y = dict(
type = 'data', # value of error bar given in data coordinates
array = [1, 2, 3], visible = True)
)
data = [trace]
layout = go.Layout(title = 'Symmetric Error Bar')
fig = go.Figure(data = data, layout = layout)
iplot(fig)
नीचे दिया गया उपरोक्त कोड का आउटपुट है।
लिपि का अनुसरण करके असममित त्रुटि प्लॉट का प्रतिपादन किया गया है -
trace = go.Scatter(
x = [1, 2, 3, 4],
y =[ 2, 1, 3, 4],
error_y = dict(
type = 'data',
symmetric = False,
array = [0.1, 0.2, 0.1, 0.1],
arrayminus = [0.2, 0.4, 1, 0.2]
)
)
data = [trace]
layout = go.Layout(title = 'Asymmetric Error Bar')
fig = go.Figure(data = data, layout = layout)
iplot(fig)
उसी का आउटपुट नीचे दिया गया है -