बोकेह - डेटा छानना

अक्सर, आप डेटा के एक हिस्से से संबंधित एक भूखंड प्राप्त करना चाह सकते हैं जो संपूर्ण डेटासेट के बजाय कुछ शर्तों को पूरा करता है। Bokeh.models मॉड्यूल में परिभाषित CDSView क्लास का ऑब्जेक्ट, इसके ऊपर एक या अधिक फ़िल्टर लागू करके विचाराधीन ColumnDatasource का एक सबसेट लौटाता है।

IndexFilter फ़िल्टर का सबसे सरल प्रकार है। आपको उस डेटासेट से केवल उन पंक्तियों के सूचकांकों को निर्दिष्ट करना है जिन्हें आप आंकड़ा तैयार करते समय उपयोग करना चाहते हैं।

उदाहरण के बाद एक CDSView सेट करने के लिए IndexFilter के उपयोग को दर्शाता है। परिणामी आंकड़ा ColumnDataSource के x और y डेटा श्रृंखला के बीच एक रेखा ग्लिफ़ दिखाता है। एक दृश्य वस्तु को इसके ऊपर इंडेक्स फिल्टर लगाकर प्राप्त किया जाता है। IndexFilter के परिणामस्वरूप सर्कल ग्लिफ़ को प्लॉट करने के लिए दृश्य का उपयोग किया जाता है।

उदाहरण

from bokeh.models import ColumnDataSource, CDSView, IndexFilter
from bokeh.plotting import figure, output_file, show
source = ColumnDataSource(data = dict(x = list(range(1,11)), y = list(range(2,22,2))))
view = CDSView(source=source, filters = [IndexFilter([0, 2, 4,6])])
fig = figure(title = 'Line Plot example', x_axis_label = 'x', y_axis_label = 'y')
fig.circle(x = "x", y = "y", size = 10, source = source, view = view, legend = 'filtered')
fig.line(source.data['x'],source.data['y'], legend = 'unfiltered')
show(fig)

उत्पादन

डेटा स्रोत से केवल उन पंक्तियों को चुनने के लिए, जो एक निश्चित बूलियन स्थिति को संतुष्ट करते हैं, एक बूलियनफ़िल्टर लागू करें।

एक विशिष्ट बोकेह इंस्टॉलेशन में नमूनाकृत निर्देशिका में कई नमूना डेटा सेट होते हैं। निम्नलिखित उदाहरण के लिए, हम उपयोग करते हैंunemployment1948डाटासेट बेरोजगारी 1948.csv के रूप में प्रदान किया गया। यह संयुक्त राज्य अमेरिका में 1948 से बेरोजगारी का वर्षवार प्रतिशत संग्रहीत करता है। हम केवल वर्ष 1980 के लिए एक भूखंड उत्पन्न करना चाहते हैं। उस प्रयोजन के लिए, दिए गए डेटा स्रोत पर बूलियनफिल्टर लगाने से एक CDSView ऑब्जेक्ट प्राप्त होता है।

from bokeh.models import ColumnDataSource, CDSView, BooleanFilter
from bokeh.plotting import figure, show
from bokeh.sampledata.unemployment1948 import data
source = ColumnDataSource(data)
booleans = [True if int(year) >= 1980 else False for year in
source.data['Year']]
print (booleans)
view1 = CDSView(source = source, filters=[BooleanFilter(booleans)])
p = figure(title = "Unemployment data", x_range = (1980,2020), x_axis_label = 'Year', y_axis_label='Percentage')
p.line(x = 'Year', y = 'Annual', source = source, view = view1, color = 'red', line_width = 2)
show(p)

उत्पादन

फ़िल्टर लगाने में और अधिक लचीलापन जोड़ने के लिए, बोकेह एक CustomJSFilter वर्ग प्रदान करता है जिसकी मदद से डेटा स्रोत को उपयोगकर्ता परिभाषित जावास्क्रिप्ट फ़ंक्शन के साथ फ़िल्टर किया जा सकता है।

नीचे दिया गया उदाहरण समान यूएसए बेरोजगारी डेटा का उपयोग करता है। वर्ष 1980 और उसके बाद के बेरोजगारी के आंकड़ों की साजिश करने के लिए एक CustomJSFilter को परिभाषित करना।

from bokeh.models import ColumnDataSource, CDSView, CustomJSFilter
from bokeh.plotting import figure, show
from bokeh.sampledata.unemployment1948 import data
source = ColumnDataSource(data)
custom_filter = CustomJSFilter(code = '''
   var indices = [];

   for (var i = 0; i < source.get_length(); i++){
      if (parseInt(source.data['Year'][i]) > = 1980){
         indices.push(true);
      } else {
         indices.push(false);
      }
   }
   return indices;
''')
view1 = CDSView(source = source, filters = [custom_filter])
p = figure(title = "Unemployment data", x_range = (1980,2020), x_axis_label = 'Year', y_axis_label = 'Percentage')
p.line(x = 'Year', y = 'Annual', source = source, view = view1, color = 'red', line_width = 2)
show(p)