पंडों और कफ़लिंक के साथ

पंडों डेटा विश्लेषण के लिए पायथन में एक बहुत लोकप्रिय पुस्तकालय है। इसका अपना प्लॉट फंक्शन सपोर्ट भी है। हालांकि, पंडों के भूखंड विज़ुअलाइज़ेशन में अन्तरक्रियाशीलता प्रदान नहीं करते हैं। शुक्र है, भूखंड के इंटरैक्टिव और गतिशील भूखंडों का उपयोग करके बनाया जा सकता हैPandas dataframe वस्तुओं।

हम साधारण सूची वस्तुओं से एक डेटाफ्रेम का निर्माण शुरू करते हैं।

data = [['Ravi',21,67],['Kiran',24,61],['Anita',18,46],['Smita',20,78],['Sunil',17,90]]
df = pd.DataFrame(data,columns = ['name','age','marks'],dtype = float)

डेटाफ्रेम कॉलम का उपयोग डेटा मान के लिए किया जाता है x तथा yग्राफ ऑब्जेक्ट निशान के गुण। यहां, हम उपयोग करके बार ट्रेस उत्पन्न करेंगेname तथा marks कॉलम।

trace = go.Bar(x = df.name, y = df.marks)
fig = go.Figure(data = [trace])
iplot(fig)

एक साधारण बार प्लॉट नीचे दी गई रूप में जूपिटर नोटबुक में प्रदर्शित किया जाएगा -

प्लॉट के ऊपर बनाया गया है d3.js और विशेष रूप से एक चार्टिंग लाइब्रेरी है जिसका उपयोग सीधे किया जा सकता है Pandas dataframes नाम से एक और पुस्तकालय का उपयोग कर Cufflinks

यदि पहले से उपलब्ध नहीं है, तो अपने पसंदीदा पैकेज प्रबंधक का उपयोग करके कफ़लिंक पैकेज स्थापित करें pip जैसा कि नीचे दिया गया है -

pip install cufflinks
or
conda install -c conda-forge cufflinks-py

सबसे पहले, अन्य पुस्तकालयों जैसे कफ़लिंक को आयात करें Pandas तथा numpy जो इसे ऑफ़लाइन उपयोग के लिए कॉन्फ़िगर कर सकता है।

import cufflinks as cf
cf.go_offline()

अब, आप सीधे उपयोग कर सकते हैं Pandas dataframe ट्रेस और फिगर ऑब्जेक्ट्स का उपयोग किए बिना विभिन्न प्रकार के भूखंडों को प्रदर्शित करने के लिए graph_objs module जैसा कि हम पहले भी करते रहे हैं।

df.iplot(kind = 'bar', x = 'name', y = 'marks')

बार प्लॉट, पहले के समान बहुत ही नीचे प्रदर्शित किया जाएगा -

डेटाबेस से पंडों डेटाफ्रेम

डेटाफ़्रेम के निर्माण के लिए पायथन सूचियों का उपयोग करने के बजाय, यह विभिन्न प्रकार के डेटाबेस में डेटा द्वारा पॉप्युलेट किया जा सकता है। उदाहरण के लिए, एक CSV फ़ाइल, SQLite डेटाबेस तालिका या mysql डेटाबेस तालिका के डेटा को पंडों के डेटाफ़्रेम में लाया जा सकता है, जो अंततः भूखंड के रेखांकन के अधीन होता हैFigure object या Cufflinks interface

से डेटा प्राप्त करने के लिए CSV file, हम प्रयोग कर सकते हैं read_csv() पंडों के पुस्तकालय से समारोह।

import pandas as pd
df = pd.read_csv('sample-data.csv')

यदि डेटा में उपलब्ध है SQLite database table, इसका उपयोग करके पुनर्प्राप्त किया जा सकता है SQLAlchemy library निम्नानुसार है -

import pandas as pd
from sqlalchemy import create_engine
disk_engine = create_engine('sqlite:///mydb.db')
df = pd.read_sql_query('SELECT name,age,marks', disk_engine)

दूसरी ओर, से डेटा MySQL database पंडों के डेटाफ्रेम में निम्नानुसार पुनर्प्राप्त किया गया है -

import pymysql
import pandas as pd
conn = pymysql.connect(host = "localhost", user = "root", passwd = "xxxx", db = "mydb")
cursor = conn.cursor()
cursor.execute('select name,age,marks')
rows = cursor.fetchall()
df = pd.DataFrame( [[ij for ij in i] for i in rows] )
df.rename(columns = {0: 'Name', 1: 'age', 2: 'marks'}, inplace = True)