पायथन - प्रसंस्करण JSON डेटा
JSON फ़ाइल डेटा को मानव-पठनीय प्रारूप में पाठ के रूप में संग्रहीत करती है। JSON का अर्थ जावास्क्रिप्ट ऑब्जेक्ट नोटेशन है। पंडों JSON फ़ाइलों का उपयोग कर पढ़ सकते हैंread_json समारोह।
इनपुट डेटा
नोटसन जैसे टेक्स्ट एडिटर में नीचे डेटा कॉपी करके एक JSON फाइल बनाएं। फ़ाइल के साथ सहेजें.json फ़ाइल प्रकार को विस्तार और चुनना all files(*.*)।
{
"ID":["1","2","3","4","5","6","7","8" ],
"Name":["Rick","Dan","Michelle","Ryan","Gary","Nina","Simon","Guru" ]
"Salary":["623.3","515.2","611","729","843.25","578","632.8","722.5" ],
"StartDate":[ "1/1/2012","9/23/2013","11/15/2014","5/11/2014","3/27/2015","5/21/2013",
"7/30/2013","6/17/2014"],
"Dept":[ "IT","Operations","IT","HR","Finance","IT","Operations","Finance"]
}
JSON फ़ाइल पढ़ें
read_json पांडा लाइब्रेरी के कार्य का उपयोग JSON फ़ाइल को पांडा डेटाफ़्रेम में पढ़ने के लिए किया जा सकता है।
import pandas as pd
data = pd.read_json('path/input.json')
print (data)
जब हम उपरोक्त कोड निष्पादित करते हैं, तो यह निम्नलिखित परिणाम उत्पन्न करता है।
Dept ID Name Salary StartDate
0 IT 1 Rick 623.30 1/1/2012
1 Operations 2 Dan 515.20 9/23/2013
2 IT 3 Tusar 611.00 11/15/2014
3 HR 4 Ryan 729.00 5/11/2014
4 Finance 5 Gary 843.25 3/27/2015
5 IT 6 Rasmi 578.00 5/21/2013
6 Operations 7 Pranab 632.80 7/30/2013
7 Finance 8 Guru 722.50 6/17/2014
विशिष्ट कॉलम और पंक्तियाँ पढ़ना
सीएसवी फ़ाइल को पढ़ने के लिए पिछले अध्याय में हमने जो देखा है, उसके समान read_jsonपंडों की लाइब्रेरी के फ़ंक्शन का उपयोग कुछ विशिष्ट कॉलम और विशिष्ट पंक्तियों को पढ़ने के लिए भी किया जा सकता है जब JSON फ़ाइल को डेटाफ़्रेम में पढ़ा जाता है। हम मल्टी-एक्सिस इंडेक्सिंग विधि का उपयोग करते हैं जिसे कहा जाता है.loc()इस काम के लिए। हम कुछ पंक्तियों के लिए वेतन और नाम कॉलम को प्रदर्शित करना चुनते हैं।
import pandas as pd
data = pd.read_json('path/input.xlsx')
# Use the multi-axes indexing funtion
print (data.loc[[1,3,5],['salary','name']])
जब हम उपरोक्त कोड निष्पादित करते हैं, तो यह निम्नलिखित परिणाम उत्पन्न करता है।
salary name
1 515.2 Dan
3 729.0 Ryan
5 578.0 Rasmi
रिकॉर्ड के रूप में पढ़ना JSON फ़ाइल
हम भी आवेदन कर सकते हैं to_json JSON फ़ाइल सामग्री को व्यक्तिगत रिकॉर्ड में पढ़ने के लिए मापदंडों के साथ कार्य करें।
import pandas as pd
data = pd.read_json('path/input.xlsx')
print(data.to_json(orient='records', lines=True))
जब हम उपरोक्त कोड निष्पादित करते हैं, तो यह निम्नलिखित परिणाम उत्पन्न करता है।
{"Dept":"IT","ID":1,"Name":"Rick","Salary":623.3,"StartDate":"1\/1\/2012"}
{"Dept":"Operations","ID":2,"Name":"Dan","Salary":515.2,"StartDate":"9\/23\/2013"}
{"Dept":"IT","ID":3,"Name":"Tusar","Salary":611.0,"StartDate":"11\/15\/2014"}
{"Dept":"HR","ID":4,"Name":"Ryan","Salary":729.0,"StartDate":"5\/11\/2014"}
{"Dept":"Finance","ID":5,"Name":"Gary","Salary":843.25,"StartDate":"3\/27\/2015"}
{"Dept":"IT","ID":6,"Name":"Rasmi","Salary":578.0,"StartDate":"5\/21\/2013"}
{"Dept":"Operations","ID":7,"Name":"Pranab","Salary":632.8,"StartDate":"7\/30\/2013"}
{"Dept":"Finance","ID":8,"Name":"Guru","Salary":722.5,"StartDate":"6\/17\/2014"}