पायथन - प्रसंस्करण JSON डेटा

JSON फ़ाइल डेटा को मानव-पठनीय प्रारूप में पाठ के रूप में संग्रहीत करती है। JSON का अर्थ जावास्क्रिप्ट ऑब्जेक्ट नोटेशन है। पंडों JSON फ़ाइलों का उपयोग कर पढ़ सकते हैंread_json समारोह।

इनपुट डेटा

नोटसन जैसे टेक्स्ट एडिटर में नीचे डेटा कॉपी करके एक JSON फाइल बनाएं। फ़ाइल के साथ सहेजें.json फ़ाइल प्रकार को विस्तार और चुनना all files(*.*)

{ 
   "ID":["1","2","3","4","5","6","7","8" ],
   "Name":["Rick","Dan","Michelle","Ryan","Gary","Nina","Simon","Guru" ]
   "Salary":["623.3","515.2","611","729","843.25","578","632.8","722.5" ],
   
   "StartDate":[ "1/1/2012","9/23/2013","11/15/2014","5/11/2014","3/27/2015","5/21/2013",
      "7/30/2013","6/17/2014"],
   "Dept":[ "IT","Operations","IT","HR","Finance","IT","Operations","Finance"]
}

JSON फ़ाइल पढ़ें

read_json पांडा लाइब्रेरी के कार्य का उपयोग JSON फ़ाइल को पांडा डेटाफ़्रेम में पढ़ने के लिए किया जा सकता है।

import pandas as pd

data = pd.read_json('path/input.json')
print (data)

जब हम उपरोक्त कोड निष्पादित करते हैं, तो यह निम्नलिखित परिणाम उत्पन्न करता है।

Dept  ID    Name  Salary   StartDate
0          IT   1    Rick  623.30    1/1/2012
1  Operations   2     Dan  515.20   9/23/2013
2          IT   3   Tusar  611.00  11/15/2014
3          HR   4    Ryan  729.00   5/11/2014
4     Finance   5    Gary  843.25   3/27/2015
5          IT   6   Rasmi  578.00   5/21/2013
6  Operations   7  Pranab  632.80   7/30/2013
7     Finance   8    Guru  722.50   6/17/2014

विशिष्ट कॉलम और पंक्तियाँ पढ़ना

सीएसवी फ़ाइल को पढ़ने के लिए पिछले अध्याय में हमने जो देखा है, उसके समान read_jsonपंडों की लाइब्रेरी के फ़ंक्शन का उपयोग कुछ विशिष्ट कॉलम और विशिष्ट पंक्तियों को पढ़ने के लिए भी किया जा सकता है जब JSON फ़ाइल को डेटाफ़्रेम में पढ़ा जाता है। हम मल्टी-एक्सिस इंडेक्सिंग विधि का उपयोग करते हैं जिसे कहा जाता है.loc()इस काम के लिए। हम कुछ पंक्तियों के लिए वेतन और नाम कॉलम को प्रदर्शित करना चुनते हैं।

import pandas as pd
data = pd.read_json('path/input.xlsx')

# Use the multi-axes indexing funtion
print (data.loc[[1,3,5],['salary','name']])

जब हम उपरोक्त कोड निष्पादित करते हैं, तो यह निम्नलिखित परिणाम उत्पन्न करता है।

salary   name
1   515.2    Dan
3   729.0   Ryan
5   578.0  Rasmi

रिकॉर्ड के रूप में पढ़ना JSON फ़ाइल

हम भी आवेदन कर सकते हैं to_json JSON फ़ाइल सामग्री को व्यक्तिगत रिकॉर्ड में पढ़ने के लिए मापदंडों के साथ कार्य करें।

import pandas as pd
data = pd.read_json('path/input.xlsx')

print(data.to_json(orient='records', lines=True))

जब हम उपरोक्त कोड निष्पादित करते हैं, तो यह निम्नलिखित परिणाम उत्पन्न करता है।

{"Dept":"IT","ID":1,"Name":"Rick","Salary":623.3,"StartDate":"1\/1\/2012"}
{"Dept":"Operations","ID":2,"Name":"Dan","Salary":515.2,"StartDate":"9\/23\/2013"}
{"Dept":"IT","ID":3,"Name":"Tusar","Salary":611.0,"StartDate":"11\/15\/2014"}
{"Dept":"HR","ID":4,"Name":"Ryan","Salary":729.0,"StartDate":"5\/11\/2014"}
{"Dept":"Finance","ID":5,"Name":"Gary","Salary":843.25,"StartDate":"3\/27\/2015"}
{"Dept":"IT","ID":6,"Name":"Rasmi","Salary":578.0,"StartDate":"5\/21\/2013"}
{"Dept":"Operations","ID":7,"Name":"Pranab","Salary":632.8,"StartDate":"7\/30\/2013"}
{"Dept":"Finance","ID":8,"Name":"Guru","Salary":722.5,"StartDate":"6\/17\/2014"}