Python Data Persistence - โมดูล CSV

CSV stands for comma separated values. รูปแบบไฟล์นี้เป็นรูปแบบข้อมูลที่ใช้กันทั่วไปในขณะที่ส่งออก / นำเข้าข้อมูลไปยัง / จากสเปรดชีตและตารางข้อมูลในฐานข้อมูล โมดูล csv ถูกรวมไว้ในไลบรารีมาตรฐานของ Python อันเป็นผลมาจาก PEP 305 โดยนำเสนอคลาสและวิธีการดำเนินการอ่าน / เขียนบนไฟล์ CSV ตามคำแนะนำของ PEP 305

CSV เป็นรูปแบบข้อมูลการส่งออกที่ต้องการโดยซอฟต์แวร์สเปรดชีต Excel ของ Microsoft อย่างไรก็ตามโมดูล csv สามารถจัดการข้อมูลที่แสดงโดยภาษาถิ่นอื่นได้เช่นกัน

อินเทอร์เฟซ CSV API ประกอบด้วยคลาสนักเขียนและผู้อ่านต่อไปนี้ -

นักเขียน ()

ฟังก์ชันนี้ในโมดูล csv ส่งคืนอ็อบเจ็กต์ตัวเขียนที่แปลงข้อมูลเป็นสตริงที่คั่นและเก็บในอ็อบเจ็กต์ไฟล์ ฟังก์ชันต้องการอ็อบเจ็กต์ไฟล์ที่มีสิทธิ์ในการเขียนเป็นพารามิเตอร์ ทุกแถวที่เขียนในไฟล์จะออกอักขระขึ้นบรรทัดใหม่ เพื่อป้องกันไม่ให้มีช่องว่างเพิ่มเติมระหว่างบรรทัดพารามิเตอร์ขึ้นบรรทัดใหม่ถูกตั้งค่าเป็น ""

คลาสนักเขียนมีวิธีการดังต่อไปนี้ -

ช่างเขียน ()

วิธีนี้จะเขียนรายการในแบบวนซ้ำได้ (รายการทูเพิลหรือสตริง) โดยคั่นด้วยอักขระลูกน้ำ

นักเขียน ()

เมธอดนี้รับรายการของการวนซ้ำเป็นพารามิเตอร์และเขียนแต่ละรายการเป็นบรรทัดรายการที่คั่นด้วยจุลภาคในไฟล์

Example

ตัวอย่างต่อไปนี้แสดงการใช้ฟังก์ชัน writer () ขั้นแรกให้เปิดไฟล์ในโหมด 'w' ไฟล์นี้ใช้เพื่อรับวัตถุตัวเขียน จากนั้นทูเพิลแต่ละรายการในรายการทูเปิลจะถูกเขียนไปยังไฟล์โดยใช้เมธอด writerow ()

import csv
   persons=[('Lata',22,45),('Anil',21,56),('John',20,60)]
   csvfile=open('persons.csv','w', newline='')
   obj=csv.writer(csvfile)
   for person in persons:
      obj.writerow(person)
csvfile.close()

Output

สิ่งนี้จะสร้างไฟล์ 'persons.csv' ในไดเรกทอรีปัจจุบัน จะแสดงข้อมูลต่อไปนี้

Lata,22,45
Anil,21,56
John,20,60

แทนที่จะวนซ้ำรายการเพื่อเขียนทีละแถวเราสามารถใช้วิธีการเขียน ()

csvfile=open('persons.csv','w', newline='')
persons=[('Lata',22,45),('Anil',21,56),('John',20,60)]
   obj=csv.writer(csvfile)
   obj.writerows(persons)
   obj.close()

ผู้อ่าน ()

ฟังก์ชันนี้ส่งคืนอ็อบเจ็กต์ผู้อ่านซึ่งส่งคืนตัววนซ้ำของบรรทัดในไฟล์ csv file. การใช้ Regular for loop ทุกบรรทัดในไฟล์จะแสดงในตัวอย่างต่อไปนี้ -

ตัวอย่าง

csvfile=open('persons.csv','r', newline='')
   obj=csv.reader(csvfile)
   for row in obj:
      print (row)

เอาต์พุต

['Lata', '22', '45']
['Anil', '21', '56']
['John', '20', '60']

อ็อบเจ็กต์ผู้อ่านเป็นตัวทำซ้ำ ดังนั้นจึงรองรับฟังก์ชัน next () ซึ่งสามารถใช้เพื่อแสดงบรรทัดทั้งหมดในไฟล์ csv แทนไฟล์for loop.

csvfile=open('persons.csv','r', newline='')
   obj=csv.reader(csvfile)
   while True:
   try:
      row=next(obj)
      print (row)
   except StopIteration:
      break

ดังที่ได้กล่าวไว้ก่อนหน้านี้โมดูล csv ใช้ Excel เป็นภาษาถิ่นเริ่มต้น โมดูล csv ยังกำหนดคลาสภาษาถิ่น ภาษาถิ่นคือชุดของมาตรฐานที่ใช้ในการใช้โปรโตคอล CSV รายการภาษาถิ่นสามารถรับได้จากฟังก์ชัน list_dialects ()

>>> csv.list_dialects()
['excel', 'excel-tab', 'unix']

นอกจาก iterables แล้วโมดูล csv ยังสามารถเอ็กซ์พอร์ตออบเจ็กต์พจนานุกรมไปยังไฟล์ CSV และอ่านเพื่อเติมอ็อบเจ็กต์พจนานุกรม Python เพื่อจุดประสงค์นี้โมดูลนี้กำหนดคลาสต่อไปนี้ -

DictWriter ()

ฟังก์ชันนี้ส่งคืนอ็อบเจ็กต์ DictWriter คล้ายกับวัตถุตัวเขียน แต่แถวจะถูกจับคู่กับวัตถุพจนานุกรม ฟังก์ชันต้องการอ็อบเจ็กต์ไฟล์ที่มีสิทธิ์ในการเขียนและรายการคีย์ที่ใช้ในพจนานุกรมเป็นพารามิเตอร์ชื่อฟิลด์ ใช้เพื่อเขียนบรรทัดแรกในไฟล์เป็นส่วนหัว

ส่วนหัวเขียน ()

วิธีนี้เขียนรายการคีย์ในพจนานุกรมเป็นบรรทัดที่คั่นด้วยจุลภาคเป็นบรรทัดแรกในไฟล์

ในตัวอย่างต่อไปนี้มีการกำหนดรายการพจนานุกรม แต่ละรายการในรายการคือพจนานุกรม โดยใช้วิธีการเขียน () จะเขียนลงในไฟล์ในลักษณะที่คั่นด้วยลูกน้ำ

persons=[
   {'name':'Lata', 'age':22, 'marks':45}, 
   {'name':'Anil', 'age':21, 'marks':56}, 
   {'name':'John', 'age':20, 'marks':60}
]
csvfile=open('persons.csv','w', newline='')
fields=list(persons[0].keys())
obj=csv.DictWriter(csvfile, fieldnames=fields)
obj.writeheader()
obj.writerows(persons)
csvfile.close()

ไฟล์ persons.csv แสดงเนื้อหาต่อไปนี้ -

name,age,marks
Lata,22,45
Anil,21,56
John,20,60

DictReader ()

ฟังก์ชันนี้ส่งคืนอ็อบเจ็กต์ DictReader จากไฟล์ CSV ที่อยู่ภายใต้ ในกรณีของอ็อบเจ็กต์ตัวอ่านอ็อบเจ็กต์นี้ยังเป็นตัววนซ้ำโดยใช้เนื้อหาของไฟล์ที่ดึงมา

csvfile=open('persons.csv','r', newline='')
obj=csv.DictReader(csvfile)

คลาสนี้มีแอตทริบิวต์ชื่อฟิลด์โดยส่งคืนคีย์พจนานุกรมที่ใช้เป็นส่วนหัวของไฟล์

print (obj.fieldnames)
['name', 'age', 'marks']

ใช้การวนซ้ำบนวัตถุ DictReader เพื่อดึงวัตถุพจนานุกรมแต่ละรายการ

for row in obj:
   print (row)

ส่งผลให้เกิดผลลัพธ์ต่อไปนี้ -

OrderedDict([('name', 'Lata'), ('age', '22'), ('marks', '45')])
OrderedDict([('name', 'Anil'), ('age', '21'), ('marks', '56')])
OrderedDict([('name', 'John'), ('age', '20'), ('marks', '60')])

ในการแปลงวัตถุ OrderDict เป็นพจนานุกรมปกติเราต้องนำเข้า OrderDict จากโมดูลคอลเลกชันก่อน

from collections import OrderedDict
   r=OrderedDict([('name', 'Lata'), ('age', '22'), ('marks', '45')])
   dict(r)
{'name': 'Lata', 'age': '22', 'marks': '45'}