Pythonデータの永続性-オブジェクトのシリアル化

Pythonの組み込みopen()関数によって返されるPythonの組み込みファイルオブジェクトには、1つの重要な欠点があります。'w'モードで開くと、write()メソッドは文字列オブジェクトのみを受け入れます。

つまり、組み込みクラス(数値、辞書、リスト、またはタプル)またはその他のユーザー定義クラスのオブジェクトである非文字列形式で表されたデータがある場合、そのデータをファイルに直接書き込むことはできません。書く前に、文字列表現に変換する必要があります。

numbers=[10,20,30,40]
   file=open('numbers.txt','w')
   file.write(str(numbers))
   file.close()

バイナリファイルの場合、 write()メソッドはバイトオブジェクトでなければなりません。たとえば、整数のリストはによってバイトに変換されますbytearray() 関数を実行してからファイルに書き込みます。

numbers=[10,20,30,40]
   data=bytearray(numbers)
   file.write(data)
   file.close()

それぞれのデータ型のファイルからデータを読み戻すには、逆変換を行う必要があります。

file=open('numbers.txt','rb')
   data=file.read()
   print (list(data))

オブジェクトから文字列またはバイト形式への(およびその逆の)このタイプの手動変換は、非常に面倒で面倒です。Pythonオブジェクトの状態をバイトストリームの形式でファイルまたはメモリストリームに直接保存して、元の状態に取得することができます。このプロセスは、シリアル化および逆シリアル化と呼ばれます。

Pythonの組み込みライブラリには、シリアル化および逆シリアル化プロセス用のさまざまなモジュールが含まれています。

シニア番号 名前と説明
1

pickle

Python固有のシリアル化ライブラリ

2

marshal

シリアル化のために内部的に使用されるライブラリ

3

shelve

Pythonicオブジェクトの永続性

4

dbm

Unixデータベースへのインターフェースを提供するライブラリ

5

csv

PythonデータをCSV形式で保存および取得するためのライブラリ

6

json

ユニバーサルJSON形式にシリアル化するためのライブラリ