Zaszyfruj duży plik, który nie mieści się w pamięci RAM, za pomocą AES-GCM

Nov 22 2020

Ten kod działa dla pliku myfilemieszczącego się w pamięci RAM:

import Crypto.Random, Crypto.Cipher.AES   # pip install pycryptodome

nonce = Crypto.Random.new().read(16)
key = Crypto.Random.new().read(16)  # in reality, use a key derivation function, etc. ouf of topic here
cipher = Crypto.Cipher.AES.new(key, Crypto.Cipher.AES.MODE_GCM, nonce=nonce)

out = io.BytesIO()
with open('myfile', 'rb') as g:
    s = g.read()
ciphertext, tag = cipher.encrypt_and_digest(s)
out.write(nonce)
out.write(ciphertext)
out.write(tag)

Ale jak zaszyfrować plik 64 GB za pomocą tej techniki?

Oczywiście g.read(...)należy użyć mniejszego rozmiaru bufora, np. 128 MB.

Ale jak to działa w przypadku części kryptograficznej? Czy powinniśmy zachować po jednym (ciphertext, tag)dla każdego 128-MB fragmentu?

A może można mieć tylko jeden tagdla całego pliku?

Odpowiedzi

Basj Nov 22 2020 at 20:30

Jak wspomniano w komentarzu @ PresidentJamesK.Polk, wydaje się, że jest to rozwiązanie:

out.write(nonce)
while True:
    block = g.read(65536)
    if not block:
        break
    out.write(cipher.encrypt(block))
out.write(cipher.digest())  # 16-byte tag at the end of the file

Jedynym problemem jest to, że podczas odczytu tego pliku w celu odszyfrowania zatrzymanie się na końcu minus 16 bajtów jest nieco denerwujące .

A może należy to zrobić:

out.write(nonce)
out.seek(16, 1)  # go forward of 16 bytes, placeholder for tag
while True:
   ...
   ...
out.seek(16)
out.write(cipher.digest())  # write the tag at offset #16 of the output file

?