Zaszyfruj duży plik, który nie mieści się w pamięci RAM, za pomocą AES-GCM
Nov 22 2020
Ten kod działa dla pliku myfile
mieszczącego się w pamięci RAM:
import Crypto.Random, Crypto.Cipher.AES # pip install pycryptodome
nonce = Crypto.Random.new().read(16)
key = Crypto.Random.new().read(16) # in reality, use a key derivation function, etc. ouf of topic here
cipher = Crypto.Cipher.AES.new(key, Crypto.Cipher.AES.MODE_GCM, nonce=nonce)
out = io.BytesIO()
with open('myfile', 'rb') as g:
s = g.read()
ciphertext, tag = cipher.encrypt_and_digest(s)
out.write(nonce)
out.write(ciphertext)
out.write(tag)
Ale jak zaszyfrować plik 64 GB za pomocą tej techniki?
Oczywiście g.read(...)
należy użyć mniejszego rozmiaru bufora, np. 128 MB.
Ale jak to działa w przypadku części kryptograficznej? Czy powinniśmy zachować po jednym (ciphertext, tag)
dla każdego 128-MB fragmentu?
A może można mieć tylko jeden tag
dla całego pliku?
Odpowiedzi
Basj Nov 22 2020 at 20:30
Jak wspomniano w komentarzu @ PresidentJamesK.Polk, wydaje się, że jest to rozwiązanie:
out.write(nonce)
while True:
block = g.read(65536)
if not block:
break
out.write(cipher.encrypt(block))
out.write(cipher.digest()) # 16-byte tag at the end of the file
Jedynym problemem jest to, że podczas odczytu tego pliku w celu odszyfrowania zatrzymanie się na końcu minus 16 bajtów jest nieco denerwujące .
A może należy to zrobić:
out.write(nonce)
out.seek(16, 1) # go forward of 16 bytes, placeholder for tag
while True:
...
...
out.seek(16)
out.write(cipher.digest()) # write the tag at offset #16 of the output file
?