PyTorch - Kumpulan Data
Dalam bab ini, kami akan lebih fokus torchvision.datasetsdan berbagai jenisnya. PyTorch menyertakan pemuat set data berikut -
- MNIST
- COCO (Teks dan Deteksi)
Set data mencakup mayoritas dari dua jenis fungsi yang diberikan di bawah ini -
Transform- fungsi yang mengambil gambar dan mengembalikan versi modifikasi dari barang standar. Ini dapat disusun bersama dengan transformasi.
Target_transform- fungsi yang mengambil target dan mengubahnya. Misalnya, mengambil string teks dan mengembalikan tensor indeks dunia.
MNIST
Berikut ini adalah contoh kode untuk dataset MNIST -
dset.MNIST(root, train = TRUE, transform = NONE,
target_transform = None, download = FALSE)
Parameternya adalah sebagai berikut -
root - direktori root dari dataset tempat data yang diproses ada.
train - True = Set latihan, False = Set tes
download - True = mendownload dataset dari internet dan meletakkannya di root.
KELAPA
Ini membutuhkan COCO API untuk diinstal. Contoh berikut digunakan untuk mendemonstrasikan implementasi COCO dari dataset menggunakan PyTorch -
import torchvision.dataset as dset
import torchvision.transforms as transforms
cap = dset.CocoCaptions(root = ‘ dir where images are’,
annFile = ’json annotation file’,
transform = transforms.ToTensor())
print(‘Number of samples: ‘, len(cap))
print(target)
Output yang dicapai adalah sebagai berikut -
Number of samples: 82783
Image Size: (3L, 427L, 640L)