PyTorch - Kumpulan Data

Dalam bab ini, kami akan lebih fokus torchvision.datasetsdan berbagai jenisnya. PyTorch menyertakan pemuat set data berikut -

  • MNIST
  • COCO (Teks dan Deteksi)

Set data mencakup mayoritas dari dua jenis fungsi yang diberikan di bawah ini -

  • Transform- fungsi yang mengambil gambar dan mengembalikan versi modifikasi dari barang standar. Ini dapat disusun bersama dengan transformasi.

  • Target_transform- fungsi yang mengambil target dan mengubahnya. Misalnya, mengambil string teks dan mengembalikan tensor indeks dunia.

MNIST

Berikut ini adalah contoh kode untuk dataset MNIST -

dset.MNIST(root, train = TRUE, transform = NONE, 
target_transform = None, download = FALSE)

Parameternya adalah sebagai berikut -

  • root - direktori root dari dataset tempat data yang diproses ada.

  • train - True = Set latihan, False = Set tes

  • download - True = mendownload dataset dari internet dan meletakkannya di root.

KELAPA

Ini membutuhkan COCO API untuk diinstal. Contoh berikut digunakan untuk mendemonstrasikan implementasi COCO dari dataset menggunakan PyTorch -

import torchvision.dataset as dset
import torchvision.transforms as transforms
cap = dset.CocoCaptions(root = ‘ dir where images are’, 
annFile = ’json annotation file’,
transform = transforms.ToTensor())
print(‘Number of samples: ‘, len(cap))
print(target)

Output yang dicapai adalah sebagai berikut -

Number of samples: 82783
Image Size: (3L, 427L, 640L)