PyTorch - Memuat Data

PyTorch menyertakan paket yang disebut torchvision yang digunakan untuk memuat dan menyiapkan kumpulan data. Ini mencakup dua fungsi dasar yaitu Dataset dan DataLoader yang membantu dalam transformasi dan pemuatan dataset.

Himpunan data

Set data digunakan untuk membaca dan mengubah titik data dari set data yang diberikan. Sintaks dasar yang akan diterapkan disebutkan di bawah -

trainset = torchvision.datasets.CIFAR10(root = './data', train = True,
   download = True, transform = transform)

DataLoader digunakan untuk mengocok dan mengumpulkan data. Ini dapat digunakan untuk memuat data secara paralel dengan pekerja multiprosesing.

trainloader = torch.utils.data.DataLoader(trainset, batch_size = 4,
   shuffle = True, num_workers = 2)

Contoh: Memuat File CSV

Kami menggunakan paket Python Panda untuk memuat file csv. File asli memiliki format berikut: (nama gambar, 68 tengara - setiap tengara memiliki sumbu, koordinat y).

landmarks_frame = pd.read_csv('faces/face_landmarks.csv')

n = 65
img_name = landmarks_frame.iloc[n, 0]
landmarks = landmarks_frame.iloc[n, 1:].as_matrix()
landmarks = landmarks.astype('float').reshape(-1, 2)