PyTorch - zestawy danych

W tym rozdziale skupimy się bardziej na torchvision.datasetsi jego różne typy. PyTorch zawiera następujące programy ładujące zestawy danych -

  • MNIST
  • COCO (napisy i wykrywanie)

Zbiór danych zawiera większość dwóch typów funkcji podanych poniżej -

  • Transform- funkcja, która pobiera obraz i zwraca zmodyfikowaną wersję standardowej rzeczy. Można je komponować razem z transformacjami.

  • Target_transform- funkcja, która przyjmuje cel i przekształca go. Na przykład pobiera napis podpisu i zwraca tensor światowych indeksów.

MNIST

Poniżej znajduje się przykładowy kod zestawu danych MNIST -

dset.MNIST(root, train = TRUE, transform = NONE, 
target_transform = None, download = FALSE)

Parametry są następujące -

  • root - katalog główny zbioru danych, w którym istnieją przetworzone dane.

  • train - True = zestaw treningowy, False = zestaw testowy

  • download - True = pobiera zestaw danych z Internetu i umieszcza go w katalogu głównym.

KOKOSOWIEC

Wymaga to zainstalowania API COCO. Poniższy przykład służy do zademonstrowania implementacji zestawu danych COCO przy użyciu PyTorch -

import torchvision.dataset as dset
import torchvision.transforms as transforms
cap = dset.CocoCaptions(root = ‘ dir where images are’, 
annFile = ’json annotation file’,
transform = transforms.ToTensor())
print(‘Number of samples: ‘, len(cap))
print(target)

Osiągnięty wynik jest następujący -

Number of samples: 82783
Image Size: (3L, 427L, 640L)