PyTorch - Наборы данных

В этой главе мы сосредоточимся на torchvision.datasetsи его различные виды. PyTorch включает следующие загрузчики наборов данных -

  • MNIST
  • COCO (субтитры и обнаружение)

Набор данных включает в себя большинство из двух типов функций, приведенных ниже -

  • Transform- функция, которая принимает изображение и возвращает измененную версию стандартного материала. Их можно составить вместе с преобразованиями.

  • Target_transform- функция, которая принимает цель и преобразует ее. Например, принимает строку заголовка и возвращает тензор мировых индексов.

MNIST

Ниже приведен пример кода для набора данных MNIST -

dset.MNIST(root, train = TRUE, transform = NONE, 
target_transform = None, download = FALSE)

Параметры следующие -

  • root - корневой каталог набора данных, в котором существуют обработанные данные.

  • train - True = обучающий набор, False = тестовый набор

  • download - True = загружает набор данных из Интернета и помещает его в корень.

COCO

Для этого необходимо установить COCO API. Следующий пример используется для демонстрации реализации набора данных COCO с использованием PyTorch.

import torchvision.dataset as dset
import torchvision.transforms as transforms
cap = dset.CocoCaptions(root = ‘ dir where images are’, 
annFile = ’json annotation file’,
transform = transforms.ToTensor())
print(‘Number of samples: ‘, len(cap))
print(target)

Достигнутый результат выглядит следующим образом -

Number of samples: 82783
Image Size: (3L, 427L, 640L)