PyTorch - Veri Kümeleri

Bu bölümde daha fazla odaklanacağız torchvision.datasetsve çeşitli türleri. PyTorch aşağıdaki veri kümesi yükleyicileri içerir -

  • MNIST
  • COCO (Başlık Oluşturma ve Algılama)

Veri kümesi, aşağıda verilen iki tür işlevin çoğunu içerir -

  • Transform- bir görüntüyü alan ve standart öğelerin değiştirilmiş bir sürümünü döndüren bir işlev. Bunlar dönüşümlerle birlikte oluşturulabilir.

  • Target_transform- hedefi alan ve dönüştüren bir işlev. Örneğin, başlık dizesini alır ve dünya indekslerinin bir tensörünü döndürür.

MNIST

MNIST veri kümesinin örnek kodu aşağıdadır -

dset.MNIST(root, train = TRUE, transform = NONE, 
target_transform = None, download = FALSE)

Parametreler aşağıdaki gibidir -

  • root - işlenmiş verilerin bulunduğu veri kümesinin kök dizini.

  • train - True = Eğitim seti, Yanlış = Test seti

  • download - True = veri setini internetten indirir ve köke yerleştirir.

COCO

Bu, COCO API'nin kurulmasını gerektirir. Aşağıdaki örnek, PyTorch kullanılarak veri kümesinin COCO uygulamasını göstermek için kullanılır -

import torchvision.dataset as dset
import torchvision.transforms as transforms
cap = dset.CocoCaptions(root = ‘ dir where images are’, 
annFile = ’json annotation file’,
transform = transforms.ToTensor())
print(‘Number of samples: ‘, len(cap))
print(target)

Elde edilen çıktı aşağıdaki gibidir -

Number of samples: 82783
Image Size: (3L, 427L, 640L)