PyTorch-데이터 세트

이 장에서는 torchvision.datasets그리고 그 다양한 유형. PyTorch에는 다음과 같은 데이터 세트 로더가 포함됩니다.

  • MNIST
  • COCO (캡션 및 감지)

데이터 세트는 아래에 주어진 두 가지 유형의 함수 대부분을 포함합니다.

  • Transform− 이미지를 받아 표준 항목의 수정 된 버전을 반환하는 함수. 이들은 변형과 함께 구성 될 수 있습니다.

  • Target_transform− 대상을 가져 와서 변환하는 함수. 예를 들어, 캡션 문자열을 받아 세계 인덱스의 텐서를 반환합니다.

MNIST

다음은 MNIST 데이터 세트의 샘플 코드입니다-

dset.MNIST(root, train = TRUE, transform = NONE, 
target_transform = None, download = FALSE)

매개 변수는 다음과 같습니다-

  • root − 처리 된 데이터가 존재하는 데이터 세트의 루트 디렉토리.

  • train − True = 훈련 세트, False = 테스트 세트

  • download − True = 인터넷에서 데이터 세트를 다운로드하여 루트에 저장합니다.

머리

이를 위해서는 COCO API를 설치해야합니다. 다음 예제는 PyTorch를 사용하여 데이터 세트의 COCO 구현을 설명하는 데 사용됩니다-

import torchvision.dataset as dset
import torchvision.transforms as transforms
cap = dset.CocoCaptions(root = ‘ dir where images are’, 
annFile = ’json annotation file’,
transform = transforms.ToTensor())
print(‘Number of samples: ‘, len(cap))
print(target)

달성 된 출력은 다음과 같습니다.

Number of samples: 82783
Image Size: (3L, 427L, 640L)