PyTorch-データセット

この章では、さらに焦点を当てます torchvision.datasetsとそのさまざまなタイプ。PyTorchには次のデータセットローダーが含まれています-

  • MNIST
  • COCO(キャプションと検出)

データセットには、以下に示す2種類の関数の大部分が含まれています-

  • Transform−画像を取り込んで、標準的なものの修正バージョンを返す関数。これらは、変換と一緒に構成できます。

  • Target_transform−ターゲットを取得して変換する関数。たとえば、キャプション文字列を取り込んで、ワールドインデックスのテンソルを返します。

MNIST

以下は、MNISTデータセットのサンプルコードです-

dset.MNIST(root, train = TRUE, transform = NONE, 
target_transform = None, download = FALSE)

パラメータは次のとおりです-

  • root −処理されたデータが存在するデータセットのルートディレクトリ。

  • train − true =トレーニングセット、False =テストセット

  • download − true =インターネットからデータセットをダウンロードし、ルートに配置します。

COCO

これには、COCOAPIがインストールされている必要があります。次の例は、PyTorch −を使用したデータセットのCOCO実装を示すために使用されます。

import torchvision.dataset as dset
import torchvision.transforms as transforms
cap = dset.CocoCaptions(root = ‘ dir where images are’, 
annFile = ’json annotation file’,
transform = transforms.ToTensor())
print(‘Number of samples: ‘, len(cap))
print(target)

達成される出力は次のとおりです-

Number of samples: 82783
Image Size: (3L, 427L, 640L)