PyTorch-データセット
この章では、さらに焦点を当てます torchvision.datasetsとそのさまざまなタイプ。PyTorchには次のデータセットローダーが含まれています-
- MNIST
- COCO(キャプションと検出)
データセットには、以下に示す2種類の関数の大部分が含まれています-
Transform−画像を取り込んで、標準的なものの修正バージョンを返す関数。これらは、変換と一緒に構成できます。
Target_transform−ターゲットを取得して変換する関数。たとえば、キャプション文字列を取り込んで、ワールドインデックスのテンソルを返します。
MNIST
以下は、MNISTデータセットのサンプルコードです-
dset.MNIST(root, train = TRUE, transform = NONE,
target_transform = None, download = FALSE)
パラメータは次のとおりです-
root −処理されたデータが存在するデータセットのルートディレクトリ。
train − true =トレーニングセット、False =テストセット
download − true =インターネットからデータセットをダウンロードし、ルートに配置します。
COCO
これには、COCOAPIがインストールされている必要があります。次の例は、PyTorch −を使用したデータセットのCOCO実装を示すために使用されます。
import torchvision.dataset as dset
import torchvision.transforms as transforms
cap = dset.CocoCaptions(root = ‘ dir where images are’,
annFile = ’json annotation file’,
transform = transforms.ToTensor())
print(‘Number of samples: ‘, len(cap))
print(target)
達成される出力は次のとおりです-
Number of samples: 82783
Image Size: (3L, 427L, 640L)