PyTorch - กำลังโหลดข้อมูล

PyTorch มีแพ็คเกจที่เรียกว่า torchvision ซึ่งใช้ในการโหลดและเตรียมชุดข้อมูล ประกอบด้วยฟังก์ชันพื้นฐานสองอย่าง ได้แก่ Dataset และ DataLoader ซึ่งช่วยในการแปลงและโหลดชุดข้อมูล

ชุดข้อมูล

ชุดข้อมูลใช้เพื่ออ่านและแปลงจุดข้อมูลจากชุดข้อมูลที่กำหนด ไวยากรณ์พื้นฐานที่จะนำไปใช้มีดังต่อไปนี้ -

trainset = torchvision.datasets.CIFAR10(root = './data', train = True,
   download = True, transform = transform)

DataLoader ใช้เพื่อสับเปลี่ยนและจัดกลุ่มข้อมูล สามารถใช้ในการโหลดข้อมูลควบคู่ไปกับการทำงานแบบหลายกระบวนการ

trainloader = torch.utils.data.DataLoader(trainset, batch_size = 4,
   shuffle = True, num_workers = 2)

ตัวอย่าง: การโหลดไฟล์ CSV

เราใช้ Python package Panda เพื่อโหลดไฟล์ csv ไฟล์ต้นฉบับมีรูปแบบต่อไปนี้: (ชื่อภาพจุดสังเกต 68 จุด - จุดสังเกตแต่ละจุดมีขวานพิกัด y)

landmarks_frame = pd.read_csv('faces/face_landmarks.csv')

n = 65
img_name = landmarks_frame.iloc[n, 0]
landmarks = landmarks_frame.iloc[n, 1:].as_matrix()
landmarks = landmarks.astype('float').reshape(-1, 2)