PyTorch - डेटा लोड हो रहा है

PyTorch में एक टार्चविजन नामक पैकेज शामिल है जिसका उपयोग डेटासेट को लोड और तैयार करने के लिए किया जाता है। इसमें डेटासेट और डेटालॉडर जैसे दो बुनियादी कार्य शामिल हैं जो डेटासेट के रूपांतरण और लोडिंग में मदद करते हैं।

डेटासेट

डेटासेट को पढ़ने और दिए गए डेटासेट से डेटापॉइंट को बदलने के लिए उपयोग किया जाता है। लागू करने के लिए मूल वाक्यविन्यास नीचे उल्लिखित है -

trainset = torchvision.datasets.CIFAR10(root = './data', train = True,
   download = True, transform = transform)

DataLoader का उपयोग फेरबदल और बैच डेटा के लिए किया जाता है। इसका उपयोग मल्टीप्रोसेसिंग श्रमिकों के समानांतर डेटा को लोड करने के लिए किया जा सकता है।

trainloader = torch.utils.data.DataLoader(trainset, batch_size = 4,
   shuffle = True, num_workers = 2)

उदाहरण: लोड हो रहा है CSV फ़ाइल

हम csv फ़ाइल को लोड करने के लिए पायथन पैकेज पांडा का उपयोग करते हैं। मूल फ़ाइल में निम्न प्रारूप है: (छवि नाम, 68 स्थल - प्रत्येक मील का पत्थर कुल्हाड़ी, y निर्देशांक है)।

landmarks_frame = pd.read_csv('faces/face_landmarks.csv')

n = 65
img_name = landmarks_frame.iloc[n, 0]
landmarks = landmarks_frame.iloc[n, 1:].as_matrix()
landmarks = landmarks.astype('float').reshape(-1, 2)