Weka - फ़ाइल प्रारूप
WEKA डेटा के लिए बड़ी संख्या में फ़ाइल स्वरूपों का समर्थन करता है। यहां देखें पूरी लिस्ट -
- arff
- arff.gz
- bsi
- csv
- dat
- data
- json
- json.gz
- libsvm
- m
- names
- xrff
- xrff.gz
फ़ाइलों के प्रकार जो इसे समर्थन करते हैं, स्क्रीन के नीचे ड्रॉप-डाउन सूची बॉक्स में सूचीबद्ध हैं। यह नीचे दिए गए स्क्रीनशॉट में दिखाया गया है।
जैसा कि आप देखेंगे कि यह CSV और JSON सहित कई प्रारूपों का समर्थन करता है। डिफ़ॉल्ट फ़ाइल प्रकार Arff है।
आर्फ़ प्रारूप
एक Arff फ़ाइल में दो खंड होते हैं - हेडर और डेटा।
- हेडर विशेषता प्रकारों का वर्णन करता है।
- डेटा अनुभाग में डेटा की अल्पविराम से अलग की गई सूची होती है।
Arff प्रारूप के लिए एक उदाहरण के रूप में, द Weather WEKA नमूना डेटाबेस से भरी गई डेटा फ़ाइल को नीचे दिखाया गया है -
स्क्रीनशॉट से, आप निम्न बिंदुओं का अनुमान लगा सकते हैं -
@Relation tag डेटाबेस के नाम को परिभाषित करता है।
@Attribute टैग विशेषताओं को परिभाषित करता है।
@Data टैग उन डेटा पंक्तियों की सूची शुरू करता है जिनमें प्रत्येक अल्पविराम से अलग किए गए फ़ील्ड हैं।
यहाँ दिखाए गए दृष्टिकोण के मामले में विशेषताएँ नाममात्र मान ले सकती हैं -
@attribute outlook (sunny, overcast, rainy)
विशेषताएँ इस मामले में वास्तविक मान ले सकती हैं -
@attribute temperature real
आप यहां दिखाए गए अनुसार एक लक्ष्य या एक वर्ग चर खेल भी सेट कर सकते हैं -
@attribute play (yes, no)
लक्ष्य दो नाममात्र मानों को हाँ या नहीं मानता है।
अन्य प्रारूप
एक्सप्लोरर पहले बताए गए किसी भी प्रारूप में डेटा लोड कर सकता है। चूंकि WEKA में arff पसंदीदा प्रारूप है, आप किसी भी प्रारूप से डेटा लोड कर सकते हैं और बाद में उपयोग के लिए इसे arff प्रारूप में सहेज सकते हैं। डेटा को प्रीप्रोसेस करने के बाद, बस इसे आगे के विश्लेषण के लिए arff फॉर्मेट में सेव करें।
अब जब आप जान गए हैं कि WEKA में डेटा को कैसे लोड करना है, तो अगले अध्याय में, आप सीखेंगे कि डेटा को प्रीप्रोसेस कैसे करें।