SAS - कच्चे डेटा पढ़ें
एसएएस विभिन्न स्रोतों से डेटा पढ़ सकता है जिसमें कई फ़ाइल प्रारूप शामिल हैं। एसएएस वातावरण में उपयोग किए जाने वाले फ़ाइल स्वरूपों की चर्चा नीचे की गई है।
- ASCII (पाठ) डेटा सेट
- डिलीट डाटा
- एक्सेल डेटा
- पदानुक्रमित डेटा
ASCII (पाठ) डेटा सेट पढ़ना
ये वो फाइलें हैं जिनमें टेक्स्ट फॉर्मेट पर डेटा होता है। डेटा को आमतौर पर एक स्थान द्वारा सीमांकित किया जाता है, लेकिन विभिन्न प्रकार के सीमांकक भी हो सकते हैं जिन्हें एसएएस संभाल सकता है। आइए एक ASCII फ़ाइल पर विचार करें जिसमें कर्मचारी डेटा है। हम इस फाइल को पढ़ते हैंInfile विवरण SAS में उपलब्ध है।
उदाहरण
नीचे दिए गए उदाहरण में हम नाम की डेटा फ़ाइल पढ़ते हैं emp_data.txt स्थानीय वातावरण से।
data TEMP;
infile
'/folders/myfolders/sasuser.v94/TutorialsPoint/emp_data.txt';
input empID empName $ Salary Dept $ DOJ date9. ;
format DOJ date9.;
run;
PROC PRINT DATA = TEMP;
RUN;
जब उपरोक्त कोड निष्पादित होता है, तो हमें निम्नलिखित आउटपुट मिलते हैं।
डेटा डिलीट करना पढ़ना
ये वे डेटा फाइलें हैं जिनमें स्तंभ मानों को अल्पविराम वर्ण जैसे अल्पविराम या पाइपलाइन आदि द्वारा अलग किया जाता है। इस स्थिति में हम इसका उपयोग करते हैं आदि। dlm में विकल्प infile बयान।
उदाहरण
नीचे दिए गए उदाहरण में हमने emp.csv नाम की डेटा फ़ाइल को स्थानीय वातावरण से पढ़ा।
data TEMP;
infile
'/folders/myfolders/sasuser.v94/TutorialsPoint/emp.csv' dlm=",";
input empID empName $ Salary Dept $ DOJ date9. ;
format DOJ date9.;
run;
PROC PRINT DATA = TEMP;
RUN;
जब उपरोक्त कोड निष्पादित होता है, तो हमें निम्नलिखित आउटपुट मिलते हैं।
एक्सेल डेटा पढ़ना
एसएएस सीधे आयात सुविधा का उपयोग कर एक एक्सेल फाइल पढ़ सकता है। जैसा कि अध्याय एसएएस डेटा सेट में देखा गया है, यह एमएस एक्सेल सहित विभिन्न प्रकार की फ़ाइल प्रकारों को संभाल सकता है। फ़ाइल emp.xls मानकर SAS वातावरण में स्थानीय रूप से उपलब्ध है।
उदाहरण
FILENAME REFFILE
"/folders/myfolders/TutorialsPoint/emp.xls"
TERMSTR = CR;
PROC IMPORT DATAFILE = REFFILE
DBMS = XLS
OUT = WORK.IMPORT;
GETNAMES = YES;
RUN;
PROC PRINT DATA = WORK.IMPORT RUN;
उपरोक्त कोड एक्सेल फ़ाइल से डेटा को पढ़ता है और दो फ़ाइल प्रकारों के समान आउटपुट देता है।
पदानुक्रमित फ़ाइलें पढ़ना
इन फ़ाइलों में डेटा पदानुक्रमित प्रारूप में मौजूद है। दिए गए अवलोकन के लिए एक हैडर रिकॉर्ड होता है जिसके नीचे कई विवरण रिकॉर्ड होते हैं। विवरण रिकॉर्ड की संख्या एक अवलोकन से दूसरे में भिन्न हो सकती है। नीचे एक पदानुक्रमित फ़ाइल का चित्रण है।
नीचे फ़ाइल में प्रत्येक विभाग के तहत प्रत्येक कर्मचारी का विवरण सूचीबद्ध है। पहला रिकॉर्ड हेडर रिकॉर्ड है जो विभाग का उल्लेख करता है और अगले रिकॉर्ड डीटीएलएस के साथ शुरू होने वाले कुछ रिकॉर्ड विवरण रिकॉर्ड हैं।
DEPT:IT
DTLS:1:Rick:623
DTLS:3:Mike:611
DTLS:6:Tusar:578
DEPT:OPS
DTLS:7:Pranab:632
DTLS:2:Dan:452
DEPT:HR
DTLS:4:Ryan:487
DTLS:2:Siyona:452
उदाहरण
पदानुक्रमित फ़ाइल को पढ़ने के लिए हम नीचे दिए गए कोड का उपयोग करते हैं जिसमें हम एक IF क्लाज के साथ हेडर रिकॉर्ड की पहचान करते हैं और विवरण रिकॉर्ड को संसाधित करने के लिए एक लूप का उपयोग करते हैं।
data employees(drop = Type);
length Type $ 3 Department
empID $ 3 empName $ 10 Empsal 3 ;
retain Department;
infile
'/folders/myfolders/TutorialsPoint/empdtls.txt' dlm = ':';
input Type $ @;
if Type = 'DEP' then
input Department $;
else do;
input empID empName $ Empsal ;
output;
end;
run;
PROC PRINT DATA = employees;
RUN;
जब उपरोक्त कोड निष्पादित होता है, तो हमें निम्नलिखित आउटपुट मिलते हैं।