SAS - कच्चे डेटा पढ़ें

एसएएस विभिन्न स्रोतों से डेटा पढ़ सकता है जिसमें कई फ़ाइल प्रारूप शामिल हैं। एसएएस वातावरण में उपयोग किए जाने वाले फ़ाइल स्वरूपों की चर्चा नीचे की गई है।

  • ASCII (पाठ) डेटा सेट
  • डिलीट डाटा
  • एक्सेल डेटा
  • पदानुक्रमित डेटा

ASCII (पाठ) डेटा सेट पढ़ना

ये वो फाइलें हैं जिनमें टेक्स्ट फॉर्मेट पर डेटा होता है। डेटा को आमतौर पर एक स्थान द्वारा सीमांकित किया जाता है, लेकिन विभिन्न प्रकार के सीमांकक भी हो सकते हैं जिन्हें एसएएस संभाल सकता है। आइए एक ASCII फ़ाइल पर विचार करें जिसमें कर्मचारी डेटा है। हम इस फाइल को पढ़ते हैंInfile विवरण SAS में उपलब्ध है।

उदाहरण

नीचे दिए गए उदाहरण में हम नाम की डेटा फ़ाइल पढ़ते हैं emp_data.txt स्थानीय वातावरण से।

data TEMP; 
   infile 
   '/folders/myfolders/sasuser.v94/TutorialsPoint/emp_data.txt'; 
   input empID empName $ Salary Dept $ DOJ date9. ;
   format DOJ date9.;
   run;
   PROC PRINT DATA = TEMP;
RUN;

जब उपरोक्त कोड निष्पादित होता है, तो हमें निम्नलिखित आउटपुट मिलते हैं।

डेटा डिलीट करना पढ़ना

ये वे डेटा फाइलें हैं जिनमें स्तंभ मानों को अल्पविराम वर्ण जैसे अल्पविराम या पाइपलाइन आदि द्वारा अलग किया जाता है। इस स्थिति में हम इसका उपयोग करते हैं आदि। dlm में विकल्प infile बयान।

उदाहरण

नीचे दिए गए उदाहरण में हमने emp.csv नाम की डेटा फ़ाइल को स्थानीय वातावरण से पढ़ा।

data TEMP; 
   infile 
   '/folders/myfolders/sasuser.v94/TutorialsPoint/emp.csv' dlm=","; 
   input empID empName $ Salary Dept $ DOJ date9. ;
   format DOJ date9.;
   run;
   PROC PRINT DATA = TEMP;
RUN;

जब उपरोक्त कोड निष्पादित होता है, तो हमें निम्नलिखित आउटपुट मिलते हैं।

एक्सेल डेटा पढ़ना

एसएएस सीधे आयात सुविधा का उपयोग कर एक एक्सेल फाइल पढ़ सकता है। जैसा कि अध्याय एसएएस डेटा सेट में देखा गया है, यह एमएस एक्सेल सहित विभिन्न प्रकार की फ़ाइल प्रकारों को संभाल सकता है। फ़ाइल emp.xls मानकर SAS वातावरण में स्थानीय रूप से उपलब्ध है।

उदाहरण

FILENAME REFFILE
"/folders/myfolders/TutorialsPoint/emp.xls"
TERMSTR = CR;

PROC IMPORT DATAFILE = REFFILE
DBMS = XLS
OUT = WORK.IMPORT;
GETNAMES = YES;
RUN;
PROC PRINT DATA = WORK.IMPORT RUN;

उपरोक्त कोड एक्सेल फ़ाइल से डेटा को पढ़ता है और दो फ़ाइल प्रकारों के समान आउटपुट देता है।

पदानुक्रमित फ़ाइलें पढ़ना

इन फ़ाइलों में डेटा पदानुक्रमित प्रारूप में मौजूद है। दिए गए अवलोकन के लिए एक हैडर रिकॉर्ड होता है जिसके नीचे कई विवरण रिकॉर्ड होते हैं। विवरण रिकॉर्ड की संख्या एक अवलोकन से दूसरे में भिन्न हो सकती है। नीचे एक पदानुक्रमित फ़ाइल का चित्रण है।

नीचे फ़ाइल में प्रत्येक विभाग के तहत प्रत्येक कर्मचारी का विवरण सूचीबद्ध है। पहला रिकॉर्ड हेडर रिकॉर्ड है जो विभाग का उल्लेख करता है और अगले रिकॉर्ड डीटीएलएस के साथ शुरू होने वाले कुछ रिकॉर्ड विवरण रिकॉर्ड हैं।

DEPT:IT 
DTLS:1:Rick:623 
DTLS:3:Mike:611 
DTLS:6:Tusar:578 
DEPT:OPS
DTLS:7:Pranab:632
DTLS:2:Dan:452
DEPT:HR
DTLS:4:Ryan:487
DTLS:2:Siyona:452

उदाहरण

पदानुक्रमित फ़ाइल को पढ़ने के लिए हम नीचे दिए गए कोड का उपयोग करते हैं जिसमें हम एक IF क्लाज के साथ हेडर रिकॉर्ड की पहचान करते हैं और विवरण रिकॉर्ड को संसाधित करने के लिए एक लूप का उपयोग करते हैं।

data employees(drop = Type);
   length Type $ 3  Department
      empID $ 3 empName $ 10 Empsal 3 ;
   retain Department;
   infile 
   '/folders/myfolders/TutorialsPoint/empdtls.txt' dlm = ':';
   input Type $ @;
   if Type = 'DEP' then 
      input Department $;
   else do;
      input empID  empName $ Empsal ;
      output;
   end;
run;

   PROC PRINT DATA = employees;
RUN;

जब उपरोक्त कोड निष्पादित होता है, तो हमें निम्नलिखित आउटपुट मिलते हैं।