एसएएस - कॉनसैटनेट डेटा सेट

एकाधिक एसएएस डेटा सेट को एक एकल डेटा सेट का उपयोग करके देने के लिए समवर्ती किया जा सकता है SETबयान। समवर्ती डेटा सेट में टिप्पणियों की कुल संख्या मूल डेटा सेटों में टिप्पणियों की संख्या का योग है। अवलोकनों का क्रम क्रमबद्ध है। पहले डेटा सेट से सभी टिप्पणियों के बाद दूसरे डेटा सेट से सभी टिप्पणियों का पालन किया जाता है।

आदर्श रूप से सभी संयोजन डेटा सेट में समान चर होते हैं, लेकिन यदि उनके पास अलग-अलग संख्या में चर होते हैं, तो इसके परिणामस्वरूप सभी चर दिखाई देते हैं, छोटे डेटा सेट के लिए लापता मान।

वाक्य - विन्यास

एसएएस में SET स्टेटमेंट के लिए मूल सिंटैक्स है -

SET data-set 1 data-set 2 data-set 3.....;

निम्नलिखित मापदंडों का वर्णन है -

  • data-set1,data-set2 डेटासेट नाम एक के बाद एक लिखे गए हैं।

उदाहरण

एक संगठन के कर्मचारी डेटा पर विचार करें जो दो अलग-अलग डेटा सेटों में उपलब्ध है, एक आईटी विभाग के लिए और दूसरा गैर-आईटी विभाग के लिए। सभी कर्मचारियों का संपूर्ण विवरण प्राप्त करने के लिए, हम नीचे दिए गए सेट स्टेटमेंट का उपयोग करके दोनों डेटा सेट को बदलते हैं।

DATA ITDEPT; 
   INPUT empid name $ salary ; DATALINES; 1 Rick 623.3 3 Mike 611.5 6 Tusar 578.6 ; RUN; DATA NON_ITDEPT; INPUT empid name $ salary  ; 
DATALINES; 
2 Dan 515.2 
4 Ryan 729.1 
5 Gary 843.25 
7 Pranab 632.8 
8 Rasmi 722.5 
RUN; 
DATA All_Dept; 
   SET ITDEPT NON_ITDEPT; 
RUN; 
PROC PRINT DATA = All_Dept; 
RUN;

जब उपरोक्त कोड निष्पादित होता है, तो हमें निम्नलिखित आउटपुट मिलते हैं।

परिदृश्यों

जब हम संघनन के लिए डेटा सेट में कई भिन्नताएँ होती हैं, तो चर का परिणाम अलग-अलग हो सकता है, लेकिन समवर्ती डेटा सेट में टिप्पणियों की कुल संख्या हमेशा प्रत्येक डेटा सेट में टिप्पणियों का योग होती है। हम इस विविधता पर कई परिदृश्यों के नीचे विचार करेंगे।

विभिन्न प्रकार के चर

यदि मूल डेटा सेट में से एक में चर की संख्या अधिक है तो दूसरे में, फिर भी डेटा सेट संयुक्त हो जाते हैं लेकिन छोटे डेटा सेट में वे चर गायब हो जाते हैं।

उदाहरण

नीचे दिए गए उदाहरण में पहले डेटा सेट में DOJ नामक एक अतिरिक्त चर है। परिणाम में दूसरे डेटा सेट के लिए डीओजे का मान गायब हो जाएगा।

DATA ITDEPT; 
   INPUT empid name $ salary DOJ date9. ; DATALINES; 1 Rick 623.3 02APR2001 3 Mike 611.5 21OCT2000 6 Tusar 578.6 01MAR2009 ; RUN; DATA NON_ITDEPT; INPUT empid name $ salary  ; 
DATALINES; 
2 Dan 515.2 
4 Ryan 729.1 
5 Gary 843.25 
7 Pranab 632.8 
8 Rasmi 722.5 
RUN; 
DATA All_Dept; 
   SET ITDEPT NON_ITDEPT; 
RUN; 
PROC PRINT DATA = All_Dept; 
RUN;

जब उपरोक्त कोड निष्पादित होता है, तो हमें निम्नलिखित आउटपुट मिलते हैं।

विभिन्न चर नाम

इस परिदृश्य में डेटा सेट में समान संख्या में चर होते हैं, लेकिन एक चर नाम उनके बीच भिन्न होता है। उस स्थिति में, एक सामान्य संगति परिणाम सेट में सभी चर का उत्पादन करेगी और दो चर जो भिन्न होते हैं, के लिए लापता परिणाम दे रही है। यद्यपि हम मूल डेटा सेट में परिवर्तनशील नाम नहीं बदल सकते हैं, हम बनाए गए डेटा सेट में RENAME फ़ंक्शन को लागू कर सकते हैं। यह सामान्य परिणाम के रूप में एक ही परिणाम देगा, लेकिन मूल डेटा सेट में मौजूद दो अलग-अलग चर नामों के स्थान पर एक नए चर नाम के साथ निश्चित रूप से।

उदाहरण

नीचे दिए गए उदाहरण में डेटा सेट ITDEPT का चर नाम है ename जबकि डेटा सेट NON_ITDEPT चर नाम है empname.लेकिन ये दोनों चर एक ही प्रकार (वर्ण) का प्रतिनिधित्व करते हैं। हम लागू होते हैंRENAME नीचे दिखाए गए अनुसार SET स्टेटमेंट में कार्य करता है।

DATA ITDEPT; 
   INPUT empid ename $ salary ; DATALINES; 1 Rick 623.3 3 Mike 611.5 6 Tusar 578.6 ; RUN; DATA NON_ITDEPT; INPUT empid empname $ salary  ; 
DATALINES; 
2 Dan 515.2 
4 Ryan 729.1 
5 Gary 843.25 
7 Pranab 632.8 
8 Rasmi 722.5 
RUN; 
DATA All_Dept; 
   SET ITDEPT(RENAME =(ename = Employee) ) NON_ITDEPT(RENAME =(empname = Employee) ); 
RUN; 
PROC PRINT DATA = All_Dept; 
RUN;

जब उपरोक्त कोड निष्पादित होता है, तो हमें निम्नलिखित आउटपुट मिलते हैं।

विभिन्न चर लंबाई

यदि दो डेटा सेटों में परिवर्तनीय लंबाई भिन्न होती है तो समवर्ती डेटा सेट में ऐसे मान होंगे जिनमें कुछ डेटा को छोटी लंबाई के साथ चर के लिए छोटा किया जाता है। यह तब होता है जब पहले डेटा सेट की लंबाई कम होती है। इसे हल करने के लिए हम नीचे दिखाए गए अनुसार दोनों डेटा सेट के लिए अधिक लंबाई लागू करते हैं।

उदाहरण

नीचे दिए गए उदाहरण में चर enameपहले डेटा सेट में लंबाई 5 और दूसरे में 7 है। कंक्रीटिंग करते समय हम एनाम लंबाई को 7 पर सेट करने के लिए निर्धारित डेटा में LENGTH स्टेटमेंट लागू करते हैं।

DATA ITDEPT; 
   INPUT  empid 1-2 ename $ 3-7 salary 8-14 ; DATALINES; 1 Rick 623.3 3 Mike 611.5 6 Tusar 578.6 ; RUN; DATA NON_ITDEPT; INPUT empid 1-2 ename $ 3-9  salary 10-16 ; 
DATALINES; 
2 Dan    515.2 
4 Ryan   729.1 
5 Gary   843.25
7 Pranab 632.8 
8 Rasmi  722.5 
RUN; 
DATA All_Dept; 
   LENGTH ename $ 7   ;
   SET ITDEPT  NON_ITDEPT ; 
RUN; 
PROC PRINT DATA = All_Dept; 
RUN;

जब उपरोक्त कोड निष्पादित होता है, तो हमें निम्नलिखित आउटपुट मिलते हैं।