SAS - metody wprowadzania danych

Do odczytu surowych danych używane są metody wejściowe. Surowe dane mogą pochodzić ze źródła zewnętrznego lub z linii danych strumieniowych. Instrukcja input tworzy zmienną o nazwie przypisywanej do każdego pola. Musisz więc utworzyć zmienną w instrukcji wejściowej. Ta sama zmienna zostanie wyświetlona w danych wyjściowych SAS Dataset. Poniżej znajdują się różne metody wprowadzania dostępne w SAS.

  • Metoda wprowadzania listy
  • Nazwana metoda wprowadzania
  • Metoda wprowadzania kolumn
  • Sformatowana metoda wprowadzania

Szczegóły każdej metody wprowadzania zostały opisane poniżej.

Metoda wprowadzania listy

W tej metodzie zmienne są wymienione z typami danych. Surowe dane są dokładnie analizowane, aby kolejność deklarowanych zmiennych była zgodna z danymi. Separator (zwykle spacja) powinien być jednolity między dowolną parą sąsiednich kolumn. Wszelkie brakujące dane spowodują problem z wynikiem, ponieważ wynik będzie nieprawidłowy.

Przykład

Poniższy kod i dane wyjściowe pokazują użycie metody wprowadzania listy.

DATA TEMP;
INPUT   EMPID ENAME $ DEPT $ ;
DATALINES;
1 Rick  IT
2 Dan  OPS
3 Tusar  IT
4 Pranab  OPS
5 Rasmi  FIN
;
PROC PRINT DATA = TEMP;
RUN;

Po uruchomieniu kodu bove otrzymujemy następujące dane wyjściowe.

Nazwana metoda wprowadzania

W tej metodzie zmienne są wymienione z typami danych. Surowe dane są modyfikowane w celu zadeklarowania nazw zmiennych przed pasującymi danymi. Separator (zwykle spacja) powinien być jednolity między dowolną parą sąsiednich kolumn.

Przykład

Poniższy kod i dane wyjściowe przedstawiają użycie nazwanej metody wprowadzania.

DATA TEMP;
INPUT   
EMPID= ENAME= $ DEPT= $ ;
DATALINES;
EMPID = 1 ENAME = Rick  DEPT = IT
EMPID = 2 ENAME = Dan  DEPT = OPS
EMPID = 3 ENAME = Tusar  DEPT = IT
EMPID = 4 ENAME = Pranab  DEPT = OPS
EMPID = 5 ENAME = Rasmi  DEPT = FIN
;
PROC PRINT DATA = TEMP;
RUN;

Po uruchomieniu kodu bove otrzymujemy następujące dane wyjściowe.

Metoda wprowadzania kolumn

W tej metodzie zmienne są wyświetlane z typami danych i szerokością kolumn, które określają wartość pojedynczej kolumny danych. Na przykład, jeśli imię i nazwisko pracownika zawiera maksymalnie 9 znaków, a nazwisko każdego pracownika zaczyna się od dziesiątej kolumny, wówczas szerokość kolumny dla zmiennej zawierającej nazwisko pracownika będzie wynosić 10-19.

Przykład

Poniższy kod ilustruje użycie metody wprowadzania kolumn.

DATA TEMP;
INPUT   EMPID 1-3 ENAME $ 4-12 DEPT $ 13-16;
DATALINES;
14 Rick     IT 
241Dan      OPS 
30 Sanvi    IT 
410Chanchal OPS 
52 Piyu     FIN 
;
PROC PRINT DATA = TEMP;
RUN;

Kiedy wykonujemy powyższy kod, otrzymujemy następujący wynik -

Sformatowana metoda wprowadzania

W tej metodzie zmienne są odczytywane od ustalonego punktu początkowego, aż do napotkania spacji. Ponieważ każda zmienna ma ustalony punkt początkowy, liczba kolumn między dowolną parą zmiennych staje się szerokością pierwszej zmiennej. Znak „@n” służy do określenia początkowej pozycji kolumny zmiennej jako n-tej kolumny.

Przykład

Poniższy kod przedstawia sposób użycia sformatowanej metody wprowadzania

DATA TEMP;
INPUT   @1 EMPID $ @4 ENAME $ @13 DEPT $ ;
DATALINES;
14 Rick     IT 
241 Dan      OPS 
30 Sanvi    IT 
410 Chanchal OPS 
52 Piyu     FIN 
;
PROC PRINT DATA = TEMP;
RUN;

Kiedy wykonujemy powyższy kod, otrzymujemy następujący wynik -