SAS - metody wprowadzania danych
Do odczytu surowych danych używane są metody wejściowe. Surowe dane mogą pochodzić ze źródła zewnętrznego lub z linii danych strumieniowych. Instrukcja input tworzy zmienną o nazwie przypisywanej do każdego pola. Musisz więc utworzyć zmienną w instrukcji wejściowej. Ta sama zmienna zostanie wyświetlona w danych wyjściowych SAS Dataset. Poniżej znajdują się różne metody wprowadzania dostępne w SAS.
- Metoda wprowadzania listy
- Nazwana metoda wprowadzania
- Metoda wprowadzania kolumn
- Sformatowana metoda wprowadzania
Szczegóły każdej metody wprowadzania zostały opisane poniżej.
Metoda wprowadzania listy
W tej metodzie zmienne są wymienione z typami danych. Surowe dane są dokładnie analizowane, aby kolejność deklarowanych zmiennych była zgodna z danymi. Separator (zwykle spacja) powinien być jednolity między dowolną parą sąsiednich kolumn. Wszelkie brakujące dane spowodują problem z wynikiem, ponieważ wynik będzie nieprawidłowy.
Przykład
Poniższy kod i dane wyjściowe pokazują użycie metody wprowadzania listy.
DATA TEMP;
INPUT EMPID ENAME $ DEPT $ ;
DATALINES;
1 Rick IT
2 Dan OPS
3 Tusar IT
4 Pranab OPS
5 Rasmi FIN
;
PROC PRINT DATA = TEMP;
RUN;
Po uruchomieniu kodu bove otrzymujemy następujące dane wyjściowe.
Nazwana metoda wprowadzania
W tej metodzie zmienne są wymienione z typami danych. Surowe dane są modyfikowane w celu zadeklarowania nazw zmiennych przed pasującymi danymi. Separator (zwykle spacja) powinien być jednolity między dowolną parą sąsiednich kolumn.
Przykład
Poniższy kod i dane wyjściowe przedstawiają użycie nazwanej metody wprowadzania.
DATA TEMP;
INPUT
EMPID= ENAME= $ DEPT= $ ;
DATALINES;
EMPID = 1 ENAME = Rick DEPT = IT
EMPID = 2 ENAME = Dan DEPT = OPS
EMPID = 3 ENAME = Tusar DEPT = IT
EMPID = 4 ENAME = Pranab DEPT = OPS
EMPID = 5 ENAME = Rasmi DEPT = FIN
;
PROC PRINT DATA = TEMP;
RUN;
Po uruchomieniu kodu bove otrzymujemy następujące dane wyjściowe.
Metoda wprowadzania kolumn
W tej metodzie zmienne są wyświetlane z typami danych i szerokością kolumn, które określają wartość pojedynczej kolumny danych. Na przykład, jeśli imię i nazwisko pracownika zawiera maksymalnie 9 znaków, a nazwisko każdego pracownika zaczyna się od dziesiątej kolumny, wówczas szerokość kolumny dla zmiennej zawierającej nazwisko pracownika będzie wynosić 10-19.
Przykład
Poniższy kod ilustruje użycie metody wprowadzania kolumn.
DATA TEMP;
INPUT EMPID 1-3 ENAME $ 4-12 DEPT $ 13-16;
DATALINES;
14 Rick IT
241Dan OPS
30 Sanvi IT
410Chanchal OPS
52 Piyu FIN
;
PROC PRINT DATA = TEMP;
RUN;
Kiedy wykonujemy powyższy kod, otrzymujemy następujący wynik -
Sformatowana metoda wprowadzania
W tej metodzie zmienne są odczytywane od ustalonego punktu początkowego, aż do napotkania spacji. Ponieważ każda zmienna ma ustalony punkt początkowy, liczba kolumn między dowolną parą zmiennych staje się szerokością pierwszej zmiennej. Znak „@n” służy do określenia początkowej pozycji kolumny zmiennej jako n-tej kolumny.
Przykład
Poniższy kod przedstawia sposób użycia sformatowanej metody wprowadzania
DATA TEMP;
INPUT @1 EMPID $ @4 ENAME $ @13 DEPT $ ;
DATALINES;
14 Rick IT
241 Dan OPS
30 Sanvi IT
410 Chanchal OPS
52 Piyu FIN
;
PROC PRINT DATA = TEMP;
RUN;
Kiedy wykonujemy powyższy kod, otrzymujemy następujący wynik -