SAS - Metodi di input
I metodi di input vengono utilizzati per leggere i dati grezzi. I dati grezzi possono provenire da una fonte esterna o da linee di dati in streaming. L'istruzione di input crea una variabile con il nome assegnato a ciascun campo. Quindi devi creare una variabile nell'istruzione di input. La stessa variabile verrà mostrata nell'output di SAS Dataset. Di seguito sono riportati diversi metodi di input disponibili in SAS.
- Metodo di input elenco
- Metodo di input denominato
- Metodo di input della colonna
- Metodo di input formattato
I dettagli di ciascun metodo di input sono descritti di seguito.
Metodo di input elenco
In questo metodo le variabili sono elencate con i tipi di dati. I dati grezzi vengono analizzati attentamente in modo che l'ordine delle variabili dichiarate corrisponda ai dati. Il delimitatore (solitamente spazio) dovrebbe essere uniforme tra qualsiasi coppia di colonne adiacenti. Eventuali dati mancanti causeranno problemi nell'output poiché il risultato sarà errato.
Esempio
Il codice e l'output seguenti mostrano l'uso del metodo di input list.
DATA TEMP;
INPUT EMPID ENAME $ DEPT $ ;
DATALINES;
1 Rick IT
2 Dan OPS
3 Tusar IT
4 Pranab OPS
5 Rasmi FIN
;
PROC PRINT DATA = TEMP;
RUN;
Eseguendo il codice bove otteniamo il seguente output.
Metodo di input denominato
In questo metodo le variabili sono elencate con i tipi di dati. I dati grezzi vengono modificati per avere nomi di variabili dichiarati davanti ai dati corrispondenti. Il delimitatore (solitamente spazio) dovrebbe essere uniforme tra qualsiasi coppia di colonne adiacenti.
Esempio
Il codice e l'output seguenti mostrano l'utilizzo del metodo di input denominato.
DATA TEMP;
INPUT
EMPID= ENAME= $ DEPT= $ ;
DATALINES;
EMPID = 1 ENAME = Rick DEPT = IT
EMPID = 2 ENAME = Dan DEPT = OPS
EMPID = 3 ENAME = Tusar DEPT = IT
EMPID = 4 ENAME = Pranab DEPT = OPS
EMPID = 5 ENAME = Rasmi DEPT = FIN
;
PROC PRINT DATA = TEMP;
RUN;
Eseguendo il codice bove otteniamo il seguente output.
Metodo di input della colonna
In questo metodo le variabili sono elencate con i tipi di dati e la larghezza delle colonne che specificano il valore della singola colonna di dati. Ad esempio, se il nome di un dipendente contiene un massimo di 9 caratteri e ciascun nome di dipendente inizia dalla decima colonna, la larghezza della colonna per la variabile del nome del dipendente sarà 10-19.
Esempio
Il codice seguente mostra l'uso del metodo di input della colonna.
DATA TEMP;
INPUT EMPID 1-3 ENAME $ 4-12 DEPT $ 13-16;
DATALINES;
14 Rick IT
241Dan OPS
30 Sanvi IT
410Chanchal OPS
52 Piyu FIN
;
PROC PRINT DATA = TEMP;
RUN;
Quando eseguiamo il codice sopra, produce il seguente risultato:
Metodo di input formattato
In questo metodo le variabili vengono lette da un punto di partenza fisso fino a quando non si incontra uno spazio. Poiché ogni variabile ha un punto di partenza fisso, il numero di colonne tra qualsiasi coppia di variabili diventa la larghezza della prima variabile. Il carattere "@n" viene utilizzato per specificare la posizione della colonna iniziale di una variabile come ennesima colonna.
Esempio
Il codice seguente mostra l'utilizzo di Formatted Input Method
DATA TEMP;
INPUT @1 EMPID $ @4 ENAME $ @13 DEPT $ ;
DATALINES;
14 Rick IT
241 Dan OPS
30 Sanvi IT
410 Chanchal OPS
52 Piyu FIN
;
PROC PRINT DATA = TEMP;
RUN;
Quando eseguiamo il codice sopra, produce il seguente risultato: