SAS - Metodi di input

I metodi di input vengono utilizzati per leggere i dati grezzi. I dati grezzi possono provenire da una fonte esterna o da linee di dati in streaming. L'istruzione di input crea una variabile con il nome assegnato a ciascun campo. Quindi devi creare una variabile nell'istruzione di input. La stessa variabile verrà mostrata nell'output di SAS Dataset. Di seguito sono riportati diversi metodi di input disponibili in SAS.

  • Metodo di input elenco
  • Metodo di input denominato
  • Metodo di input della colonna
  • Metodo di input formattato

I dettagli di ciascun metodo di input sono descritti di seguito.

Metodo di input elenco

In questo metodo le variabili sono elencate con i tipi di dati. I dati grezzi vengono analizzati attentamente in modo che l'ordine delle variabili dichiarate corrisponda ai dati. Il delimitatore (solitamente spazio) dovrebbe essere uniforme tra qualsiasi coppia di colonne adiacenti. Eventuali dati mancanti causeranno problemi nell'output poiché il risultato sarà errato.

Esempio

Il codice e l'output seguenti mostrano l'uso del metodo di input list.

DATA TEMP;
INPUT   EMPID ENAME $ DEPT $ ;
DATALINES;
1 Rick  IT
2 Dan  OPS
3 Tusar  IT
4 Pranab  OPS
5 Rasmi  FIN
;
PROC PRINT DATA = TEMP;
RUN;

Eseguendo il codice bove otteniamo il seguente output.

Metodo di input denominato

In questo metodo le variabili sono elencate con i tipi di dati. I dati grezzi vengono modificati per avere nomi di variabili dichiarati davanti ai dati corrispondenti. Il delimitatore (solitamente spazio) dovrebbe essere uniforme tra qualsiasi coppia di colonne adiacenti.

Esempio

Il codice e l'output seguenti mostrano l'utilizzo del metodo di input denominato.

DATA TEMP;
INPUT   
EMPID= ENAME= $ DEPT= $ ;
DATALINES;
EMPID = 1 ENAME = Rick  DEPT = IT
EMPID = 2 ENAME = Dan  DEPT = OPS
EMPID = 3 ENAME = Tusar  DEPT = IT
EMPID = 4 ENAME = Pranab  DEPT = OPS
EMPID = 5 ENAME = Rasmi  DEPT = FIN
;
PROC PRINT DATA = TEMP;
RUN;

Eseguendo il codice bove otteniamo il seguente output.

Metodo di input della colonna

In questo metodo le variabili sono elencate con i tipi di dati e la larghezza delle colonne che specificano il valore della singola colonna di dati. Ad esempio, se il nome di un dipendente contiene un massimo di 9 caratteri e ciascun nome di dipendente inizia dalla decima colonna, la larghezza della colonna per la variabile del nome del dipendente sarà 10-19.

Esempio

Il codice seguente mostra l'uso del metodo di input della colonna.

DATA TEMP;
INPUT   EMPID 1-3 ENAME $ 4-12 DEPT $ 13-16;
DATALINES;
14 Rick     IT 
241Dan      OPS 
30 Sanvi    IT 
410Chanchal OPS 
52 Piyu     FIN 
;
PROC PRINT DATA = TEMP;
RUN;

Quando eseguiamo il codice sopra, produce il seguente risultato:

Metodo di input formattato

In questo metodo le variabili vengono lette da un punto di partenza fisso fino a quando non si incontra uno spazio. Poiché ogni variabile ha un punto di partenza fisso, il numero di colonne tra qualsiasi coppia di variabili diventa la larghezza della prima variabile. Il carattere "@n" viene utilizzato per specificare la posizione della colonna iniziale di una variabile come ennesima colonna.

Esempio

Il codice seguente mostra l'utilizzo di Formatted Input Method

DATA TEMP;
INPUT   @1 EMPID $ @4 ENAME $ @13 DEPT $ ;
DATALINES;
14 Rick     IT 
241 Dan      OPS 
30 Sanvi    IT 
410 Chanchal OPS 
52 Piyu     FIN 
;
PROC PRINT DATA = TEMP;
RUN;

Quando eseguiamo il codice sopra, produce il seguente risultato: