SAS - pytania i odpowiedzi
Drodzy czytelnicy, te pytania do wywiadu SAS zostały opracowane specjalnie po to, aby zapoznać Was z naturą pytań, które mogą się pojawić podczas rozmowy kwalifikacyjnej na temat programowania w SAS. Z mojego doświadczenia wynika, że dobrzy ankieterzy nie planują zadawać żadnego konkretnego pytania podczas rozmowy kwalifikacyjnej, zwykle pytania zaczynają się od jakiejś podstawowej koncepcji tematu, a później są kontynuowane w oparciu o dalszą dyskusję i odpowiedź -
Wyrażenie DO WHILE jest obliczane na początku pętli DO. Jeśli wyrażenie jest fałszywe przy pierwszym obliczaniu, pętla DO nigdy nie jest wykonywana. Natomiast ZROBIĆ, aż wykonuje się co najmniej raz.
Znak, numeryczny
Używając opcji MAXDEC =
Różnica między tymi dwiema procedurami polega na tym, że PROC MEANS domyślnie tworzy raport. W przeciwieństwie do tego, aby utworzyć raport w PROC SUMMARY, należy uwzględnić opcję PRINT w instrukcji PROC SUMMARY.
Używając instrukcji TABLES.
Podwójny znak końcowy (@@) mówi SAS, zamiast przechodzić do nowego rekordu, przechowuje bieżący rekord wejściowy do wykonania następnej instrukcji INPUT.
Korzystanie z instrukcji DROP, KEEP i opcji zestawu danych.
Tworzy domyślne statystyki MIN, MAX, MEAN i STD DEV.
PDV to logiczny obszar w pamięci.PDV jest tworzony, a następnie tworzony jest bufor wejściowy. SAS buduje zbiór danych w obszarze pamięci PDV
Można go również używać do zapisywania danych wyjściowych bez tworzenia zestawu danych.
Używając PROC SORT z opcjami NODUPKEY i NODUP.
Opcja NODUPKEY usuwa zduplikowane obserwacje, w których wartość zmiennej wymienionej w instrukcji BY jest powtarzana, a opcja NODUP usuwa zduplikowane obserwacje, w których powtarzają się wartości wszystkich zmiennych (identyczne obserwacje)
Użyj słowa kluczowego DESCENDING w kodzie PROC SORT.
Tworząc zmienną o innej nazwie za pomocą funkcji PUT.
Tworząc zmienną o innej nazwie za pomocą funkcji INPUT.
SET łączy zbiory danych, gdzie jako MERGE pasuje do obserwacji zbiorów danych
SYMPUT umieszcza wartość ze zbioru danych w makrozmiennej, gdzie jako SYMGET pobiera wartość z makrozmiennej do zbioru danych.
Funkcja INTNX przesuwa datę, godzinę lub wartość daty i godziny o dany interwał i zwraca datę, godzinę lub wartość daty i godziny
Instrukcja RETAIN mówi SAS-owi, aby nie ustawiał zmiennych na brakujące podczas przechodzenia z bieżącej iteracji kroku DATA do następnego. Zamiast tego SAS zachowuje wartości.
% EVAL nie może wykonywać obliczeń arytmetycznych na operandach, które mają wartości zmiennoprzecinkowe. To wtedy pojawia się funkcja% SYSEVALF.
Wykonuje prostą i wielokrotną regresję, analizę wariancji (ANOVAL), analizę kowariancji, wielowymiarową analizę wariancji i analizę wariancji z powtarzanymi pomiarami.
SAS INFORMATS są używane do odczytywania lub wprowadzania danych z plików zewnętrznych, znanych jako pliki Flat Files ASCII, pliki tekstowe lub pliki sekwencyjne). Informat poinformuje SAS o sposobie wczytywania danych do zmiennych SAS.
Skanuj (argument, n, ograniczniki)
Scan, Substr, trim, Catx, Index, tranwrd, find, Sum.
Funkcja TRANWRD zastępuje lub usuwa wszystkie wystąpienia wzorca znaków w ciągu znaków.
Instrukcja INFILE służy do identyfikowania pliku zewnętrznego, podczas gdy instrukcja INPUT jest używana do opisywania zmiennych.
W przypadku użycia opcji MISSOVER w instrukcji INFILE instrukcja INPUT nie przeskakuje do następnego wiersza podczas odczytywania krótkiego wiersza. Zamiast tego MISSOVER ustawia zmienne na brakujące
Korzystanie z instrukcji FIRSTOBS = i OBS =.
Funkcja SUMA zwraca sumę nie brakujących argumentów, podczas gdy operator „+” zwraca brakującą wartość, jeśli brakuje któregokolwiek z argumentów.
Funkcja SUBSTR służy do wyodrębniania podłańcucha ze zmiennej znakowej.
Funkcja ceil zwraca najmniejszą liczbę całkowitą większą niż / równą argumentowi, podczas gdy floor zwraca największą liczbę całkowitą mniejszą / równą argumentowi.
SCAN wyodrębnia słowa z wartości oznaczonej ogranicznikami. SUBSTR wyodrębnia część wartości, podając określoną lokalizację. Najlepiej jest go używać, gdy znamy dokładną pozycję podłańcucha, aby wyodrębnić z wartości znakowej.
Uisng PROC SQL z COUNT (DISTINCT nazwa_zmiennej) w celu określenia liczby unikalnych wartości dla kolumny.
Istnieje kilka opcji systemowych, których można użyć do debugowania makr SAS: MPRINT, MLOGIC, SYMBOLGEN
Użyj PROC PRINTTO
Data Step MERGE nie tworzy produktu kartezjańskiego w przypadku relacji wiele-do-wielu. Natomiast Proc SQL wytwarza produkt kartezjański.
2 bajty i 1 bajt.
Procesy to podprogramy mające określony cel, a krok danych służy do wczytywania danych i manipulowania nimi.
Instrukcja PUT (sformatowana) w kroku danych.
gdzie oświadczenie
Funkcja wejściowa - Konwersja znaków na cyfry - Wejście (źródło, informat) i funkcja put - Konwersja liczb na znaki - wstawianie (źródło, format)
Nie, musi to być znakowy typ danych.
Liczba obserwacji jest ograniczona jedynie zdolnością komputera do ich obsługi i przechowywania.
Używając opcji MAXDEC =
Przetwarzanie BY wymaga, aby Twoje dane były już sortowane lub indeksowane w kolejności według zmiennych BY.
Używając instrukcji TABLES.
Pięć
proc oznacza, że poda opisowe statystyki. Domyślnie da to wyjście w oknie wyjściowym. Ale podsumowanie proc nie będzie domyślnie dawało wyjścia. Musimy podać opcję drukuj, wtedy tylko ona da wynik.
Użyj klauzuli Debug po znaku „/” w instrukcji data.
Używanie słowa kluczowego MISSOVER.