Teradata-퀵 가이드
Teradata 란 무엇입니까?
Teradata는 인기있는 관계형 데이터베이스 관리 시스템 중 하나입니다. 주로 대규모 데이터웨어 하우징 애플리케이션을 구축하는 데 적합합니다. Teradata는 병렬화 개념으로이를 달성합니다. Teradata라는 회사에서 개발했습니다.
Teradata의 역사
다음은 주요 이정표를 나열한 Teradata의 역사에 대한 간략한 요약입니다.
1979 − Teradata가 통합되었습니다.
1984 − 최초의 데이터베이스 컴퓨터 DBC / 1012 출시.
1986− Fortune 지에서는 Teradata를 '올해의 제품'으로 선정 했습니다.
1999 − 130 테라 바이트의 Teradata를 사용하는 세계에서 가장 큰 데이터베이스.
2002 − Teradata V2R5는 Partition Primary Index 및 압축으로 출시되었습니다.
2006 − Teradata Master Data Management 솔루션 출시.
2008 − Teradata 13.0은 Active Data Warehousing과 함께 출시되었습니다.
2011 − Teradata Aster를 인수하고 Advanced Analytics Space에 들어갑니다.
2012 − Teradata 14.0 도입.
2014 − Teradata 15.0이 도입되었습니다.
Teradata의 기능
다음은 Teradata의 일부 기능입니다.
Unlimited Parallelism− Teradata 데이터베이스 시스템은 MPP (Massively Parallel Processing) 아키텍처를 기반으로합니다. MPP 아키텍처는 전체 시스템에서 워크로드를 균등하게 분할합니다. Teradata 시스템은 작업을 프로세스간에 분할하고 병렬로 실행하여 작업이 신속하게 완료되도록합니다.
Shared Nothing Architecture− Teradata의 아키텍처는 Shared Nothing Architecture라고합니다. Teradata 노드, 액세스 모듈 프로세서 (AMP) 및 AMP와 관련된 디스크는 독립적으로 작동합니다. 그들은 다른 사람들과 공유되지 않습니다.
Linear Scalability− Teradata 시스템은 확장 성이 뛰어납니다. 최대 2048 개 노드까지 확장 할 수 있습니다. 예를 들어 AMP 수를 두 배로 늘려 시스템 용량을 두 배로 늘릴 수 있습니다.
Connectivity − Teradata는 메인 프레임 또는 네트워크 연결 시스템과 같은 채널 연결 시스템에 연결할 수 있습니다.
Mature Optimizer− Teradata 옵티마이 저는 시장에서 성숙한 옵티 마이저 중 하나입니다. 처음부터 병렬로 설계되었습니다. 릴리스마다 개선되었습니다.
SQL− Teradata는 테이블에 저장된 데이터와 상호 작용하기 위해 산업 표준 SQL을 지원합니다. 이 외에도 자체 확장 기능을 제공합니다.
Robust Utilities − Teradata는 FastLoad, MultiLoad, FastExport 및 TPT와 같은 Teradata 시스템에서 데이터를 가져 오거나 내보낼 수있는 강력한 유틸리티를 제공합니다.
Automatic Distribution − Teradata는 수동 개입없이 자동으로 데이터를 디스크에 균등하게 배포합니다.
Teradata는 완벽하게 작동하는 Teradata 가상 머신 인 VMWARE 용 Teradata Express를 제공합니다. 최대 1TB의 스토리지를 제공합니다. Teradata는 40GB 및 1TB 버전의 VMware를 모두 제공합니다.
전제 조건
VM이 64 비트이므로 CPU가 64 비트를 지원해야합니다.
Windows 용 설치 단계
Step 1 − 링크에서 필요한 VM 버전을 다운로드합니다. https://downloads.teradata.com/download/database/teradata-express-for-vmware-player
Step 2 − 파일 압축을 풀고 대상 폴더를 지정합니다.
Step 3 − 링크에서 VMWare Workstation 플레이어를 다운로드합니다. https://my.vmware.com/web/vmware/downloads. Windows와 Linux 모두에서 사용할 수 있습니다. Windows 용 VMWARE 워크 스테이션 플레이어를 다운로드하십시오.
Step 4 − 다운로드가 완료되면 소프트웨어를 설치하십시오.
Step 5 − 설치가 완료되면 VMWARE 클라이언트를 실행합니다.
Step 6− '가상 머신 열기'를 선택합니다. 추출 된 Teradata VMWare 폴더를 탐색하고 확장자가 .vmdk 인 파일을 선택하십시오.
Step 7− Teradata VMWare가 VMWare 클라이언트에 추가됩니다. 추가 된 Teradata VMware를 선택하고 'Play Virtual Machine'을 클릭합니다.
Step 8 − 소프트웨어 업데이트에 대한 팝업이 나타나면 '나중에 알림'을 선택할 수 있습니다.
Step 9 − 루트로 사용자 이름을 입력하고 탭을 누르고 루트로 암호를 입력 한 다음 다시 Enter를 누릅니다.
Step 10− 바탕 화면에 다음 화면이 나타나면 'root 's home'을 더블 클릭합니다. 그런 다음 'Genome 's Terminal'을 두 번 클릭합니다. 그러면 셸이 열립니다.
Step 11− 다음 셸에서 /etc/init.d/tpa start 명령을 입력합니다. Teradata 서버가 시작됩니다.
BTEQ 시작
BTEQ 유틸리티는 SQL 쿼리를 대화식으로 제출하는 데 사용됩니다. 다음은 BTEQ 유틸리티를 시작하는 단계입니다.
Step 1 − / sbin / ifconfig 명령을 입력하고 VMWare의 IP 주소를 기록해 둡니다.
Step 2− bteq 명령을 실행합니다. 로그온 프롬프트에서 명령을 입력하십시오.
로그온 <ipaddress> / dbc, dbc; 암호 프롬프트에서 암호를 dbc로 입력하십시오.
BTEQ를 사용하여 Teradata 시스템에 로그인하고 모든 SQL 쿼리를 실행할 수 있습니다.
Teradata 아키텍처는 MPP (Massively Parallel Processing) 아키텍처를 기반으로합니다. Teradata의 주요 구성 요소는 파싱 엔진, BYNET 및 액세스 모듈 프로세서 (AMP)입니다. 다음 다이어그램은 Teradata 노드의 상위 수준 아키텍처를 보여줍니다.
Teradata의 구성 요소
Teradata의 주요 구성 요소는 다음과 같습니다.
Node− Teradata System의 기본 단위입니다. Teradata 시스템의 각 개별 서버를 노드라고합니다. 노드는 자체 운영 체제, CPU, 메모리, Teradata RDBMS 소프트웨어의 자체 사본 및 디스크 공간으로 구성됩니다. 캐비닛은 하나 이상의 노드로 구성됩니다.
Parsing Engine− Parsing Engine은 클라이언트로부터 쿼리를 수신하고 효율적인 실행 계획을 준비합니다. 구문 분석 엔진의 책임은 다음과 같습니다.
클라이언트에서 SQL 쿼리 받기
구문 오류에 대한 SQL 쿼리 검사 구문 분석
사용자에게 SQL 쿼리에 사용 된 개체에 대해 필요한 권한이 있는지 확인
SQL에 사용 된 객체가 실제로 존재하는지 확인
SQL 쿼리를 실행하기위한 실행 계획을 준비하고이를 BYNET에 전달합니다.
AMP에서 결과를 받아 클라이언트로 전송
Message Passing Layer− BYNET이라고하는 Message Passing Layer는 Teradata 시스템의 네트워킹 계층입니다. PE와 AMP 사이 및 노드 사이의 통신을 허용합니다. Parsing Engine에서 실행 계획을 받아 AMP로 보냅니다. 마찬가지로 AMP에서 결과를 수신하고 Parsing Engine으로 보냅니다.
Access Module Processor (AMP)− 가상 프로세서 (vproc)라고하는 AMP는 실제로 데이터를 저장하고 검색하는 것입니다. AMP는 Parsing Engine에서 데이터 및 실행 계획을 수신하고 모든 데이터 유형 변환, 집계, 필터링, 정렬을 수행하고 관련 디스크에 데이터를 저장합니다. 테이블의 레코드는 시스템의 AMP간에 균등하게 배포됩니다. 각 AMP는 데이터가 저장되는 디스크 세트와 연결됩니다. 해당 AMP 만 디스크에서 데이터를 읽고 쓸 수 있습니다.
스토리지 아키텍처
클라이언트가 레코드를 삽입하기 위해 쿼리를 실행하면 구문 분석 엔진이 레코드를 BYNET으로 보냅니다. BYNET은 레코드를 검색하고 행을 대상 AMP로 보냅니다. AMP는 이러한 레코드를 디스크에 저장합니다. 다음 다이어그램은 Teradata의 스토리지 아키텍처를 보여줍니다.
검색 아키텍처
클라이언트가 레코드를 검색하기 위해 쿼리를 실행하면 구문 분석 엔진이 BYNET에 요청을 보냅니다. BYNET은 적절한 AMP에 검색 요청을 보냅니다. 그런 다음 AMP는 디스크를 병렬로 검색하고 필요한 레코드를 식별하여 BYNET으로 보냅니다. 그런 다음 BYNET은 레코드를 Parsing Engine으로 보내며 차례로 클라이언트에 보냅니다. 다음은 Teradata의 검색 아키텍처입니다.
관계형 데이터베이스 관리 시스템 (RDBMS)은 데이터베이스와 상호 작용하는 데 도움이되는 DBMS 소프트웨어입니다. SQL (Structured Query Language)을 사용하여 테이블에 저장된 데이터와 상호 작용합니다.
데이터 베이스
데이터베이스는 논리적으로 관련된 데이터의 모음입니다. 다른 목적으로 많은 사용자가 액세스합니다. 예를 들어, 판매 데이터베이스에는 여러 테이블에 저장된 판매에 대한 전체 정보가 포함되어 있습니다.
테이블
테이블은 데이터가 저장되는 RDBMS의 기본 단위입니다. 테이블은 행과 열의 모음입니다. 다음은 직원 테이블의 예입니다.
직원 아니요 | 이름 | 성 | 생일 |
---|---|---|---|
101 | 마이크 | 제임스 | 1980 년 1 월 5 일 |
104 | 알렉스 | 스튜어트 | 1984 년 11 월 6 일 |
102 | 로버트 | 윌리엄스 | 1983 년 3 월 5 일 |
105 | 로버트 | 제임스 | 1984 년 12 월 1 일 |
103 | 베드로 | 폴 | 1983 년 4 월 1 일 |
기둥
열에는 유사한 데이터가 포함됩니다. 예를 들어, Employee 테이블의 BirthDate 열에는 모든 직원에 대한 birth_date 정보가 포함됩니다.
생일 |
---|
1980 년 1 월 5 일 |
1984 년 11 월 6 일 |
1983 년 3 월 5 일 |
1984 년 12 월 1 일 |
1983 년 4 월 1 일 |
열
행은 모든 열의 한 인스턴스입니다. 예를 들어, 직원 테이블에서 한 행에는 단일 직원에 대한 정보가 포함됩니다.
직원 아니요 | 이름 | 성 | 생일 |
---|---|---|---|
101 | 마이크 | 제임스 | 1980 년 1 월 5 일 |
기본 키
기본 키는 테이블의 행을 고유하게 식별하는 데 사용됩니다. 기본 키 열에는 중복 값이 허용되지 않으며 NULL 값을 허용 할 수 없습니다. 테이블의 필수 필드입니다.
외래 키
외래 키는 테이블 간의 관계를 구축하는 데 사용됩니다. 하위 테이블의 외래 키는 상위 테이블의 기본 키로 정의됩니다. 테이블에는 둘 이상의 외래 키가있을 수 있습니다. 중복 값과 null 값을 허용 할 수 있습니다. 외래 키는 테이블에서 선택 사항입니다.
테이블의 각 열은 데이터 유형과 연관됩니다. 데이터 유형은 열에 저장 될 값의 종류를 지정합니다. Teradata는 여러 데이터 유형을 지원합니다. 다음은 자주 사용되는 데이터 유형 중 일부입니다.
데이터 유형 | 길이 (바이트) | 값의 범위 |
---|---|---|
BYTEINT | 1 | -128에서 +127 |
SMALLINT | 2 | -32768에서 +32767 |
정수 | 4 | -2,147,483,648에서 +2147,483,647 |
BIGINT | 8 | -9,233,372,036,854,775,80 8 ~ +9,233,372,036,854,775,8 07 |
소수 | 1-16 | |
숫자 | 1-16 | |
흙손 | 8 | IEEE 형식 |
숯 | 고정 형식 | 1-64,000 |
VARCHAR | 변하기 쉬운 | 1-64,000 |
데이트 | 4 | YYYYYMMDD |
시각 | 6 또는 8 | HHMMSS.nnnnnn or HHMMSS.nnnnnn + HHMM |
타임 스탬프 | 10 또는 12 | YYMMDDHHMMSS.nnnnnn or YYMMDDHHMMSS.nnnnnn + HHMM |
관계형 모델의 테이블은 데이터 모음으로 정의됩니다. 행과 열로 표시됩니다.
테이블 유형
유형 Teradata는 다양한 유형의 테이블을 지원합니다.
Permanent Table − 이것은 기본 테이블이며 사용자가 삽입 한 데이터를 포함하며 데이터를 영구적으로 저장합니다.
Volatile Table− 휘발성 테이블에 삽입 된 데이터는 사용자 세션 중에 만 유지됩니다. 세션이 끝나면 테이블과 데이터가 삭제됩니다. 이러한 테이블은 주로 데이터 변환 중에 중간 데이터를 보관하는 데 사용됩니다.
Global Temporary Table − Global Temporary 테이블의 정의는 영구적이지만 사용자 세션 종료시 테이블의 데이터가 삭제됩니다.
Derived Table− 파생 된 테이블은 쿼리의 중간 결과를 보유합니다. 수명은 생성, 사용 및 삭제되는 쿼리 내에 있습니다.
세트 대 다중 세트
Teradata는 중복 레코드가 처리되는 방식에 따라 테이블을 SET 또는 MULTISET 테이블로 분류합니다. SET 테이블로 정의 된 테이블은 중복 레코드를 저장하지 않는 반면 MULTISET 테이블은 중복 레코드를 저장할 수 있습니다.
Sr. 아니요 | 테이블 명령 및 설명 |
---|---|
1 | 테이블 생성 CREATE TABLE 명령은 Teradata에서 테이블을 만드는 데 사용됩니다. |
2 | 테이블 변경 ALTER TABLE 명령은 기존 테이블에서 열을 추가하거나 삭제하는 데 사용됩니다. |
삼 | 드롭 테이블 DROP TABLE 명령은 테이블을 삭제하는 데 사용됩니다. |
이 장에서는 Teradata 테이블에 저장된 데이터를 조작하는 데 사용되는 SQL 명령을 소개합니다.
기록 삽입
INSERT INTO 문은 테이블에 레코드를 삽입하는 데 사용됩니다.
통사론
다음은 INSERT INTO의 일반 구문입니다.
INSERT INTO <tablename>
(column1, column2, column3,…)
VALUES
(value1, value2, value3 …);
예
다음 예에서는 직원 테이블에 레코드를 삽입합니다.
INSERT INTO Employee (
EmployeeNo,
FirstName,
LastName,
BirthDate,
JoinedDate,
DepartmentNo
)
VALUES (
101,
'Mike',
'James',
'1980-01-05',
'2005-03-27',
01
);
위 쿼리가 삽입되면 SELECT 문을 사용하여 테이블에서 레코드를 볼 수 있습니다.
직원 아니요 | 이름 | 성 | JoinedDate | 부서 번호 | 생일 |
---|---|---|---|---|---|
101 | 마이크 | 제임스 | 2005 년 3 월 27 일 | 1 | 1980 년 1 월 5 일 |
다른 테이블에서 삽입
INSERT SELECT 문은 다른 테이블의 레코드를 삽입하는 데 사용됩니다.
통사론
다음은 INSERT INTO의 일반 구문입니다.
INSERT INTO <tablename>
(column1, column2, column3,…)
SELECT
column1, column2, column3…
FROM
<source table>;
예
다음 예에서는 직원 테이블에 레코드를 삽입합니다. 다음 삽입 쿼리를 실행하기 전에 직원 테이블과 동일한 열 정의를 사용하여 Employee_Bkup이라는 테이블을 만듭니다.
INSERT INTO Employee_Bkup (
EmployeeNo,
FirstName,
LastName,
BirthDate,
JoinedDate,
DepartmentNo
)
SELECT
EmployeeNo,
FirstName,
LastName,
BirthDate,
JoinedDate,
DepartmentNo
FROM
Employee;
위 쿼리를 실행하면 employee 테이블의 모든 레코드를 employee_bkup 테이블에 삽입합니다.
규칙
VALUES 목록에 지정된 열 수는 INSERT INTO 절에 지정된 열과 일치해야합니다.
NOT NULL 열에는 값이 필수입니다.
값을 지정하지 않으면 널 입력 가능 필드에 널이 삽입됩니다.
VALUES 절에 지정된 열의 데이터 유형은 INSERT 절에있는 열의 데이터 유형과 호환되어야합니다.
기록 업데이트
UPDATE 문은 테이블에서 레코드를 업데이트하는 데 사용됩니다.
통사론
다음은 UPDATE의 일반 구문입니다.
UPDATE <tablename>
SET <columnnamme> = <new value>
[WHERE condition];
예
다음 예제는 직원 101의 직원 부서를 03으로 업데이트합니다.
UPDATE Employee
SET DepartmentNo = 03
WHERE EmployeeNo = 101;
다음 출력에서 DepartmentNo가 EmployeeNo 101에 대해 1에서 3으로 업데이트되었음을 알 수 있습니다.
SELECT Employeeno, DepartmentNo FROM Employee;
*** Query completed. One row found. 2 columns returned.
*** Total elapsed time was 1 second.
EmployeeNo DepartmentNo
----------- -------------
101 3
규칙
하나 이상의 테이블 값을 업데이트 할 수 있습니다.
WHERE 조건이 지정되지 않으면 테이블의 모든 행이 영향을받습니다.
다른 테이블의 값으로 테이블을 업데이트 할 수 있습니다.
기록 삭제
DELETE FROM 문은 테이블에서 레코드를 업데이트하는 데 사용됩니다.
통사론
다음은 DELETE FROM의 일반 구문입니다.
DELETE FROM <tablename>
[WHERE condition];
예
다음 예제는 employee 테이블에서 employee 101을 삭제합니다.
DELETE FROM Employee
WHERE EmployeeNo = 101;
다음 출력에서 직원 101이 테이블에서 삭제되었음을 알 수 있습니다.
SELECT EmployeeNo FROM Employee;
*** Query completed. No rows found.
*** Total elapsed time was 1 second.
규칙
테이블의 하나 이상의 레코드를 업데이트 할 수 있습니다.
WHERE 조건을 지정하지 않으면 테이블의 모든 행이 삭제됩니다.
다른 테이블의 값으로 테이블을 업데이트 할 수 있습니다.
SELECT 문은 테이블에서 레코드를 검색하는 데 사용됩니다.
통사론
다음은 SELECT 문의 기본 구문입니다.
SELECT
column 1, column 2, .....
FROM
tablename;
예
다음 직원 테이블을 고려하십시오.
직원 아니요 | 이름 | 성 | JoinedDate | 부서 번호 | 생일 |
---|---|---|---|---|---|
101 | 마이크 | 제임스 | 2005 년 3 월 27 일 | 1 | 1980 년 1 월 5 일 |
102 | 로버트 | 윌리엄스 | 2007 년 4 월 25 일 | 2 | 1983 년 3 월 5 일 |
103 | 베드로 | 폴 | 2007 년 3 월 21 일 | 2 | 1983 년 4 월 1 일 |
104 | 알렉스 | 스튜어트 | 2008 년 2 월 1 일 | 2 | 1984 년 11 월 6 일 |
105 | 로버트 | 제임스 | 2008 년 1/4 월 | 삼 | 1984 년 12 월 1 일 |
다음은 SELECT 문의 예입니다.
SELECT EmployeeNo,FirstName,LastName
FROM Employee;
이 쿼리가 실행되면 직원 테이블에서 EmployeeNo, FirstName 및 LastName 열을 가져옵니다.
EmployeeNo FirstName LastName
----------- ------------------------------ ---------------------------
101 Mike James
104 Alex Stuart
102 Robert Williams
105 Robert James
103 Peter Paul
테이블에서 모든 열을 가져 오려면 모든 열을 나열하는 대신 다음 명령을 사용할 수 있습니다.
SELECT * FROM Employee;
위의 쿼리는 직원 테이블에서 모든 레코드를 가져옵니다.
WHERE 절
WHERE 절은 SELECT 문에서 반환 된 레코드를 필터링하는 데 사용됩니다. 조건은 WHERE 절과 연관됩니다. WHERE 절의 조건을 만족하는 레코드 만 반환됩니다.
통사론
다음은 WHERE 절이있는 SELECT 문의 구문입니다.
SELECT * FROM tablename
WHERE[condition];
예
다음 쿼리는 EmployeeNo가 101 인 레코드를 가져옵니다.
SELECT * FROM Employee
WHERE EmployeeNo = 101;
이 쿼리가 실행되면 다음 레코드를 반환합니다.
EmployeeNo FirstName LastName
----------- ------------------------------ -----------------------------
101 Mike James
주문
SELECT 문이 실행될 때 반환 된 행은 특정 순서가 아닙니다. ORDER BY 절은 모든 열에서 오름차순 / 내림차순으로 레코드를 정렬하는 데 사용됩니다.
통사론
다음은 ORDER BY 절이있는 SELECT 문의 구문입니다.
SELECT * FROM tablename
ORDER BY column 1, column 2..;
예
다음 쿼리는 직원 테이블에서 레코드를 가져와 FirstName별로 결과를 정렬합니다.
SELECT * FROM Employee
ORDER BY FirstName;
위 쿼리가 실행되면 다음과 같은 출력이 생성됩니다.
EmployeeNo FirstName LastName
----------- ------------------------------ -----------------------------
104 Alex Stuart
101 Mike James
103 Peter Paul
102 Robert Williams
105 Robert James
그룹화
GROUP BY 절은 SELECT 문과 함께 사용되며 유사한 레코드를 그룹으로 정렬합니다.
통사론
다음은 GROUP BY 절이있는 SELECT 문의 구문입니다.
SELECT column 1, column2 …. FROM tablename
GROUP BY column 1, column 2..;
예
다음 예에서는 DepartmentNo 열별로 레코드를 그룹화하고 각 부서의 총 개수를 식별합니다.
SELECT DepartmentNo,Count(*) FROM
Employee
GROUP BY DepartmentNo;
위 쿼리가 실행되면 다음과 같은 출력이 생성됩니다.
DepartmentNo Count(*)
------------ -----------
3 1
1 1
2 3
Teradata는 다음과 같은 논리 및 조건 연산자를 지원합니다. 이러한 연산자는 비교를 수행하고 여러 조건을 결합하는 데 사용됩니다.
통사론 | 의미 |
---|---|
> | 보다 큰 |
< | 이하 |
>= | 크거나 같음 |
<= | 작거나 같음 |
= | 동일 |
BETWEEN | 범위 내에있는 값 |
IN | <표현식>의 값 |
NOT IN | <표현식>에없는 값 |
IS NULL | 값이 NULL 인 경우 |
IS NOT NULL | 값이 NULL이 아닌 경우 |
AND | 여러 조건을 결합합니다. 모든 조건이 충족되는 경우에만 true로 평가됩니다. |
OR | 여러 조건을 결합합니다. 조건 중 하나가 충족되는 경우에만 true로 평가됩니다. |
NOT | 조건의 의미를 반대로합니다. |
중에서
BETWEEN 명령은 값이 값 범위 내에 있는지 확인하는 데 사용됩니다.
예
다음 직원 테이블을 고려하십시오.
직원 아니요 | 이름 | 성 | JoinedDate | 부서 번호 | 생일 |
---|---|---|---|---|---|
101 | 마이크 | 제임스 | 2005 년 3 월 27 일 | 1 | 1980 년 1 월 5 일 |
102 | 로버트 | 윌리엄스 | 2007 년 4 월 25 일 | 2 | 1983 년 3 월 5 일 |
103 | 베드로 | 폴 | 2007 년 3 월 21 일 | 2 | 1983 년 4 월 1 일 |
104 | 알렉스 | 스튜어트 | 2008 년 2 월 1 일 | 2 | 1984 년 11 월 6 일 |
105 | 로버트 | 제임스 | 2008 년 1/4 월 | 삼 | 1984 년 12 월 1 일 |
다음 예제는 직원 번호가 101,102에서 103 사이 인 레코드를 가져옵니다.
SELECT EmployeeNo, FirstName FROM
Employee
WHERE EmployeeNo BETWEEN 101 AND 103;
위의 쿼리를 실행하면 101에서 103 사이의 직원 번호가있는 직원 레코드를 반환합니다.
*** Query completed. 3 rows found. 2 columns returned.
*** Total elapsed time was 1 second.
EmployeeNo FirstName
----------- ------------------------------
101 Mike
102 Robert
103 Peter
에
IN 명령은 주어진 값 목록에 대해 값을 확인하는 데 사용됩니다.
예
다음 예에서는 직원 번호가 101, 102 및 103 인 레코드를 가져옵니다.
SELECT EmployeeNo, FirstName FROM
Employee
WHERE EmployeeNo in (101,102,103);
위 쿼리는 다음 레코드를 반환합니다.
*** Query completed. 3 rows found. 2 columns returned.
*** Total elapsed time was 1 second.
EmployeeNo FirstName
----------- ------------------------------
101 Mike
102 Robert
103 Peter
안
NOT IN 명령은 IN 명령의 결과를 반대로합니다. 주어진 목록과 일치하지 않는 값을 가진 레코드를 가져옵니다.
예
다음 예는 직원 번호가 101, 102 및 103이 아닌 레코드를 가져옵니다.
SELECT * FROM
Employee
WHERE EmployeeNo not in (101,102,103);
위 쿼리는 다음 레코드를 반환합니다.
*** Query completed. 2 rows found. 6 columns returned.
*** Total elapsed time was 1 second.
EmployeeNo FirstName LastName
----------- ------------------------------ -----------------------------
104 Alex Stuart
105 Robert James
SET 연산자는 여러 SELECT 문의 결과를 결합합니다. 조인과 비슷하게 보일 수 있지만 조인은 여러 테이블의 열을 결합하는 반면 SET 연산자는 여러 행의 행을 결합합니다.
규칙
각 SELECT 문의 열 수는 동일해야합니다.
각 SELECT의 데이터 유형은 호환 가능해야합니다.
ORDER BY는 최종 SELECT 문에만 포함되어야합니다.
노동 조합
UNION 문은 여러 SELECT 문의 결과를 결합하는 데 사용됩니다. 중복을 무시합니다.
통사론
다음은 UNION 문의 기본 구문입니다.
SELECT col1, col2, col3…
FROM
<table 1>
[WHERE condition]
UNION
SELECT col1, col2, col3…
FROM
<table 2>
[WHERE condition];
예
다음 직원 테이블 및 급여 테이블을 고려하십시오.
직원 아니요 | 이름 | 성 | JoinedDate | 부서 번호 | 생일 |
---|---|---|---|---|---|
101 | 마이크 | 제임스 | 2005 년 3 월 27 일 | 1 | 1980 년 1 월 5 일 |
102 | 로버트 | 윌리엄스 | 2007 년 4 월 25 일 | 2 | 1983 년 3 월 5 일 |
103 | 베드로 | 폴 | 2007 년 3 월 21 일 | 2 | 1983 년 4 월 1 일 |
104 | 알렉스 | 스튜어트 | 2008 년 2 월 1 일 | 2 | 1984 년 11 월 6 일 |
105 | 로버트 | 제임스 | 2008 년 1/4 월 | 삼 | 1984 년 12 월 1 일 |
직원 아니요 | 심한 | 공제 | 순이익 |
---|---|---|---|
101 | 40,000 | 4,000 | 36,000 |
102 | 80,000 | 6,000 | 74,000 |
103 | 90,000 | 7,000 | 83,000 |
104 | 75,000 | 5,000 | 70,000 |
다음 UNION 쿼리는 Employee 및 Salary 테이블의 EmployeeNo 값을 결합합니다.
SELECT EmployeeNo
FROM
Employee
UNION
SELECT EmployeeNo
FROM
Salary;
쿼리가 실행되면 다음과 같은 출력이 생성됩니다.
EmployeeNo
-----------
101
102
103
104
105
UNION ALL
UNION ALL 문은 UNION과 유사하며 중복 행을 포함하여 여러 테이블의 결과를 결합합니다.
통사론
다음은 UNION ALL 문의 기본 구문입니다.
SELECT col1, col2, col3…
FROM
<table 1>
[WHERE condition]
UNION ALL
SELECT col1, col2, col3…
FROM
<table 2>
[WHERE condition];
예
다음은 UNION ALL 문의 예입니다.
SELECT EmployeeNo
FROM
Employee
UNION ALL
SELECT EmployeeNo
FROM
Salary;
위 쿼리가 실행되면 다음과 같은 출력이 생성됩니다. 중복도 반환하는 것을 볼 수 있습니다.
EmployeeNo
-----------
101
104
102
105
103
101
104
102
103
교차
INTERSECT 명령은 또한 여러 SELECT 문의 결과를 결합하는 데 사용됩니다. 두 번째 SELECT 문에서 일치하는 항목이있는 첫 번째 SELECT 문에서 행을 반환합니다. 즉, 두 SELECT 문에 모두 존재하는 행을 반환합니다.
통사론
다음은 INTERSECT 문의 기본 구문입니다.
SELECT col1, col2, col3…
FROM
<table 1>
[WHERE condition]
INTERSECT
SELECT col1, col2, col3…
FROM
<table 2>
[WHERE condition];
예
다음은 INTERSECT 문의 예입니다. 두 테이블에 모두 존재하는 EmployeeNo 값을 반환합니다.
SELECT EmployeeNo
FROM
Employee
INTERSECT
SELECT EmployeeNo
FROM
Salary;
위 쿼리를 실행하면 다음과 같은 레코드를 반환합니다. EmployeeNo 105는 SALARY 테이블에 존재하지 않으므로 제외됩니다.
EmployeeNo
-----------
101
104
102
103
빼기 / 제외
MINUS / EXCEPT 명령은 여러 테이블의 행을 결합하고 첫 번째 SELECT에는 있지만 두 번째 SELECT에는없는 행을 반환합니다. 둘 다 동일한 결과를 반환합니다.
통사론
다음은 MINUS 문의 기본 구문입니다.
SELECT col1, col2, col3…
FROM
<table 1>
[WHERE condition]
MINUS
SELECT col1, col2, col3…
FROM
<table 2>
[WHERE condition];
예
다음은 MINUS 문의 예입니다.
SELECT EmployeeNo
FROM
Employee
MINUS
SELECT EmployeeNo
FROM
Salary;
이 쿼리가 실행되면 다음 레코드를 반환합니다.
EmployeeNo
-----------
105
Teradata는 문자열을 조작하는 여러 기능을 제공합니다. 이러한 기능은 ANSI 표준과 호환됩니다.
Sr. 아니요 | 문자열 기능 및 설명 |
---|---|
1 | || 문자열을 함께 연결 |
2 | SUBSTR 문자열의 일부를 추출합니다 (Teradata 확장). |
삼 | SUBSTRING 문자열의 일부 추출 (ANSI 표준) |
4 | INDEX 문자열에서 문자의 위치를 찾습니다 (Teradata 확장). |
5 | POSITION 문자열에서 문자의 위치를 찾습니다 (ANSI 표준). |
6 | TRIM 문자열에서 공백을 제거합니다. |
7 | UPPER 문자열을 대문자로 변환 |
8 | LOWER 문자열을 소문자로 변환 |
예
다음 표는 결과와 함께 일부 문자열 함수를 나열합니다.
문자열 기능 | 결과 |
---|---|
SELECT SUBSTRING ( 'warehouse'from 1 FOR 4) | 제품 |
SUBSTR ( 'warehouse', 1,4) 선택 | 제품 |
'데이터'선택 || ''|| '창고' | 데이터웨어 하우스 |
SELECT UPPER ( 'data') | 데이터 |
LOWER ( 'DATA') 선택 | 데이터 |
이 장에서는 Teradata에서 사용할 수있는 날짜 / 시간 함수에 대해 설명합니다.
날짜 저장
날짜는 다음 공식을 사용하여 내부적으로 정수로 저장됩니다.
((YEAR - 1900) * 10000) + (MONTH * 100) + DAY
다음 쿼리를 사용하여 날짜가 저장되는 방식을 확인할 수 있습니다.
SELECT CAST(CURRENT_DATE AS INTEGER);
날짜는 정수로 저장되므로 몇 가지 산술 연산을 수행 할 수 있습니다. Teradata는 이러한 작업을 수행하는 기능을 제공합니다.
추출물
EXTRACT 함수는 DATE 값에서 일, 월 및 연도의 일부를 추출합니다. 이 함수는 TIME / TIMESTAMP 값에서시, 분, 초를 추출하는데도 사용됩니다.
예
다음 예는 날짜 및 타임 스탬프 값에서 년, 월, 날짜,시, 분 및 초 값을 추출하는 방법을 보여줍니다.
SELECT EXTRACT(YEAR FROM CURRENT_DATE);
EXTRACT(YEAR FROM Date)
-----------------------
2016
SELECT EXTRACT(MONTH FROM CURRENT_DATE);
EXTRACT(MONTH FROM Date)
------------------------
1
SELECT EXTRACT(DAY FROM CURRENT_DATE);
EXTRACT(DAY FROM Date)
------------------------
1
SELECT EXTRACT(HOUR FROM CURRENT_TIMESTAMP);
EXTRACT(HOUR FROM Current TimeStamp(6))
---------------------------------------
4
SELECT EXTRACT(MINUTE FROM CURRENT_TIMESTAMP);
EXTRACT(MINUTE FROM Current TimeStamp(6))
-----------------------------------------
54
SELECT EXTRACT(SECOND FROM CURRENT_TIMESTAMP);
EXTRACT(SECOND FROM Current TimeStamp(6))
-----------------------------------------
27.140000
간격
Teradata는 DATE 및 TIME 값에 대한 산술 연산을 수행하는 INTERVAL 함수를 제공합니다. INTERVAL 함수에는 두 가지 유형이 있습니다.
년-월 간격
- YEAR
- 매년
- MONTH
주간 간격
- DAY
- 하루-시간
- DAY TO MINUTE
- DAY TO SECOND
- HOUR
- HOUR TO MINUTE
- HOUR TO SECOND
- MINUTE
- MINUTE TO SECOND
- SECOND
예
다음 예제는 현재 날짜에 3 년을 더합니다.
SELECT CURRENT_DATE, CURRENT_DATE + INTERVAL '03' YEAR;
Date (Date+ 3)
-------- ---------
16/01/01 19/01/01
다음 예에서는 현재 날짜에 3 년 1 개월을 추가합니다.
SELECT CURRENT_DATE, CURRENT_DATE + INTERVAL '03-01' YEAR TO MONTH;
Date (Date+ 3-01)
-------- ------------
16/01/01 19/02/01
다음 예제는 현재 타임 스탬프에 01 일, 05 시간, 10 분을 추가합니다.
SELECT CURRENT_TIMESTAMP,CURRENT_TIMESTAMP + INTERVAL '01 05:10' DAY TO MINUTE;
Current TimeStamp(6) (Current TimeStamp(6)+ 1 05:10)
-------------------------------- --------------------------------
2016-01-01 04:57:26.360000+00:00 2016-01-02 10:07:26.360000+00:00
Teradata는 SQL에 대한 확장 인 내장 함수를 제공합니다. 다음은 일반적인 내장 함수입니다.
함수 | 결과 |
---|---|
날짜 선택; | 날짜 -------- 16/01/01 |
CURRENT_DATE 선택; | 날짜 -------- 16/01/01 |
시간 선택; | 시간 -------- 04:50:29 |
SELECT CURRENT_TIME; | 시간 -------- 04:50:29 |
SELECT CURRENT_TIMESTAMP; | 현재 TimeStamp (6) -------------------------------- 2016-01-01 04 : 51 : 06.990000 + 00 : 00 |
데이터베이스 선택; | 데이터베이스 ------------------------------ TDUSER |
Teradata는 공통 집계 함수를 지원합니다. SELECT 문과 함께 사용할 수 있습니다.
COUNT − 행 수
SUM − 지정된 열의 값을 더합니다.
MAX − 지정된 열의 큰 값을 반환합니다.
MIN − 지정된 열의 최소값을 반환합니다.
AVG − 지정된 열의 평균값을 반환합니다.
예
다음 급여 표를 고려하십시오.
직원 아니요 | 심한 | 공제 | 순이익 |
---|---|---|---|
101 | 40,000 | 4,000 | 36,000 |
104 | 75,000 | 5,000 | 70,000 |
102 | 80,000 | 6,000 | 74,000 |
105 | 70,000 | 4,000 | 66,000 |
103 | 90,000 | 7,000 | 83,000 |
카운트
다음 예에서는 Salary 테이블의 레코드 수를 계산합니다.
SELECT count(*) from Salary;
Count(*)
-----------
5
MAX
다음 예는 최대 직원 순 급여 값을 반환합니다.
SELECT max(NetPay) from Salary;
Maximum(NetPay)
---------------------
83000
분
다음 예는 Salary 테이블에서 최소 직원 순 급여 값을 반환합니다.
SELECT min(NetPay) from Salary;
Minimum(NetPay)
---------------------
36000
평균
다음 예는 테이블에서 직원의 평균 순 급여 값을 반환합니다.
SELECT avg(NetPay) from Salary;
Average(NetPay)
---------------------
65800
합집합
다음 예에서는 Salary 테이블의 모든 레코드에서 직원 순 급여의 합계를 계산합니다.
SELECT sum(NetPay) from Salary;
Sum(NetPay)
-----------------
329000
이 장에서는 Teradata의 CASE 및 COALESCE 기능에 대해 설명합니다.
CASE 표현식
CASE 표현식은 조건 또는 WHEN 절에 대해 각 행을 평가하고 첫 번째 일치의 결과를 반환합니다. 일치하는 항목이 없으면의 ELSE 부분의 결과가 반환됩니다.
통사론
다음은 CASE 표현식의 구문입니다.
CASE <expression>
WHEN <expression> THEN result-1
WHEN <expression> THEN result-2
ELSE
Result-n
END
예
다음 Employee 테이블을 고려하십시오.
직원 아니요 | 이름 | 성 | JoinedDate | 부서 번호 | 생일 |
---|---|---|---|---|---|
101 | 마이크 | 제임스 | 2005 년 3 월 27 일 | 1 | 1980 년 1 월 5 일 |
102 | 로버트 | 윌리엄스 | 2007 년 4 월 25 일 | 2 | 1983 년 3 월 5 일 |
103 | 베드로 | 폴 | 2007 년 3 월 21 일 | 2 | 1983 년 4 월 1 일 |
104 | 알렉스 | 스튜어트 | 2008 년 2 월 1 일 | 2 | 1984 년 11 월 6 일 |
105 | 로버트 | 제임스 | 2008 년 1/4 월 | 삼 | 1984 년 12 월 1 일 |
다음 예제는 DepartmentNo 열을 평가하고 부서 번호가 1 인 경우 값 1을 반환합니다. 부서 번호가 3이면 2를 반환합니다. 그렇지 않으면 값을 잘못된 부서로 반환합니다.
SELECT
EmployeeNo,
CASE DepartmentNo
WHEN 1 THEN 'Admin'
WHEN 2 THEN 'IT'
ELSE 'Invalid Dept'
END AS Department
FROM Employee;
위 쿼리가 실행되면 다음과 같은 출력이 생성됩니다.
*** Query completed. 5 rows found. 2 columns returned.
*** Total elapsed time was 1 second.
EmployeeNo Department
----------- ------------
101 Admin
104 IT
102 IT
105 Invalid Dept
103 IT
위의 CASE 표현식은 위와 동일한 결과를 생성하는 다음 형식으로도 작성할 수 있습니다.
SELECT
EmployeeNo,
CASE
WHEN DepartmentNo = 1 THEN 'Admin'
WHEN DepartmentNo = 2 THEN 'IT'
ELSE 'Invalid Dept'
END AS Department
FROM Employee;
COALESCE
COALESCE는 표현식의 널이 아닌 첫 번째 값을 리턴하는 명령문입니다. 표현식의 모든 인수가 NULL로 평가되면 NULL을 반환합니다. 다음은 구문입니다.
통사론
COALESCE(expression 1, expression 2, ....)
예
SELECT
EmployeeNo,
COALESCE(dept_no, 'Department not found')
FROM
employee;
NULLIF
NULLIF 문은 인수가 같으면 NULL을 반환합니다.
통사론
다음은 NULLIF 문의 구문입니다.
NULLIF(expression 1, expression 2)
예
다음 예제에서는 DepartmentNo가 3이면 NULL을 반환합니다. 그렇지 않으면 DepartmentNo 값을 반환합니다.
SELECT
EmployeeNo,
NULLIF(DepartmentNo,3) AS department
FROM Employee;
위 쿼리는 다음 레코드를 반환합니다. 직원 105에 부서 번호가 있음을 알 수 있습니다. NULL로.
*** Query completed. 5 rows found. 2 columns returned.
*** Total elapsed time was 1 second.
EmployeeNo department
----------- ------------------
101 1
104 2
102 2
105 ?
103 2
기본 인덱스는 Teradata에서 데이터가있는 위치를 지정하는 데 사용됩니다. 데이터 행을 가져 오는 AMP를 지정하는 데 사용됩니다. Teradata의 각 테이블에는 기본 인덱스가 정의되어 있어야합니다. 기본 인덱스가 정의되지 않은 경우 Teradata는 자동으로 기본 인덱스를 할당합니다. 기본 인덱스는 데이터에 액세스하는 가장 빠른 방법을 제공합니다. 기본은 최대 64 개의 열을 가질 수 있습니다.
테이블을 생성하는 동안 기본 인덱스가 정의됩니다. 기본 인덱스에는 두 가지 유형이 있습니다.
- 고유 기본 인덱스 (UPI)
- 고유하지 않은 기본 인덱스 (NUPI)
고유 기본 인덱스 (UPI)
테이블에 UPI가있는 것으로 정의 된 경우 UPI로 간주되는 열에는 중복 값이 없어야합니다. 중복 값이 삽입되면 거부됩니다.
고유 기본 인덱스 생성
다음 예에서는 고유 기본 인덱스로 EmployeeNo 열이있는 Salary 테이블을 만듭니다.
CREATE SET TABLE Salary (
EmployeeNo INTEGER,
Gross INTEGER,
Deduction INTEGER,
NetPay INTEGER
)
UNIQUE PRIMARY INDEX(EmployeeNo);
고유하지 않은 기본 인덱스 (NUPI)
테이블에 NUPI가있는 것으로 정의 된 경우 UPI로 간주되는 열은 중복 값을 허용 할 수 있습니다.
고유하지 않은 기본 인덱스 생성
다음 예에서는 EmployeeNo 열을 고유하지 않은 기본 인덱스로 사용하여 직원 계정 테이블을 만듭니다. 직원이 테이블에 여러 계정을 가질 수 있으므로 EmployeeNo는 고유하지 않은 기본 인덱스로 정의됩니다. 하나는 급여 계정 용이고 다른 하나는 상환 계정 용입니다.
CREATE SET TABLE Employee _Accounts (
EmployeeNo INTEGER,
employee_bank_account_type BYTEINT.
employee_bank_account_number INTEGER,
employee_bank_name VARCHAR(30),
employee_bank_city VARCHAR(30)
)
PRIMARY INDEX(EmployeeNo);
조인은 둘 이상의 테이블에서 레코드를 결합하는 데 사용됩니다. 테이블은 이러한 테이블의 공통 열 / 값을 기반으로 조인됩니다.
다양한 유형의 조인을 사용할 수 있습니다.
- 내부 조인
- 왼쪽 외부 결합
- 오른쪽 외부 결합
- 전체 외부 결합
- 셀프 조인
- 교차 결합
- 데카르트 생산 결합
내부 조인
내부 조인은 여러 테이블의 레코드를 결합하고 두 테이블에있는 값을 반환합니다.
통사론
다음은 INNER JOIN 문의 구문입니다.
SELECT col1, col2, col3….
FROM
Table-1
INNER JOIN
Table-2
ON (col1 = col2)
<WHERE condition>;
예
다음 직원 테이블 및 급여 테이블을 고려하십시오.
직원 아니요 | 이름 | 성 | JoinedDate | 부서 번호 | 생일 |
---|---|---|---|---|---|
101 | 마이크 | 제임스 | 2005 년 3 월 27 일 | 1 | 1980 년 1 월 5 일 |
102 | 로버트 | 윌리엄스 | 2007 년 4 월 25 일 | 2 | 1983 년 3 월 5 일 |
103 | 베드로 | 폴 | 2007 년 3 월 21 일 | 2 | 1983 년 4 월 1 일 |
104 | 알렉스 | 스튜어트 | 2008 년 2 월 1 일 | 2 | 1984 년 11 월 6 일 |
105 | 로버트 | 제임스 | 2008 년 1/4 월 | 삼 | 1984 년 12 월 1 일 |
직원 아니요 | 심한 | 공제 | 순이익 |
---|---|---|---|
101 | 40,000 | 4,000 | 36,000 |
102 | 80,000 | 6,000 | 74,000 |
103 | 90,000 | 7,000 | 83,000 |
104 | 75,000 | 5,000 | 70,000 |
다음 쿼리는 EmployeeNo 공통 열에서 Employee 테이블과 Salary 테이블을 조인합니다. 각 테이블에는 별칭 A와 B가 할당되고 열은 올바른 별칭으로 참조됩니다.
SELECT A.EmployeeNo, A.DepartmentNo, B.NetPay
FROM
Employee A
INNER JOIN
Salary B
ON (A.EmployeeNo = B. EmployeeNo);
위 쿼리를 실행하면 다음과 같은 레코드를 반환합니다. 직원 105는 Salary 테이블에 일치하는 레코드가 없기 때문에 결과에 포함되지 않습니다.
*** Query completed. 4 rows found. 3 columns returned.
*** Total elapsed time was 1 second.
EmployeeNo DepartmentNo NetPay
----------- ------------ -----------
101 1 36000
102 2 74000
103 2 83000
104 2 70000
외부 조인
LEFT OUTER JOIN 및 RIGHT OUTER JOIN도 여러 테이블의 결과를 결합합니다.
LEFT OUTER JOIN 왼쪽 테이블에서 모든 레코드를 반환하고 오른쪽 테이블에서 일치하는 레코드 만 반환합니다.
RIGHT OUTER JOIN 오른쪽 테이블에서 모든 레코드를 반환하고 왼쪽 테이블에서 일치하는 행만 반환합니다.
FULL OUTER JOINLEFT OUTER 및 RIGHT OUTER JOINS의 결과를 결합합니다. 조인 된 테이블에서 일치하는 행과 일치하지 않는 행을 모두 반환합니다.
통사론
다음은 OUTER JOIN 문의 구문입니다. LEFT OUTER JOIN, RIGHT OUTER JOIN 또는 FULL OUTER JOIN의 옵션 중 하나를 사용해야합니다.
SELECT col1, col2, col3….
FROM
Table-1
LEFT OUTER JOIN/RIGHT OUTER JOIN/FULL OUTER JOIN
Table-2
ON (col1 = col2)
<WHERE condition>;
예
LEFT OUTER JOIN 쿼리의 다음 예를 고려하십시오. Employee 테이블의 모든 레코드와 Salary 테이블의 일치하는 레코드를 반환합니다.
SELECT A.EmployeeNo, A.DepartmentNo, B.NetPay
FROM
Employee A
LEFT OUTER JOIN
Salary B
ON (A.EmployeeNo = B. EmployeeNo)
ORDER BY A.EmployeeNo;
위 쿼리가 실행되면 다음과 같은 출력이 생성됩니다. 직원 105의 경우 NetPay 값은 Salary 테이블에 일치하는 레코드가 없기 때문에 NULL입니다.
*** Query completed. 5 rows found. 3 columns returned.
*** Total elapsed time was 1 second.
EmployeeNo DepartmentNo NetPay
----------- ------------ -----------
101 1 36000
102 2 74000
103 2 83000
104 2 70000
105 3 ?
크로스 조인
교차 조인은 왼쪽 테이블의 모든 행을 오른쪽 테이블의 모든 행에 조인합니다.
통사론
다음은 CROSS JOIN 문의 구문입니다.
SELECT A.EmployeeNo, A.DepartmentNo, B.EmployeeNo,B.NetPay
FROM
Employee A
CROSS JOIN
Salary B
WHERE A.EmployeeNo = 101
ORDER BY B.EmployeeNo;
위 쿼리가 실행되면 다음과 같은 출력이 생성됩니다. Employee 테이블의 Employee No 101은 Salary Table의 모든 레코드와 결합됩니다.
*** Query completed. 4 rows found. 4 columns returned.
*** Total elapsed time was 1 second.
EmployeeNo DepartmentNo EmployeeNo NetPay
----------- ------------ ----------- -----------
101 1 101 36000
101 1 104 70000
101 1 102 74000
101 1 103 83000
하위 쿼리는 다른 테이블의 값을 기반으로 한 테이블의 레코드를 반환합니다. 다른 쿼리 내의 SELECT 쿼리입니다. 내부 쿼리라고하는 SELECT 쿼리가 먼저 실행되고 그 결과는 외부 쿼리에서 사용됩니다. 그 두드러진 특징 중 일부는-
쿼리에는 여러 하위 쿼리가있을 수 있고 하위 쿼리에는 다른 하위 쿼리가 포함될 수 있습니다.
하위 쿼리는 중복 레코드를 반환하지 않습니다.
하위 쿼리가 하나의 값만 반환하는 경우 = 연산자를 사용하여 외부 쿼리와 함께 사용할 수 있습니다. 여러 값을 반환하는 경우 IN 또는 NOT IN을 사용할 수 있습니다.
통사론
다음은 하위 쿼리의 일반 구문입니다.
SELECT col1, col2, col3,…
FROM
Outer Table
WHERE col1 OPERATOR ( Inner SELECT Query);
예
다음 급여 테이블을 고려하십시오.
직원 아니요 | 심한 | 공제 | 순이익 |
---|---|---|---|
101 | 40,000 | 4,000 | 36,000 |
102 | 80,000 | 6,000 | 74,000 |
103 | 90,000 | 7,000 | 83,000 |
104 | 75,000 | 5,000 | 70,000 |
다음 쿼리는 급여가 가장 높은 사원 번호를 식별합니다. 내부 SELECT는 최대 NetPay 값을 반환하는 집계 함수를 수행하고 외부 SELECT 쿼리는이 값을 사용하여이 값을 가진 직원 레코드를 반환합니다.
SELECT EmployeeNo, NetPay
FROM Salary
WHERE NetPay =
(SELECT MAX(NetPay)
FROM Salary);
이 쿼리가 실행되면 다음과 같은 출력이 생성됩니다.
*** Query completed. One row found. 2 columns returned.
*** Total elapsed time was 1 second.
EmployeeNo NetPay
----------- -----------
103 83000
Teradata는 임시 데이터를 보관하기 위해 다음 테이블 유형을 지원합니다.
- 파생 테이블
- 휘발성 테이블
- 글로벌 임시 테이블
파생 테이블
파생 테이블은 쿼리 내에서 생성, 사용 및 삭제됩니다. 쿼리 내에 중간 결과를 저장하는 데 사용됩니다.
예
다음 예에서는 급여가 75000보다 큰 직원 레코드가있는 파생 테이블 EmpSal을 빌드합니다.
SELECT
Emp.EmployeeNo,
Emp.FirstName,
Empsal.NetPay
FROM
Employee Emp,
(select EmployeeNo , NetPay
from Salary
where NetPay >= 75000) Empsal
where Emp.EmployeeNo = Empsal.EmployeeNo;
위 쿼리를 실행하면 급여가 75000 이상인 직원을 반환합니다.
*** Query completed. One row found. 3 columns returned.
*** Total elapsed time was 1 second.
EmployeeNo FirstName NetPay
----------- ------------------------------ -----------
103 Peter 83000
휘발성 테이블
휘발성 테이블은 사용자 세션 내에서 생성, 사용 및 삭제됩니다. 그들의 정의는 데이터 사전에 저장되지 않습니다. 자주 사용되는 쿼리의 중간 데이터를 보유합니다. 다음은 구문입니다.
통사론
CREATE [SET|MULTISET] VOALTILE TABLE tablename
<table definitions>
<column definitions>
<index definitions>
ON COMMIT [DELETE|PRESERVE] ROWS
예
CREATE VOLATILE TABLE dept_stat (
dept_no INTEGER,
avg_salary INTEGER,
max_salary INTEGER,
min_salary INTEGER
)
PRIMARY INDEX(dept_no)
ON COMMIT PRESERVE ROWS;
위 쿼리가 실행되면 다음과 같은 출력이 생성됩니다.
*** Table has been created.
*** Total elapsed time was 1 second.
글로벌 임시 테이블
Global Temporary 테이블의 정의는 데이터 딕셔너리에 저장되며 많은 사용자 / 세션에서 사용할 수 있습니다. 그러나 전역 임시 테이블에로드 된 데이터는 세션 중에 만 유지됩니다. 세션 당 최대 2000 개의 글로벌 임시 테이블을 구체화 할 수 있습니다. 다음은 구문입니다.
통사론
CREATE [SET|MULTISET] GLOBAL TEMPORARY TABLE tablename
<table definitions>
<column definitions>
<index definitions>
예
CREATE SET GLOBAL TEMPORARY TABLE dept_stat (
dept_no INTEGER,
avg_salary INTEGER,
max_salary INTEGER,
min_salary INTEGER
)
PRIMARY INDEX(dept_no);
위 쿼리가 실행되면 다음과 같은 출력이 생성됩니다.
*** Table has been created.
*** Total elapsed time was 1 second.
Teradata에서는 세 가지 유형의 공간을 사용할 수 있습니다.
영구 공간
영구 공간은 사용자 / 데이터베이스가 데이터 행을 보유 할 수있는 최대 공간입니다. 영구 테이블, 저널, 폴백 테이블 및 보조 인덱스 하위 테이블은 영구 공간을 사용합니다.
영구 공간은 데이터베이스 / 사용자에 대해 사전 할당되지 않습니다. 데이터베이스 / 사용자가 사용할 수있는 최대 공간으로 정의됩니다. 영구 공간의 양은 AMP 수로 나뉩니다. AMP 당 제한을 초과 할 때마다 오류 메시지가 생성됩니다.
스풀 공간
스풀 공간은 SQL 쿼리의 중간 결과를 유지하기 위해 시스템에서 사용하는 사용되지 않는 영구 공간입니다. 스풀 공간이없는 사용자는 쿼리를 실행할 수 없습니다.
영구 공간과 유사하게 스풀 공간은 사용자가 사용할 수있는 최대 공간을 정의합니다. 스풀 공간은 AMP 수로 나뉩니다. AMP 당 제한을 초과 할 때마다 사용자는 스풀 공간 오류를 받게됩니다.
임시 공간
임시 공간은 글로벌 임시 테이블에서 사용하는 사용되지 않은 영구 공간입니다. 임시 공간도 AMP 수로 나뉩니다.
테이블에는 하나의 기본 인덱스 만 포함될 수 있습니다. 더 자주 테이블에 다른 열이 포함되어 데이터에 자주 액세스하는 시나리오가 있습니다. Teradata는 이러한 쿼리에 대해 전체 테이블 스캔을 수행합니다. 보조 색인은이 문제를 해결합니다.
보조 인덱스는 데이터에 액세스하기위한 대체 경로입니다. 기본 인덱스와 보조 인덱스 간에는 약간의 차이가 있습니다.
보조 인덱스는 데이터 배포와 관련이 없습니다.
보조 인덱스 값은 하위 테이블에 저장됩니다. 이 테이블은 모든 AMP에 빌드됩니다.
보조 인덱스는 선택 사항입니다.
테이블 생성 중 또는 테이블 생성 후에 생성 할 수 있습니다.
하위 테이블을 작성하기 때문에 추가 공간을 차지하고 각 새 행에 대해 하위 테이블을 업데이트해야하므로 유지 관리가 필요합니다.
보조 인덱스에는 두 가지 유형이 있습니다.
- 고유 보조 인덱스 (USI)
- 비 고유 2 차 색인 (NUSI)
고유 보조 인덱스 (USI)
Unique Secondary Index는 USI로 정의 된 열에 대해 고유 한 값만 허용합니다. USI로 행에 액세스하는 것은 2 암페어 작업입니다.
고유 한 보조 인덱스 생성
다음 예에서는 직원 테이블의 EmployeeNo 열에 USI를 만듭니다.
CREATE UNIQUE INDEX(EmployeeNo) on employee;
비 고유 보조 인덱스 (NUSI)
고유하지 않은 보조 인덱스는 NUSI로 정의 된 열에 대해 중복 값을 허용합니다. NUSI로 행에 액세스하는 것은 모든 앰프 작업입니다.
고유하지 않은 보조 인덱스 생성
다음 예제는 employee 테이블의 FirstName 열에 NUSI를 생성합니다.
CREATE INDEX(FirstName) on Employee;
Teradata 옵티마이 저는 모든 SQL 쿼리에 대한 실행 전략을 제공합니다. 이 실행 전략은 SQL 쿼리 내에서 사용되는 테이블에서 수집 된 통계를 기반으로합니다. 테이블에 대한 통계는 COLLECT STATISTICS 명령을 사용하여 수집됩니다. Optimizer는 최적의 실행 전략을 제시하기 위해 환경 정보와 데이터 인구 통계를 필요로합니다.
환경 정보
- 노드, AMP 및 CPU 수
- 메모리 양
데이터 인구 통계
- 행 수
- 행 크기
- 표의 값 범위
- 값당 행 수
- Null 수
테이블에서 통계를 수집하는 방법에는 세 가지가 있습니다.
- 랜덤 AMP 샘플링
- 전체 통계 수집
- SAMPLE 옵션 사용
통계 수집
COLLECT STATISTICS 명령은 테이블에 대한 통계를 수집하는 데 사용됩니다.
통사론
다음은 테이블에 대한 통계를 수집하는 기본 구문입니다.
COLLECT [SUMMARY] STATISTICS
INDEX (indexname) COLUMN (columnname)
ON <tablename>;
예
다음 예에서는 Employee 테이블의 EmployeeNo 열에 대한 통계를 수집합니다.
COLLECT STATISTICS COLUMN(EmployeeNo) ON Employee;
위 쿼리가 실행되면 다음과 같은 출력이 생성됩니다.
*** Update completed. 2 rows changed.
*** Total elapsed time was 1 second.
통계보기
HELP STATISTICS 명령을 사용하여 수집 된 통계를 볼 수 있습니다.
통사론
다음은 수집 된 통계를보기위한 구문입니다.
HELP STATISTICS <tablename>;
예
다음은 Employee 테이블에서 수집 된 통계를 보는 예입니다.
HELP STATISTICS employee;
위 질의를 수행하면 다음과 같은 결과가 나온다.
Date Time Unique Values Column Names
-------- -------- -------------------- -----------------------
16/01/01 08:07:04 5 *
16/01/01 07:24:16 3 DepartmentNo
16/01/01 08:07:04 5 EmployeeNo
압축은 테이블에서 사용하는 스토리지를 줄이는 데 사용됩니다. Teradata에서 압축은 NULL을 포함하여 최대 255 개의 고유 값을 압축 할 수 있습니다. 스토리지가 줄어들 기 때문에 Teradata는 블록에 더 많은 레코드를 저장할 수 있습니다. 모든 I / O 작업이 블록 당 더 많은 행을 처리 할 수 있으므로 쿼리 응답 시간이 향상됩니다. CREATE TABLE을 사용하여 테이블 생성시 또는 ALTER TABLE 명령을 사용하여 테이블 생성 후에 압축을 추가 할 수 있습니다.
한계
- 열당 255 개의 값만 압축 할 수 있습니다.
- 기본 인덱스 열은 압축 할 수 없습니다.
- 휘발성 테이블은 압축 할 수 없습니다.
다중 값 압축 (MVC)
다음 표는 값 1, 2 및 3에 대한 DepatmentNo 필드를 압축합니다. 열에 압축이 적용될 때이 열의 값은 행과 함께 저장되지 않습니다. 대신 값이 각 AMP의 테이블 헤더에 저장되고 존재 비트 만 행에 추가되어 값을 나타냅니다.
CREATE SET TABLE employee (
EmployeeNo integer,
FirstName CHAR(30),
LastName CHAR(30),
BirthDate DATE FORMAT 'YYYY-MM-DD-',
JoinedDate DATE FORMAT 'YYYY-MM-DD-',
employee_gender CHAR(1),
DepartmentNo CHAR(02) COMPRESS(1,2,3)
)
UNIQUE PRIMARY INDEX(EmployeeNo);
유한 값이있는 큰 테이블에 열이있는 경우 다중 값 압축을 사용할 수 있습니다.
EXPLAIN 명령은 파싱 엔진의 실행 계획을 영어로 반환합니다. 다른 EXPLAIN 명령을 제외한 모든 SQL 문과 함께 사용할 수 있습니다. 쿼리 앞에 EXPLAIN 명령이 나오면 파싱 엔진의 실행 계획이 AMP 대신 사용자에게 반환됩니다.
EXPLAIN의 예
다음 정의가있는 테이블 직원을 고려하십시오.
CREATE SET TABLE EMPLOYEE,FALLBACK (
EmployeeNo INTEGER,
FirstName VARCHAR(30),
LastName VARCHAR(30),
DOB DATE FORMAT 'YYYY-MM-DD',
JoinedDate DATE FORMAT 'YYYY-MM-DD',
DepartmentNo BYTEINT
)
UNIQUE PRIMARY INDEX ( EmployeeNo );
EXPLAIN 계획의 몇 가지 예가 아래에 나와 있습니다.
전체 테이블 스캔 (FTS)
SELECT 문에 조건이 지정되지 않은 경우 옵티마이 저는 테이블의 모든 행이 액세스되는 전체 테이블 스캔을 사용하도록 선택할 수 있습니다.
예
다음은 최적화 프로그램이 FTS를 선택할 수있는 샘플 쿼리입니다.
EXPLAIN SELECT * FROM employee;
위 쿼리가 실행되면 다음과 같은 출력이 생성됩니다. 알 수 있듯이 옵티마이 저는 모든 AMP와 AMP 내의 모든 행에 액세스하도록 선택합니다.
1) First, we lock a distinct TDUSER."pseudo table" for read on a
RowHash to prevent global deadlock for TDUSER.employee.
2) Next, we lock TDUSER.employee for read.
3) We do an all-AMPs RETRIEVE step from TDUSER.employee by way of an
all-rows scan with no residual conditions into Spool 1
(group_amps), which is built locally on the AMPs. The size of
Spool 1 is estimated with low confidence to be 2 rows (116 bytes).
The estimated time for this step is 0.03 seconds.
4) Finally, we send out an END TRANSACTION step to all AMPs involved
in processing the request.
→ The contents of Spool 1 are sent back to the user as the result of
statement 1. The total estimated time is 0.03 seconds.
고유 기본 색인
Unique Primary Index를 사용하여 행에 액세스하면 하나의 AMP 작업이됩니다.
EXPLAIN SELECT * FROM employee WHERE EmployeeNo = 101;
위 쿼리가 실행되면 다음과 같은 출력이 생성됩니다. 알 수 있듯이 단일 AMP 검색이고 옵티마이 저는 고유 한 기본 인덱스를 사용하여 행에 액세스합니다.
1) First, we do a single-AMP RETRIEVE step from TDUSER.employee by
way of the unique primary index "TDUSER.employee.EmployeeNo = 101"
with no residual conditions. The estimated time for this step is
0.01 seconds.
→ The row is sent directly back to the user as the result of
statement 1. The total estimated time is 0.01 seconds.
고유 한 보조 인덱스
Unique Secondary Index를 사용하여 행에 액세스하면 2 암페어 연산입니다.
예
다음 정의가있는 Salary 테이블을 고려하십시오.
CREATE SET TABLE SALARY,FALLBACK (
EmployeeNo INTEGER,
Gross INTEGER,
Deduction INTEGER,
NetPay INTEGER
)
PRIMARY INDEX ( EmployeeNo )
UNIQUE INDEX (EmployeeNo);
다음 SELECT 문을 고려하십시오.
EXPLAIN SELECT * FROM Salary WHERE EmployeeNo = 101;
위 쿼리가 실행되면 다음과 같은 출력이 생성됩니다. 알 수 있듯이 옵티마이 저는 고유 한 보조 인덱스를 사용하여 두 암페어 작업에서 행을 검색합니다.
1) First, we do a two-AMP RETRIEVE step from TDUSER.Salary
by way of unique index # 4 "TDUSER.Salary.EmployeeNo =
101" with no residual conditions. The estimated time for this
step is 0.01 seconds.
→ The row is sent directly back to the user as the result of
statement 1. The total estimated time is 0.01 seconds.
추가 약관
다음은 EXPLAIN 계획에서 흔히 볼 수있는 용어 목록입니다.
... (Last Use) …
스풀 파일은 더 이상 필요하지 않으며이 단계가 완료되면 해제됩니다.
... with no residual conditions …
적용 가능한 모든 조건이 행에 적용되었습니다.
... END TRANSACTION …
트랜잭션 잠금이 해제되고 변경 사항이 커밋됩니다.
... eliminating duplicate rows ...
중복 행은 세트 테이블이 아닌 스풀 파일에만 존재합니다. DISTINCT 연산 수행.
... by way of a traversal of index #n extracting row ids only …
보조 인덱스 (인덱스 #n)에서 찾은 행 ID를 포함하는 스풀 파일이 빌드됩니다.
... we do a SMS (set manipulation step) …
UNION, MINUS 또는 INTERSECT 연산자를 사용하여 행 결합.
... which is redistributed by hash code to all AMPs.
조인 준비를위한 데이터 재배포.
... which is duplicated on all AMPs.
조인을 준비하기 위해 더 작은 테이블 (SPOOL 측면)에서 데이터 복제.
... (one_AMP) or (group_AMPs)
모든 AMP 대신 하나의 AMP 또는 AMP의 하위 집합이 사용됨을 나타냅니다.
1 차 색인 값을 기반으로 특정 AMP에 행이 지정됩니다. Teradata는 해싱 알고리즘을 사용하여 행을 가져 오는 AMP를 결정합니다.
다음은 해싱 알고리즘에 대한 높은 수준의 다이어그램입니다.
다음은 데이터를 삽입하는 단계입니다.
클라이언트가 쿼리를 제출합니다.
파서는 쿼리를 수신하고 레코드의 PI 값을 해싱 알고리즘에 전달합니다.
해싱 알고리즘은 기본 인덱스 값을 해시하고 Row Hash라는 32 비트 숫자를 반환합니다.
행 해시의 상위 비트 (처음 16 비트)는 해시 맵 항목을 식별하는 데 사용됩니다. 해시 맵에는 하나의 AMP #이 포함됩니다. 해시 맵은 특정 AMP #을 포함하는 버킷의 배열입니다.
BYNET은 식별 된 AMP로 데이터를 보냅니다.
AMP는 32 비트 행 해시를 사용하여 디스크 내에서 행을 찾습니다.
행 해시가 동일한 레코드가 있으면 32 비트 숫자 인 고유성 ID를 증가시킵니다. 새 행 해시의 경우 고유성 ID는 1로 할당되고 동일한 행 해시가있는 레코드가 삽입 될 때마다 증가합니다.
행 해시와 고유성 ID의 조합을 행 ID라고합니다.
행 ID는 디스크의 각 레코드 앞에 붙습니다.
AMP의 각 테이블 행은 행 ID를 기준으로 논리적으로 정렬됩니다.
테이블 저장 방법
테이블은 행 ID (행 해시 + 고유성 ID)로 정렬 된 다음 AMP 내에 저장됩니다. 행 ID는 각 데이터 행과 함께 저장됩니다.
행 해시 | 고유성 ID | 직원 아니요 | 이름 | 성 |
---|---|---|---|---|
2A01 2611 | 0000 0001 | 101 | 마이크 | 제임스 |
2A01 2612 | 0000 0001 | 104 | 알렉스 | 스튜어트 |
2A01 2613 | 0000 0001 | 102 | 로버트 | 윌리엄스 |
2A01 2614 | 0000 0001 | 105 | 로버트 | 제임스 |
2A01 2615 | 0000 0001 | 103 | 베드로 | 폴 |
JOIN INDEX는 구체화 된 뷰입니다. 해당 정의는 영구적으로 저장되고 조인 인덱스에서 참조되는 기본 테이블이 업데이트 될 때마다 데이터가 업데이트됩니다. JOIN INDEX는 하나 이상의 테이블을 포함 할 수 있으며 사전 집계 된 데이터도 포함 할 수 있습니다. 조인 인덱스는 주로 성능 향상에 사용됩니다.
다양한 유형의 조인 인덱스를 사용할 수 있습니다.
- 단일 테이블 조인 인덱스 (STJI)
- MTJI (Multi Table Join Index)
- 집계 된 조인 인덱스 (AJI)
단일 테이블 조인 인덱스
단일 테이블 조인 인덱스를 사용하면 기본 테이블의 것과 다른 기본 인덱스 열을 기반으로 큰 테이블을 분할 할 수 있습니다.
통사론
다음은 JOIN INDEX의 구문입니다.
CREATE JOIN INDEX <index name>
AS
<SELECT Query>
<Index Definition>;
예
다음 Employee 및 Salary 테이블을 고려하십시오.
CREATE SET TABLE EMPLOYEE,FALLBACK (
EmployeeNo INTEGER,
FirstName VARCHAR(30) ,
LastName VARCHAR(30) ,
DOB DATE FORMAT 'YYYY-MM-DD',
JoinedDate DATE FORMAT 'YYYY-MM-DD',
DepartmentNo BYTEINT
)
UNIQUE PRIMARY INDEX ( EmployeeNo );
CREATE SET TABLE SALARY,FALLBACK (
EmployeeNo INTEGER,
Gross INTEGER,
Deduction INTEGER,
NetPay INTEGER
)
PRIMARY INDEX ( EmployeeNo )
UNIQUE INDEX (EmployeeNo);
다음은 Employee 테이블에 Employee_JI라는 Join 인덱스를 생성하는 예제입니다.
CREATE JOIN INDEX Employee_JI
AS
SELECT EmployeeNo,FirstName,LastName,
BirthDate,JoinedDate,DepartmentNo
FROM Employee
PRIMARY INDEX(FirstName);
사용자가 EmployeeNo에 WHERE 절이있는 쿼리를 제출하면 시스템은 고유 한 기본 인덱스를 사용하여 Employee 테이블을 쿼리합니다. 사용자가 employee_name을 사용하여 employee 테이블을 쿼리하면 시스템은 employee_name을 사용하여 조인 인덱스 Employee_JI에 액세스 할 수 있습니다. 조인 인덱스의 행은 employee_name 열에서 해시됩니다. 조인 인덱스가 정의되어 있지 않고 employee_name이 보조 인덱스로 정의되지 않은 경우 시스템은 전체 테이블 스캔을 수행하여 시간이 많이 걸리는 행에 액세스합니다.
다음 EXPLAIN 계획을 실행하고 최적화 프로그램 계획을 확인할 수 있습니다. 다음 예에서는 테이블이 Employee_Name 열을 사용하여 쿼리 할 때 옵티마이 저가 기본 Employee 테이블 대신 조인 인덱스를 사용하고 있음을 알 수 있습니다.
EXPLAIN SELECT * FROM EMPLOYEE WHERE FirstName='Mike';
*** Help information returned. 8 rows.
*** Total elapsed time was 1 second.
Explanation
------------------------------------------------------------------------
1) First, we do a single-AMP RETRIEVE step from EMPLOYEE_JI by
way of the primary index "EMPLOYEE_JI.FirstName = 'Mike'"
with no residual conditions into Spool 1 (one-amp), which is built
locally on that AMP. The size of Spool 1 is estimated with low
confidence to be 2 rows (232 bytes). The estimated time for this
step is 0.02 seconds.
→ The contents of Spool 1 are sent back to the user as the result of
statement 1. The total estimated time is 0.02 seconds.
다중 테이블 조인 인덱스
다중 테이블 조인 인덱스는 둘 이상의 테이블을 결합하여 생성됩니다. 다중 테이블 조인 인덱스를 사용하여 자주 조인 된 테이블의 결과 집합을 저장하여 성능을 향상시킬 수 있습니다.
예
다음 예에서는 Employee 및 Salary 테이블을 조인하여 Employee_Salary_JI라는 JOIN INDEX를 만듭니다.
CREATE JOIN INDEX Employee_Salary_JI
AS
SELECT a.EmployeeNo,a.FirstName,a.LastName,
a.BirthDate,a.JoinedDate,a.DepartmentNo,b.Gross,b.Deduction,b.NetPay
FROM Employee a
INNER JOIN Salary b
ON(a.EmployeeNo = b.EmployeeNo)
PRIMARY INDEX(FirstName);
기본 테이블 Employee 또는 Salary가 업데이트 될 때마다 Join 인덱스 Employee_Salary_JI도 자동으로 업데이트됩니다. Employee 및 Salary 테이블을 조인하는 쿼리를 실행하는 경우 옵티마이 저는 테이블을 조인하는 대신 Employee_Salary_JI의 데이터에 직접 액세스하도록 선택할 수 있습니다. 쿼리에 대한 EXPLAIN 계획을 사용하여 최적화 프로그램이 기본 테이블 또는 조인 인덱스를 선택하는지 확인할 수 있습니다.
집계 조인 인덱스
테이블이 특정 열에서 일관되게 집계되는 경우 집계 조인 인덱스를 테이블에 정의하여 성능을 향상시킬 수 있습니다. 집계 조인 인덱스의 한 가지 제한은 SUM 및 COUNT 함수 만 지원한다는 것입니다.
예
다음 예에서는 Employee와 Salary가 결합되어 부서별 총 급여를 식별합니다.
CREATE JOIN INDEX Employee_Salary_JI
AS
SELECT a.DepartmentNo,SUM(b.NetPay) AS TotalPay
FROM Employee a
INNER JOIN Salary b
ON(a.EmployeeNo = b.EmployeeNo)
GROUP BY a.DepartmentNo
Primary Index(DepartmentNo);
뷰는 쿼리로 작성된 데이터베이스 개체입니다. 조인을 통해 단일 테이블 또는 여러 테이블을 사용하여 뷰를 작성할 수 있습니다. 그들의 정의는 데이터 사전에 영구적으로 저장되지만 데이터 사본을 저장하지 않습니다. 보기에 대한 데이터는 동적으로 작성됩니다.
뷰에는 테이블 행의 하위 집합 또는 테이블 열의 하위 집합이 포함될 수 있습니다.
보기 만들기
뷰는 CREATE VIEW 문을 사용하여 생성됩니다.
통사론
다음은보기를 만드는 구문입니다.
CREATE/REPLACE VIEW <viewname>
AS
<select query>;
예
다음 Employee 테이블을 고려하십시오.
직원 아니요 | 이름 | 성 | 생일 |
---|---|---|---|
101 | 마이크 | 제임스 | 1980 년 1 월 5 일 |
104 | 알렉스 | 스튜어트 | 1984 년 11 월 6 일 |
102 | 로버트 | 윌리엄스 | 1983 년 3 월 5 일 |
105 | 로버트 | 제임스 | 1984 년 12 월 1 일 |
103 | 베드로 | 폴 | 1983 년 4 월 1 일 |
다음 예에서는 Employee 테이블에 대한보기를 만듭니다.
CREATE VIEW Employee_View
AS
SELECT
EmployeeNo,
FirstName,
LastName,
FROM
Employee;
보기 사용
일반 SELECT 문을 사용하여 뷰에서 데이터를 검색 할 수 있습니다.
예
다음 예제는 Employee_View에서 레코드를 검색합니다.
SELECT EmployeeNo, FirstName, LastName FROM Employee_View;
위 쿼리가 실행되면 다음과 같은 출력이 생성됩니다.
*** Query completed. 5 rows found. 3 columns returned.
*** Total elapsed time was 1 second.
EmployeeNo FirstName LastName
----------- ------------------------------ ---------------------------
101 Mike James
104 Alex Stuart
102 Robert Williams
105 Robert James
103 Peter Paul
보기 수정
REPLACE VIEW 문을 사용하여 기존 뷰를 수정할 수 있습니다.
다음은보기를 수정하는 구문입니다.
REPLACE VIEW <viewname>
AS
<select query>;
예
다음 예제는 추가 열을 추가하기 위해 Employee_View보기를 수정합니다.
REPLACE VIEW Employee_View
AS
SELECT
EmployeeNo,
FirstName,
BirthDate,
JoinedDate
DepartmentNo
FROM
Employee;
드롭 뷰
DROP VIEW 문을 사용하여 기존 뷰를 삭제할 수 있습니다.
통사론
다음은 DROP VIEW의 구문입니다.
DROP VIEW <viewname>;
예
다음은 Employee_View 뷰를 삭제하는 예제입니다.
DROP VIEW Employee_View;
뷰의 장점
뷰는 테이블의 행이나 열을 제한하여 추가 보안 수준을 제공합니다.
사용자는 기본 테이블 대신보기에만 액세스 할 수 있습니다.
뷰를 사용하여 테이블을 미리 조인하여 여러 테이블의 사용을 단순화합니다.
매크로는 매크로 이름을 호출하여 저장 및 실행되는 SQL 문 집합입니다. 매크로의 정의는 데이터 사전에 저장됩니다. 사용자는 매크로를 실행하기 위해 EXEC 권한 만 필요합니다. 사용자는 매크로 내에서 사용되는 데이터베이스 개체에 대한 별도의 권한이 필요하지 않습니다. 매크로 문은 단일 트랜잭션으로 실행됩니다. 매크로의 SQL 문 중 하나가 실패하면 모든 명령문이 롤백됩니다. 매크로는 매개 변수를 받아 들일 수 있습니다. 매크로는 DDL 문을 포함 할 수 있지만 매크로의 마지막 문이어야합니다.
매크로 만들기
매크로는 CREATE MACRO 문을 사용하여 생성됩니다.
통사론
다음은 CREATE MACRO 명령의 일반 구문입니다.
CREATE MACRO <macroname> [(parameter1, parameter2,...)] (
<sql statements>
);
예
다음 Employee 테이블을 고려하십시오.
직원 아니요 | 이름 | 성 | 생일 |
---|---|---|---|
101 | 마이크 | 제임스 | 1980 년 1 월 5 일 |
104 | 알렉스 | 스튜어트 | 1984 년 11 월 6 일 |
102 | 로버트 | 윌리엄스 | 1983 년 3 월 5 일 |
105 | 로버트 | 제임스 | 1984 년 12 월 1 일 |
103 | 베드로 | 폴 | 1983 년 4 월 1 일 |
다음 예제에서는 Get_Emp라는 매크로를 만듭니다. 여기에는 직원 테이블에서 레코드를 검색하는 select 문이 포함되어 있습니다.
CREATE MACRO Get_Emp AS (
SELECT
EmployeeNo,
FirstName,
LastName
FROM
employee
ORDER BY EmployeeNo;
);
매크로 실행
매크로는 EXEC 명령을 사용하여 실행됩니다.
통사론
다음은 EXECUTE MACRO 명령의 구문입니다.
EXEC <macroname>;
예
다음 예제는 매크로 이름 Get_Emp를 실행합니다. 다음 명령을 실행하면 직원 테이블에서 모든 레코드를 검색합니다.
EXEC Get_Emp;
*** Query completed. 5 rows found. 3 columns returned.
*** Total elapsed time was 1 second.
EmployeeNo FirstName LastName
----------- ------------------------------ ---------------------------
101 Mike James
102 Robert Williams
103 Peter Paul
104 Alex Stuart
105 Robert James
매개 변수화 된 매크로
Teradata 매크로는 매개 변수를 허용 할 수 있습니다. 매크로 내에서 이러한 매개 변수는; (세미콜론).
다음은 매개 변수를 허용하는 매크로의 예입니다.
CREATE MACRO Get_Emp_Salary(EmployeeNo INTEGER) AS (
SELECT
EmployeeNo,
NetPay
FROM
Salary
WHERE EmployeeNo = :EmployeeNo;
);
매개 변수화 된 매크로 실행
매크로는 EXEC 명령을 사용하여 실행됩니다. 매크로를 실행하려면 EXEC 권한이 필요합니다.
통사론
다음은 EXECUTE MACRO 문의 구문입니다.
EXEC <macroname>(value);
예
다음 예제는 매크로 이름 Get_Emp를 실행합니다. 매개 변수로 직원 번호를 받아들이고 해당 직원에 대한 직원 테이블에서 레코드를 추출합니다.
EXEC Get_Emp_Salary(101);
*** Query completed. One row found. 2 columns returned.
*** Total elapsed time was 1 second.
EmployeeNo NetPay
----------- ------------
101 36000
저장 프로 시저에는 일련의 SQL 문과 절차 문이 포함됩니다. 절차 적 설명 만 포함 할 수 있습니다. 저장 프로 시저의 정의는 데이터베이스에 저장되고 매개 변수는 데이터 사전 테이블에 저장됩니다.
장점
저장 프로시 저는 클라이언트와 서버 간의 네트워크로드를 줄입니다.
데이터에 직접 액세스하는 대신 저장 프로 시저를 통해 액세스하므로 더 나은 보안을 제공합니다.
비즈니스 로직이 테스트되고 서버에 저장되기 때문에 더 나은 유지 관리를 제공합니다.
절차 생성
저장 프로시 저는 CREATE PROCEDURE 문을 사용하여 생성됩니다.
통사론
다음은 CREATE PROCEDURE 문의 일반 구문입니다.
CREATE PROCEDURE <procedurename> ( [parameter 1 data type, parameter 2 data type..] )
BEGIN
<SQL or SPL statements>;
END;
예
다음 급여 표를 고려하십시오.
직원 아니요 | 심한 | 공제 | 순이익 |
---|---|---|---|
101 | 40,000 | 4,000 | 36,000 |
102 | 80,000 | 6,000 | 74,000 |
103 | 90,000 | 7,000 | 83,000 |
104 | 75,000 | 5,000 | 70,000 |
다음 예제에서는 값을 수락하고 Salary Table에 삽입 할 InsertSalary라는 저장 프로 시저를 만듭니다.
CREATE PROCEDURE InsertSalary (
IN in_EmployeeNo INTEGER, IN in_Gross INTEGER,
IN in_Deduction INTEGER, IN in_NetPay INTEGER
)
BEGIN
INSERT INTO Salary (
EmployeeNo,
Gross,
Deduction,
NetPay
)
VALUES (
:in_EmployeeNo,
:in_Gross,
:in_Deduction,
:in_NetPay
);
END;
절차 실행
저장 프로시 저는 CALL 문을 사용하여 실행됩니다.
통사론
다음은 CALL 문의 일반 구문입니다.
CALL <procedure name> [(parameter values)];
예
다음 예제에서는 저장 프로 시저 InsertSalary를 호출하고 Salary Table에 레코드를 삽입합니다.
CALL InsertSalary(105,20000,2000,18000);
위의 질의가 실행되면 다음과 같은 출력이 생성되고 Salary 테이블에서 삽입 된 행을 볼 수 있습니다.
직원 아니요 | 심한 | 공제 | 순이익 |
---|---|---|---|
101 | 40,000 | 4,000 | 36,000 |
102 | 80,000 | 6,000 | 74,000 |
103 | 90,000 | 7,000 | 83,000 |
104 | 75,000 | 5,000 | 70,000 |
105 | 20,000 | 2,000 | 18,000 |
이 장에서는 Teradata에서 사용할 수있는 다양한 JOIN 전략에 대해 설명합니다.
결합 방법
Teradata는 다양한 조인 방법을 사용하여 조인 작업을 수행합니다. 일반적으로 사용되는 조인 방법 중 일부는-
- 결합 결합
- 중첩 결합
- 제품 가입
결합 결합
병합 조인 방법은 조인이 동등 조건을 기반으로 할 때 발생합니다. 병합 조인에서는 조인 행이 동일한 AMP에 있어야합니다. 행은 행 해시를 기반으로 결합됩니다. Merge Join은 다른 조인 전략을 사용하여 행을 동일한 AMP로 가져옵니다.
전략 # 1
조인 열이 해당 테이블의 기본 인덱스 인 경우 조인 행은 이미 동일한 AMP에 있습니다. 이 경우 배포가 필요하지 않습니다.
다음 직원 및 급여 테이블을 고려하십시오.
CREATE SET TABLE EMPLOYEE,FALLBACK (
EmployeeNo INTEGER,
FirstName VARCHAR(30) ,
LastName VARCHAR(30) ,
DOB DATE FORMAT 'YYYY-MM-DD',
JoinedDate DATE FORMAT 'YYYY-MM-DD',
DepartmentNo BYTEINT
)
UNIQUE PRIMARY INDEX ( EmployeeNo );
CREATE SET TABLE Salary (
EmployeeNo INTEGER,
Gross INTEGER,
Deduction INTEGER,
NetPay INTEGER
)
UNIQUE PRIMARY INDEX(EmployeeNo);
이 두 테이블이 EmployeeNo 열에서 조인되면 EmployeeNo가 조인되는 두 테이블의 기본 인덱스이므로 재배포가 발생하지 않습니다.
전략 # 2
다음 Employee 및 Department 테이블을 고려하십시오.
CREATE SET TABLE EMPLOYEE,FALLBACK (
EmployeeNo INTEGER,
FirstName VARCHAR(30) ,
LastName VARCHAR(30) ,
DOB DATE FORMAT 'YYYY-MM-DD',
JoinedDate DATE FORMAT 'YYYY-MM-DD',
DepartmentNo BYTEINT
)
UNIQUE PRIMARY INDEX ( EmployeeNo );
CREATE SET TABLE DEPARTMENT,FALLBACK (
DepartmentNo BYTEINT,
DepartmentName CHAR(15)
)
UNIQUE PRIMARY INDEX ( DepartmentNo );
이 두 테이블이 DeparmentNo 열에서 조인되면 DepartmentNo가 한 테이블의 기본 인덱스이고 다른 테이블의 기본이 아닌 인덱스이므로 행을 재분배해야합니다. 이 시나리오에서 조인 행은 동일한 AMP에 있지 않을 수 있습니다. 이 경우 Teradata는 DepartmentNo 열에 직원 테이블을 재배포 할 수 있습니다.
전략 # 3
위의 Employee 및 Department 테이블의 경우 Teradata는 Department 테이블의 크기가 작은 경우 모든 AMP에서 Department 테이블을 복제 할 수 있습니다.
중첩 결합
Nested Join은 모든 AMP를 사용하지 않습니다. 중첩 조인이 발생하려면 조건 중 하나가 한 테이블의 고유 기본 인덱스에서 동일해야하며이 열을 다른 테이블의 인덱스에 조인해야합니다.
이 시나리오에서 시스템은 한 테이블의 고유 기본 인덱스를 사용하여 한 행을 가져오고 해당 행 해시를 사용하여 다른 테이블에서 일치하는 레코드를 가져옵니다. 중첩 조인은 모든 조인 방법 중에서 가장 효율적입니다.
제품 가입
Product Join은 한 테이블의 각 한정 행을 다른 테이블의 각 한정 행과 비교합니다. 제품 결합은 다음 요인 중 일부로 인해 발생할 수 있습니다.
- 조건이없는 곳.
- 조인 조건은 동등 조건을 기반으로하지 않습니다.
- 테이블 별칭이 올바르지 않습니다.
- 다중 결합 조건.
PPI (Partitioned Primary Index)는 특정 쿼리의 성능을 향상시키는 데 유용한 인덱싱 메커니즘입니다. 행이 테이블에 삽입되면 AMP에 저장되고 행 해시 순서에 따라 정렬됩니다. 테이블이 PPI로 정의되면 행이 파티션 번호로 정렬됩니다. 각 파티션 내에서 행 해시로 정렬됩니다. 정의 된 파티션 식을 기반으로 행이 파티션에 할당됩니다.
장점
특정 쿼리에 대한 전체 테이블 스캔을 피하십시오.
추가 물리적 구조와 추가 I / O 유지 관리가 필요한 보조 인덱스를 사용하지 마십시오.
큰 테이블의 하위 집합에 빠르게 액세스합니다.
이전 데이터를 빠르게 삭제하고 새 데이터를 추가하십시오.
예
OrderNo에 대한 기본 인덱스가있는 다음 주문 테이블을 고려하십시오.
StoreNo | 주문 번호 | OrderDate | OrderTotal |
---|---|---|---|
101 | 7501 | 2015-10-01 | 900 |
101 | 7502 | 2015-10-02 | 1,200 |
102 | 7503 | 2015-10-02 | 3,000 |
102 | 7504 | 2015-10-03 | 2,454 |
101 | 7505 | 2015-10-03 | 1201 |
103 | 7506 | 2015-10-04 | 2,454 |
101 | 7507 | 2015-10-05 | 1201 |
101 | 7508 | 2015-10-05 | 1201 |
다음 표에 표시된 것처럼 레코드가 AMP간에 배포된다고 가정합니다. 기록은 AMP에 저장되며 행 해시를 기준으로 정렬됩니다.
RowHash | 주문 번호 | OrderDate |
---|---|---|
1 | 7505 | 2015-10-03 |
2 | 7504 | 2015-10-03 |
삼 | 7501 | 2015-10-01 |
4 | 7508 | 2015-10-05 |
RowHash | 주문 번호 | OrderDate |
---|---|---|
1 | 7507 | 2015-10-05 |
2 | 7502 | 2015-10-02 |
삼 | 7506 | 2015-10-04 |
4 | 7503 | 2015-10-02 |
특정 날짜에 대한 주문을 추출하기 위해 쿼리를 실행하면 최적화 프로그램이 전체 테이블 스캔을 사용하도록 선택할 수 있으며 AMP 내의 모든 레코드에 액세스 할 수 있습니다. 이를 방지하기 위해 주문 날짜를 분할 된 기본 인덱스로 정의 할 수 있습니다. 주문 테이블에 행이 삽입되면 주문 날짜별로 분할됩니다. 각 파티션 내에서 행 해시로 정렬됩니다.
다음 데이터는 레코드가 Order Date로 분할 된 경우 AMP에 레코드가 저장되는 방식을 보여줍니다. Order Date를 기준으로 레코드에 액세스하기 위해 쿼리를 실행하면 해당 특정 주문에 대한 레코드가 포함 된 파티션 만 액세스됩니다.
분할 | RowHash | 주문 번호 | OrderDate |
---|---|---|---|
0 | 삼 | 7501 | 2015-10-01 |
1 | 1 | 7505 | 2015-10-03 |
1 | 2 | 7504 | 2015-10-03 |
2 | 4 | 7508 | 2015-10-05 |
분할 | RowHash | 주문 번호 | OrderDate |
---|---|---|---|
0 | 2 | 7502 | 2015-10-02 |
0 | 4 | 7503 | 2015-10-02 |
1 | 삼 | 7506 | 2015-10-04 |
2 | 1 | 7507 | 2015-10-05 |
다음은 파티션 primary Index가있는 테이블을 생성하는 예입니다. PARTITION BY 절은 파티션을 정의하는 데 사용됩니다.
CREATE SET TABLE Orders (
StoreNo SMALLINT,
OrderNo INTEGER,
OrderDate DATE FORMAT 'YYYY-MM-DD',
OrderTotal INTEGER
)
PRIMARY INDEX(OrderNo)
PARTITION BY RANGE_N (
OrderDate BETWEEN DATE '2010-01-01' AND '2016-12-31' EACH INTERVAL '1' DAY
);
위의 예에서 테이블은 OrderDate 열로 분할됩니다. 매일 하나의 별도 파티션이 있습니다.
OLAP 함수는 집계 함수가 하나의 값만 반환하는 반면 OLAP 함수는 집계 외에 개별 행을 제공한다는 점을 제외하면 집계 함수와 유사합니다.
통사론
다음은 OLAP 함수의 일반 구문입니다.
<aggregate function> OVER
([PARTITION BY] [ORDER BY columnname][ROWS BETWEEN
UNBOUDED PRECEDING AND UNBOUNDED FOLLOWING)
집계 함수는 SUM, COUNT, MAX, MIN, AVG 일 수 있습니다.
예
다음 급여 테이블을 고려하십시오.
직원 아니요 | 심한 | 공제 | 순이익 |
---|---|---|---|
101 | 40,000 | 4,000 | 36,000 |
102 | 80,000 | 6,000 | 74,000 |
103 | 90,000 | 7,000 | 83,000 |
104 | 75,000 | 5,000 | 70,000 |
다음은 Salary 테이블에서 NetPay의 누적 합계 또는 누계를 찾는 예입니다. 레코드는 EmployeeNo별로 정렬되고 누적 합계는 NetPay 열에서 계산됩니다.
SELECT
EmployeeNo, NetPay,
SUM(Netpay) OVER(ORDER BY EmployeeNo ROWS
UNBOUNDED PRECEDING) as TotalSalary
FROM Salary;
위 쿼리가 실행되면 다음과 같은 출력이 생성됩니다.
EmployeeNo NetPay TotalSalary
----------- ----------- -----------
101 36000 36000
102 74000 110000
103 83000 193000
104 70000 263000
105 18000 281000
계급
RANK 함수는 제공된 열을 기반으로 레코드를 정렬합니다. RANK 함수는 순위에 따라 반환 된 레코드 수를 필터링 할 수도 있습니다.
통사론
다음은 RANK 함수를 사용하는 일반적인 구문입니다.
RANK() OVER
([PARTITION BY columnnlist] [ORDER BY columnlist][DESC|ASC])
예
다음 Employee 테이블을 고려하십시오.
직원 아니요 | 이름 | 성 | JoinedDate | 부서 ID | 생일 |
---|---|---|---|---|---|
101 | 마이크 | 제임스 | 2005 년 3 월 27 일 | 1 | 1980 년 1 월 5 일 |
102 | 로버트 | 윌리엄스 | 2007 년 4 월 25 일 | 2 | 1983 년 3 월 5 일 |
103 | 베드로 | 폴 | 2007 년 3 월 21 일 | 2 | 1983 년 4 월 1 일 |
104 | 알렉스 | 스튜어트 | 2008 년 2 월 1 일 | 2 | 1984 년 11 월 6 일 |
105 | 로버트 | 제임스 | 2008 년 1/4 월 | 삼 | 1984 년 12 월 1 일 |
다음 쿼리는 Joined Date별로 직원 테이블의 레코드를 정렬하고 Joined Date에 순위를 할당합니다.
SELECT EmployeeNo, JoinedDate,RANK()
OVER(ORDER BY JoinedDate) as Seniority
FROM Employee;
위 쿼리가 실행되면 다음과 같은 출력이 생성됩니다.
EmployeeNo JoinedDate Seniority
----------- ---------- -----------
101 2005-03-27 1
103 2007-03-21 2
102 2007-04-25 3
105 2008-01-04 4
104 2008-02-01 5
PARTITION BY 절은 PARTITION BY 절에 정의 된 열별로 데이터를 그룹화하고 각 그룹 내에서 OLAP 기능을 수행합니다. 다음은 PARTITION BY 절을 사용하는 쿼리의 예입니다.
SELECT EmployeeNo, JoinedDate,RANK()
OVER(PARTITION BY DeparmentNo ORDER BY JoinedDate) as Seniority
FROM Employee;
위 쿼리가 실행되면 다음과 같은 출력이 생성됩니다. 부서별로 랭크가 초기화되는 것을 확인할 수 있습니다.
EmployeeNo DepartmentNo JoinedDate Seniority
----------- ------------ ---------- -----------
101 1 2005-03-27 1
103 2 2007-03-21 1
102 2 2007-04-25 2
104 2 2008-02-01 3
105 3 2008-01-04 1
이 장에서는 Teradata에서 데이터 보호에 사용할 수있는 기능에 대해 설명합니다.
과도 저널
Teradata는 Transient Journal을 사용하여 트랜잭션 실패로부터 데이터를 보호합니다. 트랜잭션이 실행될 때마다 Transient 저널은 트랜잭션이 성공하거나 성공적으로 롤백 될 때까지 영향을받는 행의 이전 이미지 사본을 보관합니다. 그런 다음 이전 이미지가 삭제됩니다. 임시 저널은 각 AMP에 보관됩니다. 이는 자동 프로세스이며 비활성화 할 수 없습니다.
폴백
폴백은 폴백 AMP라고하는 다른 AMP에 테이블 행의 두 번째 사본을 저장하여 테이블 데이터를 보호합니다. 하나의 AMP가 실패하면 대체 행에 액세스합니다. 이를 통해 하나의 AMP가 실패하더라도 대체 AMP를 통해 데이터를 계속 사용할 수 있습니다. 폴백 옵션은 테이블 생성시 또는 테이블 생성 후에 사용할 수 있습니다. 폴백은 AMP 실패로부터 데이터를 보호하기 위해 테이블 행의 두 번째 사본이 항상 다른 AMP에 저장되도록합니다. 그러나 폴백은 삽입 / 삭제 / 업데이트를위한 스토리지 및 I / O의 두 배를 차지합니다.
다음 다이어그램은 행의 대체 사본이 다른 AMP에 저장되는 방식을 보여줍니다.
다운 AMP 복구 저널
Down AMP 복구 저널은 AMP가 실패하고 테이블이 폴백 보호되는 경우 활성화됩니다. 이 저널은 실패한 AMP의 데이터에 대한 모든 변경 사항을 추적합니다. 저널은 클러스터의 나머지 AMP에서 활성화됩니다. 이는 자동 프로세스이며 비활성화 할 수 없습니다. 실패한 AMP가 활성화되면 Down AMP 복구 저널의 데이터가 AMP와 동기화됩니다. 이 작업이 완료되면 저널이 삭제됩니다.
파벌
Clique는 노드 장애로부터 데이터를 보호하기 위해 Teradata에서 사용하는 메커니즘입니다. 파벌은 일반적인 디스크 어레이 세트를 공유하는 Teradata 노드 세트에 불과합니다. 노드에 장애가 발생하면 장애가 발생한 노드의 vproc이 파벌의 다른 노드로 마이그레이션되고 디스크 어레이에 계속 액세스합니다.
핫 스탠바이 노드
Hot Standby 노드는 프로덕션 환경에 참여하지 않는 노드입니다. 노드가 실패하면 실패한 노드의 vproc이 상시 대기 노드로 마이그레이션됩니다. 실패한 노드가 복구되면 상시 대기 노드가됩니다. 핫 스탠바이 노드는 노드 장애시 성능을 유지하는 데 사용됩니다.
RAID
RAID (Redundant Array of Independent Disks)는 디스크 오류로부터 데이터를 보호하는 데 사용되는 메커니즘입니다. 디스크 어레이는 논리 단위로 그룹화 된 디스크 세트로 구성됩니다. 이 장치는 사용자에게 단일 장치처럼 보일 수 있지만 여러 디스크에 분산되어있을 수 있습니다.
RAID 1은 일반적으로 Teradata에서 사용됩니다. RAID 1에서 각 디스크는 미러 디스크와 연결됩니다. 기본 디스크의 데이터 변경 사항은 미러 사본에도 반영됩니다. 기본 디스크에 오류가 발생하면 미러 디스크의 데이터에 액세스 할 수 있습니다.
이 장에서는 Teradata의 다양한 사용자 관리 전략에 대해 설명했습니다.
사용자
사용자는 CREATE USER 명령을 사용하여 생성됩니다. Teradata에서 사용자는 데이터베이스와도 유사합니다. 둘 다 공간을 할당 할 수 있으며 사용자에게 암호가 할당 된 것을 제외하고 데이터베이스 개체를 포함 할 수 있습니다.
통사론
다음은 CREATE USER의 구문입니다.
CREATE USER username
AS
[PERMANENT|PERM] = n BYTES
PASSWORD = password
TEMPORARY = n BYTES
SPOOL = n BYTES;
사용자를 만드는 동안 사용자 이름, 영구 공간 및 암호 값은 필수입니다. 다른 필드는 선택 사항입니다.
예
다음은 사용자 TD01을 생성하는 예입니다.
CREATE USER TD01
AS
PERMANENT = 1000000 BYTES
PASSWORD = ABC$124
TEMPORARY = 1000000 BYTES
SPOOL = 1000000 BYTES;
계정
새 사용자를 만드는 동안 사용자가 계정에 할당 될 수 있습니다. CREATE USER의 ACCOUNT 옵션은 계정을 할당하는 데 사용됩니다. 사용자는 여러 계정에 할당 될 수 있습니다.
통사론
다음은 계정 옵션이있는 CREATE USER의 구문입니다.
CREATE USER username
PERM = n BYTES
PASSWORD = password
ACCOUNT = accountid
예
다음 예에서는 사용자 TD02를 생성하고 계정을 IT 및 Admin으로 할당합니다.
CREATE USER TD02
AS
PERMANENT = 1000000 BYTES
PASSWORD = abc$123
TEMPORARY = 1000000 BYTES
SPOOL = 1000000 BYTES
ACCOUNT = (‘IT’,’Admin’);
사용자는 Teradata 시스템에 로그인하는 동안 또는 SET SESSION 명령을 사용하여 시스템에 로그인 한 후 계정 ID를 지정할 수 있습니다.
.LOGON username, passowrd,accountid
OR
SET SESSION ACCOUNT = accountid
권한 부여
GRANT 명령은 데이터베이스 개체에 대한 하나 이상의 권한을 사용자 또는 데이터베이스에 할당하는 데 사용됩니다.
통사론
다음은 GRANT 명령의 구문입니다.
GRANT privileges ON objectname TO username;
권한은 INSERT, SELECT, UPDATE, REFERENCES 일 수 있습니다.
예
다음은 GRANT 문의 예입니다.
GRANT SELECT,INSERT,UPDATE ON Employee TO TD01;
권한 취소
REVOKE 명령은 사용자 또는 데이터베이스에서 권한을 제거합니다. REVOKE 명령은 명시 적 권한 만 제거 할 수 있습니다.
통사론
다음은 REVOKE 명령의 기본 구문입니다.
REVOKE [ALL|privileges] ON objectname FROM username;
예
다음은 REVOKE 명령의 예입니다.
REVOKE INSERT,SELECT ON Employee FROM TD01;
이 장에서는 Teradata의 성능 조정 절차에 대해 설명합니다.
설명
성능 튜닝의 첫 번째 단계는 쿼리에서 EXPLAIN을 사용하는 것입니다. EXPLAIN 계획은 최적화 프로그램이 쿼리를 실행하는 방법에 대한 세부 정보를 제공합니다. 계획 설명에서 신뢰 수준, 사용 된 조인 전략, 스풀 파일 크기, 재배포 등과 같은 키워드를 확인합니다.
통계 수집
Optimizer는 데이터 인구 통계를 사용하여 효과적인 실행 전략을 제시합니다. COLLECT STATISTICS 명령은 테이블의 데이터 인구 통계를 수집하는 데 사용됩니다. 컬럼에서 수집 된 통계가 최신 상태인지 확인하십시오.
WHERE 절에서 사용되는 열과 조인 조건에서 사용되는 열에 대한 통계를 수집합니다.
Unique Primary Index 열에 대한 통계를 수집합니다.
고유하지 않은 보조 인덱스 열에 대한 통계를 수집합니다. Optimizer는 NUSI 또는 전체 테이블 스캔을 사용할 수 있는지 여부를 결정합니다.
기본 테이블에 대한 통계를 수집하더라도 Join Index에 대한 통계를 수집합니다.
분할 열에 대한 통계를 수집합니다.
데이터 유형
적절한 데이터 유형이 사용되었는지 확인하십시오. 이렇게하면 필요한 것보다 과도한 스토리지 사용을 방지 할 수 있습니다.
변환
조인 조건에 사용 된 열의 데이터 유형이 호환되는지 확인하여 명시 적 데이터 변환을 방지하십시오.
종류
필요하지 않은 경우 불필요한 ORDER BY 절을 제거하십시오.
스풀 공간 문제
쿼리가 해당 사용자에 대한 AMP 당 스풀 공간 제한을 초과하면 스풀 공간 오류가 생성됩니다. 계획 설명을 확인하고 더 많은 스풀 공간을 사용하는 단계를 식별하십시오. 이러한 중간 쿼리를 분할하고 별도로 배치하여 임시 테이블을 작성할 수 있습니다.
기본 색인
테이블에 대해 기본 인덱스가 올바르게 정의되었는지 확인하십시오. 기본 인덱스 열은 데이터를 균등하게 분산해야하며 데이터에 액세스하는 데 자주 사용해야합니다.
SET 테이블
SET 테이블을 정의하면 옵티마이 저는 삽입 된 모든 레코드에 대해 레코드가 중복되는지 확인합니다. 중복 검사 조건을 제거하기 위해 테이블에 대한 고유 보조 인덱스를 정의 할 수 있습니다.
큰 테이블에 대한 업데이트
큰 테이블을 업데이트하는 데 시간이 많이 걸립니다. 테이블을 업데이트하는 대신 레코드를 삭제하고 수정 된 행이있는 레코드를 삽입 할 수 있습니다.
임시 테이블 삭제
더 이상 필요하지 않은 경우 임시 테이블 (스테이징 테이블) 및 휘발성을 삭제하십시오. 이렇게하면 영구적 인 공간과 스풀 공간이 확보됩니다.
MULTISET 테이블
입력 레코드에 중복 레코드가없는 것이 확실하면 대상 테이블을 MULTISET 테이블로 정의하여 SET 테이블에서 사용하는 중복 행 검사를 방지 할 수 있습니다.
FastLoad 유틸리티는 빈 테이블에 데이터를로드하는 데 사용됩니다. 임시 저널을 사용하지 않기 때문에 데이터를 빠르게로드 할 수 있습니다. 대상 테이블이 MULTISET 테이블 인 경우에도 중복 행을로드하지 않습니다.
한정
대상 테이블에는 보조 인덱스, 조인 인덱스 및 외래 키 참조가 없어야합니다.
FastLoad의 작동 원리
FastLoad는 두 단계로 실행됩니다.
1 단계
구문 분석 엔진은 입력 파일에서 레코드를 읽고 각 AMP에 블록을 보냅니다.
각 AMP는 레코드 블록을 저장합니다.
그런 다음 AMP는 각 레코드를 해시하고 올바른 AMP에 재배포합니다.
1 단계가 끝나면 각 AMP에 행이 있지만 행 해시 시퀀스에 있지 않습니다.
2 단계
FastLoad가 END LOADING 문을 수신하면 2 단계가 시작됩니다.
각 AMP는 행 해시에서 레코드를 정렬하고 디스크에 기록합니다.
대상 테이블에 대한 잠금이 해제되고 오류 테이블이 삭제됩니다.
예
다음 레코드로 텍스트 파일을 만들고 파일 이름을 employee.txt로 지정합니다.
101,Mike,James,1980-01-05,2010-03-01,1
102,Robert,Williams,1983-03-05,2010-09-01,1
103,Peter,Paul,1983-04-01,2009-02-12,2
104,Alex,Stuart,1984-11-06,2014-01-01,2
105,Robert,James,1984-12-01,2015-03-09,3
다음은 위 파일을 Employee_Stg 테이블에로드하는 샘플 FastLoad 스크립트입니다.
LOGON 192.168.1.102/dbc,dbc;
DATABASE tduser;
BEGIN LOADING tduser.Employee_Stg
ERRORFILES Employee_ET, Employee_UV
CHECKPOINT 10;
SET RECORD VARTEXT ",";
DEFINE in_EmployeeNo (VARCHAR(10)),
in_FirstName (VARCHAR(30)),
in_LastName (VARCHAR(30)),
in_BirthDate (VARCHAR(10)),
in_JoinedDate (VARCHAR(10)),
in_DepartmentNo (VARCHAR(02)),
FILE = employee.txt;
INSERT INTO Employee_Stg (
EmployeeNo,
FirstName,
LastName,
BirthDate,
JoinedDate,
DepartmentNo
)
VALUES (
:in_EmployeeNo,
:in_FirstName,
:in_LastName,
:in_BirthDate (FORMAT 'YYYY-MM-DD'),
:in_JoinedDate (FORMAT 'YYYY-MM-DD'),
:in_DepartmentNo
);
END LOADING;
LOGOFF;
FastLoad 스크립트 실행
입력 파일 employee.txt가 생성되고 FastLoad 스크립트의 이름이 EmployeeLoad.fl로 지정되면 UNIX 및 Windows에서 다음 명령을 사용하여 FastLoad 스크립트를 실행할 수 있습니다.
FastLoad < EmployeeLoad.fl;
위의 명령이 실행되면 FastLoad 스크립트가 실행되고 로그를 생성합니다. 로그에서 FastLoad에 의해 처리 된 레코드 수와 상태 코드를 볼 수 있습니다.
**** 03:19:14 END LOADING COMPLETE
Total Records Read = 5
Total Error Table 1 = 0 ---- Table has been dropped
Total Error Table 2 = 0 ---- Table has been dropped
Total Inserts Applied = 5
Total Duplicate Rows = 0
Start: Fri Jan 8 03:19:13 2016
End : Fri Jan 8 03:19:14 2016
**** 03:19:14 Application Phase statistics:
Elapsed time: 00:00:01 (in hh:mm:ss)
0008 LOGOFF;
**** 03:19:15 Logging off all sessions
FastLoad 약관
다음은 FastLoad 스크립트에서 사용되는 일반적인 용어 목록입니다.
LOGON − Teradata에 로그인하고 하나 이상의 세션을 시작합니다.
DATABASE − 기본 데이터베이스를 설정합니다.
BEGIN LOADING −로드 할 테이블을 식별합니다.
ERRORFILES − 생성 / 업데이트해야하는 2 개의 오류 테이블을 식별합니다.
CHECKPOINT − 체크 포인트를받을시기를 정의합니다.
SET RECORD − 입력 파일 형식이 포맷, 바이너리, 텍스트 또는 포맷되지 않은지 지정합니다.
DEFINE − 입력 파일 레이아웃을 정의합니다.
FILE − 입력 파일 이름과 경로를 지정합니다.
INSERT − 입력 파일의 레코드를 대상 테이블에 삽입합니다.
END LOADING− FastLoad의 2 단계를 시작합니다. 레코드를 대상 테이블에 분배합니다.
LOGOFF − 모든 세션을 종료하고 FastLoad를 종료합니다.
MultiLoad는 한 번에 여러 테이블을로드 할 수 있으며 INSERT, DELETE, UPDATE 및 UPSERT와 같은 다양한 유형의 작업을 수행 할 수도 있습니다. 한 번에 최대 5 개의 테이블을로드 할 수 있으며 스크립트에서 최대 20 개의 DML 작업을 수행 할 수 있습니다. MultiLoad에는 대상 테이블이 필요하지 않습니다.
MultiLoad는 두 가지 모드를 지원합니다-
- IMPORT
- DELETE
MultiLoad에는 대상 테이블 외에 작업 테이블, 로그 테이블 및 두 개의 오류 테이블이 필요합니다.
Log Table − 다시 시작하는 데 사용될로드 중에 취해진 체크 포인트를 유지하는 데 사용됩니다.
Error Tables−이 테이블은 오류 발생시로드 중에 삽입됩니다. 첫 번째 오류 테이블은 변환 오류를 저장하고 두 번째 오류 테이블은 중복 레코드를 저장합니다.
Log Table − 재시작을 위해 MultiLoad의 각 단계에서 얻은 결과를 유지합니다.
Work table− MultiLoad 스크립트는 대상 테이블 당 하나의 작업 테이블을 생성합니다. 작업 테이블은 DML 작업과 입력 데이터를 유지하는 데 사용됩니다.
한정
MultiLoad에는 몇 가지 제한 사항이 있습니다.
- 고유 보조 인덱스가 대상 테이블에서 지원되지 않습니다.
- 참조 무결성이 지원되지 않습니다.
- 트리거는 지원되지 않습니다.
MultiLoad의 작동 원리
MultiLoad 가져 오기에는 5 단계가 있습니다.
Phase 1 − 예비 단계 – 기본 설정 작업을 수행합니다.
Phase 2 − DML 트랜잭션 단계 – DML 문의 구문을 확인하고 Teradata 시스템으로 가져옵니다.
Phase 3 − 획득 단계 – 입력 데이터를 작업 테이블로 가져오고 테이블을 잠급니다.
Phase 4 − 적용 단계 – 모든 DML 작업을 적용합니다.
Phase 5 − 정리 단계 – 테이블 잠금을 해제합니다.
MultiLoad 스크립트에 관련된 단계는 다음과 같습니다.
Step 1 − 로그 테이블을 설정합니다.
Step 2 − Teradata에 로그온합니다.
Step 3 − 목표, 작업 및 오류 테이블을 지정합니다.
Step 4 − INPUT 파일 레이아웃을 정의합니다.
Step 5 − DML 쿼리를 정의합니다.
Step 6 − IMPORT 파일의 이름을 지정합니다.
Step 7 − 사용할 LAYOUT을 지정합니다.
Step 8 −로드를 시작합니다.
Step 9 −로드를 완료하고 세션을 종료합니다.
예
다음 레코드로 텍스트 파일을 만들고 파일 이름을 employee.txt로 지정합니다.
101,Mike,James,1980-01-05,2010-03-01,1
102,Robert,Williams,1983-03-05,2010-09-01,1
103,Peter,Paul,1983-04-01,2009-02-12,2
104,Alex,Stuart,1984-11-06,2014-01-01,2
105,Robert,James,1984-12-01,2015-03-09,3
다음 예제는 직원 테이블에서 레코드를 읽고 Employee_Stg 테이블로로드하는 MultiLoad 스크립트입니다.
.LOGTABLE tduser.Employee_log;
.LOGON 192.168.1.102/dbc,dbc;
.BEGIN MLOAD TABLES Employee_Stg;
.LAYOUT Employee;
.FIELD in_EmployeeNo * VARCHAR(10);
.FIELD in_FirstName * VARCHAR(30);
.FIELD in_LastName * VARCHAR(30);
.FIELD in_BirthDate * VARCHAR(10);
.FIELD in_JoinedDate * VARCHAR(10);
.FIELD in_DepartmentNo * VARCHAR(02);
.DML LABEL EmpLabel;
INSERT INTO Employee_Stg (
EmployeeNo,
FirstName,
LastName,
BirthDate,
JoinedDate,
DepartmentNo
)
VALUES (
:in_EmployeeNo,
:in_FirstName,
:in_Lastname,
:in_BirthDate,
:in_JoinedDate,
:in_DepartmentNo
);
.IMPORT INFILE employee.txt
FORMAT VARTEXT ','
LAYOUT Employee
APPLY EmpLabel;
.END MLOAD;
LOGOFF;
MultiLoad 스크립트 실행
입력 파일 employee.txt가 생성되고 멀티로드 스크립트의 이름이 EmployeeLoad.ml로 지정되면 UNIX 및 Windows에서 다음 명령을 사용하여 멀티로드 스크립트를 실행할 수 있습니다.
Multiload < EmployeeLoad.ml;
FastExport 유틸리티는 Teradata 테이블의 데이터를 플랫 파일로 내보내는 데 사용됩니다. 보고서 형식으로 데이터를 생성 할 수도 있습니다. 조인을 사용하여 하나 이상의 테이블에서 데이터를 추출 할 수 있습니다. FastExport는 데이터를 64K 블록으로 내보내므로 대량의 데이터를 추출하는 데 유용합니다.
예
다음 Employee 테이블을 고려하십시오.
직원 아니요 | 이름 | 성 | 생일 |
---|---|---|---|
101 | 마이크 | 제임스 | 1980 년 1 월 5 일 |
104 | 알렉스 | 스튜어트 | 1984 년 11 월 6 일 |
102 | 로버트 | 윌리엄스 | 1983 년 3 월 5 일 |
105 | 로버트 | 제임스 | 1984 년 12 월 1 일 |
103 | 베드로 | 폴 | 1983 년 4 월 1 일 |
다음은 FastExport 스크립트의 예입니다. 직원 테이블에서 데이터를 내보내고 employeedata.txt 파일에 씁니다.
.LOGTABLE tduser.employee_log;
.LOGON 192.168.1.102/dbc,dbc;
DATABASE tduser;
.BEGIN EXPORT SESSIONS 2;
.EXPORT OUTFILE employeedata.txt
MODE RECORD FORMAT TEXT;
SELECT CAST(EmployeeNo AS CHAR(10)),
CAST(FirstName AS CHAR(15)),
CAST(LastName AS CHAR(15)),
CAST(BirthDate AS CHAR(10))
FROM
Employee;
.END EXPORT;
.LOGOFF;
FastExport 스크립트 실행
스크립트가 작성되고 employee.fx로 이름이 지정되면 다음 명령을 사용하여 스크립트를 실행할 수 있습니다.
fexp < employee.fx
위의 명령을 실행하면 employeedata.txt 파일에 다음 출력이 표시됩니다.
103 Peter Paul 1983-04-01
101 Mike James 1980-01-05
102 Robert Williams 1983-03-05
105 Robert James 1984-12-01
104 Alex Stuart 1984-11-06
FastExport 약관
다음은 FastExport 스크립트에서 일반적으로 사용되는 용어 목록입니다.
LOGTABLE − 재시작을위한 로그 테이블을 지정합니다.
LOGON − Teradata에 로그인하고 하나 이상의 세션을 시작합니다.
DATABASE − 기본 데이터베이스를 설정합니다.
BEGIN EXPORT − 내보내기 시작을 나타냅니다.
EXPORT − 대상 파일과 내보내기 형식을 지정합니다.
SELECT − 데이터를 내보낼 선택 쿼리를 지정합니다.
END EXPORT − FastExport의 끝을 지정합니다.
LOGOFF − 모든 세션을 종료하고 FastExport를 종료합니다.
BTEQ 유틸리티는 일괄 및 대화 형 모드 모두에서 사용할 수있는 Teradata의 강력한 유틸리티입니다. DDL 문, DML 문을 실행하고 매크로 및 저장 프로 시저를 만드는 데 사용할 수 있습니다. BTEQ는 플랫 파일에서 Teradata 테이블로 데이터를 가져 오는 데 사용할 수 있으며 테이블에서 파일 또는 보고서로 데이터를 추출하는 데 사용할 수도 있습니다.
BTEQ 용어
다음은 BTEQ 스크립트에서 일반적으로 사용되는 용어 목록입니다.
LOGON − Teradata 시스템에 로그인하는 데 사용됩니다.
ACTIVITYCOUNT − 이전 쿼리의 영향을받은 행 수를 반환합니다.
ERRORCODE − 이전 쿼리의 상태 코드를 반환합니다.
DATABASE − 기본 데이터베이스를 설정합니다.
LABEL − 일련의 SQL 명령에 레이블을 할당합니다.
RUN FILE − 파일에 포함 된 쿼리를 실행합니다.
GOTO − 제어를 레이블로 전송합니다.
LOGOFF − 데이터베이스에서 로그 오프하고 모든 세션을 종료합니다.
IMPORT − 입력 파일 경로를 지정합니다.
EXPORT − 출력 파일 경로를 지정하고 내보내기를 시작합니다.
예
다음은 샘플 BTEQ 스크립트입니다.
.LOGON 192.168.1.102/dbc,dbc;
DATABASE tduser;
CREATE TABLE employee_bkup (
EmployeeNo INTEGER,
FirstName CHAR(30),
LastName CHAR(30),
DepartmentNo SMALLINT,
NetPay INTEGER
)
Unique Primary Index(EmployeeNo);
.IF ERRORCODE <> 0 THEN .EXIT ERRORCODE;
SELECT * FROM
Employee
Sample 1;
.IF ACTIVITYCOUNT <> 0 THEN .GOTO InsertEmployee;
DROP TABLE employee_bkup;
.IF ERRORCODE <> 0 THEN .EXIT ERRORCODE;
.LABEL InsertEmployee
INSERT INTO employee_bkup
SELECT a.EmployeeNo,
a.FirstName,
a.LastName,
a.DepartmentNo,
b.NetPay
FROM
Employee a INNER JOIN Salary b
ON (a.EmployeeNo = b.EmployeeNo);
.IF ERRORCODE <> 0 THEN .EXIT ERRORCODE;
.LOGOFF;
위 스크립트는 다음 작업을 수행합니다.
Teradata System에 로그인합니다.
기본 데이터베이스를 설정합니다.
employee_bkup이라는 테이블을 생성합니다.
Employee 테이블에서 하나의 레코드를 선택하여 테이블에 레코드가 있는지 확인합니다.
테이블이 비어있는 경우 employee_bkup 테이블을 삭제합니다.
employee_bkup 테이블에 레코드를 삽입하는 Label InsertEmployee로 컨트롤을 전송합니다.
ERRORCODE를 확인하여 각 SQL 문 다음에 명령문이 성공적인지 확인합니다.
ACTIVITYCOUNT는 이전 SQL 쿼리에서 선택 / 영향을받은 레코드 수를 반환합니다.