Teradata-성능 조정
이 장에서는 Teradata의 성능 조정 절차에 대해 설명합니다.
설명
성능 조정의 첫 번째 단계는 쿼리에서 EXPLAIN을 사용하는 것입니다. EXPLAIN 계획은 최적화 프로그램이 쿼리를 실행하는 방법에 대한 세부 정보를 제공합니다. 계획 설명에서 신뢰 수준, 사용 된 조인 전략, 스풀 파일 크기, 재배포 등과 같은 키워드를 확인합니다.
통계 수집
Optimizer는 데이터 인구 통계를 사용하여 효과적인 실행 전략을 제시합니다. COLLECT STATISTICS 명령은 테이블의 데이터 인구 통계를 수집하는 데 사용됩니다. 컬럼에서 수집 된 통계가 최신인지 확인하십시오.
WHERE 절에 사용 된 열과 결합 조건에 사용 된 열에 대한 통계를 수집합니다.
Unique Primary Index 열에 대한 통계를 수집합니다.
고유하지 않은 보조 인덱스 열에 대한 통계를 수집합니다. Optimizer는 NUSI 또는 전체 테이블 스캔을 사용할 수 있는지 여부를 결정합니다.
기본 테이블에 대한 통계를 수집하더라도 Join Index에 대한 통계를 수집합니다.
분할 열에 대한 통계를 수집합니다.
데이터 유형
적절한 데이터 유형이 사용되었는지 확인하십시오. 이렇게하면 필요한 것보다 과도한 스토리지 사용을 방지 할 수 있습니다.
변환
조인 조건에 사용 된 열의 데이터 유형이 호환되는지 확인하여 명시 적 데이터 변환을 방지하십시오.
종류
필요하지 않은 경우 불필요한 ORDER BY 절을 제거하십시오.
스풀 공간 문제
쿼리가 해당 사용자에 대한 AMP 당 스풀 공간 제한을 초과하면 스풀 공간 오류가 생성됩니다. 계획 설명을 확인하고 더 많은 스풀 공간을 사용하는 단계를 식별하십시오. 이러한 중간 쿼리를 분할하고 별도로 배치하여 임시 테이블을 작성할 수 있습니다.
기본 색인
테이블에 대해 기본 인덱스가 올바르게 정의되었는지 확인하십시오. 기본 인덱스 열은 데이터를 균등하게 분산해야하며 데이터에 액세스하는 데 자주 사용해야합니다.
SET 테이블
SET 테이블을 정의하면 옵티마이 저는 삽입 된 각 레코드에 대해 레코드가 중복되는지 확인합니다. 중복 검사 조건을 제거하기 위해 테이블에 대한 고유 보조 인덱스를 정의 할 수 있습니다.
큰 테이블에 대한 업데이트
큰 테이블을 업데이트하는 데 시간이 많이 걸립니다. 테이블을 업데이트하는 대신 레코드를 삭제하고 수정 된 행이있는 레코드를 삽입 할 수 있습니다.
임시 테이블 삭제
더 이상 필요하지 않은 경우 임시 테이블 (스테이징 테이블) 및 휘발성을 삭제하십시오. 이렇게하면 영구 공간과 스풀 공간이 확보됩니다.
MULTISET 테이블
입력 레코드에 중복 레코드가없는 것이 확실하면 대상 테이블을 MULTISET 테이블로 정의하여 SET 테이블에서 사용하는 중복 행 검사를 방지 할 수 있습니다.