Teradata-성능 조정

이 장에서는 Teradata의 성능 조정 절차에 대해 설명합니다.

설명

성능 조정의 첫 번째 단계는 쿼리에서 EXPLAIN을 사용하는 것입니다. EXPLAIN 계획은 최적화 프로그램이 쿼리를 실행하는 방법에 대한 세부 정보를 제공합니다. 계획 설명에서 신뢰 수준, 사용 된 조인 전략, 스풀 파일 크기, 재배포 등과 같은 키워드를 확인합니다.

통계 수집

Optimizer는 데이터 인구 통계를 사용하여 효과적인 실행 전략을 제시합니다. COLLECT STATISTICS 명령은 테이블의 데이터 인구 통계를 수집하는 데 사용됩니다. 컬럼에서 수집 된 통계가 최신인지 확인하십시오.

  • WHERE 절에 사용 된 열과 결합 조건에 사용 된 열에 대한 통계를 수집합니다.

  • Unique Primary Index 열에 대한 통계를 수집합니다.

  • 고유하지 않은 보조 인덱스 열에 대한 통계를 수집합니다. Optimizer는 NUSI 또는 전체 테이블 스캔을 사용할 수 있는지 여부를 결정합니다.

  • 기본 테이블에 대한 통계를 수집하더라도 Join Index에 대한 통계를 수집합니다.

  • 분할 열에 대한 통계를 수집합니다.

데이터 유형

적절한 데이터 유형이 사용되었는지 확인하십시오. 이렇게하면 필요한 것보다 과도한 스토리지 사용을 방지 할 수 있습니다.

변환

조인 조건에 사용 된 열의 데이터 유형이 호환되는지 확인하여 명시 적 데이터 변환을 방지하십시오.

종류

필요하지 않은 경우 불필요한 ORDER BY 절을 제거하십시오.

스풀 공간 문제

쿼리가 해당 사용자에 대한 AMP 당 스풀 공간 제한을 초과하면 스풀 공간 오류가 생성됩니다. 계획 설명을 확인하고 더 많은 스풀 공간을 사용하는 단계를 식별하십시오. 이러한 중간 쿼리를 분할하고 별도로 배치하여 임시 테이블을 작성할 수 있습니다.

기본 색인

테이블에 대해 기본 인덱스가 올바르게 정의되었는지 확인하십시오. 기본 인덱스 열은 데이터를 균등하게 분산해야하며 데이터에 액세스하는 데 자주 사용해야합니다.

SET 테이블

SET 테이블을 정의하면 옵티마이 저는 삽입 된 각 레코드에 대해 레코드가 중복되는지 확인합니다. 중복 검사 조건을 제거하기 위해 테이블에 대한 고유 보조 인덱스를 정의 할 수 있습니다.

큰 테이블에 대한 업데이트

큰 테이블을 업데이트하는 데 시간이 많이 걸립니다. 테이블을 업데이트하는 대신 레코드를 삭제하고 수정 된 행이있는 레코드를 삽입 할 수 있습니다.

임시 테이블 삭제

더 이상 필요하지 않은 경우 임시 테이블 (스테이징 테이블) 및 휘발성을 삭제하십시오. 이렇게하면 영구 공간과 스풀 공간이 확보됩니다.

MULTISET 테이블

입력 레코드에 중복 레코드가없는 것이 확실하면 대상 테이블을 MULTISET 테이블로 정의하여 SET 테이블에서 사용하는 중복 행 검사를 방지 할 수 있습니다.