Teradata-해싱 알고리즘
1 차 색인 값을 기반으로 특정 AMP에 행이 지정됩니다. Teradata는 해싱 알고리즘을 사용하여 행을 가져 오는 AMP를 결정합니다.
다음은 해싱 알고리즘에 대한 높은 수준의 다이어그램입니다.
다음은 데이터를 삽입하는 단계입니다.
클라이언트가 쿼리를 제출합니다.
파서는 쿼리를 수신하고 레코드의 PI 값을 해싱 알고리즘에 전달합니다.
해싱 알고리즘은 기본 인덱스 값을 해시하고 Row Hash라는 32 비트 숫자를 반환합니다.
행 해시의 상위 비트 (처음 16 비트)는 해시 맵 항목을 식별하는 데 사용됩니다. 해시 맵에는 하나의 AMP #이 포함됩니다. 해시 맵은 특정 AMP #을 포함하는 버킷의 배열입니다.
BYNET은 식별 된 AMP로 데이터를 보냅니다.
AMP는 32 비트 행 해시를 사용하여 디스크 내에서 행을 찾습니다.
행 해시가 동일한 레코드가 있으면 32 비트 숫자 인 고유성 ID를 증가시킵니다. 새 행 해시의 경우 고유성 ID는 1로 할당되고 동일한 행 해시가있는 레코드가 삽입 될 때마다 증가합니다.
행 해시와 고유성 ID의 조합을 행 ID라고합니다.
행 ID는 디스크의 각 레코드 앞에 붙습니다.
AMP의 각 테이블 행은 행 ID를 기준으로 논리적으로 정렬됩니다.
테이블 저장 방법
테이블은 행 ID (행 해시 + 고유성 ID)로 정렬 된 다음 AMP 내에 저장됩니다. 행 ID는 각 데이터 행과 함께 저장됩니다.
행 해시 | 고유성 ID | 직원 아니요 | 이름 | 성 |
---|---|---|---|---|
2A01 2611 | 0000 0001 | 101 | 마이크 | 제임스 |
2A01 2612 | 0000 0001 | 104 | 알렉스 | 스튜어트 |
2A01 2613 | 0000 0001 | 102 | 로버트 | 윌리엄스 |
2A01 2614 | 0000 0001 | 105 | 로버트 | 제임스 |
2A01 2615 | 0000 0001 | 103 | 베드로 | 폴 |