Teradata - Guía rápida

¿Qué es Teradata?

Teradata es uno de los populares sistemas de gestión de bases de datos relacionales. Es principalmente adecuado para construir aplicaciones de almacenamiento de datos a gran escala. Teradata logra esto mediante el concepto de paralelismo. Está desarrollado por la empresa Teradata.

Historia de Teradata

A continuación se incluye un breve resumen de la historia de Teradata, que enumera los principales hitos.

  • 1979 - Se incorporó Teradata.

  • 1984 - Lanzamiento del primer ordenador de base de datos DBC / 1012.

  • 1986- La revista Fortune nombra a Teradata como 'Producto del año'.

  • 1999 - La base de datos más grande del mundo con Teradata con 130 Terabytes.

  • 2002 - Lanzamiento de Teradata V2R5 con índice primario de partición y compresión.

  • 2006 - Lanzamiento de la solución Teradata Master Data Management.

  • 2008 - Lanzamiento de Teradata 13.0 con Active Data Warehousing.

  • 2011 - Adquiere Teradata Aster y entra en Advanced Analytics Space.

  • 2012 - Introducción de Teradata 14.0.

  • 2014 - Introducción de Teradata 15.0.

Características de Teradata

A continuación se muestran algunas de las características de Teradata:

  • Unlimited Parallelism- El sistema de base de datos Teradata se basa en la arquitectura de procesamiento masivo paralelo (MPP). La arquitectura MPP divide la carga de trabajo de manera uniforme en todo el sistema. El sistema Teradata divide la tarea entre sus procesos y los ejecuta en paralelo para garantizar que la tarea se complete rápidamente.

  • Shared Nothing Architecture- La arquitectura de Teradata se denomina Arquitectura de nada compartido. Los nodos de Teradata, sus procesadores de módulo de acceso (AMP) y los discos asociados con AMP funcionan de forma independiente. No se comparten con otros.

  • Linear Scalability- Los sistemas de Teradata son altamente escalables. Pueden escalar hasta 2048 nodos. Por ejemplo, puede duplicar la capacidad del sistema duplicando la cantidad de AMP.

  • Connectivity - Teradata puede conectarse a sistemas conectados al canal, como los sistemas Mainframe o conectados a la red.

  • Mature Optimizer- El optimizador de Teradata es uno de los optimizadores maduros del mercado. Ha sido diseñado para ser paralelo desde sus inicios. Se ha perfeccionado para cada lanzamiento.

  • SQL- Teradata admite SQL estándar de la industria para interactuar con los datos almacenados en tablas. Además de esto, proporciona su propia extensión.

  • Robust Utilities - Teradata proporciona utilidades sólidas para importar / exportar datos desde / hacia el sistema Teradata, como FastLoad, MultiLoad, FastExport y TPT.

  • Automatic Distribution - Teradata distribuye automáticamente los datos de manera uniforme a los discos sin ninguna intervención manual.

Teradata proporciona Teradata express para VMWARE, que es una máquina virtual Teradata completamente operativa. Proporciona hasta 1 terabyte de almacenamiento. Teradata proporciona versiones de VMware de 40 GB y 1 TB.

Prerrequisitos

Dado que la máquina virtual es de 64 bits, su CPU debe admitir 64 bits.

Pasos de instalación para Windows

Step 1 - Descargue la versión de VM requerida desde el enlace, https://downloads.teradata.com/download/database/teradata-express-for-vmware-player

Step 2 - Extraiga el archivo y especifique la carpeta de destino.

Step 3 - Descargue el reproductor VMWare Workstation desde el enlace, https://my.vmware.com/web/vmware/downloads. Está disponible para Windows y Linux. Descargue el reproductor de estación de trabajo VMWARE para Windows.

Step 4 - Una vez que se complete la descarga, instale el software.

Step 5 - Una vez completada la instalación, ejecute el cliente VMWARE.

Step 6- Seleccione 'Abrir una máquina virtual'. Navegue por la carpeta Teradata VMWare extraída y seleccione el archivo con extensión .vmdk.

Step 7- Teradata VMWare se agrega al cliente VMWare. Seleccione el VMware de Teradata agregado y haga clic en 'Reproducir máquina virtual'.

Step 8 - Si aparece una ventana emergente sobre las actualizaciones de software, puede seleccionar 'Recordármelo más tarde'.

Step 9 - Ingrese el nombre de usuario como root, presione la tecla tab e ingrese la contraseña como root y nuevamente presione Enter.

Step 10- Una vez que aparezca la siguiente pantalla en el escritorio, haga doble clic en 'root's home'. Luego, haga doble clic en 'Genome's Terminal'. Esto abrirá el Shell.

Step 11- Desde el siguiente shell, ingrese el comando /etc/init.d/tpa start. Esto iniciará el servidor de Teradata.

Comenzando BTEQ

La utilidad BTEQ se utiliza para enviar consultas SQL de forma interactiva. Los siguientes son los pasos para iniciar la utilidad BTEQ.

Step 1 - Ingrese el comando / sbin / ifconfig y anote la dirección IP del VMWare.

Step 2- Ejecute el comando bteq. En el indicador de inicio de sesión, ingrese el comando.

Inicio de sesión <ipddress> / dbc, dbc; e ingrese En la solicitud de contraseña, ingrese la contraseña como dbc;

Puede iniciar sesión en el sistema Teradata usando BTEQ y ejecutar cualquier consulta SQL.

La arquitectura de Teradata se basa en la arquitectura de procesamiento masivo paralelo (MPP). Los componentes principales de Teradata son Parsing Engine, BYNET y Access Module Processors (AMP). El siguiente diagrama muestra la arquitectura de alto nivel de un nodo Teradata.

Componentes de Teradata

Los componentes clave de Teradata son los siguientes:

  • Node- Es la unidad básica en Teradata System. Cada servidor individual de un sistema Teradata se denomina Node. Un nodo consta de su propio sistema operativo, CPU, memoria, copia propia del software Teradata RDBMS y espacio en disco. Un gabinete consta de uno o más nodos.

  • Parsing Engine- Parsing Engine se encarga de recibir consultas del cliente y preparar un plan de ejecución eficiente. Las responsabilidades del motor de análisis son:

    • Reciba la consulta SQL del cliente

    • Analizar la consulta SQL para ver si hay errores de sintaxis

    • Verifique si el usuario ha requerido privilegios contra los objetos usados ​​en la consulta SQL

    • Verifique si los objetos utilizados en SQL realmente existen

    • Prepare el plan de ejecución para ejecutar la consulta SQL y pasarlo a BYNET

    • Recibe los resultados de los AMP y los envía al cliente

  • Message Passing Layer- La capa de paso de mensajes llamada BYNET, es la capa de red en el sistema Teradata. Permite la comunicación entre PE y AMP y también entre los nodos. Recibe el plan de ejecución de Parsing Engine y lo envía a AMP. De manera similar, recibe los resultados de los AMP y los envía al motor de análisis.

  • Access Module Processor (AMP)- Los AMP, llamados procesadores virtuales (vprocs) son los que realmente almacenan y recuperan los datos. Los AMP reciben los datos y el plan de ejecución de Parsing Engine, realizan cualquier tipo de conversión de datos, agregación, filtración, clasificación y almacenan los datos en los discos asociados con ellos. Los registros de las tablas se distribuyen uniformemente entre los AMP del sistema. Cada AMP está asociado con un conjunto de discos en los que se almacenan los datos. Solo ese AMP puede leer / escribir datos de los discos.

Arquitectura de almacenamiento

Cuando el cliente ejecuta consultas para insertar registros, el motor de análisis envía los registros a BYNET. BYNET recupera los registros y envía la fila al AMP de destino. AMP almacena estos registros en sus discos. El siguiente diagrama muestra la arquitectura de almacenamiento de Teradata.

Arquitectura de recuperación

Cuando el cliente ejecuta consultas para recuperar registros, el motor de análisis envía una solicitud a BYNET. BYNET envía la solicitud de recuperación a los AMP correspondientes. Luego, los AMP buscan sus discos en paralelo e identifican los registros requeridos y los envía a BYNET. Luego, BYNET envía los registros al motor de análisis, que a su vez los enviará al cliente. A continuación se muestra la arquitectura de recuperación de Teradata.

El sistema de gestión de bases de datos relacionales (RDBMS) es un software DBMS que ayuda a interactuar con las bases de datos. Usan lenguaje de consulta estructurado (SQL) para interactuar con los datos almacenados en tablas.

Base de datos

La base de datos es una colección de datos relacionados lógicamente. Muchos usuarios acceden a ellos para diferentes propósitos. Por ejemplo, una base de datos de ventas contiene información completa sobre las ventas que se almacena en muchas tablas.

Mesas

Tablas es la unidad básica en RDBMS donde se almacenan los datos. Una tabla es una colección de filas y columnas. A continuación se muestra un ejemplo de tabla de empleados.

Numero de empleado Primer nombre Apellido Fecha de nacimiento
101 Miguel James 5/1/1980
104 Alex Stuart 6/11/1984
102 Robert Williams 05/03/1983
105 Robert James 1/12/1984
103 Pedro Pablo 1/4/1983

Columnas

Una columna contiene datos similares. Por ejemplo, la columna Fecha de nacimiento en la tabla Empleado contiene información sobre la fecha de nacimiento de todos los empleados.

Fecha de nacimiento
5/1/1980
6/11/1984
05/03/1983
1/12/1984
1/4/1983

Fila

Row es una instancia de todas las columnas. Por ejemplo, en la tabla de empleados, una fila contiene información sobre un solo empleado.

Numero de empleado Primer nombre Apellido Fecha de nacimiento
101 Miguel James 5/1/1980

Clave primaria

La clave principal se utiliza para identificar de forma única una fila en una tabla. No se permiten valores duplicados en una columna de clave principal y no pueden aceptar valores NULL. Es un campo obligatorio en una tabla.

Clave externa

Las claves externas se utilizan para construir una relación entre las tablas. Una clave externa en una tabla secundaria se define como la clave principal en la tabla principal. Una tabla puede tener más de una clave externa. Puede aceptar valores duplicados y también valores nulos. Las claves externas son opcionales en una tabla.

Cada columna de una tabla está asociada con un tipo de datos. Los tipos de datos especifican qué tipo de valores se almacenarán en la columna. Teradata admite varios tipos de datos. A continuación se muestran algunos de los tipos de datos más utilizados.

Tipos de datos Longitud (bytes) Rango de valores
BYTEINT 1 -128 hasta +127
PEQUEÑO 2 -32768 al +32767
ENTERO 4 -2,147,483,648 al +2147,483,647
EMPEZANDO 8 -9,233,372,036,854,775,80 8 a +9,233,372,036,854,775,8 07
DECIMAL 1-16  
NUMÉRICO 1-16  
FLOTADOR 8 Formato IEEE
CARBONIZARSE Formato fijo 1-64.000
VARCHAR Variable 1-64.000
FECHA 4 AAAAMMDD
HORA 6 u 8 HHMMSS.nnnnnn or HHMMSS.nnnnnn + HHMM
TIMESTAMP 10 o 12 AAMMDDHHMMSS.nnnnnn or AAMMDDHHMMSS.nnnnnn + HHMM

Las tablas en el modelo relacional se definen como recopilación de datos. Se representan como filas y columnas.

Tipos de tablas

Tipos Teradata admite diferentes tipos de tablas.

  • Permanent Table - Esta es la tabla predeterminada y contiene datos insertados por el usuario y almacena los datos de forma permanente.

  • Volatile Table- Los datos insertados en una tabla volátil se retienen solo durante la sesión del usuario. La tabla y los datos se eliminan al final de la sesión. Estas tablas se utilizan principalmente para contener los datos intermedios durante la transformación de datos.

  • Global Temporary Table - La definición de tabla temporal global es persistente, pero los datos de la tabla se eliminan al final de la sesión del usuario.

  • Derived Table- La tabla derivada contiene los resultados intermedios en una consulta. Su duración está dentro de la consulta en la que se crean, utilizan y eliminan.

Establecer versus multiset

Teradata clasifica las tablas como tablas SET o MULTISET según cómo se manejan los registros duplicados. Una tabla definida como tabla SET no almacena los registros duplicados, mientras que la tabla MULTISET puede almacenar registros duplicados.

No Señor Comandos y descripción de la tabla
1 Crear mesa

El comando CREATE TABLE se utiliza para crear tablas en Teradata.

2 Modificar tabla

El comando ALTER TABLE se usa para agregar o quitar columnas de una tabla existente.

3 Mesa plegable

El comando DROP TABLE se utiliza para eliminar una tabla.

Este capítulo presenta los comandos SQL que se utilizan para manipular los datos almacenados en las tablas de Teradata.

Insertar registros

La instrucción INSERT INTO se utiliza para insertar registros en la tabla.

Sintaxis

A continuación se muestra la sintaxis genérica de INSERT INTO.

INSERT INTO <tablename> 
(column1, column2, column3,…) 
VALUES 
(value1, value2, value3 …);

Ejemplo

El siguiente ejemplo inserta registros en la tabla de empleados.

INSERT INTO Employee (
   EmployeeNo, 
   FirstName, 
   LastName, 
   BirthDate, 
   JoinedDate, 
   DepartmentNo 
)
VALUES ( 
   101, 
   'Mike', 
   'James', 
   '1980-01-05', 
   '2005-03-27', 
   01
);

Una vez que se inserta la consulta anterior, puede usar la instrucción SELECT para ver los registros de la tabla.

Numero de empleado Primer nombre Apellido JoinedDate Departamento No Fecha de nacimiento
101 Miguel James 27/03/2005 1 5/1/1980

Insertar desde otra tabla

La instrucción INSERT SELECT se utiliza para insertar registros de otra tabla.

Sintaxis

A continuación se muestra la sintaxis genérica de INSERT INTO.

INSERT INTO <tablename> 
(column1, column2, column3,…) 
SELECT 
column1, column2, column3… 
FROM  
<source table>;

Ejemplo

El siguiente ejemplo inserta registros en la tabla de empleados. Cree una tabla llamada Employee_Bkup con la misma definición de columna que la tabla de empleados antes de ejecutar la siguiente consulta de inserción.

INSERT INTO Employee_Bkup ( 
   EmployeeNo, 
   FirstName, 
   LastName, 
   BirthDate, 
   JoinedDate, 
   DepartmentNo 
) 
SELECT 
   EmployeeNo, 
   FirstName, 
   LastName, 
   BirthDate, 
   JoinedDate,
   DepartmentNo 
FROM  
   Employee;

Cuando se ejecuta la consulta anterior, insertará todos los registros de la tabla de empleados en la tabla employee_bkup.

Reglas

  • El número de columnas especificadas en la lista VALUES debe coincidir con las columnas especificadas en la cláusula INSERT INTO.

  • Los valores son obligatorios para las columnas NOT NULL.

  • Si no se especifican valores, se inserta NULL para los campos que aceptan valores NULL.

  • Los tipos de datos de las columnas especificados en la cláusula VALUES deben ser compatibles con los tipos de datos de las columnas de la cláusula INSERT.

Actualizar registros

La instrucción UPDATE se utiliza para actualizar los registros de la tabla.

Sintaxis

A continuación se muestra la sintaxis genérica de UPDATE.

UPDATE <tablename> 
SET <columnnamme> = <new value> 
[WHERE condition];

Ejemplo

El siguiente ejemplo actualiza el departamento de empleados a 03 para el empleado 101.

UPDATE Employee 
SET DepartmentNo = 03 
WHERE EmployeeNo = 101;

En el siguiente resultado, puede ver que DepartmentNo se actualiza de 1 a 3 para EmployeeNo 101.

SELECT Employeeno, DepartmentNo FROM Employee; 
*** Query completed. One row found. 2 columns returned. 
*** Total elapsed time was 1 second.  
EmployeeNo    DepartmentNo 
-----------  ------------- 
   101             3

Reglas

  • Puede actualizar uno o más valores de la tabla.

  • Si no se especifica la condición WHERE, todas las filas de la tabla se ven afectadas.

  • Puede actualizar una tabla con los valores de otra tabla.

Eliminar registros

La sentencia DELETE FROM se utiliza para actualizar los registros de la tabla.

Sintaxis

A continuación se muestra la sintaxis genérica de DELETE FROM.

DELETE FROM  <tablename> 
[WHERE condition];

Ejemplo

El siguiente ejemplo elimina el empleado 101 de la tabla empleado.

DELETE FROM Employee 
WHERE EmployeeNo = 101;

En el siguiente resultado, puede ver que el empleado 101 se elimina de la tabla.

SELECT EmployeeNo FROM Employee;  
*** Query completed. No rows found. 
*** Total elapsed time was 1 second.

Reglas

  • Puede actualizar uno o más registros de la tabla.

  • Si no se especifica la condición WHERE, se eliminan todas las filas de la tabla.

  • Puede actualizar una tabla con los valores de otra tabla.

La instrucción SELECT se usa para recuperar registros de una tabla.

Sintaxis

A continuación se muestra la sintaxis básica de la instrucción SELECT.

SELECT 
column 1, column 2, ..... 
FROM  
tablename;

Ejemplo

Considere la siguiente tabla de empleados.

Numero de empleado Primer nombre Apellido JoinedDate Departamento No Fecha de nacimiento
101 Miguel James 27/03/2005 1 5/1/1980
102 Robert Williams 25/4/2007 2 05/03/1983
103 Pedro Pablo 21/03/2007 2 1/4/1983
104 Alex Stuart 1/2/2008 2 6/11/1984
105 Robert James 1/4/2008 3 1/12/1984

A continuación se muestra un ejemplo de instrucción SELECT.

SELECT EmployeeNo,FirstName,LastName 
FROM Employee;

Cuando se ejecuta esta consulta, obtiene las columnas EmployeeNo, FirstName y LastName de la tabla de empleados.

EmployeeNo            FirstName                       LastName 
-----------  ------------------------------  --------------------------- 
   101                   Mike                            James 
   104                   Alex                            Stuart 
   102                   Robert                          Williams 
   105                   Robert                          James 
   103                   Peter                           Paul

Si desea obtener todas las columnas de una tabla, puede usar el siguiente comando en lugar de enumerar todas las columnas.

SELECT * FROM Employee;

La consulta anterior obtendrá todos los registros de la tabla de empleados.

Dónde cláusula

La cláusula WHERE se usa para filtrar los registros devueltos por la instrucción SELECT. Una condición está asociada con la cláusula WHERE. Solo se devuelven los registros que cumplen la condición de la cláusula WHERE.

Sintaxis

A continuación se muestra la sintaxis de la instrucción SELECT con la cláusula WHERE.

SELECT * FROM tablename 
WHERE[condition];

Ejemplo

La siguiente consulta obtiene registros donde EmployeeNo es 101.

SELECT * FROM Employee 
WHERE EmployeeNo = 101;

Cuando se ejecuta esta consulta, devuelve los siguientes registros.

EmployeeNo          FirstName                      LastName 
----------- ------------------------------ ----------------------------- 
   101                 Mike                           James

PEDIR POR

Cuando se ejecuta la instrucción SELECT, las filas devueltas no están en ningún orden específico. La cláusula ORDER BY se utiliza para organizar los registros en orden ascendente / descendente en cualquier columna.

Sintaxis

A continuación se muestra la sintaxis de la instrucción SELECT con la cláusula ORDER BY.

SELECT * FROM tablename 
ORDER BY column 1, column 2..;

Ejemplo

La siguiente consulta obtiene registros de la tabla de empleados y ordena los resultados por Nombre.

SELECT * FROM Employee 
ORDER BY FirstName;

Cuando se ejecuta la consulta anterior, produce el siguiente resultado.

EmployeeNo         FirstName                      LastName 
----------- ------------------------------ ----------------------------- 
    104               Alex                           Stuart 
    101               Mike                           James 
    103               Peter                          Paul 
    102               Robert                         Williams 
    105               Robert                         James

AGRUPAR POR

La cláusula GROUP BY se usa con la instrucción SELECT y organiza registros similares en grupos.

Sintaxis

A continuación se muestra la sintaxis de la instrucción SELECT con la cláusula GROUP BY.

SELECT column 1, column2 …. FROM tablename 
GROUP BY column 1, column 2..;

Ejemplo

El siguiente ejemplo agrupa los registros por columna DepartmentNo e identifica el recuento total de cada departamento.

SELECT DepartmentNo,Count(*) FROM   
Employee 
GROUP BY DepartmentNo;

Cuando se ejecuta la consulta anterior, produce el siguiente resultado.

DepartmentNo    Count(*) 
------------  ----------- 
     3             1 
     1             1 
     2             3

Teradata admite los siguientes operadores lógicos y condicionales. Estos operadores se utilizan para realizar comparaciones y combinar varias condiciones.

Sintaxis Sentido
> Mas grande que
< Menos que
>= Mayor qué o igual a
<= Menos que o igual a
= Igual a
BETWEEN Si los valores están dentro del rango
IN Si valores en <expresión>
NOT IN Si los valores no están en <expresión>
IS NULL Si el valor es NULO
IS NOT NULL Si el valor NO es NULO
AND Combine múltiples condiciones. Se evalúa como verdadero solo si se cumplen todas las condiciones
OR Combine múltiples condiciones. Se evalúa como verdadero solo si se cumple alguna de las condiciones.
NOT Invierte el significado de la condición.

ENTRE

El comando BETWEEN se usa para verificar si un valor está dentro de un rango de valores.

Ejemplo

Considere la siguiente tabla de empleados.

Numero de empleado Primer nombre Apellido JoinedDate Departamento No Fecha de nacimiento
101 Miguel James 27/03/2005 1 5/1/1980
102 Robert Williams 25/4/2007 2 05/03/1983
103 Pedro Pablo 21/03/2007 2 1/4/1983
104 Alex Stuart 1/2/2008 2 6/11/1984
105 Robert James 1/4/2008 3 1/12/1984

El siguiente ejemplo obtiene registros con números de empleados en el rango entre 101,102 y 103.

SELECT EmployeeNo, FirstName FROM  
Employee 
WHERE EmployeeNo BETWEEN 101 AND 103;

Cuando se ejecuta la consulta anterior, devuelve los registros de empleados con el número de empleado entre 101 y 103.

*** Query completed. 3 rows found. 2 columns returned. 
*** Total elapsed time was 1 second. 
 EmployeeNo            FirstName 
-----------  ------------------------------ 
   101                   Mike 
   102                   Robert 
   103                   Peter

EN

El comando IN se usa para comparar el valor con una lista de valores dada.

Ejemplo

El siguiente ejemplo obtiene registros con números de empleado en 101, 102 y 103.

SELECT EmployeeNo, FirstName FROM  
Employee 
WHERE EmployeeNo in (101,102,103);

La consulta anterior devuelve los siguientes registros.

*** Query completed. 3 rows found. 2 columns returned. 
*** Total elapsed time was 1 second.  
 EmployeeNo            FirstName 
-----------  ------------------------------ 
   101                   Mike 
   102                   Robert 
   103                   Peter

NO EN

El comando NOT IN invierte el resultado del comando IN. Obtiene registros con valores que no coinciden con la lista dada.

Ejemplo

El siguiente ejemplo obtiene registros con números de empleado que no están en 101, 102 y 103.

SELECT * FROM  
Employee 
WHERE EmployeeNo not in (101,102,103);

La consulta anterior devuelve los siguientes registros.

*** Query completed. 2 rows found. 6 columns returned. 
*** Total elapsed time was 1 second. 
 EmployeeNo          FirstName                      LastName 
----------- ------------------------------ -----------------------------    
    104                Alex                          Stuart 
    105                Robert                        James

Los operadores SET combinan los resultados de varias sentencias SELECT. Esto puede parecer similar a Joins, pero joins combina columnas de varias tablas, mientras que los operadores SET combinan filas de varias filas.

Reglas

  • El número de columnas de cada instrucción SELECT debe ser el mismo.

  • Los tipos de datos de cada SELECT deben ser compatibles.

  • ORDER BY debe incluirse solo en la declaración SELECT final.

UNIÓN

La declaración UNION se utiliza para combinar resultados de varias declaraciones SELECT. Ignora los duplicados.

Sintaxis

A continuación se muestra la sintaxis básica de la declaración UNION.

SELECT col1, col2, col3… 
FROM  
<table 1> 
[WHERE condition] 
UNION  

SELECT col1, col2, col3… 
FROM  
<table 2> 
[WHERE condition];

Ejemplo

Considere la siguiente tabla de empleados y salario.

Numero de empleado Primer nombre Apellido JoinedDate Departamento No Fecha de nacimiento
101 Miguel James 27/03/2005 1 5/1/1980
102 Robert Williams 25/4/2007 2 05/03/1983
103 Pedro Pablo 21/03/2007 2 1/4/1983
104 Alex Stuart 1/2/2008 2 6/11/1984
105 Robert James 1/4/2008 3 1/12/1984
Numero de empleado Bruto Deducción Salario neto
101 40.000 4000 36.000
102 80.000 6.000 74.000
103 90.000 7.000 83.000
104 75.000 5,000 70.000

La siguiente consulta UNION combina el valor EmployeeNo de la tabla Employee y Salario.

SELECT EmployeeNo 
FROM  
Employee 
UNION 

SELECT EmployeeNo 
FROM  
Salary;

Cuando se ejecuta la consulta, produce el siguiente resultado.

EmployeeNo 
----------- 
   101 
   102 
   103 
   104 
   105

UNIÓN TODOS

La declaración UNION ALL es similar a UNION, combina resultados de varias tablas, incluidas filas duplicadas.

Sintaxis

A continuación se muestra la sintaxis básica de la instrucción UNION ALL.

SELECT col1, col2, col3… 
FROM  
<table 1> 
[WHERE condition] 
UNION ALL 

SELECT col1, col2, col3…
FROM  
<table 2> 
[WHERE condition];

Ejemplo

A continuación se muestra un ejemplo de la declaración UNION ALL.

SELECT EmployeeNo 
FROM  
Employee 
UNION ALL 

SELECT EmployeeNo 
FROM  
Salary;

Cuando se ejecuta la consulta anterior, produce el siguiente resultado. Puede ver que también devuelve los duplicados.

EmployeeNo 
----------- 
    101 
    104 
    102 
    105 
    103 
    101 
    104 
    102 
    103

INTERSECARSE

El comando INTERSECT también se usa para combinar resultados de múltiples sentencias SELECT. Devuelve las filas de la primera instrucción SELECT que tiene una coincidencia correspondiente en las segundas instrucciones SELECT. En otras palabras, devuelve las filas que existen en ambas sentencias SELECT.

Sintaxis

A continuación se muestra la sintaxis básica de la instrucción INTERSECT.

SELECT col1, col2, col3… 
FROM  
<table 1>
[WHERE condition] 
INTERSECT 

SELECT col1, col2, col3… 
FROM  
<table 2> 
[WHERE condition];

Ejemplo

A continuación se muestra un ejemplo de instrucción INTERSECT. Devuelve los valores EmployeeNo que existen en ambas tablas.

SELECT EmployeeNo 
FROM  
Employee 
INTERSECT 

SELECT EmployeeNo 
FROM  
Salary;

Cuando se ejecuta la consulta anterior, devuelve los siguientes registros. EmployeeNo 105 está excluido ya que no existe en la tabla SALARY.

EmployeeNo 
----------- 
   101 
   104 
   102 
   103

MENOS / EXCEPTO

Los comandos MINUS / EXCEPT combinan filas de varias tablas y devuelven las filas que están en el primer SELECT pero no en el segundo SELECT. Ambos devuelven los mismos resultados.

Sintaxis

A continuación se muestra la sintaxis básica de la declaración MINUS.

SELECT col1, col2, col3… 
FROM  
<table 1> 
[WHERE condition] 
MINUS 

SELECT col1, col2, col3… 
FROM  
<table 2> 
[WHERE condition];

Ejemplo

A continuación se muestra un ejemplo de declaración MINUS.

SELECT EmployeeNo 
FROM  
Employee 
MINUS 

SELECT EmployeeNo 
FROM  
Salary;

Cuando se ejecuta esta consulta, devuelve el siguiente registro.

EmployeeNo 
----------- 
   105

Teradata proporciona varias funciones para manipular las cadenas. Estas funciones son compatibles con el estándar ANSI.

No Señor Función de cadena y descripción
1 ||

Concatena cadenas juntas

2 SUBSTR

Extrae una parte de una cadena (extensión Teradata)

3 SUBSTRING

Extrae una parte de una cadena (estándar ANSI)

4 INDEX

Localiza la posición de un carácter en una cadena (extensión Teradata)

5 POSITION

Localiza la posición de un carácter en una cadena (estándar ANSI)

6 TRIM

Recorta los espacios en blanco de una cuerda

7 UPPER

Convierte una cadena en mayúsculas

8 LOWER

Convierte una cadena en minúsculas

Ejemplo

La siguiente tabla enumera algunas de las funciones de cadena con los resultados.

Función de cadena Resultado
SELECCIONAR SUBSTRING ('almacén' DE 1 PARA 4) mercancía
SELECT SUBSTR ('almacén', 1,4) mercancía
SELECCIONAR 'datos' || '' || 'almacén' almacén de datos
SELECCIONAR SUPERIOR ('datos') DATOS
SELECCIONAR INFERIOR ('DATOS') datos

Este capítulo analiza las funciones de fecha / hora disponibles en Teradata.

Almacenamiento de fecha

Las fechas se almacenan como enteros internamente usando la siguiente fórmula.

((YEAR - 1900) * 10000) + (MONTH * 100) + DAY

Puede utilizar la siguiente consulta para comprobar cómo se almacenan las fechas.

SELECT CAST(CURRENT_DATE AS INTEGER);

Dado que las fechas se almacenan como números enteros, puede realizar algunas operaciones aritméticas en ellas. Teradata proporciona funciones para realizar estas operaciones.

EXTRAER

La función EXTRACT extrae porciones de día, mes y año de un valor de FECHA. Esta función también se utiliza para extraer la hora, los minutos y los segundos del valor de TIME / TIMESTAMP.

Ejemplo

Los siguientes ejemplos muestran cómo extraer los valores de Año, Mes, Fecha, Hora, Minuto y segundo de los valores de Fecha y Marca de tiempo.

SELECT EXTRACT(YEAR FROM CURRENT_DATE);  
EXTRACT(YEAR FROM Date) 
----------------------- 
        2016  
SELECT EXTRACT(MONTH FROM CURRENT_DATE);  
EXTRACT(MONTH FROM Date) 
------------------------ 
          1        
SELECT EXTRACT(DAY FROM CURRENT_DATE);  
EXTRACT(DAY FROM Date) 
------------------------ 
          1    
       
SELECT EXTRACT(HOUR FROM CURRENT_TIMESTAMP);  
EXTRACT(HOUR FROM Current TimeStamp(6)) 
--------------------------------------- 
                 4      
SELECT EXTRACT(MINUTE FROM CURRENT_TIMESTAMP);  
EXTRACT(MINUTE FROM Current TimeStamp(6)) 
----------------------------------------- 
                 54  
SELECT EXTRACT(SECOND FROM CURRENT_TIMESTAMP);  
EXTRACT(SECOND FROM Current TimeStamp(6)) 
----------------------------------------- 
              27.140000

INTERVALO

Teradata proporciona la función INTERVALO para realizar operaciones aritméticas en valores de FECHA y HORA. Hay dos tipos de funciones de INTERVALO.

Intervalo año-mes

  • YEAR
  • AÑO A MES
  • MONTH

Intervalo diurno

  • DAY
  • DÍA A HORA
  • DÍA A MINUTO
  • DÍA A SEGUNDO
  • HOUR
  • HORA A MINUTO
  • HORA AL SEGUNDO
  • MINUTE
  • MINUTO AL SEGUNDO
  • SECOND

Ejemplo

El siguiente ejemplo agrega 3 años a la fecha actual.

SELECT CURRENT_DATE, CURRENT_DATE + INTERVAL '03' YEAR; 
  Date    (Date+ 3) 
--------  --------- 
16/01/01   19/01/01

El siguiente ejemplo agrega 3 años y 01 mes a la fecha actual.

SELECT CURRENT_DATE, CURRENT_DATE + INTERVAL '03-01' YEAR TO MONTH; 
 Date     (Date+ 3-01) 
--------  ------------ 
16/01/01    19/02/01

El siguiente ejemplo agrega 01 día, 05 horas y 10 minutos a la marca de tiempo actual.

SELECT CURRENT_TIMESTAMP,CURRENT_TIMESTAMP + INTERVAL '01 05:10' DAY TO MINUTE; 
     Current TimeStamp(6)         (Current TimeStamp(6)+ 1 05:10) 
--------------------------------  -------------------------------- 
2016-01-01 04:57:26.360000+00:00  2016-01-02 10:07:26.360000+00:00

Teradata proporciona funciones integradas que son extensiones de SQL. A continuación se muestran las funciones integradas habituales.

Función Resultado
SELECCIONE FECHA; Fecha
--------
16/01/01
SELECT CURRENT_DATE; Fecha
--------
16/01/01
SELECCIONAR HORA; Hora
--------
04:50:29
SELECT CURRENT_TIME; Hora
--------
04:50:29
SELECT CURRENT_TIMESTAMP; Marca de tiempo actual (6)
--------------------------------
2016-01-01 04: 51: 06.990000 + 00: 00
SELECCIONAR BASE DE DATOS; Base de datos
------------------------------
TDUSER

Teradata admite funciones agregadas comunes. Se pueden usar con la instrucción SELECT.

  • COUNT - Cuenta las filas

  • SUM - Suma los valores de las columnas especificadas

  • MAX - Devuelve el valor grande de la columna especificada

  • MIN - Devuelve el valor mínimo de la columna especificada

  • AVG - Devuelve el valor promedio de la columna especificada

Ejemplo

Considere la siguiente tabla de sueldos.

Numero de empleado Bruto Deducción Salario neto
101 40.000 4000 36.000
104 75.000 5,000 70.000
102 80.000 6.000 74.000
105 70.000 4000 66.000
103 90.000 7.000 83.000

CONTAR

El siguiente ejemplo cuenta el número de registros en la tabla Salario.

SELECT count(*) from Salary;  

  Count(*) 
----------- 
    5

MAX

El siguiente ejemplo devuelve el valor del salario neto máximo del empleado.

SELECT max(NetPay) from Salary;   
   Maximum(NetPay) 
--------------------- 
       83000

MIN

El siguiente ejemplo devuelve el valor del salario neto mínimo del empleado de la tabla Salario.

SELECT min(NetPay) from Salary;   

   Minimum(NetPay) 
--------------------- 
        36000

AVG

El siguiente ejemplo devuelve el valor promedio del salario neto de los empleados de la tabla.

SELECT avg(NetPay) from Salary; 
  
   Average(NetPay) 
--------------------- 
       65800

SUMA

El siguiente ejemplo calcula la suma del salario neto de los empleados a partir de todos los registros de la tabla Salario.

SELECT sum(NetPay) from Salary;
  
   Sum(NetPay) 
----------------- 
     329000

Este capítulo explica las funciones CASE y COALESCE de Teradata.

Expresión CASE

La expresión CASE evalúa cada fila contra una condición o cláusula WHEN y devuelve el resultado de la primera coincidencia. Si no hay coincidencias, el resultado de ELSE parte de devuelto.

Sintaxis

A continuación se muestra la sintaxis de la expresión CASE.

CASE <expression> 
WHEN <expression> THEN result-1 
WHEN <expression> THEN result-2 

ELSE  
   Result-n 
END

Ejemplo

Considere la siguiente tabla de empleados.

Numero de empleado Primer nombre Apellido JoinedDate Departamento No Fecha de nacimiento
101 Miguel James 27/03/2005 1 5/1/1980
102 Robert Williams 25/4/2007 2 05/03/1983
103 Pedro Pablo 21/03/2007 2 1/4/1983
104 Alex Stuart 1/2/2008 2 6/11/1984
105 Robert James 1/4/2008 3 1/12/1984

El siguiente ejemplo evalúa la columna DepartmentNo y devuelve el valor 1 si el número de departamento es 1; devuelve 2 si el número de departamento es 3; de lo contrario, devuelve un valor como departamento no válido.

SELECT 
   EmployeeNo, 
CASE DepartmentNo 
   WHEN 1 THEN 'Admin' 
   WHEN 2 THEN 'IT' 
ELSE 'Invalid Dept'
   END AS Department 
FROM Employee;

Cuando se ejecuta la consulta anterior, produce el siguiente resultado.

*** Query completed. 5 rows found. 2 columns returned. 
*** Total elapsed time was 1 second. 
 EmployeeNo    Department 
-----------   ------------ 
   101         Admin 
   104         IT 
   102         IT 
   105         Invalid Dept 
   103         IT

La expresión CASE anterior también se puede escribir en la siguiente forma que producirá el mismo resultado que el anterior.

SELECT 
   EmployeeNo, 
CASE  
   WHEN DepartmentNo = 1 THEN 'Admin' 
   WHEN  DepartmentNo = 2 THEN 'IT' 
ELSE 'Invalid Dept' 
   END AS Department  
FROM Employee;

JUNTARSE

COALESCE es una declaración que devuelve el primer valor no nulo de la expresión. Devuelve NULL si todos los argumentos de la expresión se evalúan como NULL. A continuación se muestra la sintaxis.

Sintaxis

COALESCE(expression 1, expression 2, ....)

Ejemplo

SELECT 
   EmployeeNo, 
   COALESCE(dept_no, 'Department not found') 
FROM  
   employee;

NULLIF

La instrucción NULLIF devuelve NULL si los argumentos son iguales.

Sintaxis

A continuación se muestra la sintaxis de la declaración NULLIF.

NULLIF(expression 1, expression 2)

Ejemplo

El siguiente ejemplo devuelve NULL si DepartmentNo es igual a 3. De lo contrario, devuelve el valor DepartmentNo.

SELECT 
   EmployeeNo,  
   NULLIF(DepartmentNo,3) AS department 
FROM Employee;

La consulta anterior devuelve los siguientes registros. Puede ver que el empleado 105 tiene el número de departamento. como NULL.

*** Query completed. 5 rows found. 2 columns returned. 
*** Total elapsed time was 1 second. 
 EmployeeNo      department 
-----------  ------------------ 
    101              1 
    104              2 
    102              2 
    105              ? 
    103              2

El índice principal se utiliza para especificar dónde residen los datos en Teradata. Se utiliza para especificar qué AMP obtiene la fila de datos. Cada tabla en Teradata debe tener definido un índice principal. Si el índice principal no está definido, Teradata asigna automáticamente el índice principal. El índice primario proporciona la forma más rápida de acceder a los datos. Un primario puede tener un máximo de 64 columnas.

El índice principal se define al crear una tabla. Hay 2 tipos de índices primarios.

  • Índice primario único (UPI)
  • Índice primario no único (NUPI)

Índice primario único (UPI)

Si se define que la tabla tiene UPI, la columna considerada como UPI no debe tener valores duplicados. Si se insertan valores duplicados, se rechazarán.

Crear índice primario único

El siguiente ejemplo crea la tabla Salario con la columna EmployeeNo como índice principal único.

CREATE SET TABLE Salary ( 
   EmployeeNo INTEGER, 
   Gross INTEGER,  
   Deduction INTEGER, 
   NetPay INTEGER 
) 
UNIQUE PRIMARY INDEX(EmployeeNo);

Índice primario no único (NUPI)

Si se define que la tabla tiene NUPI, entonces la columna considerada como UPI puede aceptar valores duplicados.

Crear índice primario no exclusivo

El siguiente ejemplo crea la tabla de cuentas de empleados con la columna EmployeeNo como índice primario no exclusivo. EmployeeNo se define como índice primario no exclusivo, ya que un empleado puede tener varias cuentas en la tabla; uno para cuenta de sueldo y otro para cuenta de reembolso.

CREATE SET TABLE Employee _Accounts ( 
   EmployeeNo INTEGER, 
   employee_bank_account_type BYTEINT. 
   employee_bank_account_number INTEGER, 
   employee_bank_name VARCHAR(30), 
   employee_bank_city VARCHAR(30) 
) 
PRIMARY INDEX(EmployeeNo);

La combinación se utiliza para combinar registros de más de una tabla. Las tablas se unen según las columnas / valores comunes de estas tablas.

Hay diferentes tipos de combinaciones disponibles.

  • Unir internamente
  • Izquierda combinación externa
  • Unión externa derecha
  • Unión externa completa
  • Auto unión
  • Unión cruzada
  • Unión de producción cartesiana

UNIR INTERNAMENTE

Inner Join combina registros de varias tablas y devuelve los valores que existen en ambas tablas.

Sintaxis

A continuación se muestra la sintaxis de la instrucción INNER JOIN.

SELECT col1, col2, col3…. 
FROM  
Table-1 
INNER JOIN 
Table-2 
ON (col1 = col2) 
<WHERE condition>;

Ejemplo

Considere la siguiente tabla de empleados y salario.

Numero de empleado Primer nombre Apellido JoinedDate Departamento No Fecha de nacimiento
101 Miguel James 27/03/2005 1 5/1/1980
102 Robert Williams 25/4/2007 2 05/03/1983
103 Pedro Pablo 21/03/2007 2 1/4/1983
104 Alex Stuart 1/2/2008 2 6/11/1984
105 Robert James 1/4/2008 3 1/12/1984
Numero de empleado Bruto Deducción Salario neto
101 40.000 4000 36.000
102 80.000 6.000 74.000
103 90.000 7.000 83.000
104 75.000 5,000 70.000

La siguiente consulta une la tabla Empleado y la tabla Salario en la columna común EmployeeNo. A cada tabla se le asigna un alias A y B y se hace referencia a las columnas con el alias correcto.

SELECT A.EmployeeNo, A.DepartmentNo, B.NetPay 
FROM  
Employee A 
INNER JOIN 
Salary B 
ON (A.EmployeeNo = B. EmployeeNo);

Cuando se ejecuta la consulta anterior, devuelve los siguientes registros. El empleado 105 no se incluye en el resultado porque no tiene registros coincidentes en la tabla Salario.

*** Query completed. 4 rows found. 3 columns returned. 
*** Total elapsed time was 1 second. 
 EmployeeNo   DepartmentNo     NetPay 
-----------  ------------   ----------- 
    101           1            36000 
    102           2            74000 
    103           2            83000 
    104           2            70000

ÚNETE EXTERIOR

LEFT OUTER JOIN y RIGHT OUTER JOIN también combinan los resultados de varias tablas.

  • LEFT OUTER JOIN devuelve todos los registros de la tabla de la izquierda y devuelve solo los registros coincidentes de la tabla de la derecha.

  • RIGHT OUTER JOIN devuelve todos los registros de la tabla de la derecha y devuelve solo las filas coincidentes de la tabla de la izquierda.

  • FULL OUTER JOINcombina los resultados de las UNIONES EXTERIOR IZQUIERDA y EXTERIOR DERECHA. Devuelve filas coincidentes y no coincidentes de las tablas unidas.

Sintaxis

A continuación se muestra la sintaxis de la instrucción OUTER JOIN. Debe utilizar una de las opciones de LEFT OUTER JOIN, RIGHT OUTER JOIN o FULL OUTER JOIN.

SELECT col1, col2, col3…. 
FROM  
Table-1 
LEFT OUTER JOIN/RIGHT OUTER JOIN/FULL OUTER JOIN 
Table-2 
ON (col1 = col2) 
<WHERE condition>;

Ejemplo

Considere el siguiente ejemplo de la consulta LEFT OUTER JOIN. Devuelve todos los registros de la tabla Empleado y los registros coincidentes de la tabla Salario.

SELECT A.EmployeeNo, A.DepartmentNo, B.NetPay 
FROM  
Employee A 
LEFT OUTER JOIN 
Salary B 
ON (A.EmployeeNo = B. EmployeeNo) 
ORDER BY A.EmployeeNo;

Cuando se ejecuta la consulta anterior, produce el siguiente resultado. Para el empleado 105, el valor de NetPay es NULO, ya que no tiene registros coincidentes en la tabla Salario.

*** Query completed. 5 rows found. 3 columns returned. 
*** Total elapsed time was 1 second. 
 EmployeeNo  DepartmentNo     NetPay 
-----------  ------------   ----------- 
    101           1           36000 
    102           2           74000 
    103           2           83000 
    104           2           70000 
    105           3             ?

ÚNETE CRUZADO

Cross Join une todas las filas de la tabla de la izquierda a todas las filas de la tabla de la derecha.

Sintaxis

A continuación se muestra la sintaxis de la instrucción CROSS JOIN.

SELECT A.EmployeeNo, A.DepartmentNo, B.EmployeeNo,B.NetPay 
FROM  
Employee A 
CROSS JOIN 
Salary B 
WHERE A.EmployeeNo = 101 
ORDER BY B.EmployeeNo;

Cuando se ejecuta la consulta anterior, produce el siguiente resultado. El empleado nº 101 de la tabla de empleados se une a todos y cada uno de los registros de la tabla de sueldos.

*** Query completed. 4 rows found. 4 columns returned. 
*** Total elapsed time was 1 second. 
 EmployeeNo  DepartmentNo   EmployeeNo    NetPay 
-----------  ------------  -----------  ----------- 
    101           1            101         36000 
    101           1            104         70000 
    101           1            102         74000 
    101           1            103         83000

Una subconsulta devuelve registros de una tabla en función de los valores de otra tabla. Es una consulta SELECT dentro de otra consulta. La consulta SELECT llamada como consulta interna se ejecuta primero y el resultado es utilizado por la consulta externa. Algunas de sus características más destacadas son:

  • Una consulta puede tener varias subconsultas y las subconsultas pueden contener otra subconsulta.

  • Las subconsultas no devuelven registros duplicados.

  • Si la subconsulta devuelve solo un valor, puede usar el operador = para usarlo con la consulta externa. Si devuelve varios valores, puede usar IN o NOT IN.

Sintaxis

A continuación se muestra la sintaxis genérica de las subconsultas.

SELECT col1, col2, col3,… 
FROM  
Outer Table 
WHERE col1 OPERATOR ( Inner SELECT Query);

Ejemplo

Considere la siguiente tabla de sueldos.

Numero de empleado Bruto Deducción Salario neto
101 40.000 4000 36.000
102 80.000 6.000 74.000
103 90.000 7.000 83.000
104 75.000 5,000 70.000

La siguiente consulta identifica el número de empleado con el salario más alto. El SELECT interno realiza la función de agregación para devolver el valor máximo de NetPay y la consulta SELECT externa usa este valor para devolver el registro del empleado con este valor.

SELECT EmployeeNo, NetPay 
FROM Salary 
WHERE NetPay =  
(SELECT MAX(NetPay)  
FROM Salary);

Cuando se ejecuta esta consulta, produce el siguiente resultado.

*** Query completed. One row found. 2 columns returned. 
*** Total elapsed time was 1 second.  
 EmployeeNo     NetPay 
-----------  ----------- 
    103         83000

Teradata admite los siguientes tipos de tablas para almacenar datos temporales.

  • Tabla derivada
  • Mesa volátil
  • Tabla temporal global

Tabla derivada

Las tablas derivadas se crean, utilizan y eliminan dentro de una consulta. Se utilizan para almacenar resultados intermedios dentro de una consulta.

Ejemplo

El siguiente ejemplo crea una tabla derivada EmpSal con registros de empleados con salario superior a 75000.

SELECT 
Emp.EmployeeNo, 
Emp.FirstName, 
Empsal.NetPay 
FROM 
Employee Emp, 
(select EmployeeNo , NetPay 
from Salary
where NetPay >= 75000) Empsal 
where Emp.EmployeeNo = Empsal.EmployeeNo;

Cuando se ejecuta la consulta anterior, devuelve los empleados con salario superior a 75000.

*** Query completed. One row found. 3 columns returned. 
*** Total elapsed time was 1 second. 
 EmployeeNo            FirstName               NetPay 
-----------  ------------------------------  ----------- 
    103                  Peter                 83000

Mesa volátil

Las tablas volátiles se crean, utilizan y eliminan dentro de una sesión de usuario. Su definición no se almacena en el diccionario de datos. Contienen datos intermedios de la consulta que se utilizan con frecuencia. A continuación se muestra la sintaxis.

Sintaxis

CREATE [SET|MULTISET] VOALTILE TABLE tablename 
<table definitions> 
<column definitions> 
<index definitions> 
ON COMMIT [DELETE|PRESERVE] ROWS

Ejemplo

CREATE VOLATILE TABLE dept_stat ( 
   dept_no INTEGER, 
   avg_salary INTEGER, 
   max_salary INTEGER, 
   min_salary INTEGER 
) 
PRIMARY INDEX(dept_no) 
ON COMMIT PRESERVE ROWS;

Cuando se ejecuta la consulta anterior, produce el siguiente resultado.

*** Table has been created. 
*** Total elapsed time was 1 second.

Tabla temporal global

La definición de tabla temporal global se almacena en el diccionario de datos y puede ser utilizada por muchos usuarios / sesiones. Pero los datos cargados en la tabla temporal global se retienen solo durante la sesión. Puede materializar hasta 2000 tablas temporales globales por sesión. A continuación se muestra la sintaxis.

Sintaxis

CREATE [SET|MULTISET] GLOBAL TEMPORARY TABLE tablename 
<table definitions> 
<column definitions> 
<index definitions>

Ejemplo

CREATE SET GLOBAL TEMPORARY TABLE dept_stat ( 
   dept_no INTEGER, 
   avg_salary INTEGER, 
   max_salary INTEGER, 
   min_salary INTEGER 
) 
PRIMARY INDEX(dept_no);

Cuando se ejecuta la consulta anterior, produce el siguiente resultado.

*** Table has been created. 
*** Total elapsed time was 1 second.

Hay tres tipos de espacios disponibles en Teradata.

Espacio permanente

El espacio permanente es la cantidad máxima de espacio disponible para que el usuario / base de datos contenga filas de datos. Las tablas permanentes, los diarios, las tablas de respaldo y las subtablas de índices secundarios utilizan un espacio permanente.

El espacio permanente no está preasignado para la base de datos / usuario. Simplemente se definen como la cantidad máxima de espacio que la base de datos / usuario puede usar. La cantidad de espacio permanente se divide por la cantidad de AMP. Siempre que se excede el límite por AMP, se genera un mensaje de error.

Espacio del carrete

El espacio de spool es el espacio permanente no utilizado que utiliza el sistema para mantener los resultados intermedios de la consulta SQL. Los usuarios sin espacio en el spool no pueden ejecutar ninguna consulta.

Al igual que en el espacio permanente, el espacio de la cola define la cantidad máxima de espacio que puede utilizar el usuario. El espacio del spool se divide por el número de AMP. Siempre que se exceda el límite de AMP, el usuario recibirá un error de espacio en la cola de impresión.

Espacio de temperatura

El espacio temporal es el espacio permanente no utilizado que utilizan las tablas temporales globales. El espacio temporal también se divide por el número de AMP.

Una tabla puede contener solo un índice principal. Más a menudo, se encontrará con escenarios en los que la tabla contiene otras columnas, mediante las cuales se accede con frecuencia a los datos. Teradata realizará un escaneo completo de la tabla para esas consultas. Los índices secundarios resuelven este problema.

Los índices secundarios son una ruta alternativa para acceder a los datos. Existen algunas diferencias entre el índice primario y el índice secundario.

  • El índice secundario no participa en la distribución de datos.

  • Los valores de índice secundarios se almacenan en subtablas. Estas tablas están integradas en todos los AMP.

  • Los índices secundarios son opcionales.

  • Se pueden crear durante la creación de la tabla o después de que se crea una tabla.

  • Ocupan espacio adicional ya que construyen sub-tablas y también requieren mantenimiento ya que las sub-tablas necesitan actualizarse para cada nueva fila.

Hay dos tipos de índices secundarios:

  • Índice secundario único (USI)
  • Índice secundario no exclusivo (NUSI)

Índice secundario único (USI)

Un índice secundario único permite solo valores únicos para las columnas definidas como USI. Acceder a la fila por USI es una operación de dos amperios.

Crear índice secundario único

El siguiente ejemplo crea USI en la columna EmployeeNo de la tabla de empleados.

CREATE UNIQUE INDEX(EmployeeNo) on employee;

Índice secundario no único (NUSI)

Un índice secundario no exclusivo permite valores duplicados para las columnas definidas como NUSI. El acceso a la fila por NUSI es una operación de amplificador total.

Crear índice secundario no exclusivo

El siguiente ejemplo crea NUSI en la columna FirstName de la tabla de empleados.

CREATE INDEX(FirstName) on Employee;

El optimizador de Teradata presenta una estrategia de ejecución para cada consulta SQL. Esta estrategia de ejecución se basa en las estadísticas recopiladas en las tablas utilizadas dentro de la consulta SQL. Las estadísticas de la tabla se recopilan mediante el comando COLLECT STATISTICS. Optimizer requiere información del entorno y datos demográficos para elaborar una estrategia de ejecución óptima.

Información medioambiental

  • Número de nodos, AMP y CPU
  • Cantidad de memoria

Datos demográficos

  • Número de filas
  • Tamaño de fila
  • Rango de valores en la tabla
  • Número de filas por valor
  • Número de nulos

Hay tres enfoques para recopilar estadísticas sobre la mesa.

  • Muestreo de AMP aleatorio
  • Recopilación completa de estadísticas
  • Usando la opción SAMPLE

Recopilación de estadísticas

El comando COLLECT STATISTICS se utiliza para recopilar estadísticas en una tabla.

Sintaxis

A continuación se muestra la sintaxis básica para recopilar estadísticas en una tabla.

COLLECT [SUMMARY] STATISTICS   
INDEX (indexname) COLUMN (columnname) 
ON <tablename>;

Ejemplo

El siguiente ejemplo recopila estadísticas sobre la columna EmployeeNo de la tabla Employee.

COLLECT STATISTICS COLUMN(EmployeeNo) ON Employee;

Cuando se ejecuta la consulta anterior, produce el siguiente resultado.

*** Update completed. 2 rows changed. 
*** Total elapsed time was 1 second.

Visualización de estadísticas

Puede ver las estadísticas recopiladas mediante el comando HELP STATISTICS.

Sintaxis

A continuación se muestra la sintaxis para ver las estadísticas recopiladas.

HELP STATISTICS <tablename>;

Ejemplo

A continuación, se muestra un ejemplo para ver las estadísticas recopiladas en la tabla Empleado.

HELP STATISTICS employee;

Cuando se ejecuta la consulta anterior, produce el siguiente resultado.

Date       Time      Unique Values           Column Names 
--------   -------- -------------------- ----------------------- 
16/01/01   08:07:04         5                       * 
16/01/01   07:24:16         3                   DepartmentNo 
16/01/01   08:07:04         5                   EmployeeNo

La compresión se utiliza para reducir el almacenamiento utilizado por las tablas. En Teradata, la compresión puede comprimir hasta 255 valores distintos, incluido NULL. Dado que el almacenamiento se reduce, Teradata puede almacenar más registros en un bloque. Esto da como resultado un tiempo de respuesta de consulta mejorado, ya que cualquier operación de E / S puede procesar más filas por bloque. La compresión se puede agregar en la creación de la tabla usando CREATE TABLE o después de la creación de la tabla usando el comando ALTER TABLE.

Limitaciones

  • Solo se pueden comprimir 255 valores por columna.
  • La columna de índice principal no se puede comprimir.
  • Las tablas volátiles no se pueden comprimir.

Compresión de valores múltiples (MVC)

La siguiente tabla comprime el campo DepatmentNo para los valores 1, 2 y 3. Cuando se aplica compresión en una columna, los valores de esta columna no se almacenan con la fila. En cambio, los valores se almacenan en el encabezado de la tabla en cada AMP y solo se agregan bits de presencia a la fila para indicar el valor.

CREATE SET TABLE employee ( 
   EmployeeNo integer, 
   FirstName CHAR(30), 
   LastName CHAR(30), 
   BirthDate DATE FORMAT 'YYYY-MM-DD-', 
   JoinedDate DATE FORMAT 'YYYY-MM-DD-', 
   employee_gender CHAR(1), 
   DepartmentNo CHAR(02) COMPRESS(1,2,3) 
) 
UNIQUE PRIMARY INDEX(EmployeeNo);

La compresión de varios valores se puede utilizar cuando tiene una columna en una tabla grande con valores finitos.

El comando EXPLAIN devuelve el plan de ejecución del motor de análisis en inglés. Se puede utilizar con cualquier instrucción SQL excepto en otro comando EXPLAIN. Cuando una consulta va precedida del comando EXPLAIN, el plan de ejecución del motor de análisis se devuelve al usuario en lugar de los AMP.

Ejemplos de EXPLAIN

Considere la tabla Empleado con la siguiente definición.

CREATE SET TABLE EMPLOYEE,FALLBACK ( 
   EmployeeNo INTEGER, 
   FirstName VARCHAR(30), 
   LastName VARCHAR(30),
   DOB DATE FORMAT 'YYYY-MM-DD', 
   JoinedDate DATE FORMAT 'YYYY-MM-DD', 
   DepartmentNo BYTEINT 
) 
UNIQUE PRIMARY INDEX ( EmployeeNo );

A continuación se ofrecen algunos ejemplos del plan EXPLAIN.

Escaneo de tabla completa (FTS)

Cuando no se especifican condiciones en la instrucción SELECT, el optimizador puede optar por utilizar la exploración de tabla completa donde se accede a todas y cada una de las filas de la tabla.

Ejemplo

A continuación se muestra una consulta de muestra en la que el optimizador puede elegir FTS.

EXPLAIN SELECT * FROM employee;

Cuando se ejecuta la consulta anterior, produce el siguiente resultado. Como se puede ver, el optimizador elige acceder a todos los AMP y a todas las filas dentro del AMP.

1) First, we lock a distinct TDUSER."pseudo table" for read on a 
   RowHash to prevent global deadlock for TDUSER.employee.  
2) Next, we lock TDUSER.employee for read.  
3) We do an all-AMPs RETRIEVE step from TDUSER.employee by way of an
   all-rows scan with no residual conditions into Spool 1 
   (group_amps), which is built locally on the AMPs.  The size of 
   Spool 1 is estimated with low confidence to be 2 rows (116 bytes).  
   The estimated time for this step is 0.03 seconds.  
4) Finally, we send out an END TRANSACTION step to all AMPs involved 
   in processing the request. 
→ The contents of Spool 1 are sent back to the user as the result of 
   statement 1.  The total estimated time is 0.03 seconds.

Índice primario único

Cuando se accede a las filas mediante el índice principal único, se trata de una operación de AMP.

EXPLAIN SELECT * FROM employee WHERE EmployeeNo = 101;

Cuando se ejecuta la consulta anterior, produce el siguiente resultado. Como puede verse, se trata de una recuperación de un solo AMP y el optimizador está utilizando el índice principal único para acceder a la fila.

1) First, we do a single-AMP RETRIEVE step from TDUSER.employee by 
   way of the unique primary index "TDUSER.employee.EmployeeNo = 101" 
   with no residual conditions. The estimated time for this step is 
   0.01 seconds.  
→ The row is sent directly back to the user as the result of 
   statement 1.  The total estimated time is 0.01 seconds.

Índice secundario único

Cuando se accede a las filas mediante el índice secundario único, es una operación de dos amperios.

Ejemplo

Considere la tabla Salario con la siguiente definición.

CREATE SET TABLE SALARY,FALLBACK ( 
   EmployeeNo INTEGER, 
   Gross INTEGER, 
   Deduction INTEGER, 
   NetPay INTEGER 
)
PRIMARY INDEX ( EmployeeNo ) 
UNIQUE INDEX (EmployeeNo);

Considere la siguiente declaración SELECT.

EXPLAIN SELECT * FROM Salary WHERE EmployeeNo = 101;

Cuando se ejecuta la consulta anterior, produce el siguiente resultado. Como puede verse, el optimizador recupera la fila en la operación de dos amperios utilizando un índice secundario único.

1) First, we do a two-AMP RETRIEVE step from TDUSER.Salary 
   by way of unique index # 4 "TDUSER.Salary.EmployeeNo = 
   101" with no residual conditions.  The estimated time for this 
   step is 0.01 seconds.  
→ The row is sent directly back to the user as the result of 
   statement 1.  The total estimated time is 0.01 seconds.

Terminos adicionales

A continuación se muestra la lista de términos que se ven comúnmente en el plan EXPLAIN.

... (Last Use) …

Ya no se necesita un archivo de cola y se publicará cuando se complete este paso.

... with no residual conditions …

Se han aplicado todas las condiciones aplicables a las filas.

... END TRANSACTION …

Se liberan los bloqueos de transacciones y se confirman los cambios.

... eliminating duplicate rows ...

Las filas duplicadas solo existen en archivos de cola, no en tablas establecidas. Haciendo una operación DISTINTA.

... by way of a traversal of index #n extracting row ids only …

Se crea un archivo de cola que contiene los ID de fila que se encuentran en un índice secundario (índice #n)

... we do a SMS (set manipulation step) …

Combinar filas mediante un operador UNION, MINUS o INTERSECT.

... which is redistributed by hash code to all AMPs.

Redistribuir datos en preparación para una combinación.

... which is duplicated on all AMPs.

Duplicar datos de la tabla más pequeña (en términos de SPOOL) en preparación para una combinación.

... (one_AMP) or (group_AMPs)

Indica que se utilizará un AMP o un subconjunto de AMP en lugar de todos los AMP.

Se asigna una fila a un AMP en particular según el valor del índice principal. Teradata usa un algoritmo hash para determinar qué AMP obtiene la fila.

A continuación se muestra un diagrama de alto nivel sobre el algoritmo hash.

Los siguientes son los pasos para insertar los datos.

  • El cliente envía una consulta.

  • El analizador recibe la consulta y pasa el valor PI del registro al algoritmo hash.

  • El algoritmo hash calcula el valor del índice principal y devuelve un número de 32 bits, llamado Row Hash.

  • Los bits de orden superior del hash de fila (primeros 16 bits) se utilizan para identificar la entrada del mapa de hash. El mapa hash contiene un AMP #. El mapa hash es una matriz de depósitos que contiene un número de AMP específico.

  • BYNET envía los datos al AMP identificado.

  • AMP usa el hash de fila de 32 bits para ubicar la fila dentro de su disco.

  • Si hay algún registro con el mismo hash de fila, aumenta el ID de unicidad, que es un número de 32 bits. Para el hash de fila nuevo, el ID de unicidad se asigna como 1 y se incrementa cada vez que se inserta un registro con el mismo hash de fila.

  • La combinación de hash de fila e ID de unicidad se denomina ID de fila.

  • El ID de fila antepone cada registro del disco.

  • Cada fila de la tabla en AMP está ordenada lógicamente por sus ID de fila.

Cómo se almacenan las tablas

Las tablas se ordenan por su ID de fila (hash de fila + ID de unicidad) y luego se almacenan dentro de las AMP. El ID de fila se almacena con cada fila de datos.

Hash de fila ID de unicidad Numero de empleado Primer nombre Apellido
2A01 2611 0000 0001 101 Miguel James
2A01 2612 0000 0001 104 Alex Stuart
2A01 2613 0000 0001 102 Robert Williams
2A01 2614 0000 0001 105 Robert James
2A01 2615 0000 0001 103 Pedro Pablo

JOIN INDEX es una vista materializada. Su definición se almacena permanentemente y los datos se actualizan cada vez que se actualizan las tablas base referidas en el índice de unión. JOIN INDEX puede contener una o más tablas y también contener datos agregados previamente. Los índices de unión se utilizan principalmente para mejorar el rendimiento.

Hay diferentes tipos de índices de combinación disponibles.

  • Índice de unión de una sola tabla (STJI)
  • Índice de unión de múltiples tablas (MTJI)
  • Índice de unión agregado (AJI)

Índice de unión de una sola tabla

El índice de unión de tabla única permite particionar una tabla grande en función de las diferentes columnas de índice primario que la de la tabla base.

Sintaxis

A continuación se muestra la sintaxis de JOIN INDEX.

CREATE JOIN INDEX <index name> 
AS 
<SELECT Query> 
<Index Definition>;

Ejemplo

Considere las siguientes tablas de empleados y salarios.

CREATE SET TABLE EMPLOYEE,FALLBACK ( 
   EmployeeNo INTEGER, 
   FirstName VARCHAR(30) , 
   LastName VARCHAR(30) , 
   DOB DATE FORMAT 'YYYY-MM-DD', 
   JoinedDate DATE FORMAT 'YYYY-MM-DD', 
   DepartmentNo BYTEINT 
) 
UNIQUE PRIMARY INDEX ( EmployeeNo );

CREATE SET TABLE SALARY,FALLBACK ( 
   EmployeeNo INTEGER, 
   Gross INTEGER, 
   Deduction INTEGER, 
   NetPay INTEGER 
) 
PRIMARY INDEX ( EmployeeNo ) 
UNIQUE INDEX (EmployeeNo);

A continuación, se muestra un ejemplo que crea un índice de unión llamado Employee_JI en la tabla de empleados.

CREATE JOIN INDEX Employee_JI 
AS 
SELECT EmployeeNo,FirstName,LastName, 
BirthDate,JoinedDate,DepartmentNo 
FROM Employee 
PRIMARY INDEX(FirstName);

Si el usuario envía una consulta con una cláusula WHERE en EmployeeNo, el sistema consultará la tabla de empleados utilizando el índice primario único. Si el usuario consulta la tabla de empleados usando employee_name, entonces el sistema puede acceder al índice de unión Employee_JI usando employee_name. Las filas del índice de combinación tienen un hash en la columna employee_name. Si el índice de unión no está definido y el nombre_empleado no está definido como índice secundario, entonces el sistema realizará un escaneo completo de la tabla para acceder a las filas, lo que requiere mucho tiempo.

Puede ejecutar el siguiente plan EXPLAIN y verificar el plan optimizador. En el siguiente ejemplo, puede ver que el optimizador usa el índice de unión en lugar de la tabla base de empleados cuando la tabla consulta usando la columna Employee_Name.

EXPLAIN SELECT * FROM EMPLOYEE WHERE FirstName='Mike'; 
*** Help information returned. 8 rows. 
*** Total elapsed time was 1 second. 
Explanation 
------------------------------------------------------------------------ 
   1) First, we do a single-AMP RETRIEVE step from EMPLOYEE_JI by 
      way of the primary index "EMPLOYEE_JI.FirstName = 'Mike'" 
      with no residual conditions into Spool 1 (one-amp), which is built 
      locally on that AMP.  The size of Spool 1 is estimated with low 
      confidence to be 2 rows (232 bytes).  The estimated time for this 
      step is 0.02 seconds.
   → The contents of Spool 1 are sent back to the user as the result of 
      statement 1.  The total estimated time is 0.02 seconds.

Índice de unión de varias tablas

Un índice de combinación de varias tablas se crea uniendo más de una tabla. El índice de combinación de varias tablas se puede utilizar para almacenar el conjunto de resultados de las tablas unidas con frecuencia para mejorar el rendimiento.

Ejemplo

El siguiente ejemplo crea un JOIN INDEX llamado Employee_Salary_JI uniendo las tablas de Empleado y Salario.

CREATE JOIN INDEX Employee_Salary_JI 
AS 
SELECT a.EmployeeNo,a.FirstName,a.LastName, 
a.BirthDate,a.JoinedDate,a.DepartmentNo,b.Gross,b.Deduction,b.NetPay 
FROM Employee a 
INNER JOIN Salary b 
ON(a.EmployeeNo = b.EmployeeNo) 
PRIMARY INDEX(FirstName);

Siempre que se actualizan las tablas base Empleado o Salario, el índice de unión Empleado_Salario_JI también se actualiza automáticamente. Si está ejecutando una consulta que une las tablas de Empleados y Salarios, entonces el optimizador puede optar por acceder a los datos de Employee_Salary_JI directamente en lugar de unirse a las tablas. El plan EXPLAIN de la consulta se puede utilizar para verificar si el optimizador elegirá la tabla base o el índice de unión.

Índice de unión agregado

Si una tabla se agrega consistentemente en ciertas columnas, entonces el índice de combinación agregado se puede definir en la tabla para mejorar el rendimiento. Una limitación del índice de combinación agregado es que solo admite funciones SUM y COUNT.

Ejemplo

En el siguiente ejemplo, Empleado y Salario se unen para identificar el salario total por Departamento.

CREATE JOIN INDEX Employee_Salary_JI 
AS 
SELECT a.DepartmentNo,SUM(b.NetPay) AS TotalPay 
FROM Employee a 
INNER JOIN Salary b 
ON(a.EmployeeNo = b.EmployeeNo)
GROUP BY a.DepartmentNo 
Primary Index(DepartmentNo);

Las vistas son objetos de base de datos que crea la consulta. Las vistas se pueden crear utilizando una sola tabla o varias tablas mediante uniones. Su definición se almacena permanentemente en el diccionario de datos, pero no almacenan una copia de los datos. Los datos de la vista se crean de forma dinámica.

Una vista puede contener un subconjunto de filas de la tabla o un subconjunto de columnas de la tabla.

Crear una vista

Las vistas se crean utilizando la instrucción CREATE VIEW.

Sintaxis

A continuación se muestra la sintaxis para crear una vista.

CREATE/REPLACE VIEW <viewname> 
AS  
<select query>;

Ejemplo

Considere la siguiente tabla de empleados.

Numero de empleado Primer nombre Apellido Fecha de nacimiento
101 Miguel James 5/1/1980
104 Alex Stuart 6/11/1984
102 Robert Williams 05/03/1983
105 Robert James 1/12/1984
103 Pedro Pablo 1/4/1983

El siguiente ejemplo crea una vista en la tabla Empleado.

CREATE VIEW Employee_View 
AS 
SELECT 
EmployeeNo, 
FirstName, 
LastName, 
FROM  
Employee;

Usar vistas

Puede utilizar la instrucción SELECT normal para recuperar datos de Vistas.

Ejemplo

El siguiente ejemplo recupera los registros de Employee_View;

SELECT EmployeeNo, FirstName, LastName FROM Employee_View;

Cuando se ejecuta la consulta anterior, produce el siguiente resultado.

*** Query completed. 5 rows found. 3 columns returned. 
*** Total elapsed time was 1 second.  
 EmployeeNo            FirstName                       LastName 
-----------  ------------------------------  --------------------------- 
    101                  Mike                           James 
    104                  Alex                           Stuart 
    102                  Robert                         Williams 
    105                  Robert                         James 
    103                  Peter                          Paul

Modificar vistas

Una vista existente se puede modificar usando la instrucción REPLACE VIEW.

A continuación se muestra la sintaxis para modificar una vista.

REPLACE VIEW <viewname> 
AS  
<select query>;

Ejemplo

El siguiente ejemplo modifica la vista Employee_View para agregar columnas adicionales.

REPLACE VIEW Employee_View 
AS 
SELECT 
EmployeeNo, 
FirstName, 
BirthDate,
JoinedDate 
DepartmentNo 
FROM  
Employee;

Drop View

Una vista existente se puede eliminar mediante la instrucción DROP VIEW.

Sintaxis

A continuación se muestra la sintaxis de DROP VIEW.

DROP VIEW <viewname>;

Ejemplo

A continuación, se muestra un ejemplo para eliminar la vista Employee_View.

DROP VIEW Employee_View;

Ventajas de las vistas

  • Las vistas proporcionan un nivel adicional de seguridad al restringir las filas o columnas de una tabla.

  • Los usuarios pueden tener acceso solo a las vistas en lugar de a las tablas base.

  • Simplifica el uso de varias tablas uniéndolas previamente mediante Vistas.

Macro es un conjunto de sentencias SQL que se almacenan y ejecutan llamando al nombre de la macro. La definición de macros se almacena en el Diccionario de datos. Los usuarios solo necesitan privilegios EXEC para ejecutar la macro. Los usuarios no necesitan privilegios separados sobre los objetos de la base de datos utilizados dentro de la macro. Las declaraciones macro se ejecutan como una sola transacción. Si una de las sentencias SQL en Macro falla, todas las sentencias se deshacen. Las macros pueden aceptar parámetros. Las macros pueden contener declaraciones DDL, pero esa debería ser la última declaración en Macro.

Crear macros

Las macros se crean utilizando la instrucción CREATE MACRO.

Sintaxis

A continuación se muestra la sintaxis genérica del comando CREATE MACRO.

CREATE MACRO <macroname> [(parameter1, parameter2,...)] ( 
   <sql statements> 
);

Ejemplo

Considere la siguiente tabla de empleados.

Numero de empleado Primer nombre Apellido Fecha de nacimiento
101 Miguel James 5/1/1980
104 Alex Stuart 6/11/1984
102 Robert Williams 05/03/1983
105 Robert James 1/12/1984
103 Pedro Pablo 1/4/1983

El siguiente ejemplo crea una macro llamada Get_Emp. Contiene una declaración de selección para recuperar registros de la tabla de empleados.

CREATE MACRO Get_Emp AS ( 
   SELECT 
   EmployeeNo, 
   FirstName, 
   LastName 
   FROM  
   employee 
   ORDER BY EmployeeNo; 
);

Ejecutando macros

Las macros se ejecutan usando el comando EXEC.

Sintaxis

A continuación se muestra la sintaxis del comando EXECUTE MACRO.

EXEC <macroname>;

Ejemplo

El siguiente ejemplo ejecuta los nombres de macro Get_Emp; Cuando se ejecuta el siguiente comando, recupera todos los registros de la tabla de empleados.

EXEC Get_Emp; 
*** Query completed. 5 rows found. 3 columns returned. 
*** Total elapsed time was 1 second.  
EmployeeNo             FirstName                      LastName 
-----------  ------------------------------  --------------------------- 
   101                  Mike                          James 
   102                  Robert                        Williams 
   103                  Peter                         Paul 
   104                  Alex                          Stuart 
   105                  Robert                        James

Macros parametrizados

Las macros de Teradata pueden aceptar parámetros. Dentro de una macro, se hace referencia a estos parámetros con; (punto y coma).

A continuación se muestra un ejemplo de una macro que acepta parámetros.

CREATE MACRO Get_Emp_Salary(EmployeeNo INTEGER) AS ( 
   SELECT 
   EmployeeNo, 
   NetPay 
   FROM  
   Salary 
   WHERE EmployeeNo = :EmployeeNo; 
);

Ejecución de macros parametrizadas

Las macros se ejecutan usando el comando EXEC. Necesita privilegios EXEC para ejecutar las macros.

Sintaxis

A continuación se muestra la sintaxis de la instrucción EXECUTE MACRO.

EXEC <macroname>(value);

Ejemplo

El siguiente ejemplo ejecuta los nombres de macro Get_Emp; Acepta el número de empleado como parámetro y extrae registros de la tabla de empleados para ese empleado.

EXEC Get_Emp_Salary(101); 
*** Query completed. One row found. 2 columns returned. 
*** Total elapsed time was 1 second.
 
EmployeeNo      NetPay 
-----------  ------------ 
   101           36000

Un procedimiento almacenado contiene un conjunto de sentencias SQL y sentencias de procedimiento. Pueden contener solo declaraciones de procedimiento. La definición de procedimiento almacenado se almacena en la base de datos y los parámetros se almacenan en tablas de diccionario de datos.

Ventajas

  • Los procedimientos almacenados reducen la carga de red entre el cliente y el servidor.

  • Proporciona mayor seguridad ya que se accede a los datos a través de procedimientos almacenados en lugar de acceder a ellos directamente.

  • Ofrece un mejor mantenimiento ya que la lógica empresarial se prueba y se almacena en el servidor.

Procedimiento de creación

Los procedimientos almacenados se crean mediante la instrucción CREATE PROCEDURE.

Sintaxis

A continuación se muestra la sintaxis genérica de la instrucción CREATE PROCEDURE.

CREATE PROCEDURE <procedurename> ( [parameter 1 data type, parameter 2 data type..] ) 
BEGIN 
   <SQL or SPL statements>; 
END;

Ejemplo

Considere la siguiente tabla de sueldos.

Numero de empleado Bruto Deducción Salario neto
101 40.000 4000 36.000
102 80.000 6.000 74.000
103 90.000 7.000 83.000
104 75.000 5,000 70.000

El siguiente ejemplo crea un procedimiento almacenado denominado InsertSalary para aceptar los valores e insertarlos en la tabla de sueldos.

CREATE PROCEDURE InsertSalary ( 
   IN in_EmployeeNo INTEGER, IN in_Gross INTEGER, 
   IN in_Deduction INTEGER, IN in_NetPay INTEGER 
) 
BEGIN 
   INSERT INTO Salary ( 
      EmployeeNo, 
      Gross, 
      Deduction, 
      NetPay 
   ) 
   VALUES ( 
      :in_EmployeeNo, 
      :in_Gross, 
      :in_Deduction, 
      :in_NetPay 
   ); 
END;

Procedimientos de ejecución

Los procedimientos almacenados se ejecutan mediante la instrucción CALL.

Sintaxis

A continuación se muestra la sintaxis genérica de la instrucción CALL.

CALL <procedure name> [(parameter values)];

Ejemplo

El siguiente ejemplo llama al procedimiento almacenado InsertSalary e inserta registros en la tabla de sueldos.

CALL InsertSalary(105,20000,2000,18000);

Una vez que se ejecuta la consulta anterior, produce el siguiente resultado y puede ver la fila insertada en la tabla Salario.

Numero de empleado Bruto Deducción Salario neto
101 40.000 4000 36.000
102 80.000 6.000 74.000
103 90.000 7.000 83.000
104 75.000 5,000 70.000
105 20.000 2000 18.000

Este capítulo analiza las diversas estrategias JOIN disponibles en Teradata.

Métodos de unión

Teradata utiliza diferentes métodos de combinación para realizar operaciones de combinación. Algunos de los métodos de unión más utilizados son:

  • Fusionar unión
  • Unión anidada
  • Producto unido

Fusionar unión

El método Merge Join tiene lugar cuando la combinación se basa en la condición de igualdad. Merge Join requiere que las filas de unión estén en el mismo AMP. Las filas se unen en función de su hash de fila. Merge Join utiliza diferentes estrategias de combinación para llevar las filas al mismo AMP.

Estrategia # 1

Si las columnas de unión son los índices principales de las tablas correspondientes, las filas de unión ya están en el mismo AMP. En este caso, no se requiere distribución.

Considere las siguientes tablas de empleados y salarios.

CREATE SET TABLE EMPLOYEE,FALLBACK ( 
   EmployeeNo INTEGER, 
   FirstName VARCHAR(30) , 
   LastName VARCHAR(30) , 
   DOB DATE FORMAT 'YYYY-MM-DD', 
   JoinedDate DATE FORMAT 'YYYY-MM-DD', 
   DepartmentNo BYTEINT 
) 
UNIQUE PRIMARY INDEX ( EmployeeNo );
CREATE SET TABLE Salary ( 
   EmployeeNo INTEGER, 
   Gross INTEGER,  
   Deduction INTEGER, 
   NetPay INTEGER 
) 
UNIQUE PRIMARY INDEX(EmployeeNo);

Cuando estas dos tablas se unen en la columna EmployeeNo, no se realiza ninguna redistribución ya que EmployeeNo es el índice principal de ambas tablas que se unen.

Estrategia # 2

Considere las siguientes tablas de empleados y departamentos.

CREATE SET TABLE EMPLOYEE,FALLBACK (
   EmployeeNo INTEGER, 
   FirstName VARCHAR(30) , 
   LastName VARCHAR(30) , 
   DOB DATE FORMAT 'YYYY-MM-DD', 
   JoinedDate DATE FORMAT 'YYYY-MM-DD', 
   DepartmentNo BYTEINT 
) 
UNIQUE PRIMARY INDEX ( EmployeeNo );
CREATE SET TABLE DEPARTMENT,FALLBACK ( 
   DepartmentNo BYTEINT, 
   DepartmentName CHAR(15) 
) 
UNIQUE PRIMARY INDEX ( DepartmentNo );

Si estas dos tablas se unen en la columna DeparmentNo, entonces las filas deben redistribuirse ya que DepartmentNo es un índice principal en una tabla y un índice no principal en otra tabla. En este escenario, es posible que las filas unidas no estén en el mismo AMP. En tal caso, Teradata puede redistribuir la tabla de empleados en la columna DepartmentNo.

Estrategia # 3

Para las tablas de empleados y departamentos anteriores, Teradata puede duplicar la tabla de departamentos en todos los AMP, si el tamaño de la tabla de departamentos es pequeño.

Unión anidada

La unión anidada no usa todas las AMP. Para que tenga lugar la unión anidada, una de las condiciones debe ser la igualdad en el índice principal único de una tabla y luego unir esta columna a cualquier índice de la otra tabla.

En este escenario, el sistema buscará una fila usando el índice principal único de una tabla y usará ese hash de fila para buscar los registros coincidentes de otra tabla. La combinación anidada es el más eficaz de todos los métodos de combinación.

Producto unido

Product Join compara cada fila calificada de una tabla con cada fila calificada de otra tabla. La unión de productos puede tener lugar debido a algunos de los siguientes factores:

  • Donde falta la condición.
  • La condición de unión no se basa en la condición de igualdad.
  • Los alias de la tabla no son correctos.
  • Múltiples condiciones de unión.

El índice primario particionado (PPI) es un mecanismo de indexación que resulta útil para mejorar el rendimiento de determinadas consultas. Cuando las filas se insertan en una tabla, se almacenan en un AMP y se organizan según el orden de hash de las filas. Cuando una tabla se define con PPI, las filas se ordenan por su número de partición. Dentro de cada partición, están ordenados por su hash de fila. Las filas se asignan a una partición según la expresión de partición definida.

Ventajas

  • Evite el escaneo completo de la tabla para determinadas consultas.

  • Evite el uso de índices secundarios que requieran una estructura física adicional y un mantenimiento de E / S adicional.

  • Acceda rápidamente a un subconjunto de una mesa grande.

  • Elimine los datos antiguos rápidamente y agregue datos nuevos.

Ejemplo

Considere la siguiente tabla de pedidos con el índice principal en el número de pedido.

Almacenar ninguna N º de pedido Fecha de orden Total del pedido
101 7501 2015-10-01 900
101 7502 2015-10-02 1200
102 7503 2015-10-02 3000
102 7504 2015-10-03 2,454
101 7505 2015-10-03 1201
103 7506 2015-10-04 2,454
101 7507 2015-10-05 1201
101 7508 2015-10-05 1201

Suponga que los registros se distribuyen entre AMP como se muestra en las siguientes tablas. Los registros se almacenan en AMP, ordenados en función de su hash de fila.

AMP 1

RowHash N º de pedido Fecha de orden
1 7505 2015-10-03
2 7504 2015-10-03
3 7501 2015-10-01
4 7508 2015-10-05

AMP 2

RowHash N º de pedido Fecha de orden
1 7507 2015-10-05
2 7502 2015-10-02
3 7506 2015-10-04
4 7503 2015-10-02

Si ejecuta una consulta para extraer los pedidos para una fecha en particular, entonces el optimizador puede optar por utilizar la exploración de tabla completa, luego se puede acceder a todos los registros dentro del AMP. Para evitar esto, puede definir la fecha del pedido como Índice primario particionado. Cuando se insertan filas en la tabla de pedidos, se dividen según la fecha del pedido. Dentro de cada partición, se ordenarán por su hash de fila.

Los siguientes datos muestran cómo se almacenarán los registros en AMP, si están divididos por fecha de pedido. Si se ejecuta una consulta para acceder a los registros por Fecha de pedido, solo se accederá a la partición que contiene los registros de ese pedido en particular.

AMP 1

Dividir RowHash N º de pedido Fecha de orden
0 3 7501 2015-10-01
1 1 7505 2015-10-03
1 2 7504 2015-10-03
2 4 7508 2015-10-05

AMP 2

Dividir RowHash N º de pedido Fecha de orden
0 2 7502 2015-10-02
0 4 7503 2015-10-02
1 3 7506 2015-10-04
2 1 7507 2015-10-05

A continuación se muestra un ejemplo para crear una tabla con el índice primario de partición. La cláusula PARTITION BY se utiliza para definir la partición.

CREATE SET TABLE Orders (
   StoreNo SMALLINT, 
   OrderNo INTEGER, 
   OrderDate DATE FORMAT 'YYYY-MM-DD', 
   OrderTotal INTEGER 
) 
PRIMARY INDEX(OrderNo) 
PARTITION BY RANGE_N  (
   OrderDate BETWEEN DATE '2010-01-01' AND '2016-12-31' EACH INTERVAL '1' DAY
);

En el ejemplo anterior, la tabla está dividida por la columna OrderDate. Habrá una partición separada para cada día.

Las funciones OLAP son similares a las funciones agregadas, excepto que las funciones agregadas devolverán solo un valor, mientras que la función OLAP proporcionará las filas individuales además de los agregados.

Sintaxis

A continuación se muestra la sintaxis general de la función OLAP.

<aggregate function> OVER  
([PARTITION BY] [ORDER BY columnname][ROWS BETWEEN 
UNBOUDED PRECEDING AND UNBOUNDED FOLLOWING)

Las funciones de agregación pueden ser SUM, COUNT, MAX, MIN, AVG.

Ejemplo

Considere la siguiente tabla de sueldos.

Numero de empleado Bruto Deducción Salario neto
101 40.000 4000 36.000
102 80.000 6.000 74.000
103 90.000 7.000 83.000
104 75.000 5,000 70.000

A continuación se muestra un ejemplo para encontrar la suma acumulada o el total acumulado de NetPay en la tabla Salario. Los registros se ordenan por EmployeeNo y la suma acumulada se calcula en la columna NetPay.

SELECT  
EmployeeNo, NetPay, 
SUM(Netpay) OVER(ORDER BY EmployeeNo ROWS  
UNBOUNDED PRECEDING) as TotalSalary 
FROM Salary;

Cuando se ejecuta la consulta anterior, produce el siguiente resultado.

EmployeeNo     NetPay     TotalSalary 
-----------  -----------  ----------- 
   101         36000        36000 
   102         74000        110000 
   103         83000        193000 
   104         70000        263000 
   105         18000        281000

RANGO

La función RANK ordena los registros según la columna proporcionada. La función RANK también puede filtrar el número de registros devueltos según el rango.

Sintaxis

A continuación se muestra la sintaxis genérica para usar la función RANK.

RANK() OVER 
([PARTITION BY columnnlist] [ORDER BY columnlist][DESC|ASC])

Ejemplo

Considere la siguiente tabla de empleados.

Numero de empleado Primer nombre Apellido JoinedDate DepartmentID Fecha de nacimiento
101 Miguel James 27/03/2005 1 5/1/1980
102 Robert Williams 25/4/2007 2 05/03/1983
103 Pedro Pablo 21/03/2007 2 1/4/1983
104 Alex Stuart 1/2/2008 2 6/11/1984
105 Robert James 1/4/2008 3 1/12/1984

La siguiente consulta ordena los registros de la tabla de empleados por Fecha de incorporación y asigna la clasificación en la Fecha de incorporación.

SELECT EmployeeNo, JoinedDate,RANK() 
OVER(ORDER BY JoinedDate) as Seniority 
FROM Employee;

Cuando se ejecuta la consulta anterior, produce el siguiente resultado.

EmployeeNo   JoinedDate   Seniority 
-----------  ----------  ----------- 
   101       2005-03-27       1 
   103       2007-03-21       2 
   102       2007-04-25       3 
   105       2008-01-04       4 
   104       2008-02-01       5

La cláusula PARTITION BY agrupa los datos por las columnas definidas en la cláusula PARTITION BY y realiza la función OLAP dentro de cada grupo. A continuación se muestra un ejemplo de la consulta que utiliza la cláusula PARTITION BY.

SELECT EmployeeNo, JoinedDate,RANK() 
OVER(PARTITION BY DeparmentNo ORDER BY JoinedDate) as Seniority 
FROM Employee;

Cuando se ejecuta la consulta anterior, produce el siguiente resultado. Puede ver que el rango se restablece para cada departamento.

EmployeeNo  DepartmentNo  JoinedDate   Seniority 
-----------  ------------  ----------  ----------- 

    101           1        2005-03-27       1 
    103           2        2007-03-21       1 
    102           2        2007-04-25       2 
    104           2        2008-02-01       3 
    105           3        2008-01-04       1

Este capítulo analiza las funciones disponibles para la protección de datos en Teradata.

Diario transitorio

Teradata usa Transient Journal para proteger los datos de fallas en las transacciones. Siempre que se ejecutan transacciones, el diario Transient guarda una copia de las imágenes anteriores de las filas afectadas hasta que la transacción se realiza correctamente o se revierte correctamente. Luego, se descartan las imágenes anteriores. El diario transitorio se mantiene en cada AMP. Es un proceso automático y no se puede desactivar.

Retroceder

El respaldo protege los datos de la tabla almacenando la segunda copia de las filas de una tabla en otro AMP llamado Fallback AMP. Si falla un AMP, se accede a las filas de respaldo. Con esto, incluso si falla un AMP, los datos siguen estando disponibles a través del AMP de respaldo. La opción de reserva se puede utilizar en la creación de la tabla o después de la creación de la tabla. El respaldo asegura que la segunda copia de las filas de la tabla siempre se almacene en otro AMP para proteger los datos de fallas de AMP. Sin embargo, la reserva ocupa el doble de almacenamiento y E / S para Insertar / Eliminar / Actualizar.

El siguiente diagrama muestra cómo se almacenan las copias de respaldo de las filas en otro AMP.

Diario de recuperación de Down AMP

El diario de recuperación de Down AMP se activa cuando el AMP falla y la tabla está protegida contra retrocesos. Este diario realiza un seguimiento de todos los cambios en los datos del AMP fallido. El diario se activa en los AMP restantes del clúster. Es un proceso automático y no se puede desactivar. Una vez que el AMP fallido está activo, los datos del diario de recuperación de Down AMP se sincronizan con el AMP. Una vez hecho esto, se descarta el diario.

Camarillas

Clique es un mecanismo utilizado por Teradata para proteger los datos de las fallas de los nodos. Una camarilla no es más que un conjunto de nodos de Teradata que comparten un conjunto común de matrices de discos. Cuando un nodo falla, los vprocs del nodo fallido migrarán a otros nodos de la camarilla y continuarán accediendo a sus matrices de discos.

Nodo de espera en caliente

Hot Standby Node es un nodo que no participa en el entorno de producción. Si un nodo falla, los vprocs de los nodos fallidos migrarán al nodo de espera activa. Una vez que se recupera el nodo fallido, se convierte en el nodo de reserva activa. Los nodos Hot Standby se utilizan para mantener el rendimiento en caso de fallas en los nodos.

REDADA

La matriz redundante de discos independientes (RAID) es un mecanismo que se utiliza para proteger los datos de fallas de disco. Disk Array consta de un conjunto de discos que se agrupan como una unidad lógica. Esta unidad puede parecer una sola unidad para el usuario, pero pueden estar distribuidas en varios discos.

RAID 1 se usa comúnmente en Teradata. En RAID 1, cada disco está asociado con un disco espejo. Cualquier cambio en los datos del disco principal también se refleja en la copia reflejada. Si el disco principal falla, se puede acceder a los datos del disco espejo.

Este capítulo discutió las diversas estrategias de administración de usuarios en Teradata.

Usuarios

Se crea un usuario mediante el comando CREATE USER. En Teradata, un usuario también es similar a una base de datos. A ambos se les puede asignar espacio y contener objetos de base de datos, excepto que al usuario se le asigna una contraseña.

Sintaxis

A continuación se muestra la sintaxis de CREAR USUARIO.

CREATE USER username 
AS  
[PERMANENT|PERM] = n BYTES 
PASSWORD = password 
TEMPORARY = n BYTES 
SPOOL = n BYTES;

Al crear un usuario, los valores para el nombre de usuario, el espacio permanente y la contraseña son obligatorios. Otros campos son opcionales.

Ejemplo

A continuación se muestra un ejemplo para crear el usuario TD01.

CREATE USER TD01 
AS  
PERMANENT = 1000000 BYTES 
PASSWORD = ABC$124 
TEMPORARY = 1000000 BYTES 
SPOOL = 1000000 BYTES;

Cuentas

Al crear un nuevo usuario, el usuario puede asignarse a una cuenta. La opción CUENTA en CREAR USUARIO se utiliza para asignar la cuenta. Un usuario puede estar asignado a varias cuentas.

Sintaxis

A continuación se muestra la sintaxis para CREAR USUARIO con opción de cuenta.

CREATE USER username 
PERM = n BYTES 
PASSWORD = password 
ACCOUNT = accountid

Ejemplo

El siguiente ejemplo crea el usuario TD02 y asigna la cuenta como IT y Admin.

CREATE USER TD02 
AS  
PERMANENT = 1000000 BYTES 
PASSWORD = abc$123 
TEMPORARY = 1000000 BYTES 
SPOOL = 1000000 BYTES 
ACCOUNT = (‘IT’,’Admin’);

El usuario puede especificar la identificación de la cuenta mientras inicia sesión en el sistema Teradata o después de iniciar sesión en el sistema usando el comando SET SESSION.

.LOGON username, passowrd,accountid 
OR 
SET SESSION ACCOUNT = accountid

Conceder privilegios

El comando GRANT se utiliza para asignar uno o más privilegios sobre los objetos de la base de datos al usuario o la base de datos.

Sintaxis

A continuación se muestra la sintaxis del comando GRANT.

GRANT privileges ON objectname TO username;

Los privilegios pueden ser INSERTAR, SELECCIONAR, ACTUALIZAR, REFERENCIAS.

Ejemplo

A continuación se muestra un ejemplo de declaración GRANT.

GRANT SELECT,INSERT,UPDATE ON Employee TO TD01;

Revocar privilegios

El comando REVOKE elimina los privilegios de los usuarios o bases de datos. El comando REVOKE solo puede eliminar privilegios explícitos.

Sintaxis

A continuación se muestra la sintaxis básica del comando REVOKE.

REVOKE [ALL|privileges] ON objectname FROM username;

Ejemplo

A continuación se muestra un ejemplo del comando REVOKE.

REVOKE INSERT,SELECT ON Employee FROM TD01;

Este capítulo analiza el procedimiento de ajuste del rendimiento en Teradata.

Explique

El primer paso en el ajuste del rendimiento es el uso de EXPLAIN en su consulta. El plan EXPLAIN brinda los detalles de cómo el optimizador ejecutará su consulta. En el plan Explicar, verifique las palabras clave como el nivel de confianza, la estrategia de unión utilizada, el tamaño del archivo de cola, la redistribución, etc.

Recopilar estadísticas

Optimizer utiliza datos demográficos para idear una estrategia de ejecución eficaz. El comando COLLECT STATISTICS se utiliza para recopilar datos demográficos de la tabla. Asegúrese de que las estadísticas recopiladas en las columnas estén actualizadas.

  • Recopile estadísticas sobre las columnas que se utilizan en la cláusula WHERE y sobre las columnas utilizadas en la condición de unión.

  • Recopile estadísticas sobre las columnas del índice primario único.

  • Recopile estadísticas sobre las columnas del índice secundario no exclusivo. Optimizer decidirá si puede usar NUSI o Full Table Scan.

  • Recopile estadísticas sobre el índice de unión aunque se recopilen las estadísticas de la tabla base.

  • Recopile estadísticas sobre las columnas de partición.

Tipos de datos

Asegúrese de que se utilicen los tipos de datos adecuados. Esto evitará el uso de almacenamiento excesivo de lo necesario.

Conversión

Asegúrese de que los tipos de datos de las columnas utilizadas en la condición de combinación sean compatibles para evitar conversiones de datos explícitas.

Ordenar

Elimine las cláusulas ORDER BY innecesarias a menos que sea necesario.

Problema con el espacio del carrete

Se genera un error de espacio de spool si la consulta supera el límite de espacio de spool de AMP para ese usuario. Verifique el plan de explicación e identifique el paso que consume más espacio en el spool. Estas consultas intermedias se pueden dividir y colocar por separado para crear tablas temporales.

Índice primario

Asegúrese de que el índice principal esté correctamente definido para la tabla. La columna de índice principal debe distribuir los datos de manera uniforme y debe usarse con frecuencia para acceder a los datos.

Mesa SET

Si define una tabla SET, el optimizador verificará si el registro está duplicado para todos y cada uno de los registros insertados. Para eliminar la condición de verificación duplicada, puede definir un índice secundario único para la tabla.

ACTUALIZAR en mesa grande

Actualizar la tabla grande llevará mucho tiempo. En lugar de actualizar la tabla, puede eliminar los registros e insertar los registros con filas modificadas.

Dejar caer tablas temporales

Elimine las tablas temporales (tablas de preparación) y los volátiles si ya no son necesarios. Esto liberará espacio permanente y espacio para el carrete.

Mesa MULTISET

Si está seguro de que los registros de entrada no tendrán registros duplicados, puede definir la tabla de destino como tabla MULTISET para evitar la verificación de filas duplicadas que usa la tabla SET.

La utilidad FastLoad se utiliza para cargar datos en tablas vacías. Dado que no utiliza diarios transitorios, los datos se pueden cargar rápidamente. No carga filas duplicadas incluso si la tabla de destino es una tabla MULTISET.

Limitación

La tabla de destino no debe tener índice secundario, índice de unión ni referencia de clave externa.

Cómo funciona FastLoad

FastLoad se ejecuta en dos fases.

Fase 1

  • Los motores de análisis leen los registros del archivo de entrada y envían un bloque a cada AMP.

  • Cada AMP almacena los bloques de registros.

  • Luego, los AMP procesan cada registro y los redistribuyen al AMP correcto.

  • Al final de la Fase 1, cada AMP tiene sus filas pero no están en la secuencia hash de filas.

Fase 2

  • La fase 2 comienza cuando FastLoad recibe la instrucción END LOADING.

  • Cada AMP ordena los registros por hash de fila y los escribe en el disco.

  • Los bloqueos de la tabla de destino se liberan y las tablas de errores se eliminan.

Ejemplo

Cree un archivo de texto con los siguientes registros y asigne un nombre al archivo employee.txt.

101,Mike,James,1980-01-05,2010-03-01,1  
102,Robert,Williams,1983-03-05,2010-09-01,1 
103,Peter,Paul,1983-04-01,2009-02-12,2 
104,Alex,Stuart,1984-11-06,2014-01-01,2 
105,Robert,James,1984-12-01,2015-03-09,3

A continuación se muestra una secuencia de comandos FastLoad de muestra para cargar el archivo anterior en la tabla Employee_Stg.

LOGON 192.168.1.102/dbc,dbc;  
   DATABASE tduser;  
   BEGIN LOADING tduser.Employee_Stg  
      ERRORFILES Employee_ET, Employee_UV  
      CHECKPOINT 10;  
      SET RECORD VARTEXT ",";  
      DEFINE in_EmployeeNo (VARCHAR(10)), 
         in_FirstName (VARCHAR(30)), 
         in_LastName (VARCHAR(30)), 
         in_BirthDate (VARCHAR(10)), 
         in_JoinedDate (VARCHAR(10)), 
         in_DepartmentNo (VARCHAR(02)), 
         FILE = employee.txt;
      INSERT INTO Employee_Stg (
         EmployeeNo,
         FirstName,
         LastName,
         BirthDate,
         JoinedDate, 
         DepartmentNo
      ) 
      VALUES (  
         :in_EmployeeNo, 
         :in_FirstName, 
         :in_LastName, 
         :in_BirthDate (FORMAT 'YYYY-MM-DD'), 
         :in_JoinedDate (FORMAT 'YYYY-MM-DD'),
         :in_DepartmentNo
      ); 
   END LOADING;  
LOGOFF;

Ejecución de una secuencia de comandos FastLoad

Una vez que se crea el archivo de entrada employee.txt y el script FastLoad se denomina EmployeeLoad.fl, puede ejecutar el script FastLoad utilizando el siguiente comando en UNIX y Windows.

FastLoad < EmployeeLoad.fl;

Una vez que se ejecuta el comando anterior, el script FastLoad se ejecutará y producirá el registro. En el registro, puede ver la cantidad de registros procesados ​​por FastLoad y el código de estado.

**** 03:19:14 END LOADING COMPLETE 
   Total Records Read              =  5 
   Total Error Table 1             =  0  ---- Table has been dropped 
   Total Error Table 2             =  0  ---- Table has been dropped 
   Total Inserts Applied           =  5 
   Total Duplicate Rows            =  0 
   Start:   Fri Jan  8 03:19:13 2016 
   End  :   Fri Jan  8 03:19:14 2016 
**** 03:19:14 Application Phase statistics: 
              Elapsed time: 00:00:01 (in hh:mm:ss) 
0008  LOGOFF; 
**** 03:19:15 Logging off all sessions

Términos de FastLoad

A continuación se muestra la lista de términos comunes utilizados en el script FastLoad.

  • LOGON - Inicia sesión en Teradata e inicia una o más sesiones.

  • DATABASE - Establece la base de datos predeterminada.

  • BEGIN LOADING - Identifica la tabla a cargar.

  • ERRORFILES - Identifica las 2 tablas de errores que deben crearse / actualizarse.

  • CHECKPOINT - Define cuándo tomar el punto de control.

  • SET RECORD - Especifica si el formato del archivo de entrada está formateado, binario, de texto o sin formato.

  • DEFINE - Define el diseño del archivo de entrada.

  • FILE - Especifica el nombre y la ruta del archivo de entrada.

  • INSERT - Inserta los registros del archivo de entrada en la tabla de destino.

  • END LOADING- Inicia la fase 2 de FastLoad. Distribuye los registros en la tabla de destino.

  • LOGOFF - Finaliza todas las sesiones y finaliza FastLoad.

MultiLoad puede cargar varias tablas a la vez y también puede realizar diferentes tipos de tareas como INSERT, DELETE, UPDATE y UPSERT. Puede cargar hasta 5 tablas a la vez y realizar hasta 20 operaciones DML en un script. La tabla de destino no es necesaria para MultiLoad.

MultiLoad admite dos modos:

  • IMPORT
  • DELETE

MultiLoad requiere una mesa de trabajo, una tabla de registro y dos tablas de errores además de la tabla de destino.

  • Log Table - Se usa para mantener los puntos de control tomados durante la carga que se usarán para reiniciar.

  • Error Tables- Estas tablas se insertan durante la carga cuando ocurre un error. La primera tabla de errores almacena errores de conversión, mientras que la segunda tabla de errores almacena registros duplicados.

  • Log Table - Mantiene los resultados de cada fase de MultiLoad con el propósito de reiniciar.

  • Work table- El script MultiLoad crea una tabla de trabajo por tabla de destino. La tabla de trabajo se utiliza para mantener las tareas DML y los datos de entrada.

Limitación

MultiLoad tiene algunas limitaciones.

  • El índice secundario único no es compatible con la tabla de destino.
  • No se admite la integridad referencial.
  • No se admiten activadores.

Cómo funciona MultiLoad

La importación de MultiLoad tiene cinco fases:

  • Phase 1 - Fase preliminar: realiza actividades básicas de configuración.

  • Phase 2 - Fase de transacción DML: verifica la sintaxis de las declaraciones DML y las lleva al sistema Teradata.

  • Phase 3 - Fase de adquisición: trae los datos de entrada a las tablas de trabajo y bloquea la mesa.

  • Phase 4 - Fase de aplicación: aplica todas las operaciones de DML.

  • Phase 5 - Fase de limpieza: libera el bloqueo de la mesa.

Los pasos involucrados en un script MultiLoad son:

  • Step 1 - Prepara la mesa de registro.

  • Step 2 - Inicie sesión en Teradata.

  • Step 3 - Especifique las tablas de destino, trabajo y error.

  • Step 4 - Definir el diseño del archivo INPUT.

  • Step 5 - Definir las consultas DML.

  • Step 6 - Nombre el archivo IMPORT.

  • Step 7 - Especifique el DISEÑO que se utilizará.

  • Step 8 - Iniciar la carga.

  • Step 9 - Finalizar la carga y finalizar las sesiones.

Ejemplo

Cree un archivo de texto con los siguientes registros y asigne un nombre al archivo employee.txt.

101,Mike,James,1980-01-05,2010-03-01,1  
102,Robert,Williams,1983-03-05,2010-09-01,1 
103,Peter,Paul,1983-04-01,2009-02-12,2 
104,Alex,Stuart,1984-11-06,2014-01-01,2 
105,Robert,James,1984-12-01,2015-03-09,3

El siguiente ejemplo es un script MultiLoad que lee registros de la tabla de empleados y los carga en la tabla Employee_Stg.

.LOGTABLE tduser.Employee_log;  
.LOGON 192.168.1.102/dbc,dbc; 
   .BEGIN MLOAD TABLES Employee_Stg;  
      .LAYOUT Employee;  
      .FIELD in_EmployeeNo * VARCHAR(10);  
      .FIELD in_FirstName * VARCHAR(30); 
      .FIELD in_LastName * VARCHAR(30);  
      .FIELD in_BirthDate * VARCHAR(10); 
      .FIELD in_JoinedDate * VARCHAR(10);  
      .FIELD in_DepartmentNo * VARCHAR(02);

      .DML LABEL EmpLabel; 
      INSERT INTO Employee_Stg (
         EmployeeNo,
         FirstName,
         LastName,
         BirthDate,
         JoinedDate,
         DepartmentNo
      )  
      VALUES (
         :in_EmployeeNo,
         :in_FirstName,
         :in_Lastname,
         :in_BirthDate,
         :in_JoinedDate,
         :in_DepartmentNo
      );
      .IMPORT INFILE employee.txt  
      FORMAT VARTEXT ','
      LAYOUT Employee
      APPLY EmpLabel;  
   .END MLOAD;  
LOGOFF;

Ejecución de un script de carga múltiple

Una vez que se crea el archivo de entrada employee.txt y el script multiload se denomina EmployeeLoad.ml, puede ejecutar el script Multiload utilizando el siguiente comando en UNIX y Windows.

Multiload < EmployeeLoad.ml;

La utilidad FastExport se utiliza para exportar datos de tablas de Teradata a archivos planos. También puede generar los datos en formato de informe. Los datos se pueden extraer de una o más tablas usando Join. Dado que FastExport exporta los datos en bloques de 64K, resulta útil para extraer un gran volumen de datos.

Ejemplo

Considere la siguiente tabla de empleados.

Numero de empleado Primer nombre Apellido Fecha de nacimiento
101 Miguel James 5/1/1980
104 Alex Stuart 6/11/1984
102 Robert Williams 05/03/1983
105 Robert James 1/12/1984
103 Pedro Pablo 1/4/1983

A continuación se muestra un ejemplo de un script FastExport. Exporta datos de la tabla de empleados y los escribe en un archivo employeedata.txt.

.LOGTABLE tduser.employee_log;  
.LOGON 192.168.1.102/dbc,dbc;  
   DATABASE tduser;  
   .BEGIN EXPORT SESSIONS 2;  
      .EXPORT OUTFILE employeedata.txt  
      MODE RECORD FORMAT TEXT;
      SELECT CAST(EmployeeNo AS CHAR(10)), 
         CAST(FirstName AS CHAR(15)), 
         CAST(LastName AS CHAR(15)), 
         CAST(BirthDate AS CHAR(10))   
      FROM
      Employee;
   .END EXPORT;
.LOGOFF;

Ejecución de un script FastExport

Una vez que la secuencia de comandos está escrita y nombrada como employee.fx, puede usar el siguiente comando para ejecutar la secuencia de comandos.

fexp < employee.fx

Después de ejecutar el comando anterior, recibirá el siguiente resultado en el archivo employeedata.txt.

103       Peter          Paul           1983-04-01 
101       Mike           James          1980-01-05 
102       Robert         Williams       1983-03-05 
105       Robert         James          1984-12-01 
104       Alex           Stuart         1984-11-06

Términos de FastExport

A continuación se muestra la lista de términos que se usan comúnmente en el script FastExport.

  • LOGTABLE - Especifica la tabla de registro para reiniciar.

  • LOGON - Inicia sesión en Teradata e inicia una o más sesiones.

  • DATABASE - Establece la base de datos predeterminada.

  • BEGIN EXPORT - Indica el inicio de la exportación.

  • EXPORT - Especifica el archivo de destino y el formato de exportación.

  • SELECT - Especifica la consulta de selección para exportar datos.

  • END EXPORT - Especifica el final de FastExport.

  • LOGOFF - Finaliza todas las sesiones y finaliza FastExport.

La utilidad BTEQ es una poderosa utilidad en Teradata que se puede usar tanto en modo por lotes como interactivo. Se puede utilizar para ejecutar cualquier declaración DDL, declaración DML, crear macros y procedimientos almacenados. BTEQ se puede utilizar para importar datos a tablas de Teradata desde un archivo plano y también se puede utilizar para extraer datos de tablas a archivos o informes.

Términos BTEQ

A continuación se muestra la lista de términos que se usan comúnmente en los scripts BTEQ.

  • LOGON - Se utiliza para iniciar sesión en el sistema Teradata.

  • ACTIVITYCOUNT - Devuelve el número de filas afectadas por la consulta anterior.

  • ERRORCODE - Devuelve el código de estado de la consulta anterior.

  • DATABASE - Establece la base de datos predeterminada.

  • LABEL - Asigna una etiqueta a un conjunto de comandos SQL.

  • RUN FILE - Ejecuta la consulta contenida en un archivo.

  • GOTO - Transfiere el control a una etiqueta.

  • LOGOFF - Cierra la sesión de la base de datos y finaliza todas las sesiones.

  • IMPORT : Especifica la ruta del archivo de entrada.

  • EXPORT - Especifica la ruta del archivo de salida e inicia la exportación.

Ejemplo

A continuación se muestra un ejemplo de script BTEQ.

.LOGON 192.168.1.102/dbc,dbc; 
   DATABASE tduser;

   CREATE TABLE employee_bkup ( 
      EmployeeNo INTEGER, 
      FirstName CHAR(30), 
      LastName CHAR(30), 
      DepartmentNo SMALLINT, 
      NetPay INTEGER 
   )
   Unique Primary Index(EmployeeNo);

   .IF ERRORCODE <> 0 THEN .EXIT ERRORCODE;
  
   SELECT * FROM  
   Employee 
   Sample 1; 
   .IF ACTIVITYCOUNT <> 0 THEN .GOTO InsertEmployee;  

   DROP TABLE employee_bkup;
  
   .IF ERRORCODE <> 0 THEN .EXIT ERRORCODE; 
 
   .LABEL InsertEmployee 
   INSERT INTO employee_bkup 
   SELECT a.EmployeeNo, 
      a.FirstName, 
      a.LastName, 
      a.DepartmentNo, 
      b.NetPay 
   FROM  
   Employee a INNER JOIN Salary b 
   ON (a.EmployeeNo = b.EmployeeNo);  

   .IF ERRORCODE <> 0 THEN .EXIT ERRORCODE; 
.LOGOFF;

El script anterior realiza las siguientes tareas.

  • Inicia sesión en Teradata System.

  • Establece la base de datos predeterminada.

  • Crea una tabla llamada employee_bkup.

  • Selecciona un registro de la tabla Empleado para verificar si la tabla tiene registros.

  • Elimina la tabla employee_bkup, si la tabla está vacía.

  • Transfiere el control a una etiqueta InsertEmployee que inserta registros en la tabla employee_bkup

  • Comprueba ERRORCODE para asegurarse de que la instrucción sea correcta, después de cada instrucción SQL.

  • ACTIVITYCOUNT devuelve el número de registros seleccionados / afectados por la consulta SQL anterior.