Hive - просмотр и индексы

В этой главе описывается, как создавать представления и управлять ими. Просмотры создаются на основе требований пользователей. Вы можете сохранить любые данные набора результатов в виде представления. Использование представления в Hive такое же, как и представление в SQL. Это стандартная концепция СУБД. Мы можем выполнять все операции DML с представлением.

Создание представления

Вы можете создать представление во время выполнения оператора SELECT. Синтаксис следующий:

CREATE VIEW [IF NOT EXISTS] view_name [(column_name [COMMENT column_comment], ...) ]
[COMMENT table_comment]
AS SELECT ...

пример

Давайте возьмем пример для просмотра. Предположим, что таблица сотрудников, как указано ниже, с полями Id, Name, Salary, Designation и Dept. Создайте запрос для получения сведений о сотрудниках, которые получают зарплату более 30000 рупий. Мы сохраняем результат в представлении с именемemp_30000.

+------+--------------+-------------+-------------------+--------+
| ID   | Name         | Salary      | Designation       | Dept   |
+------+--------------+-------------+-------------------+--------+
|1201  | Gopal        | 45000       | Technical manager | TP     |
|1202  | Manisha      | 45000       | Proofreader       | PR     |
|1203  | Masthanvali  | 40000       | Technical writer  | TP     |
|1204  | Krian        | 40000       | Hr Admin          | HR     |
|1205  | Kranthi      | 30000       | Op Admin          | Admin  |
+------+--------------+-------------+-------------------+--------+

Следующий запрос извлекает сведения о сотруднике, используя описанный выше сценарий:

hive> CREATE VIEW emp_30000 AS
SELECT * FROM employee
WHERE salary>30000;

Удаление представления

Используйте следующий синтаксис, чтобы удалить представление:

DROP VIEW view_name

Следующий запрос отбрасывает представление с именем emp_30000:

hive> DROP VIEW emp_30000;

Создание индекса

Индекс - это не что иное, как указатель на определенный столбец таблицы. Создание индекса означает создание указателя на определенный столбец таблицы. Его синтаксис следующий:

CREATE INDEX index_name
ON TABLE base_table_name (col_name, ...)
AS 'index.handler.class.name'
[WITH DEFERRED REBUILD]
[IDXPROPERTIES (property_name=property_value, ...)]
[IN TABLE index_table_name]
[PARTITIONED BY (col_name, ...)]
[
   [ ROW FORMAT ...] STORED AS ...
   | STORED BY ...
]
[LOCATION hdfs_path]
[TBLPROPERTIES (...)]

пример

Давайте возьмем пример для index. Используйте ту же таблицу сотрудников, которую мы использовали ранее, с полями Id, Name, Salary, Designation и Dept. Создайте индекс с именем index_salary в столбце salary таблицы сотрудников.

Следующий запрос создает индекс:

hive> CREATE INDEX inedx_salary ON TABLE employee(salary)
AS 'org.apache.hadoop.hive.ql.index.compact.CompactIndexHandler';

Это указатель на столбец зарплаты. Если столбец изменен, изменения сохраняются с использованием значения индекса.

Удаление индекса

Для удаления индекса используется следующий синтаксис:

DROP INDEX <index_name> ON <table_name>

Следующий запрос отбрасывает индекс с именем index_salary:

hive> DROP INDEX index_salary ON employee;