छत्ता - देखें और अनुक्रमित

इस अध्याय में विचारों को बनाने और प्रबंधित करने का तरीका बताया गया है। उपयोगकर्ता की आवश्यकताओं के आधार पर दृश्य उत्पन्न किए जाते हैं। आप किसी भी परिणाम सेट डेटा को दृश्य के रूप में सहेज सकते हैं। हाइव में दृश्य का उपयोग SQL में दृश्य के समान है। यह एक मानक RDBMS अवधारणा है। हम सभी DML परिचालनों को एक दृश्य पर निष्पादित कर सकते हैं।

एक दृश्य बनाना

आप एक सेलेक्ट स्टेटमेंट निष्पादित करते समय एक दृश्य बना सकते हैं। सिंटैक्स निम्नानुसार है:

CREATE VIEW [IF NOT EXISTS] view_name [(column_name [COMMENT column_comment], ...) ]
[COMMENT table_comment]
AS SELECT ...

उदाहरण

आइए हम एक उदाहरण देखें। कर्मचारी आईडी, नाम, वेतन, पदनाम और विभाग के साथ नीचे दी गई तालिका के अनुसार मान लें। कर्मचारी विवरण प्राप्त करने के लिए एक प्रश्न उत्पन्न करें जो 30000 रुपये से अधिक का वेतन अर्जित करता है। हम परिणाम को एक दृश्य नाम में संग्रहीत करते हैंemp_30000.

+------+--------------+-------------+-------------------+--------+
| ID   | Name         | Salary      | Designation       | Dept   |
+------+--------------+-------------+-------------------+--------+
|1201  | Gopal        | 45000       | Technical manager | TP     |
|1202  | Manisha      | 45000       | Proofreader       | PR     |
|1203  | Masthanvali  | 40000       | Technical writer  | TP     |
|1204  | Krian        | 40000       | Hr Admin          | HR     |
|1205  | Kranthi      | 30000       | Op Admin          | Admin  |
+------+--------------+-------------+-------------------+--------+

निम्नलिखित क्वेरी उपरोक्त परिदृश्य का उपयोग करते हुए कर्मचारी विवरण प्राप्त करती है:

hive> CREATE VIEW emp_30000 AS
SELECT * FROM employee
WHERE salary>30000;

एक दृश्य गिर रहा है

एक दृश्य छोड़ने के लिए निम्नलिखित सिंटैक्स का उपयोग करें:

DROP VIEW view_name

निम्नलिखित क्वेरी emp_30000 के रूप में नामित एक दृश्य को छोड़ देती है:

hive> DROP VIEW emp_30000;

एक सूचकांक बनाना

एक सूचकांक एक तालिका के एक विशेष स्तंभ पर एक संकेतक के अलावा कुछ भी नहीं है। इंडेक्स बनाने का मतलब है कि किसी टेबल के किसी विशेष कॉलम पर पॉइंटर बनाना। इसका सिंटैक्स इस प्रकार है:

CREATE INDEX index_name
ON TABLE base_table_name (col_name, ...)
AS 'index.handler.class.name'
[WITH DEFERRED REBUILD]
[IDXPROPERTIES (property_name=property_value, ...)]
[IN TABLE index_table_name]
[PARTITIONED BY (col_name, ...)]
[
   [ ROW FORMAT ...] STORED AS ...
   | STORED BY ...
]
[LOCATION hdfs_path]
[TBLPROPERTIES (...)]

उदाहरण

सूचकांक के लिए एक उदाहरण लेते हैं। उसी कर्मचारी तालिका का उपयोग करें जिसे हमने पहले फ़ील्ड आईडी, नाम, वेतन, पदनाम और विभाग के साथ उपयोग किया है। कर्मचारी तालिका के वेतन स्तंभ पर index_salary नामक एक सूचकांक बनाएँ।

निम्नलिखित क्वेरी एक इंडेक्स बनाती है:

hive> CREATE INDEX inedx_salary ON TABLE employee(salary)
AS 'org.apache.hadoop.hive.ql.index.compact.CompactIndexHandler';

यह वेतन स्तंभ के लिए एक संकेतक है। यदि स्तंभ को संशोधित किया गया है, तो परिवर्तनों को एक सूचकांक मान का उपयोग करके संग्रहीत किया जाता है।

एक सूचकांक छोड़ने

अनुक्रमणिका को छोड़ने के लिए निम्न सिंटैक्स का उपयोग किया जाता है:

DROP INDEX <index_name> ON <table_name>

निम्नलिखित क्वेरी index_salary नामक एक इंडेक्स को छोड़ती है:

hive> DROP INDEX index_salary ON employee;