HiveQL - चयन-जुड़ता है
JOIN एक ऐसा क्लॉज होता है, जिसका उपयोग विशिष्ट क्षेत्रों को दो तालिकाओं से प्रत्येक के लिए मानों का उपयोग करके किया जाता है। इसका उपयोग डेटाबेस में दो या अधिक तालिकाओं से रिकॉर्ड को संयोजित करने के लिए किया जाता है।
वाक्य - विन्यास
join_table:
table_reference JOIN table_factor [join_condition]
| table_reference {LEFT|RIGHT|FULL} [OUTER] JOIN table_reference
join_condition
| table_reference LEFT SEMI JOIN table_reference join_condition
| table_reference CROSS JOIN table_reference [join_condition]
उदाहरण
हम इस अध्याय में निम्नलिखित दो तालिकाओं का उपयोग करेंगे। ग्राहक नाम की निम्न तालिका पर विचार करें।
+----+----------+-----+-----------+----------+
| ID | NAME | AGE | ADDRESS | SALARY |
+----+----------+-----+-----------+----------+
| 1 | Ramesh | 32 | Ahmedabad | 2000.00 |
| 2 | Khilan | 25 | Delhi | 1500.00 |
| 3 | kaushik | 23 | Kota | 2000.00 |
| 4 | Chaitali | 25 | Mumbai | 6500.00 |
| 5 | Hardik | 27 | Bhopal | 8500.00 |
| 6 | Komal | 22 | MP | 4500.00 |
| 7 | Muffy | 24 | Indore | 10000.00 |
+----+----------+-----+-----------+----------+
एक अन्य तालिका ORDERS पर विचार करें:
+-----+---------------------+-------------+--------+
|OID | DATE | CUSTOMER_ID | AMOUNT |
+-----+---------------------+-------------+--------+
| 102 | 2009-10-08 00:00:00 | 3 | 3000 |
| 100 | 2009-10-08 00:00:00 | 3 | 1500 |
| 101 | 2009-11-20 00:00:00 | 2 | 1560 |
| 103 | 2008-05-20 00:00:00 | 4 | 2060 |
+-----+---------------------+-------------+--------+
इस प्रकार दिए गए विभिन्न प्रकार के जोड़ हैं:
- JOIN
- बाईं ओर का बाहरी जोड़
- राइट कंप्यूटर शामिल हैं
- पूरा कंप्यूटर शामिल है
में शामिल होने के
JOIN क्लॉज का उपयोग कई तालिकाओं से रिकॉर्ड को संयोजित करने और पुनः प्राप्त करने के लिए किया जाता है। JOIN SQL में OUTER JOIN के समान है। एक JOIN स्थिति को प्राथमिक कुंजी और तालिकाओं की विदेशी कुंजियों का उपयोग करके उठाया जाना है।
निम्नलिखित क्वेरी कस्टमर और आदेश तालिकाओं पर शामिल होती है, और अभिलेखों को पुनः प्राप्त करती है:
hive> SELECT c.ID, c.NAME, c.AGE, o.AMOUNT
FROM CUSTOMERS c JOIN ORDERS o
ON (c.ID = o.CUSTOMER_ID);
क्वेरी के सफल निष्पादन पर, आपको निम्न प्रतिक्रिया देखने को मिलती है:
+----+----------+-----+--------+
| ID | NAME | AGE | AMOUNT |
+----+----------+-----+--------+
| 3 | kaushik | 23 | 3000 |
| 3 | kaushik | 23 | 1500 |
| 2 | Khilan | 25 | 1560 |
| 4 | Chaitali | 25 | 2060 |
+----+----------+-----+--------+
बाईं ओर का बाहरी जोड़
HiveQL LEFT OUTER JOIN, बाएं टेबल से सभी पंक्तियों को लौटाता है, भले ही सही तालिका में कोई मैच न हों। इसका अर्थ है, यदि ON क्लॉज राइट टेबल में 0 (शून्य) रिकॉर्ड से मेल खाता है, तो JOIN परिणाम में एक पंक्ति देता है, लेकिन राइट टेबल से प्रत्येक कॉलम में NULL के साथ।
एक बाईं ओर की बाईं बाईं मेज से सभी मान लौटाता है, साथ ही दाईं मेज से मिलान किए गए मान, या कोई मिलान जोइन के मिलान के मामले में NULL नहीं है।
निम्नलिखित प्रश्न ग्राहक और आदेश तालिकाओं के बीच LEFT OUTER JOIN प्रदर्शित करता है:
hive> SELECT c.ID, c.NAME, o.AMOUNT, o.DATE
FROM CUSTOMERS c
LEFT OUTER JOIN ORDERS o
ON (c.ID = o.CUSTOMER_ID);
क्वेरी के सफल निष्पादन पर, आपको निम्न प्रतिक्रिया देखने को मिलती है:
+----+----------+--------+---------------------+
| ID | NAME | AMOUNT | DATE |
+----+----------+--------+---------------------+
| 1 | Ramesh | NULL | NULL |
| 2 | Khilan | 1560 | 2009-11-20 00:00:00 |
| 3 | kaushik | 3000 | 2009-10-08 00:00:00 |
| 3 | kaushik | 1500 | 2009-10-08 00:00:00 |
| 4 | Chaitali | 2060 | 2008-05-20 00:00:00 |
| 5 | Hardik | NULL | NULL |
| 6 | Komal | NULL | NULL |
| 7 | Muffy | NULL | NULL |
+----+----------+--------+---------------------+
राइट कंप्यूटर शामिल हैं
HiveQL राइट OUTER JOIN दाएं टेबल से सभी पंक्तियों को वापस कर देता है, भले ही बाईं तालिका में कोई मेल न हो। यदि ओन क्लॉज लेफ्ट टेबल में 0 (शून्य) रिकॉर्ड से मेल खाता है, तो JOIN परिणाम में एक पंक्ति देता है, लेकिन लेफ्ट टेबल से प्रत्येक कॉलम में NULL के साथ।
राइट जॉइन सही तालिका से सभी मान लौटाता है, साथ ही बाईं तालिका से मिलान किए गए मान या कोई मिलान शामिल नहीं होने की स्थिति में NULL देता है।
निम्न क्वेरी ग्राहक और आदेश तालिकाओं के बीच सही OUTER JOIN प्रदर्शित करती है।
notranslate "> hive> SELECT c.ID, c.NAME, o.AMOUNT, o.DATE FROM CUSTOMERS c RIGHT OUTER JOIN ORDERS o ON (c.ID = o.CUSTERER_ID);क्वेरी के सफल निष्पादन पर, आपको निम्न प्रतिक्रिया देखने को मिलती है:
+------+----------+--------+---------------------+
| ID | NAME | AMOUNT | DATE |
+------+----------+--------+---------------------+
| 3 | kaushik | 3000 | 2009-10-08 00:00:00 |
| 3 | kaushik | 1500 | 2009-10-08 00:00:00 |
| 2 | Khilan | 1560 | 2009-11-20 00:00:00 |
| 4 | Chaitali | 2060 | 2008-05-20 00:00:00 |
+------+----------+--------+---------------------+
पूरा कंप्यूटर शामिल है
HiveQL भरा पूरा जॉय संयुक्त और बाएँ और दाएँ दोनों बाहरी तालिकाओं के रिकॉर्ड को जोड़ती है जो JOIN स्थिति को पूरा करते हैं। शामिल तालिका में दोनों तालिकाओं से सभी रिकॉर्ड शामिल हैं, या दोनों तरफ लापता मैचों के लिए NULL मानों में भरता है।
निम्नलिखित प्रश्न ग्राहक और आदेश तालिकाओं के बीच पूरी तरह से शामिल हैं:
hive> SELECT c.ID, c.NAME, o.AMOUNT, o.DATE
FROM CUSTOMERS c
FULL OUTER JOIN ORDERS o
ON (c.ID = o.CUSTOMER_ID);
क्वेरी के सफल निष्पादन पर, आपको निम्न प्रतिक्रिया देखने को मिलती है:
+------+----------+--------+---------------------+
| ID | NAME | AMOUNT | DATE |
+------+----------+--------+---------------------+
| 1 | Ramesh | NULL | NULL |
| 2 | Khilan | 1560 | 2009-11-20 00:00:00 |
| 3 | kaushik | 3000 | 2009-10-08 00:00:00 |
| 3 | kaushik | 1500 | 2009-10-08 00:00:00 |
| 4 | Chaitali | 2060 | 2008-05-20 00:00:00 |
| 5 | Hardik | NULL | NULL |
| 6 | Komal | NULL | NULL |
| 7 | Muffy | NULL | NULL |
| 3 | kaushik | 3000 | 2009-10-08 00:00:00 |
| 3 | kaushik | 1500 | 2009-10-08 00:00:00 |
| 2 | Khilan | 1560 | 2009-11-20 00:00:00 |
| 4 | Chaitali | 2060 | 2008-05-20 00:00:00 |
+------+----------+--------+---------------------+