HiveQL - चयन-समूह द्वारा

यह अध्याय एक सेलेक्ट स्टेटमेंट में GROUP BY क्लॉज के विवरण की व्याख्या करता है। ग्रुप बाय क्लॉज़ का उपयोग किसी विशेष संग्रह कॉलम का उपयोग करके सेट किए गए सभी रिकॉर्डों को समूहीकृत करने के लिए किया जाता है। इसका उपयोग अभिलेखों के समूह को क्वेरी करने के लिए किया जाता है।

वाक्य - विन्यास

ग्रुप बाय क्लॉज का सिंटैक्स इस प्रकार है:

SELECT [ALL | DISTINCT] select_expr, select_expr, ... 
FROM table_reference 
[WHERE where_condition] 
[GROUP BY col_list] 
[HAVING having_condition] 
[ORDER BY col_list]] 
[LIMIT number];

उदाहरण

आइए हम SELECT… GROUP BY क्लॉज का एक उदाहरण लेते हैं। कर्मचारी तालिका मान लीजिए, नीचे दिए गए आईडी, नाम, वेतन, पदनाम और विभाग के साथ। प्रत्येक विभाग में कर्मचारियों की संख्या को पुनः प्राप्त करने के लिए एक क्वेरी बनाएँ।

+------+--------------+-------------+-------------------+--------+ 
| ID   | Name         | Salary      | Designation       | Dept   |
+------+--------------+-------------+-------------------+--------+ 
|1201  | Gopal        | 45000       | Technical manager | TP     | 
|1202  | Manisha      | 45000       | Proofreader       | PR     | 
|1203  | Masthanvali  | 40000       | Technical writer  | TP     | 
|1204  | Krian        | 45000       | Proofreader       | PR     | 
|1205  | Kranthi      | 30000       | Op Admin          | Admin  |
+------+--------------+-------------+-------------------+--------+

निम्नलिखित क्वेरी उपरोक्त परिदृश्य का उपयोग करके कर्मचारी विवरण को पुनः प्राप्त करती है।

hive> SELECT Dept,count(*) FROM employee GROUP BY DEPT;

क्वेरी के सफल निष्पादन पर, आपको निम्न प्रतिक्रिया देखने को मिलती है:

+------+--------------+ 
| Dept | Count(*)     | 
+------+--------------+ 
|Admin |    1         | 
|PR    |    2         | 
|TP    |    3         | 
+------+--------------+

JDBC कार्यक्रम

नीचे दिए गए उदाहरण के लिए ग्रुप बाय क्लॉज को लागू करने के लिए JDBC प्रोग्राम नीचे दिया गया है।

import java.sql.SQLException;
import java.sql.Connection;
import java.sql.ResultSet;
import java.sql.Statement;
import java.sql.DriverManager;

public class HiveQLGroupBy {
   private static String driverName = "org.apache.hadoop.hive.jdbc.HiveDriver";
   
   public static void main(String[] args) throws SQLException {
   
      // Register driver and create driver instance
      Class.forName(driverName);
      
      // get connection
      Connection con = DriverManager.
      getConnection("jdbc:hive://localhost:10000/userdb", "", "");
      
      // create statement
      Statement stmt = con.createStatement();
      
      // execute statement
      Resultset res = stmt.executeQuery(“SELECT Dept,count(*) ” + “FROM employee GROUP BY DEPT; ”);
      System.out.println(" Dept \t count(*)");
      
      while (res.next()) {
         System.out.println(res.getString(1) + " " + res.getInt(2)); 
      }
      con.close();
   }
}

कार्यक्रम को HiveQLGroupBy.java नामक फ़ाइल में सहेजें। इस प्रोग्राम को संकलित करने और निष्पादित करने के लिए निम्न कमांड का उपयोग करें।

$ javac HiveQLGroupBy.java
$ java HiveQLGroupBy

आउटपुट:

Dept     Count(*)
 Admin       1
 PR          2
 TP          3