Импала - Группировка по пунктам
Импала GROUP BY Предложение используется в сотрудничестве с оператором SELECT для организации идентичных данных в группы.
Синтаксис
Ниже приводится синтаксис предложения GROUP BY.
select data from table_name Group BY col_name;
пример
Предположим, у нас есть таблица с именем customers в базе данных my_db и его содержимое выглядит следующим образом -
[quickstart.cloudera:21000] > select * from customers;
Query: select * from customers
+----+----------+-----+-----------+--------+
| id | name | age | address | salary |
+----+----------+-----+-----------+--------+
| 1 | Ramesh | 32 | Ahmedabad | 20000 |
| 2 | Khilan | 25 | Delhi | 15000 |
| 3 | kaushik | 23 | Kota | 30000 |
| 4 | Chaitali | 25 | Mumbai | 35000 |
| 5 | Hardik | 27 | Bhopal | 40000 |
| 6 | Komal | 22 | MP | 32000 |
+----+----------+-----+-----------+--------+
Fetched 6 row(s) in 0.51s
Вы можете получить общую сумму зарплаты каждого клиента, используя запрос GROUP BY, как показано ниже.
[quickstart.cloudera:21000] > Select name, sum(salary) from customers Group BY name;
При выполнении вышеуказанный запрос дает следующий результат.
Query: select name, sum(salary) from customers Group BY name
+----------+-------------+
| name | sum(salary) |
+----------+-------------+
| Ramesh | 20000 |
| Komal | 32000 |
| Hardik | 40000 |
| Khilan | 15000 |
| Chaitali | 35000 |
| kaushik | 30000 |
+----------+-------------+
Fetched 6 row(s) in 1.75s
Предположим, что в этой таблице есть несколько записей, как показано ниже.
+----+----------+-----+-----------+--------+
| id | name | age | address | salary |
+----+----------+-----+-----------+--------+
| 1 | Ramesh | 32 | Ahmedabad | 20000 |
| 2 | Ramesh | 32 | Ahmedabad | 1000| |
| 3 | Khilan | 25 | Delhi | 15000 |
| 4 | kaushik | 23 | Kota | 30000 |
| 5 | Chaitali | 25 | Mumbai | 35000 |
| 6 | Chaitali | 25 | Mumbai | 2000 |
| 7 | Hardik | 27 | Bhopal | 40000 |
| 8 | Komal | 22 | MP | 32000 |
+----+----------+-----+-----------+--------+
Опять же, вы можете получить общую сумму заработной платы сотрудников с учетом повторных записей записей, используя Group By пункт, как показано ниже.
Select name, sum(salary) from customers Group BY name;
При выполнении вышеуказанный запрос дает следующий результат.
Query: select name, sum(salary) from customers Group BY name
+----------+-------------+
| name | sum(salary) |
+----------+-------------+
| Ramesh | 21000 |
| Komal | 32000 |
| Hardik | 40000 |
| Khilan | 15000 |
| Chaitali | 37000 |
| kaushik | 30000 |
+----------+-------------+
Fetched 6 row(s) in 1.75s