Impala-クイックガイド

Impalaとは何ですか?

Impalaは、Hadoopクラスターに格納されている大量のデータを処理するためのMPP(Massive Parallel Processing)SQLクエリエンジンです。これは、C ++およびJavaで記述されたオープンソースソフトウェアです。Hadoopの他のSQLエンジンと比較して、高いパフォーマンスと低いレイテンシーを提供します。

言い換えると、Impalaは最高のパフォーマンスを発揮するSQLエンジン(RDBMSのようなエクスペリエンスを提供)であり、Hadoop分散ファイルシステムに格納されているデータにアクセスするための最速の方法を提供します。

なぜインパラ?

Impalaは、HDFS、HBase、Metastore、YARN、Sentryなどの標準コンポーネントを利用することにより、従来の分析データベースのSQLサポートとマルチユーザーパフォーマンスをApacheHadoopのスケーラビリティと柔軟性と組み合わせています。

  • Impalaを使用すると、ユーザーは、Hiveなどの他のSQLエンジンと比較して、SQLクエリを使用してHDFSまたはHBaseとより高速に通信できます。

  • Impalaは、Hadoopで使用されるParquet、Avro、RCFileなどのほぼすべてのファイル形式を読み取ることができます。

Impalaは、Apache Hiveと同じメタデータ、SQL構文(Hive SQL)、ODBCドライバー、およびユーザーインターフェイス(Hue Beeswax)を使用して、バッチ指向またはリアルタイムのクエリに使い慣れた統合プラットフォームを提供します。

Apache Hiveとは異なり、 Impala is not based on MapReduce algorithms。に基づく分散アーキテクチャを実装しますdaemon processes 同じマシンで実行されるクエリ実行のすべての側面を担当します。

したがって、MapReduceを利用する待ち時間が短縮され、ImpalaがApacheHiveよりも高速になります。

Impalaの利点

ClouderaImpalaのいくつかの注目すべき利点のリストを次に示します。

  • impalaを使用すると、HDFSに保存されているデータを、従来のSQLの知識を使用して超高速で処理できます。

  • データ処理はデータが存在する場所(Hadoopクラスター上)で実行されるため、Impalaでの作業中に、Hadoopに保存されたデータにデータ変換やデータ移動は必要ありません。

  • Impalaを使用すると、Java(MapReduceジョブ)の知識がなくても、HDFS、HBase、およびAmazons3に保存されているデータにアクセスできます。SQLクエリの基本的な考え方でそれらにアクセスできます。

  • ビジネスツールでクエリを作成するには、データを複雑な抽出-変換-読み込み(ETL)サイクルを経る必要があります。ただし、Impalaを使用すると、この手順が短縮されます。ロードと再編成の時間のかかる段階は、次のような新しい手法で克服されます。exploratory data analysis & data discovery プロセスを高速化します。

  • Impalaは、データウェアハウスのシナリオで一般的な大規模クエリ用に最適化された列型ストレージレイアウトであるParquetファイル形式の使用を開拓しています。

インパラの特徴

以下に、clouderaImpalaの機能を示します-

  • Impalaは、Apacheライセンスの下でオープンソースとして無料で入手できます。

  • Impalaは、メモリ内データ処理をサポートします。つまり、データを移動せずにHadoopデータノードに保存されているデータにアクセス/分析します。

  • SQLのようなクエリを使用してImpalaを使用してデータにアクセスできます。

  • Impalaは、他のSQLエンジンと比較して、HDFSのデータへのより高速なアクセスを提供します。

  • Impalaを使用すると、HDFS、Apache HBase、Amazons3などのストレージシステムにデータを保存できます。

  • Impalaは、Tableau、Pentaho、Micro戦略、Zoomデータなどのビジネスインテリジェンスツールと統合できます。

  • Impalaは、LZO、Sequence File、Avro、RCFile、Parquetなどのさまざまなファイル形式をサポートしています。

  • Impalaは、Apache Hiveのメタデータ、ODBCドライバー、およびSQL構文を使用します。

リレーショナルデータベースとImpala

Impalaは、SQLやHiveQLに似たクエリ言語を使用します。次の表は、SQLとImpalaクエリ言語の主な違いのいくつかを説明しています。

インパラ リレーショナルデータベース
Impalaは、HiveQLに似たSQLのようなクエリ言語を使用します。 リレーショナルデータベースはSQL言語を使用します。
Impalaでは、個々のレコードを更新または削除することはできません。 リレーショナルデータベースでは、個々のレコードを更新または削除することができます。
Impalaはトランザクションをサポートしていません。 リレーショナルデータベースはトランザクションをサポートします。
Impalaはインデックス作成をサポートしていません。 リレーショナルデータベースはインデックス作成をサポートしています。
Impalaは、大量のデータ(ペタバイト)を保存および管理します。 リレーショナルデータベースは、Impalaと比較して、処理するデータ量(テラバイト)が少なくなります。

Hive、Hbase、およびImpala

Cloudera ImpalaはHiveと同じクエリ言語、メタストア、およびユーザーインターフェイスを使用しますが、特定の点でHiveおよびHBaseとは異なります。次の表は、HBase、Hive、およびImpalaの比較分析を示しています。

HBase ハイブ インパラ
HBaseは、ApacheHadoopに基づくワイドカラムストアデータベースです。BigTableの概念を使用しています。 Hiveはデータウェアハウスソフトウェアです。これを使用して、Hadoop上に構築された大規模な分散データセットにアクセスして管理できます。 Impalaは、Hadoopに保存されているデータを管理および分析するためのツールです。
HBaseのデータモデルはワイド列ストアです。 ハイブはリレーショナルモデルに従います。 Impalaはリレーショナルモデルに従います。
HBaseはJava言語を使用して開発されています。 HiveはJava言語を使用して開発されています。 ImpalaはC ++を使用して開発されています。
HBaseのデータモデルはスキーマフリーです。 Hiveのデータモデルはスキーマベースです。 Impalaのデータモデルはスキーマベースです。
HBaseは、Java、RESTful、およびThriftAPIを提供します。 Hiveは、JDBC、ODBC、ThriftAPIを提供します。 Impalaは、JDBCおよびODBCAPIを提供します。
C、C#、C ++、Groovy、Java PHP、Python、Scalaなどのプログラミング言語をサポートします。 C ++、Java、PHP、Pythonなどのプログラミング言語をサポートします。 Impalaは、JDBC / ODBCをサポートするすべての言語をサポートします。
HBaseはトリガーのサポートを提供します。 Hiveはトリガーをサポートしていません。 Impalaはトリガーをサポートしていません。

これら3つのデータベースすべて-

  • NOSQLデータベースです。

  • オープンソースとして利用できます。

  • サーバーサイドスクリプトをサポートします。

  • 耐久性や同時実行性などのACIDプロパティに従います。

  • 使用する sharding にとって partitioning

インパラの欠点

Impalaを使用することのいくつかの欠点は次のとおりです-

  • Impalaは、シリアル化と逆シリアル化をサポートしていません。
  • Impalaはテキストファイルのみを読み取ることができ、カスタムバイナリファイルは読み取ることができません。
  • 新しいレコード/ファイルがHDFSのデータディレクトリに追加されるたびに、テーブルを更新する必要があります。

この章では、Impalaをインストールするための前提条件、ダウンロード、インストール、およびセットアップの方法について説明します。 Impala あなたのシステムで。

Hadoopとそのエコシステムソフトウェアと同様に、LinuxオペレーティングシステムにImpalaをインストールする必要があります。clouderaはImpalaを出荷したため、Cloudera Quick Start VM.

この章では、ダウンロード方法について説明します Cloudera Quick Start VM そしてImpalaを起動します。

ClouderaクイックスタートVMのダウンロード

以下の手順に従って、の最新バージョンをダウンロードしてください。 Cloudera QuickStartVM

ステップ1

clouderaウェブサイトのホームページを開く http://www.cloudera.com/。以下のようなページが表示されます。

ステップ2

クリック Sign in clouderaホームページのリンクをクリックすると、以下に示すようにサインインページにリダイレクトされます。

まだ登録していない場合は、 Register Now あなたに与えるリンク Account Registration形。そこで登録し、clouderaアカウントにサインインします。

ステップ3

サインインした後、次のをクリックしてclouderaWebサイトのダウンロードページを開きます。 Downloads 次のスナップショットで強調表示されているリンク。

ステップ4-QuickStartVMをダウンロードする

clouderaをダウンロード QuickStartVM をクリックして Download Now 次のスナップショットで強調表示されているボタン

これにより、のダウンロードページにリダイレクトされます QuickStart VM

クリック Get ONE NOW ボタンをクリックし、使用許諾契約に同意して、以下に示すように送信ボタンをクリックします。

Clouderaは、VM互換のVMware、KVM、およびVIRTUALBOXを提供します。必要なバージョンを選択します。このチュートリアルでは、Cloudera QuickStartVM 仮想ボックスを使用してセットアップするため、 VIRTUALBOX DOWNLOAD 以下のスナップショットに示すように、ボタン。

これにより、という名前のファイルのダウンロードが開始されます cloudera-quickstart-vm-5.5.0-0-virtualbox.ovf これは仮想ボックスの画像ファイルです。

ClouderaQuickStartVMのインポート

ダウンロードした後 cloudera-quickstart-vm-5.5.0-0-virtualbox.ovfファイルの場合、仮想ボックスを使用してインポートする必要があります。そのためには、まず、システムに仮想ボックスをインストールする必要があります。ダウンロードした画像ファイルをインポートするには、以下の手順に従ってください。

ステップ1

次のリンクから仮想ボックスをダウンロードしてインストールします https://www.virtualbox.org/

ステップ2

仮想ボックスソフトウェアを開きます。クリックFile と選択します Import Appliance、以下に示すように。

ステップ3

クリックすると Import Appliance、[仮想アプライアンスのインポート]ウィンドウが表示されます。以下に示すように、ダウンロードした画像ファイルの場所を選択します。

インポート後 Cloudera QuickStartVMイメージ、仮想マシンを起動します。この仮想マシンには、Hadoop、cloudera Impala、および必要なすべてのソフトウェアがインストールされています。VMのスナップショットを以下に示します。

Impalaシェルの起動

Impalaを起動するには、ターミナルを開いて次のコマンドを実行します。

[cloudera@quickstart ~] $ impala-shell

これにより、Impala Shellが起動し、次のメッセージが表示されます。

Starting Impala Shell without Kerberos authentication 
Connected to quickstart.cloudera:21000 
Server version: impalad version 2.3.0-cdh5.5.0 RELEASE (build
0c891d79aa38f297d244855a32f1e17280e2129b) 
********************************************************************************
 Welcome to the Impala shell. Copyright (c) 2015 Cloudera, Inc. All rights reserved. 
(Impala Shell v2.3.0-cdh5.5.0 (0c891d7) built on Mon Nov 9 12:18:12 PST 2015)
 
Press TAB twice to see a list of available commands. 
******************************************************************************** 
[quickstart.cloudera:21000] >

Note −すべてのimpala-shellコマンドについては後の章で説明します。

Impalaクエリエディター

に加えて Impala shell、Hueブラウザを使用してImpalaと通信できます。CDH5をインストールしてImpalaを起動した後、ブラウザを開くと、以下のようなclouderaホームページが表示されます。

次に、ブックマークをクリックします HueHueブラウザを開きます。クリックすると、Hue Browserのログインページが表示され、clouderaとclouderaの認証情報でログが記録されます。

Hueブラウザーにログオンするとすぐに、以下に示すようにHueブラウザーのクイックスタートウィザードが表示されます。

クリックすると Query Editors ドロップダウンメニューには、次のスクリーンショットに示すように、Impalaがサポートするエディターのリストが表示されます。

クリックすると Impala ドロップダウンメニューに、次のようなImpalaクエリエディタが表示されます。

Impalaは、Hadoopクラスター内の多数のシステムで実行されるMPP(Massive Parallel Processing)クエリ実行エンジンです。従来のストレージシステムとは異なり、impalaはストレージエンジンから切り離されています。これには、Impalaデーモン(Impalad)、Impala Statestore、およびImpalaメタデータまたはメタストアの3つの主要コンポーネントがあります。

Impalaデーモン(Impalad

Impalaデーモン(別名 impalad)Impalaがインストールされている各ノードで実行されます。impalaシェル、色相ブラウザなどのさまざまなインターフェイスからのクエリを受け入れ、それらを処理します。

クエリが特定のノードのインパラドに送信されると、そのノードは「coordinator nodeそのクエリの」。複数のクエリは、他のノードで実行されているImpaladによっても処理されます。クエリを受け入れた後、Impaladはデータファイルの読み取りと書き込みを行い、Impalaクラスター内の他のImpalaノードに作業を分散することでクエリを並列化します。クエリがさまざまなImpaladインスタンスで処理されている場合、それらすべてが結果を中央の調整ノードに返します。

要件に応じて、クエリを専用のImpaladに送信することも、負荷分散された方法でクラスター内の別のImpaladに送信することもできます。

インパラステートストア

Impalaには、Impala Stateストアと呼ばれる別の重要なコンポーネントがあります。これは、各Impaladの状態をチェックし、各Impalaデーモンの状態を他のデーモンに頻繁に中継する役割を果たします。これは、Impalaサーバーまたはクラスター内の他のノードが実行されているのと同じノードで実行できます。

インパラ状態ストアデーモンプロセスの名前がされた状態で保存されましたImpaladは、すなわち、インパラ状態ストアデーモンにその健康状態を報告する状態が保存されました

何らかの理由でノードに障害が発生した場合、Statestoreはこの障害について他のすべてのノードを更新し、そのような通知が他のimpaladで利用可能になると、他のImpalaデーモンは影響を受けるノードにそれ以上のクエリを割り当てません。

Impalaメタデータとメタストア

Impalaメタデータとメタストアはもう1つの重要なコンポーネントです。Impalaは、従来のMySQLまたはPostgreSQLデータベースを使用してテーブル定義を格納します。テーブルと列の情報やテーブルの定義などの重要な詳細は、メタストアと呼ばれる一元化されたデータベースに保存されます。

各Impalaノードは、すべてのメタデータをローカルにキャッシュします。非常に大量のデータや多数のパーティションを処理する場合、テーブル固有のメタデータの取得にはかなりの時間がかかる可能性があります。したがって、ローカルに保存されたメタデータキャッシュは、そのような情報を即座に提供するのに役立ちます。

テーブル定義またはテーブルデータが更新されると、他のImpalaデーモンは、問題のテーブルに対して新しいクエリを発行する前に、最新のメタデータを取得してメタデータキャッシュを更新する必要があります。

クエリ処理インターフェイス

クエリを処理するために、Impalaは以下にリストされている3つのインターフェースを提供します。

  • Impala-shell − Cloudera VMを使用してImpalaをセットアップした後、コマンドを入力してImpalaシェルを起動できます impala-shellエディターで。Impalaシェルについては、次の章で詳しく説明します。

  • Hue interface−Hueブラウザを使用してImpalaクエリを処理できます。Hueブラウザーには、Impalaクエリを入力して実行できるImpalaクエリエディターがあります。このエディターにアクセスするには、まず、Hueブラウザーにログインする必要があります。

  • ODBC/JDBC drivers−他のデータベースと同様に、ImpalaはODBC / JDBCドライバーを提供します。これらのドライバーを使用すると、これらのドライバーをサポートするプログラミング言語を介してimpalaに接続し、これらのプログラミング言語を使用してimpalaでクエリを処理するアプリケーションを構築できます。

クエリ実行手順

ユーザーが提供されたインターフェースのいずれかを使用してクエリを渡すときはいつでも、これはクラスター内のImpaladの1つによって受け入れられます。このImpaladは、その特定のクエリのコーディネーターとして扱われます。

クエリを受信した後、クエリコーディネーターは、クエリを使用してクエリが適切かどうかを確認します。 Table SchemaHiveメタストアから。後で、クエリの実行に必要なデータの場所に関する情報をHDFS名前ノードから収集し、クエリを実行するためにこの情報を他のインパラドに送信します。

他のすべてのImpalaデーモンは、指定されたデータブロックを読み取り、クエリを処理します。すべてのデーモンがタスクを完了するとすぐに、クエリコーディネーターは結果を収集してユーザーに配信します。

前の章では、clouderaとそのアーキテクチャを使用したImpalaのインストールを見てきました。

  • Impalaシェル(コマンドプロンプト)
  • 色相(ユーザーインターフェイス)
  • ODBCおよびJDBC(サードパーティライブラリ)

この章では、ImpalaShellの起動方法とシェルのさまざまなオプションについて説明します。

Impalaシェルコマンドリファレンス

Impalaシェルのコマンドは次のように分類されます general commands, query specific options、および table and database specific options、以下で説明するように。

一般的なコマンド

  • help
  • version
  • history
  • シェル(または)!
  • connect
  • 終了| 終了する

特定のオプションを照会する

  • Set/unset
  • Profile
  • Explain

テーブルおよびデータベース固有のオプション

  • Alter
  • describe
  • drop
  • insert
  • select
  • show
  • use

Impalaシェルの起動

clouderaターミナルを開き、スーパーユーザーとしてサインインして、次のように入力します cloudera 以下に示すようにパスワードとして。

[cloudera@quickstart ~]$ su
Password: cloudera
[root@quickstart cloudera]#

次のコマンドを入力してImpalaシェルを起動します-

[root@quickstart cloudera] # impala-shell 
Starting Impala Shell without Kerberos authentication 
Connected to quickstart.cloudera:21000 
Server version: impalad version 2.3.0-cdh5.5.0 RELEASE 
(build 0c891d79aa38f297d244855a32f1e17280e2129b)
********************************************************************* 

Welcome to the Impala shell. Copyright (c) 2015 Cloudera, Inc. All rights reserved.
(Impala Shell v2.3.0-cdh5.5.0 (0c891d7) built on Mon Nov 9 12:18:12 PST 2015)

Want to know what version of Impala you're connected to? Run the VERSION command to 
find out! 
********************************************************************* 
[quickstart.cloudera:21000] >

Impala –汎用コマンド

Impalaの汎用コマンドを以下に説明します-

ヘルプコマンド

ザ・ help Impalaシェルのコマンドは、Impalaで使用可能なコマンドのリストを提供します-

[quickstart.cloudera:21000] > help;
 
Documented commands (type help <topic>):
========================================================
compute  describe  insert  set     unset  with  version
connect  explain   quit    show    values use
exit     history   profile select  shell  tip 
  
Undocumented commands:
========================================= 
alter create desc drop help load summary

バージョンコマンド

ザ・ version 以下に示すように、コマンドはImpalaの現在のバージョンを提供します。

[quickstart.cloudera:21000] > version;
Shell version: Impala Shell v2.3.0-cdh5.5.0 (0c891d7) built on Mon Nov 9 
12:18:12 PST 2015

Server version: impalad version 2.3.0-cdh5.5.0 RELEASE (build 
0c891d79aa38f297d244855a32f1e17280e2129b)

履歴コマンド

ザ・ historyImpalaのコマンドは、シェルで実行された最後の10個のコマンドを表示します。以下はの例ですhistoryコマンド。ここでは、バージョン、ヘルプ、表示、使用、履歴の5つのコマンドを実行しました。

[quickstart.cloudera:21000] > history;
[1]:version;
[2]:help;
[3]:show databases;
[4]:use my_db;
[5]:history;

quit / exitコマンド

あなたはインパラシェルから出てくることができます quit または exit 以下に示すように、コマンド。

[quickstart.cloudera:21000] > exit; 
Goodbye cloudera

接続コマンド

ザ・ connectコマンドは、Impalaの特定のインスタンスに接続するために使用されます。インスタンスを指定しない場合は、デフォルトのポートに接続します21000 以下に示すように。

[quickstart.cloudera:21000] > connect; 
Connected to quickstart.cloudera:21000 
Server version: impalad version 2.3.0-cdh5.5.0 RELEASE (build 
0c891d79aa38f297d244855a32f1e17280e2129b)

Impalaクエリ固有のオプション

Impalaのクエリ固有のコマンドはクエリを受け入れます。それらは以下に説明されています-

説明する

ザ・ explain コマンドは、指定されたクエリの実行プランを返します。

[quickstart.cloudera:21000] > explain select * from sample;
Query: explain select * from sample
+------------------------------------------------------------------------------------+ 
| Explain String                                                                     | 
+------------------------------------------------------------------------------------+ 
| Estimated Per-Host Requirements: Memory = 48.00MB VCores = 1                       | 
| WARNING: The following tables are missing relevant table and/or column statistics. |
| my_db.customers                                                                    | 
| 01:EXCHANGE [UNPARTITIONED]                                                        | 
| 00:SCAN HDFS [my_db.customers]                                                     | 
| partitions = 1/1 files = 6 size = 148B                                             | 
+------------------------------------------------------------------------------------+ 
Fetched 7 row(s) in 0.17s

プロフィール

ザ・ profileコマンドは、最近のクエリに関する低レベルの情報を表示します。このコマンドは、クエリの診断とパフォーマンスチューニングに使用されます。以下は、profileコマンド。このシナリオでは、profile コマンドはの低レベル情報を返します explain クエリ。

[quickstart.cloudera:21000] > profile;

Query Runtime Profile: 
Query (id=164b1294a1049189:a67598a6699e3ab6): 

   Summary: 
      Session ID: e74927207cd752b5:65ca61e630ad3ad
      Session Type: BEESWAX 
      Start Time: 2016-04-17 23:49:26.08148000 End Time: 2016-04-17 23:49:26.2404000 
      Query Type: EXPLAIN 
      Query State: FINISHED 
      Query Status: OK 
      Impala Version: impalad version 2.3.0-cdh5.5.0 RELEASE (build 0c891d77280e2129b) 
      User: cloudera 
      Connected User: cloudera 
      Delegated User: 
      Network Address:10.0.2.15:43870 
      Default Db: my_db 
      Sql Statement: explain select * from sample 
      Coordinator: quickstart.cloudera:22000 
      : 0ns 
      Query Timeline: 167.304ms 
         - Start execution: 41.292us (41.292us) - Planning finished: 56.42ms (56.386ms) 
         - Rows available: 58.247ms (1.819ms) 
         - First row fetched: 160.72ms (101.824ms) 
         - Unregister query: 166.325ms (6.253ms)
         
   ImpalaServer: 
      - ClientFetchWaitTimer: 107.969ms 
      - RowMaterializationTimer: 0ns

テーブルおよびデータベース固有のオプション

次の表に、Impalaのテーブルとデータ固有のオプションを示します。

シニア番号 コマンドと説明
1

Alter

ザ・ alter コマンドは、Impalaのテーブルの構造と名前を変更するために使用されます。

2

Describe

ザ・ describeImpalaのコマンドは、テーブルのメタデータを提供します。列やそのデータ型などの情報が含まれています。ザ・describe コマンドは持っています desc ショートカットとして。

3

Drop

ザ・ drop コマンドは、Impalaから構成を削除するために使用されます。構成は、テーブル、ビュー、またはデータベース関数です。

4

insert

ザ・ insert インパラのコマンドは、

  • データ(列)をテーブルに追加します。
  • 既存のテーブルのデータを上書きします。
  • 既存のテーブルのデータを上書きします。
5

select

ザ・ selectステートメントは、特定のデータセットに対して目的の操作を実行するために使用されます。アクションを完了するデータセットを指定します。selectステートメントの結果を(ファイルに)印刷または保存できます。

6

show

ザ・ show Impalaのステートメントは、テーブル、データベース、テーブルなどのさまざまな構成のメタストアを表示するために使用されます。

7

use

ザ・ use Impalaのステートメントは、現在のコンテキストを目的のデータベースに変更するために使用されます。

Impalaのデータ型

次の表で、Impalaのデータ型について説明します。

シニア番号 データ型と説明
1

BIGINT

このデータ型は数値を格納し、このデータ型の範囲は-9223372036854775808から9223372036854775807です。このデータ型は、テーブルの作成およびテーブルの変更ステートメントで使用されます。

2

BOOLEAN

このデータ型は true または false 値であり、createtableステートメントの列定義で使用されます。

3

CHAR

このデータ型は固定長のストレージであり、スペースが埋め込まれています。最大長255まで保存できます。

4

DECIMAL

このデータ型は、10進値を格納するために使用され、テーブルの作成およびテーブルの変更ステートメントで使用されます。

5

DOUBLE

このデータ型は、正または負の4.94065645841246544e-324d -1.79769313486231570e +308の範囲の浮動小数点値を格納するために使用されます。

6

FLOAT

このデータ型は、正または負の範囲の単精度浮動小数点データ型を格納するために使用されます1.40129846432481707e-45 .. 3.40282346638528860e +38。

7

INT

このデータ型は、-2147483648から2147483647の範囲までの4バイト整数を格納するために使用されます。

8

SMALLINT

このデータ型は、-32768〜32767の範囲までの2バイト整数を格納するために使用されます。

9

STRING

これは、文字列値を格納するために使用されます。

10

TIMESTAMP

このデータ型は、ある時点を表すために使用されます。

11

TINYINT

このデータ型は、-128〜127の範囲までの1バイト整数値を格納するために使用されます。

12

VARCHAR

このデータ型は、最大長65,535までの可変長文字を格納するために使用されます。

13

ARRAY

これは複雑なデータ型であり、可変数の順序付けられた要素を格納するために使用されます。

14

Map

これは複雑なデータ型であり、可変数のキーと値のペアを格納するために使用されます。

15

Struct

これは複雑なデータ型であり、単一のアイテムの複数のフィールドを表すために使用されます。

Impalaのコメント

ImpalaのコメントはSQLのコメントと似ています。一般に、プログラミング言語には、単一行コメントと複数行コメントの2種類のコメントがあります。

Single-line comments−「—」が続くすべての行は、Impalaではコメントと見なされます。以下は、Impalaの1行コメントの例です。

-- Hello welcome to tutorials point.

Multiline comments −間のすべての行 /* そして */Impalaでは複数行コメントと見なされます。以下は、Impalaの複数行コメントの例です。

/*
Hi this is an example
Of multiline comments in Impala
*/

Impalaの演算子はSQLの演算子と似ています。次のリンクをクリックして、SQLチュートリアルを参照してくださいsql-operators。

Impala-データベースを作成する

Impalaでは、データベースは、名前空間内に関連するテーブル、ビュー、および関数を保持する構造です。これは、HDFSではディレクトリツリーとして表されます。テーブルパーティションとデータファイルが含まれています。この章では、Impalaでデータベースを作成する方法について説明します。

CREATEDATABASEステートメント

ザ・ CREATE DATABASE Statement Impalaで新しいデータベースを作成するために使用されます。

構文

以下は、の構文です。 CREATE DATABASE ステートメント。

CREATE DATABASE IF NOT EXISTS database_name;

ここに、 IF NOT EXISTSオプションの句です。この句を使用すると、同じ名前の既存のデータベースがない場合にのみ、指定された名前のデータベースが作成されます。

以下は、の例です。 create database statement。この例では、次の名前のデータベースを作成しましたmy_database.

[quickstart.cloudera:21000] > CREATE DATABASE IF NOT EXISTS my_database;

上記のクエリを実行すると cloudera impala-shell、次の出力が得られます。

Query: create DATABASE my_database 

Fetched 0 row(s) in 0.21s

検証

ザ・ SHOW DATABASES クエリはImpalaのデータベースのリストを提供するため、データベースが作成されているかどうかを確認するには、 SHOWDATABASESステートメント。ここでは、新しく作成されたデータベースを観察できますmy_db リストにあります。

[quickstart.cloudera:21000] > show databases; 

Query: show databases
+-----------------------------------------------+
| name                                          | 
+-----------------------------------------------+ 
| _impala_builtins                              |
| default                                       | 
|  my_db                                        | 
+-----------------------------------------------+
Fetched 3 row(s) in 0.20s 
[quickstart.cloudera:21000] >

Hdfsパス

HDFSファイルシステムでデータベースを作成するには、データベースを作成する場所を指定する必要があります。

CREATE DATABASE IF NOT EXISTS database_name LOCATION hdfs_path;

Hueブラウザを使用したデータベースの作成

Impalaクエリエディタを開き、次のように入力します CREATE DATABASEその中のステートメント。その後、次のスクリーンショットに示すように、実行ボタンをクリックします。

クエリを実行した後、カーソルをドロップダウンメニューの上部にそっと移動すると、更新記号が表示されます。更新記号をクリックすると、データベースのリストが更新され、最近の変更が適用されます。

検証

クリック drop-down box 見出しの下 DATABASEエディターの左側にあります。そこで、システム内のデータベースのリストを見ることができます。ここでは、新しく作成されたデータベースを観察できますmy_db 以下に示すように。

注意深く観察すると、1つのデータベースしか見ることができません。 my_db デフォルトのデータベースと一緒にリストにあります。

ザ・ DROP DATABASE Statementof Impalaは、Impalaからデータベースを削除するために使用されます。データベースを削除する前に、データベースからすべてのテーブルを削除することをお勧めします。

構文

以下はの構文です DROP DATABASE ステートメント。

DROP (DATABASE|SCHEMA) [IF EXISTS] database_name [RESTRICT | 
CASCADE] [LOCATION hdfs_path];

ここに、 IF EXISTSオプションの句です。指定された名前のデータベースが存在するときにこの句を使用すると、データベースは削除されます。また、指定された名前の既存のデータベースがない場合、操作は実行されません。

以下はの例です DROP DATABASEステートメント。Impalaに名前のデータベースがあると仮定しますsample_database

また、を使用してデータベースのリストを確認すると、 SHOW DATABASES ステートメント、あなたはその中の名前を観察します。

[quickstart.cloudera:21000] > SHOW DATABASES;

Query: show DATABASES
+-----------------------+ 
| name                  | 
+-----------------------+ 
| _impala_builtins      | 
| default               | 
| my_db                 | 
| sample_database       | 
+-----------------------+ 
Fetched 4 row(s) in 0.11s

これで、を使用してこのデータベースを削除できます。 DROP DATABASE Statement 以下に示すように。

< DROP DATABASE IF EXISTS sample_database;

これにより、指定されたデータベースが削除され、次の出力が得られます。

Query: drop DATABASE IF EXISTS sample_database;

検証

指定されたデータベースが削除されているかどうかを確認するには、 SHOW DATABASESステートメント。ここでは、という名前のデータベースを確認できますsample_database データベースのリストから削除されます。

[quickstart.cloudera:21000] > SHOW DATABASES;

Query: show DATABASES 
+----------------------+ 
| name                 | 
+----------------------+ 
| _impala_builtins     | 
| default              | 
| my_db                | 
+----------------------+ 
Fetched 3 row(s) in 0.10s 
[quickstart.cloudera:21000] >

カスケード

一般に、データベースを削除するには、データベース内のすべてのテーブルを手動で削除する必要があります。カスケードを使用する場合、Impalaは、指定されたデータベース内のテーブルを削除する前に削除します。

Impalaに名前の付いたデータベースがあるとします。 sample、および2つのテーブルが含まれています。 student そして test。このデータベースを直接削除しようとすると、次のようなエラーが発生します。

[quickstart.cloudera:21000] > DROP database sample;
Query: drop database sample 
ERROR: 
ImpalaRuntimeException: Error making 'dropDatabase' RPC to Hive Metastore: 
CAUSED BY: InvalidOperationException: Database sample is not empty. One or more 
tables exist.

使用する cascade、以下に示すように、このデータベースを直接(コンテンツを手動で削除せずに)削除できます。

[quickstart.cloudera:21000] > DROP database sample cascade; 
Query: drop database sample cascade

Note −「current database」をImpalaで。したがって、データベースを削除する前に、現在のコンテキストが、削除するデータベース以外のデータベースに設定されていることを確認する必要があります。

Hueブラウザを使用したデータベースの削除

Impalaクエリエディタを開き、次のように入力します DELETE DATABASEその中のステートメントを入力し、以下に示すように実行ボタンをクリックします。3つのデータベースがあるとします。my_db, my_database、および sample_databaseデフォルトのデータベースと一緒に。ここでは、my_databaseという名前のデータベースを削除しています。

クエリを実行した後、カーソルをドロップダウンメニューの上部にそっと移動します。次に、以下のスクリーンショットに示すような更新記号が表示されます。更新記号をクリックすると、データベースのリストが更新され、最近行われた変更がデータベースに適用されます。

検証

クリックしてください drop down 見出しの下 DATABASEエディターの左側にあります。そこで、システム内のデータベースのリストを見ることができます。ここでは、新しく作成されたデータベースを観察できますmy_db 以下に示すように。

注意深く観察すると、1つのデータベースしか見ることができません。 my_db デフォルトのデータベースと一緒にリストにあります。

Impalaに接続したら、使用可能なデータベースから1つを選択する必要があります。ザ・USE DATABASE Statement of Impalaは、現在のセッションを別のデータベースに切り替えるために使用されます。

構文

以下はの構文です USE ステートメント。

USE db_name;

以下はの例です USE statement。まず、という名前のデータベースを作成しましょうsample_database 以下に示すように。

> CREATE DATABASE IF NOT EXISTS sample_database;

これにより、新しいデータベースが作成され、次の出力が得られます。

Query: create DATABASE IF NOT EXISTS my_db2

Fetched 0 row(s) in 2.73s

を使用してデータベースのリストを確認する場合 SHOW DATABASES ステートメントでは、新しく作成されたデータベースの名前を確認できます。

> SHOW DATABASES;

Query: show DATABASES 
+-----------------------+ 
| name                  | 
+-----------------------+ 
| _impala_builtins      | 
| default               | 
| my_db                 | 
| sample_database       | 
+-----------------------+ 
Fetched 4 row(s) in 0.11s

それでは、セッションを新しく作成されたデータベース(sample_database)に切り替えましょう。 USE 以下に示すステートメント。

> USE sample_database;

これにより、現在のコンテキストがsample_databaseに変更され、次のようなメッセージが表示されます。

Query: use sample_database

Hueブラウザを使用したデータベースの選択

の左側に Query Editor Impalaの場合、次のスクリーンショットに示すようなドロップダウンメニューがあります。

ドロップダウンメニューをクリックすると、以下に示すようにImpala内のすべてのデータベースのリストが表示されます。

現在のコンテキストを変更する必要があるデータベースを選択するだけです。

ザ・ CREATE TABLEステートメントは、Impalaの必要なデータベースに新しいテーブルを作成するために使用されます。基本テーブルの作成には、テーブルに名前を付け、その列と各列のデータ型を定義することが含まれます。

構文

以下は、の構文です。 CREATE TABLEステートメント。ここに、IF NOT EXISTSオプションの句です。この句を使用すると、指定されたデータベースに同じ名前の既存のテーブルがない場合にのみ、指定された名前のテーブルが作成されます。

create table IF NOT EXISTS database_name.table_name (
   column1 data_type,
   column2 data_type,
   column3 data_type,
   ………
   columnN data_type
);

CREATE TABLEは、データベースシステムに新しいテーブルを作成するように指示するキーワードです。テーブルの一意の名前または識別子は、CREATETABLEステートメントの後に続きます。オプションで指定できますdatabase_name に加えて table_name

以下は、createtableステートメントの例です。この例では、という名前のテーブルを作成しましたstudent データベース内 my_db

[quickstart.cloudera:21000] > CREATE TABLE IF NOT EXISTS my_db.student
   (name STRING, age INT, contact INT );

上記のステートメントを実行すると、指定された名前のテーブルが作成され、次の出力が表示されます。

Query: create table student (name STRING, age INT, phone INT) 

Fetched 0 row(s) in 0.48s

検証

ザ・ show Tablesクエリは、Impalaの現在のデータベース内のテーブルのリストを提供します。したがって、を使用してテーブルが作成されているかどうかを確認できます。Show Tables ステートメント。

まず、以下に示すように、必要なテーブルが存在するデータベースにコンテキストを切り替える必要があります。

[quickstart.cloudera:21000] > use my_db; 
Query: use my_db

次に、を使用してテーブルのリストを取得する場合 show tables クエリ、あなたはという名前のテーブルを観察することができます student 以下に示すようにその中に。

[quickstart.cloudera:21000] > show tables;

Query: show tables 
+-----------+ 
| name      | 
+-----------+ 
| student   | 
+-----------+ 
Fetched 1 row(s) in 0.10s

HDFSパス

HDFSファイルシステムでデータベースを作成するには、以下に示すように、データベースを作成する場所を指定する必要があります。

CREATE DATABASE IF NOT EXISTS database_name LOCATION hdfs_path;

Hueブラウザを使用したデータベースの作成

impalaクエリエディタを開き、次のように入力します CREATE Tableその中のステートメント。次のスクリーンショットに示すように、実行ボタンをクリックします。

クエリを実行した後、カーソルをドロップダウンメニューの上部にそっと移動すると、更新記号が表示されます。更新記号をクリックすると、データベースのリストが更新され、最近行われた変更がデータベースに適用されます。

検証

クリックしてください drop down 見出しの下 DATABASEエディターの左側にあります。そこにデータベースのリストが表示されます。データベースを選択しますmy_db 以下に示すように。

データベースの選択について my_db以下に示すように、その中のテーブルのリストを見ることができます。ここでは、新しく作成されたテーブルを見つけることができますstudent 以下に示すように。

ザ・ INSERT インパラの声明には2つの条項があります- into そして overwrite。ステートメントを挿入しますinto 句は、データベース内の既存のテーブルに新しいレコードを追加するために使用されます。

構文

の2つの基本的な構文があります INSERT 次のようなステートメント-

insert into table_name (column1, column2, column3,...columnN)

values (value1, value2, value3,...valueN);

ここで、column1、column2、... columnNは、データを挿入するテーブル内の列の名前です。

列名を指定せずに値を追加することもできますが、そのためには、以下に示すように、値の順序が表の列と同じ順序であることを確認する必要があります。

Insert into table_name values (value1, value2, value2);

CREATE TABLEは、データベースシステムに新しいテーブルを作成するように指示するキーワードです。テーブルの一意の名前または識別子は、CREATETABLEステートメントの後に続きます。オプションで指定できますdatabase_name 一緒に table_name

次の名前のテーブルを作成したとします。 student 以下に示すようにインパラで。

create table employee (Id INT, name STRING, age INT,address STRING, salary BIGINT);

以下は、という名前のテーブルにレコードを作成する例です。 employee

[quickstart.cloudera:21000] > insert into employee 
(ID,NAME,AGE,ADDRESS,SALARY)VALUES (1, 'Ramesh', 32, 'Ahmedabad', 20000 );

上記のステートメントを実行すると、次の名前のテーブルにレコードが挿入されます。 employee 次のメッセージが表示されます。

Query: insert into employee (ID,NAME,AGE,ADDRESS,SALARY) VALUES (1, 'Ramesh',
   32, 'Ahmedabad', 20000 ) 
Inserted 1 row(s) in 1.32s

以下に示すように、列名を指定せずに別のレコードを挿入できます。

[quickstart.cloudera:21000] > insert into employee values (2, 'Khilan', 25, 
   'Delhi', 15000 );

上記のステートメントを実行すると、次の名前のテーブルにレコードが挿入されます。 employee 次のメッセージが表示されます。

Query: insert into employee values (2, 'Khilan', 25, 'Delhi', 15000 ) 
Inserted 1 row(s) in 0.31s

以下に示すように、employeeテーブルにさらにいくつかのレコードを挿入できます。

Insert into employee values (3, 'kaushik', 23, 'Kota', 30000 );

Insert into employee values (4, 'Chaitali', 25, 'Mumbai', 35000 );

Insert into employee values (5, 'Hardik', 27, 'Bhopal', 40000 );

Insert into employee values (6, 'Komal', 22, 'MP', 32000 );

値を挿入した後、 employee Impalaのテーブルは以下のようになります。

+----+----------+-----+-----------+--------+
| id | name     | age | address   | salary |
+----+----------+-----+-----------+--------+
| 1  | Ramesh   | 32  | Ahmedabad | 20000  |
| 2  | Khilan   | 25  | Delhi     | 15000  |
| 5  | Hardik   | 27  | Bhopal    | 40000  |
| 4  | Chaitali | 25  | Mumbai    | 35000  |
| 3  | kaushik  | 23  | Kota      | 30000  |
| 6  | Komal    | 22  | MP        | 32000  |
+----+----------+-----+-----------+--------+

テーブル内のデータを上書きする

上書き句を使用して、テーブルのレコードを上書きできます。上書きされたレコードは、テーブルから完全に削除されます。以下は、overwrite句を使用する構文です。

Insert overwrite table_name values (value1, value2, value2);

以下は、この句の使用例です。 overwrite

[quickstart.cloudera:21000] > Insert overwrite employee values (1, 'Ram', 26, 
   'Vishakhapatnam', 37000 );

上記のクエリを実行すると、テーブルデータが指定されたレコードで上書きされ、次のメッセージが表示されます。

Query: insert overwrite employee values (1, 'Ram', 26, 'Vishakhapatnam', 37000 ) 
Inserted 1 row(s) in 0.31s

テーブルを確認すると、テーブルのすべてのレコードを確認できます。 employee 以下に示すように、新しいレコードによって上書きされます。

+----+------+-----+---------------+--------+
| id | name | age | address       | salary |
+----+------+-----+---------------+--------+
| 1  | Ram  | 26  | Vishakhapatnam| 37000  |
+----+------+-----+---------------+--------+

Hueブラウザを使用したデータの挿入

Impalaクエリエディタを開き、次のように入力します insertその中のステートメント。次のスクリーンショットに示すように、実行ボタンをクリックします。

クエリ/ステートメントの実行後、このレコードはテーブルに追加されます。

インパラ SELECTステートメントは、データベース内の1つ以上のテーブルからデータをフェッチするために使用されます。このクエリは、テーブルの形式でデータを返します。

構文

以下はインパラの構文です select ステートメント。

SELECT column1, column2, columnN from table_name;

ここで、column1、column2 ...は、値をフェッチするテーブルのフィールドです。フィールドで使用可能なすべてのフィールドをフェッチする場合は、次の構文を使用できます-

SELECT * FROM table_name;

名前の付いたテーブルがあると仮定します customers インパラでは、次のデータがあります-

ID    NAME       AGE    ADDRESS      SALARY
---   -------    ---    ----------   -------
1     Ramesh     32     Ahmedabad    20000
2     Khilan     25     Delhi        15000
3     Hardik     27     Bhopal       40000
4     Chaitali   25     Mumbai       35000
5     kaushik    23     Kota         30000
6     Komal      22     Mp           32000

あなたはフェッチすることができます id, name、および age のすべての記録の customers 使用するテーブル select 以下に示すステートメント-

[quickstart.cloudera:21000] > select id, name, age from customers;

上記のクエリを実行すると、Impalaは指定されたテーブルからすべてのレコードのID、名前、経過時間をフェッチし、以下に示すようにそれらを表示します。

Query: select id,name,age from customers

+----+----------+-----+
| id | name     | age |
| 1  | Ramesh   | 32  |
| 2  | Khilan   | 25  |
| 3  | Hardik   | 27  |
| 4  | Chaitali | 25  |
| 5  | kaushik  | 23  |
| 6  | Komal    | 22  |
+----+----------+-----+

Fetched 6 row(s) in 0.66s

フェッチすることもできます all からのレコード customers を使用したテーブル select 以下に示すようにクエリします。

[quickstart.cloudera:21000] > select name, age from customers; 
Query: select * from customers

上記のクエリを実行すると、Impalaは、以下に示すように、指定されたテーブルからすべてのレコードをフェッチして表示します。

+----+----------+-----+-----------+--------+
| id | name     | age | address   | salary |
+----+----------+-----+-----------+--------+
| 1  | Ramesh   | 32  | Ahmedabad | 20000  |
| 2  | Khilan   | 25  | Delhi     | 15000  |
| 3  | Hardik   | 27  | Bhopal    | 40000  |
| 4  | Chaitali | 25  | Mumbai    | 35000  |
| 5  | kaushik  | 23  | Kota      | 30000  |
| 6  | Komal    | 22  | MP        | 32000  |
+----+----------+-----+-----------+--------+

Fetched 6 row(s) in 0.66s

色相を使用してレコードを取得する

Impalaクエリエディタを開き、次のように入力します selectその中のステートメント。次のスクリーンショットに示すように、実行ボタンをクリックします。

クエリを実行した後、下にスクロールして選択すると Results タブをクリックすると、以下に示すように、指定したテーブルのレコードのリストが表示されます。

ザ・ describeImpalaのステートメントは、テーブルの説明を提供するために使用されます。このステートメントの結果には、列名やそのデータ型などのテーブルに関する情報が含まれています。

構文

以下はインパラの構文です describe ステートメント。

Describe table_name;

たとえば、次の名前のテーブルがあるとします。 customer インパラでは、次のデータがあります-

ID    NAME     AGE    ADDRESS     SALARY
--- --------- ----- ----------- -----------
1   Ramesh     32    Ahmedabad    20000
2   Khilan     25    Delhi        15000
3   Hardik     27    Bhopal       40000
4   Chaitali   25    Mumbai       35000
5   kaushik    23    Kota         30000
6   Komal      22    Mp           32000

あなたはの説明を得ることができます customer を使用したテーブル describe 以下に示すステートメント-

[quickstart.cloudera:21000] > describe customer;

上記のクエリを実行すると、Impalaは metadata 指定されたテーブルのを下に示すように表示します。

Query: describe customer
 
+---------+--------+---------+ 
| name    | type   | comment | 
+---------+--------+---------+ 
| id      | int    |         |                    
| name    | string |         | 
| age     | int    |         | 
| address | string |         | 
| salary  | bigint |         |
+---------+--------+---------+ 

Fetched 5 row(s) in 0.51s

色相を使用してレコードを説明する

Impalaクエリエディタを開き、次のように入力します describe その中のステートメントを入力し、次のスクリーンショットに示すように実行ボタンをクリックします。

クエリを実行した後、下にスクロールして選択すると Results タブをクリックすると、以下に示すようにテーブルのメタデータが表示されます。

ImpalaのAltertableステートメントは、特定のテーブルで変更を実行するために使用されます。このステートメントを使用して、既存のテーブルの列を追加、削除、または変更したり、名前を変更したりできます。

この章では、構文と例を使用して、さまざまなタイプの変更ステートメントについて説明します。まず、次の名前のテーブルがあると仮定しますcustomers の中に my_db Impalaのデータベース、次のデータ

ID   NAME     AGE   ADDRESS    SALARY
--- --------- ----- ----------- --------
1   Ramesh    32    Ahmedabad   20000
2   Khilan    25    Delhi       15000
3   Hardik    27    Bhopal      40000
4   Chaitali  25    Mumbai      35000
5   kaushik   23    Kota        30000
6   Komal     22    Mp          32000

そして、データベース内のテーブルのリストを取得した場合 my_db、あなたは見つけることができます customers 以下に示すように、その中のテーブル。

[quickstart.cloudera:21000] > show tables;

Query: show tables 
+-----------+ 
| name      | 
+-----------+ 
| customers | 
| employee  | 
| student   | 
| student1  | 
+-----------+

テーブルの名前を変更する

構文

の基本構文 ALTER TABLE 既存のテーブルの名前を変更するには、次のようにします-

ALTER TABLE [old_db_name.]old_table_name RENAME TO [new_db_name.]new_table_name

以下は、を使用してテーブルの名前を変更する例です。 alterステートメント。ここでは、テーブルの名前を変更していますcustomers ユーザーに。

[quickstart.cloudera:21000] > ALTER TABLE my_db.customers RENAME TO my_db.users;

上記のクエリを実行した後、Impalaは必要に応じてテーブルの名前を変更し、次のメッセージを表示します。

Query: alter TABLE my_db.customers RENAME TO my_db.users

を使用して、現在のデータベース内のテーブルのリストを確認できます。 show tablesステートメント。あなたはという名前のテーブルを見つけることができますusers の代わりに customers

Query: show tables 
+----------+ 
| name     | 
+----------+ 
| employee | 
| student  | 
| student1 | 
| users    | 
+----------+ 
Fetched 4 row(s) in 0.10s

テーブルへの列の追加

構文

の基本構文 ALTER TABLE 既存のテーブルに列を追加するには、次のようにします-

ALTER TABLE name ADD COLUMNS (col_spec[, col_spec ...])

次のクエリは、既存のテーブルに列を追加する方法を示す例です。ここでは、account_no列とphone_number列(どちらもbigintデータ型)をに追加しています。users テーブル。

[quickstart.cloudera:21000] > ALTER TABLE users ADD COLUMNS (account_no BIGINT, 
phone_no BIGINT);

上記のクエリを実行すると、指定された列がという名前のテーブルに追加されます student、次のメッセージを表示します。

Query: alter TABLE users ADD COLUMNS (account_no BIGINT, phone_no BIGINT)

テーブルのスキーマを確認する場合 users、以下に示すように、新しく追加された列を見つけることができます。

quickstart.cloudera:21000] > describe users;
 
Query: describe users 
+------------+--------+---------+ 
| name       | type   | comment | 
+------------+--------+---------+ 
| id         | int    |         | 
| name       | string |         | 
| age        | int    |         |
| address    | string |         | 
| salary     | bigint |         | 
| account_no | bigint |         | 
| phone_no   | bigint |         | 
+------------+--------+---------+ 
Fetched 7 row(s) in 0.20s

テーブルからの列の削除

構文

ALTERTABLEの基本構文から DROP COLUMN 既存のテーブルでは次のとおりです-

ALTER TABLE name DROP [COLUMN] column_name

次のクエリは、既存のテーブルから列を削除する例です。ここでは、という名前の列を削除していますaccount_no

[quickstart.cloudera:21000] > ALTER TABLE users DROP account_no;

上記のクエリを実行すると、Impalaはaccount_noという名前の列を削除し、次のメッセージを表示します。

Query: alter TABLE users DROP account_no

テーブルのスキーマを確認する場合 users、という名前の列が見つかりません account_no 削除されたので。

[quickstart.cloudera:21000] > describe users; 

Query: describe users 
+----------+--------+---------+ 
| name     | type   | comment | 
+----------+--------+---------+ 
| id       | int    |         | 
| name     | string |         | 
| age      | int    |         | 
| address  | string |         | 
| salary   | bigint |         | 
| phone_no | bigint |         |
+----------+--------+---------+ 
Fetched 6 row(s) in 0.11s

列の名前とタイプを変更する

構文

ALTERTABLEの基本構文から change the name and datatype 既存のテーブルの列の例は次のとおりです-

ALTER TABLE name CHANGE column_name new_name new_type

以下は、alterステートメントを使用して列の名前とデータ型を変更する例です。ここでは、列の名前を変更していますphone_no to email およびそのデータ型を string

[quickstart.cloudera:21000] > ALTER TABLE users CHANGE phone_no e_mail string;

上記のクエリを実行すると、Impalaは指定された変更を行い、次のメッセージを表示します。

Query: alter TABLE users CHANGE phone_no e_mail string

テーブルユーザーのメタデータは、 describeステートメント。Impalaが指定された列に必要な変更を加えたことを確認できます。

[quickstart.cloudera:21000] > describe users; 
Query: describe users 
+----------+--------+---------+ 
| name     | type   | comment | 
+----------+--------+---------+ 
| id       | int    |         | 
| name     | string |         | 
| age      | int    |         | 
| address  | string |         | 
| salary   | bigint |         | 
| phone_no | bigint |         |
+----------+--------+---------+ 
Fetched 6 row(s) in 0.11s

色相を使用してテーブルを変更する

Impalaクエリエディタを開き、次のように入力します alter その中のステートメントを入力し、次のスクリーンショットに示すように実行ボタンをクリックします。

上記のクエリを実行すると、テーブルの名前が変更されます customersusers。同様に、すべてを実行できますalter クエリ。

インパラ drop tableステートメントは、Impalaの既存のテーブルを削除するために使用されます。このステートメントは、内部テーブルの基になるHDFSファイルも削除します

NOTE −このコマンドを使用するときは注意が必要です。テーブルが削除されると、テーブルで使用可能なすべての情報も永久に失われるためです。

構文

以下は、の構文です。 DROP TABLEステートメント。ここに、IF EXISTSオプションの句です。この句を使用すると、指定された名前のテーブルは、存在する場合にのみ削除されます。それ以外の場合、操作は実行されません。

DROP table database_name.table_name;

IF EXISTS句なしで存在しないテーブルを削除しようとすると、エラーが生成されます。オプションで指定できますdatabase_name tと一緒にable_name

まず、データベース内のテーブルのリストを確認しましょう my_db 以下に示すように。

[quickstart.cloudera:21000] > show tables;

Query: show tables 
+------------+ 
| name       | 
+------------+ 
| customers  | 
| employee   | 
| student    | 
+------------+ 
Fetched 3 row(s) in 0.11s

上記の結果から、データベースが my_db 3つのテーブルが含まれています

以下は、の例です。 drop table statement。この例では、という名前のテーブルを削除していますstudent データベースから my_db

[quickstart.cloudera:21000] > drop table if exists my_db.student;

上記のクエリを実行すると、指定した名前のテーブルが削除され、次の出力が表示されます。

Query: drop table if exists student

検証

ザ・ show Tablesクエリは、Impalaの現在のデータベース内のテーブルのリストを提供します。したがって、を使用してテーブルが削除されているかどうかを確認できます。Show Tables ステートメント。

まず、以下に示すように、必要なテーブルが存在するデータベースにコンテキストを切り替える必要があります。

[quickstart.cloudera:21000] > use my_db; 
Query: use my_db

次に、を使用してテーブルのリストを取得する場合 show tables クエリ、あなたはという名前のテーブルを観察することができます student リストにありません。

[quickstart.cloudera:21000] > show tables; 

Query: show tables 
+-----------+ 
| name      | 
+-----------+ 
| customers | 
| employee  | 
| student   | 
+-----------+ 
Fetched 3 row(s) in 0.11s

Hueブラウザを使用したデータベースの作成

Impalaクエリエディタを開き、次のように入力します drop Tableその中のステートメント。次のスクリーンショットに示すように、実行ボタンをクリックします。

クエリを実行した後、カーソルをドロップダウンメニューの上部にそっと移動すると、更新記号が表示されます。更新記号をクリックすると、データベースのリストが更新され、最近行われた変更がデータベースに適用されます。

検証

クリックしてください drop down 見出しの下 DATABASEエディターの左側にあります。そこにデータベースのリストが表示されます。データベースを選択しますmy_db 以下に示すように。

データベースの選択について my_db、以下に示すように、その中のテーブルのリストを見ることができます。ここでは、削除されたテーブルが見つかりませんstudent 以下に示すようにリストにあります。

ザ・ Truncate Table Impalaのステートメントは、既存のテーブルからすべてのレコードを削除するために使用されます。

DROP TABLEコマンドを使用して完全なテーブルを削除することもできますが、データベースから完全なテーブル構造が削除されるため、データを保存する場合は、このテーブルをもう一度作成する必要があります。

構文

以下は、truncatetableステートメントの構文です。

truncate table_name;

ある名前のテーブルがあるとします。 customersImpalaで、その内容を確認すると、次の結果が得られます。これは、customersテーブルに6つのレコードが含まれていることを意味します。

[quickstart.cloudera:21000] > select * from customers; 

Query: select * from customers 
+----+----------+-----+-----------+--------+--------+ 
| id | name     | age | address   | salary | e_mail | 
+----+----------+-----+-----------+--------+--------+
| 1  | Ramesh   | 32  | Ahmedabad | 20000  | NULL   | 
| 2  | Khilan   | 25  | Delhi     | 15000  | NULL   | 
| 3  | kaushik  | 23  | Kota      | 30000  | NULL   |
| 4  | Chaitali | 25  | Mumbai    | 35000  | NULL   | 
| 5  | Hardik   | 27  | Bhopal    | 40000  | NULL   | 
| 6  | Komal    | 22  | MP        | 32000  | NULL   | 
+----+----------+-----+-----------+--------+--------+

以下は、Impalaでテーブルを切り捨てる例です。 truncate statement。ここでは、という名前のテーブルのすべてのレコードを削除していますcustomers

[quickstart.cloudera:21000] > truncate customers;

上記のステートメントを実行すると、Impalaは指定されたテーブルのすべてのレコードを削除し、次のメッセージを表示します。

Query: truncate customers 

Fetched 0 row(s) in 0.37s

検証

削除操作後、customersテーブルの内容を確認する場合は、 select ステートメントでは、以下に示すように空の行が表示されます。

[quickstart.cloudera:21000] > select * from customers;
Query: select * from customers 

Fetched 0 row(s) in 0.12s

Hueブラウザを使用してテーブルを切り捨てる

Impalaクエリエディタを開き、次のように入力します truncateその中のステートメント。次のスクリーンショットに示すように、実行ボタンをクリックします。

クエリ/ステートメントの実行後、テーブルのすべてのレコードが削除されます。

ザ・ show tables Impalaのステートメントは、現在のデータベースにあるすべての既存のテーブルのリストを取得するために使用されます。

以下は、の例です。 show tablesステートメント。特定のデータベース内のテーブルのリストを取得する場合は、まず、コンテキストを必要なデータベースに変更し、を使用してそのデータベース内のテーブルのリストを取得します。show tables 以下に示すステートメント。

[quickstart.cloudera:21000] > use my_db; 
Query: use my_db
[quickstart.cloudera:21000] > show tables;

上記のクエリを実行すると、Impalaは指定されたデータベース内のすべてのテーブルのリストをフェッチし、次のように表示します。

Query: show tables 
+-----------+ 
| name      | 
+-----------+ 
| customers | 
| employee  | 
+-----------+ 
Fetched 2 row(s) in 0.10s

色相を使用したテーブルの一覧表示

impalaクエリエディタを開き、コンテキストを次のように選択します my_db と入力します show tables その中のステートメントを入力し、次のスクリーンショットに示すように実行ボタンをクリックします。

クエリを実行した後、下にスクロールして選択すると Results タブをクリックすると、以下のようなテーブルのリストが表示されます。

ビューは、関連付けられた名前でデータベースに格納されるImpalaクエリ言語のステートメントにすぎません。これは、事前定義されたSQLクエリの形式のテーブルの構成です。

ビューには、テーブルのすべての行または選択した行を含めることができます。ビューは、1つまたは複数のテーブルから作成できます。ビューにより、ユーザーは次のことができます。

  • ユーザーまたはユーザーのクラスが自然または直感的に感じる方法でデータを構造化します。

  • データへのアクセスを制限して、ユーザーが必要なものを正確に表示し、(場合によっては)変更できないようにします。

  • レポートの生成に使用できるさまざまなテーブルのデータを要約します。

を使用してビューを作成できます Create View インパラの声明。

構文

以下は、createviewステートメントの構文です。 IF NOT EXISTSオプションの句です。この句を使用すると、指定されたデータベースに同じ名前の既存のテーブルがない場合にのみ、指定された名前のテーブルが作成されます。

Create View IF NOT EXISTS view_name as Select statement

たとえば、次の名前のテーブルがあるとします。 customers の中に my_db Impalaのデータベース、次のデータ。

ID  NAME      AGE   ADDRESS     SALARY
--- --------- ----- ----------- --------
1   Ramesh    32    Ahmedabad   20000
2   Khilan    25    Delhi       15000
3   Hardik    27    Bhopal      40000
4   Chaitali  25    Mumbai      35000
5   kaushik   23    Kota        30000
6   Komal     22    MP          32000

以下はの例です Create View Statement。この例では、次のようにビューを作成しています。customers 列、名前、および年齢を含むテーブル。

[quickstart.cloudera:21000] > CREATE VIEW IF NOT EXISTS customers_view AS 
select name, age from customers;

上記のクエリを実行すると、目的の列を持つビューが作成され、次のメッセージが表示されます。

Query: create VIEW IF NOT EXISTS sample AS select * from customers 
Fetched 0 row(s) in 0.33s

検証

作成したばかりのビューの内容を確認するには、 select 以下に示すステートメント。

[quickstart.cloudera:21000] > select * from customers_view;

これにより、次の結果が得られます。

Query: select * from customers_view 
+----------+-----+ 
| name     | age | 
+----------+-----+ 
| Komal    | 22  | 
| Khilan   | 25  | 
| Ramesh   | 32  | 
| Hardik   | 27  | 
| Chaitali | 25  | 
| kaushik  | 23  | 
+----------+-----+ 
Fetched 6 row(s) in 4.80s

色相を使用してビューを作成する

Impalaクエリエディタを開き、コンテキストを次のように選択します my_db、と入力します Create View その中のステートメントを入力し、次のスクリーンショットに示すように実行ボタンをクリックします。

クエリを実行した後、下にスクロールすると、 view 名前付き sample 以下に示すように、テーブルのリストに作成されます。

ザ・ Alter Viewインパラのステートメントは、ビューを変更するために使用されます。このステートメントを使用して、ビューの名前、データベース、およびそれに関連付けられているクエリを変更できます。

以来 view は論理構造であり、物理データは影響を受けません alter view クエリ。

構文

以下は、の構文です。 Alter View ステートメント

ALTER VIEW database_name.view_name as Select statement

たとえば、次の名前のビューがあるとします。 customers_view の中に my_db 以下の内容のImpalaのデータベース。

+----------+-----+ 
| name     | age | 
+----------+-----+ 
| Komal    | 22  | 
| Khilan   | 25  | 
| Ramesh   | 32  | 
| Hardik   | 27  | 
| Chaitali | 25  | 
| kaushik  | 23  | 
+----------+-----+

以下はの例です Alter View Statement。この例では、名前と年齢の代わりに、列id、name、salaryをに含めています。customers_view

[quickstart.cloudera:21000] > Alter view customers_view as select id, name, 
salary from customers;

上記のクエリを実行すると、Impalaは指定された変更を customers_view、次のメッセージを表示します。

Query: alter view customers_view as select id, name, salary from customers

検証

内容を確認できます view 名前付き customers_view、を使用して select 以下に示すステートメント。

[quickstart.cloudera:21000] > select * from customers_view;
Query: select * from customers_view

これにより、次の結果が得られます。

+----+----------+--------+ 
| id | name     | salary | 
+----+----------+--------+
| 3  | kaushik  | 30000  | 
| 2  | Khilan   | 15000  | 
| 5  | Hardik   | 40000  | 
| 6  | Komal    | 32000  | 
| 1  | Ramesh   | 20000  | 
| 4  | Chaitali | 35000  | 
+----+----------+--------+ 
Fetched 6 row(s) in 0.69s

色相を使用してビューを変更する

Impalaクエリエディタを開き、コンテキストを次のように選択します my_db、と入力します Alter View その中のステートメントを入力し、次のスクリーンショットに示すように実行ボタンをクリックします。

クエリを実行した後、 view 名前付き sample それに応じて変更されます。

ザ・ Drop ViewImpalaのクエリは、既存のビューを削除するために使用されます。以来view は論理構造であり、物理データは影響を受けません drop view クエリ。

構文

以下は、ドロップビューステートメントの構文です。

DROP VIEW database_name.view_name;

たとえば、次の名前のビューがあるとします。 customers_view の中に my_db 以下の内容のImpalaのデータベース。

+----------+-----+ 
| name     | age | 
+----------+-----+ 
| Komal    | 22  | 
| Khilan   | 25  | 
| Ramesh   | 32  | 
| Hardik   | 27  | 
| Chaitali | 25  | 
| kaushik  | 23  | 
+----------+-----+

以下はの例です Drop View Statement。この例では、を削除しようとしていますview 名前付き customers_view を使用して drop view クエリ。

[quickstart.cloudera:21000] > Drop view customers_view;

上記のクエリを実行すると、Impalaは指定されたビューを削除し、次のメッセージを表示します。

Query: drop view customers_view

検証

を使用してテーブルのリストを確認する場合 show tables ステートメント、あなたはそれを観察することができます view 名前付き customers_view 削除されます。

[quickstart.cloudera:21000] > show tables;

これにより、次の結果が得られます。

Query: show tables 
+-----------+ 
| name      | 
+-----------+ 
| customers | 
| employee  | 
| sample    | 
+-----------+ 
Fetched 3 row(s) in 0.10s

色相を使用してビューをドロップする

Impalaクエリエディタを開き、コンテキストを次のように選択します my_db、と入力します Drop view その中のステートメントを入力し、次のスクリーンショットに示すように実行ボタンをクリックします。

クエリを実行した後、下にスクロールすると、という名前のリストが表示されます。 TABLES。このリストには、tables そして views現在のデータベースで。このリストから、指定されたことがわかりますview 削除されました。

インパラ ORDER BY句は、1つ以上の列に基づいて、データを昇順または降順で並べ替えるために使用されます。一部のデータベースは、デフォルトでクエリ結果を昇順で並べ替えます。

構文

以下は、ORDERBY句の構文です。

select * from table_name ORDER BY col_name [ASC|DESC] [NULLS FIRST|NULLS LAST]

キーワードを使用して、テーブル内のデータを昇順または降順で並べ替えることができます ASC または DESC それぞれ。

同様に、NULLS FIRSTを使用すると、テーブル内のすべてのnull値が一番上の行に配置されます。NULLS LASTを使用すると、NULL値を含む行が最後に配置されます。

名前の付いたテーブルがあると仮定します customers データベース内 my_db 内容は以下の通りです−

[quickstart.cloudera:21000] > select * from customers;
Query: select * from customers 
+----+----------+-----+-----------+--------+ 
| id | name     | age | address   | salary | 
+----+----------+-----+-----------+--------+ 
| 3  | kaushik  | 23  | Kota      | 30000  | 
| 1  | Ramesh   |  32 | Ahmedabad | 20000  | 
| 2  | Khilan   | 25  | Delhi     | 15000  | 
| 6  | Komal    | 22  | MP        | 32000  | 
| 4  | Chaitali | 25  | Mumbai    | 35000  | 
| 5  | Hardik   | 27  | Bhopal    | 40000  | 
+----+----------+-----+-----------+--------+ 
Fetched 6 row(s) in 0.51s

以下は、データを配置する例です。 customers テーブル、昇順 id’s を使用して order by 句。

[quickstart.cloudera:21000] > Select * from customers ORDER BY id asc;

実行すると、上記のクエリは次の出力を生成します。

Query: select * from customers ORDER BY id asc 
+----+----------+-----+-----------+--------+ 
| id | name     | age | address   | salary | 
+----+----------+-----+-----------+--------+ 
| 1  | Ramesh   | 32  | Ahmedabad | 20000  | 
| 2  | Khilan   | 25  | Delhi     | 15000  | 
| 3  | kaushik  | 23  | Kota      | 30000  | 
| 4  | Chaitali | 25  | Mumbai    | 35000  | 
| 5  | Hardik   | 27  | Bhopal    | 40000  | 
| 6  | Komal    | 22  | MP        | 32000  | 
+----+----------+-----+-----------+--------+ 
Fetched 6 row(s) in 0.56s

同様に、あなたはのデータを整理することができます customers を使用して降順でテーブル order by 以下に示す句。

[quickstart.cloudera:21000] > Select * from customers ORDER BY id desc;

実行すると、上記のクエリは次の出力を生成します。

Query: select * from customers ORDER BY id desc 
+----+----------+-----+-----------+--------+ 
| id | name     | age | address   | salary | 
+----+----------+-----+-----------+--------+ 
| 6  | Komal    | 22  | MP        | 32000  | 
| 5  | Hardik   | 27  | Bhopal    | 40000  | 
| 4  | Chaitali | 25  | Mumbai    | 35000  | 
| 3  | kaushik  | 23  | Kota      | 30000  | 
| 2  | Khilan   | 25  | Delhi     | 15000  |
| 1  | Ramesh   | 32  | Ahmedabad | 20000  | 
+----+----------+-----+-----------+--------+ 
Fetched 6 row(s) in 0.54s

インパラ GROUP BY 句は、SELECTステートメントと連携して使用され、同一のデータをグループに配置します。

構文

以下は、GROUPBY句の構文です。

select data from table_name Group BY col_name;

名前の付いたテーブルがあると仮定します customers データベース内 my_db 内容は以下の通りです−

[quickstart.cloudera:21000] > select * from customers; 
Query: select * from customers 
+----+----------+-----+-----------+--------+ 
| id | name     | age | address   | salary | 
+----+----------+-----+-----------+--------+ 
| 1  | Ramesh   | 32  | Ahmedabad | 20000  | 
| 2  | Khilan   | 25  | Delhi     | 15000  | 
| 3  | kaushik  | 23  | Kota      | 30000  | 
| 4  | Chaitali | 25  | Mumbai    | 35000  | 
| 5  | Hardik   | 27  | Bhopal    | 40000  | 
| 6  | Komal    | 22  | MP        | 32000  | 
+----+----------+-----+-----------+--------+ 
Fetched 6 row(s) in 0.51s

以下に示すように、GROUP BYクエリを使用して、各顧客の給与の合計額を取得できます。

[quickstart.cloudera:21000] > Select name, sum(salary) from customers Group BY name;

実行すると、上記のクエリは次の出力を返します。

Query: select name, sum(salary) from customers Group BY name 
+----------+-------------+ 
| name     | sum(salary) | 
+----------+-------------+ 
| Ramesh   | 20000       | 
| Komal    | 32000       | 
| Hardik   | 40000       | 
| Khilan   | 15000       | 
| Chaitali | 35000       | 
| kaushik  | 30000       |
+----------+-------------+ 
Fetched 6 row(s) in 1.75s

以下に示すように、このテーブルに複数のレコードがあると想定します。

+----+----------+-----+-----------+--------+ 
| id | name     | age | address   | salary | 
+----+----------+-----+-----------+--------+ 
| 1  | Ramesh   | 32  | Ahmedabad | 20000  |
| 2  | Ramesh   | 32  | Ahmedabad | 1000|  | 
| 3  | Khilan   | 25  | Delhi     | 15000  | 
| 4  | kaushik  | 23  | Kota      | 30000  | 
| 5  | Chaitali | 25  | Mumbai    | 35000  |
| 6  | Chaitali | 25  | Mumbai    | 2000   |
| 7  | Hardik   | 27  | Bhopal    | 40000  | 
| 8  | Komal    | 22  | MP        | 32000  | 
+----+----------+-----+-----------+--------+

ここでも、レコードの繰り返し入力を考慮して、従業員の給与の合計額を次のように使用して取得できます。 Group By 以下に示す句。

Select name, sum(salary) from customers Group BY name;

実行すると、上記のクエリは次の出力を返します。

Query: select name, sum(salary) from customers Group BY name 
+----------+-------------+ 
| name     | sum(salary) | 
+----------+-------------+ 
| Ramesh   | 21000       | 
| Komal    | 32000       | 
| Hardik   | 40000       | 
| Khilan   | 15000       | 
| Chaitali | 37000       | 
| kaushik  | 30000       | 
+----------+-------------+
Fetched 6 row(s) in 1.75s

ザ・ Having Impalaの句を使用すると、最終結果に表示されるグループ結果をフィルタリングする条件を指定できます。

一般的に、 Having 句は一緒に使用されます group by句; GROUPBY句によって作成されたグループに条件を設定します。

構文

以下は、の構文です。 Having句。

select * from table_name ORDER BY col_name [ASC|DESC] [NULLS FIRST|NULLS LAST]

名前の付いたテーブルがあると仮定します customers データベース内 my_db 内容は以下の通りです−

[quickstart.cloudera:21000] > select * from customers; 
Query: select * from customers 
+----+----------+-----+-------------+--------+ 
| id | name     | age | address     | salary | 
+----+----------+-----+-------------+--------+ 
| 1  | Ramesh   | 32  | Ahmedabad   | 20000  |
| 2  | Khilan   | 25  | Delhi       | 15000  | 
| 3  | kaushik  | 23  | Kota        | 30000  | 
| 4  | Chaitali | 25  | Mumbai      | 35000  | 
| 5  | Hardik   | 27  | Bhopal      | 40000  | 
| 6  | Komal    | 22  | MP          | 32000  | 
| 7  | ram      | 25  | chennai     | 23000  | 
| 8  | rahim    | 22  | vizag       | 31000  | 
| 9  | robert   | 23  | banglore    | 28000  | 
+----+----------+-----+-----------+--------+ 
Fetched 9 row(s) in 0.51s

以下は使用例です Having Impalaの節-

[quickstart.cloudera:21000] > select max(salary) from customers group by age having max(salary) > 20000;

このクエリは、最初にテーブルを年齢別にグループ化し、各グループの最大給与を選択して、以下に示すように20000を超える給与を表示します。

20000 
+-------------+ 
| max(salary) |
+-------------+ 
| 30000       |
| 35000       | 
| 40000       | 
| 32000       | 
+-------------+ 
Fetched 4 row(s) in 1.30s

ザ・ limit Impalaの句は、結果セットの行数を目的の数に制限するために使用されます。つまり、クエリの結果セットは、指定された制限を超えてレコードを保持しません。

構文

以下は、の構文です。 Limit Impalaの節。

select * from table_name order by id limit numerical_expression;

名前の付いたテーブルがあると仮定します customers データベース内 my_db 内容は以下の通りです−

[quickstart.cloudera:21000] > select * from customers; 
Query: select * from customers 
+----+----------+-----+-----------+--------+ 
| id | name     | age | address   | salary | 
+----+----------+-----+-----------+--------+ 
| 3  | kaushik  | 23  | Kota      | 30000  | 
| 6  | Komal    | 22  | MP        | 32000  | 
| 1  | Ramesh   | 32  | Ahmedabad | 20000  | 
| 5  | Hardik   | 27  | Bhopal    | 40000  | 
| 2  | Khilan   | 25  | Delhi     | 15000  | 
| 8  | ram      | 22  | vizag     | 31000  | 
| 9  | robert   | 23  | banglore  | 28000  | 
| 7  | ram      | 25  | chennai   | 23000  | 
| 4  | Chaitali | 25  | Mumbai    | 35000  | 
+----+----------+-----+-----------+--------+ 
Fetched 9 row(s) in 0.51s

テーブル内のレコードは、IDを使用して昇順で並べ替えることができます。 order by 以下に示す句。

[quickstart.cloudera:21000] > select * from customers order by id; 
Query: select * from customers order by id 
+----+----------+-----+-----------+--------+ 
| id | name     | age | address   | salary | 
+----+----------+-----+-----------+--------+ 
| 1  | Ramesh   | 32  | Ahmedabad | 20000  | 
| 2  | Khilan   | 25  | Delhi     | 15000  | 
| 3  | kaushik  | 23  | Kota      | 30000  | 
| 4  | Chaitali | 25  | Mumbai    | 35000  | 
| 5  | Hardik   | 27  | Bhopal    | 40000  | 
| 6  | Komal    | 22  | MP        | 32000  | 
| 7  | ram      | 25  | chennai   | 23000  | 
| 8  | ram      | 22  | vizag     | 31000  |
| 9  | robert   | 23  | banglore  | 28000  | 
+----+----------+-----+-----------+--------+ 
Fetched 9 row(s) in 0.54s

今、を使用して limit 句を使用すると、出力のレコード数を4に制限できます。 limit 以下に示す句。

[quickstart.cloudera:21000] > select * from customers order by id limit 4;

実行すると、上記のクエリは次の出力を返します。

Query: select * from customers order by id limit 4 
+----+----------+-----+-----------+--------+ 
| id | name     | age | address   | salary | 
+----+----------+-----+-----------+--------+ 
| 1  | Ramesh   | 32  | Ahmedabad | 20000  | 
| 2  | Khilan   | 25  | Delhi     | 15000  |
| 3  | kaushik  | 23  | Kota      | 30000  | 
| 4  | Chaitali | 25  | Mumbai    | 35000  | 
+----+----------+-----+-----------+--------+ 
Fetched 4 row(s) in 0.64s

一般に、結果セットの行は select クエリは0から始まります。 offset節では、出力をどこから検討するかを決定できます。たとえば、オフセットを0として選択した場合、結果は通常どおりになり、オフセットを5として選択した場合、結果は5行目から始まります。

構文

以下は、の構文です。 offsetImpalaの節。

select data from table_name Group BY col_name;

名前の付いたテーブルがあると仮定します customers データベース内 my_db 内容は以下の通りです−

[quickstart.cloudera:21000] > select * from customers; 
Query: select * from customers 
+----+----------+-----+-----------+--------+ 
| id | name     | age | address   | salary | 
+----+----------+-----+-----------+--------+ 
| 3  | kaushik  | 23  | Kota      | 30000  | 
| 6  | Komal    | 22  | MP        | 32000  | 
| 1  | Ramesh   | 32  | Ahmedabad | 20000  | 
| 5  | Hardik   | 27  | Bhopal    | 40000  | 
| 2  | Khilan   | 25  | Delhi     | 15000  | 
| 8  | ram      | 22  | vizag     | 31000  | 
| 9  | robert   | 23  | banglore  | 28000  |
| 7  | ram      | 25  | chennai   | 23000  | 
| 4  | Chaitali | 25  | Mumbai    | 35000  | 
+----+----------+-----+-----------+--------+ 
Fetched 9 row(s) in 0.51s

テーブル内のレコードをIDの昇順で配置し、レコード数を4に制限できます。 limit そして order by 以下に示す句。

Query: select * from customers order by id limit 4 
+----+----------+-----+-----------+--------+ 
| id | name     | age | address   | salary | 
+----+----------+-----+-----------+--------+ 
| 1  | Ramesh   | 32  | Ahmedabad | 20000  | 
| 2  | Khilan   | 25  | Delhi     | 15000  | 
| 3  | kaushik  | 23  | Kota      | 30000  | 
| 4  | Chaitali | 25  | Mumbai    | 35000  | 
+----+----------+-----+-----------+--------+ 
Fetched 4 row(s) in 0.64s

以下は、の例です。 offset句。ここでは、レコードを取得していますcustomersIDの順序でテーブルを作成し、0番目の行から始まる最初の4行を出力します。

[quickstart.cloudera:21000] > select * from customers order by id limit 4 offset 0;

上記のクエリを実行すると、次の結果が得られます。

Query: select * from customers order by id limit 4 offset 0 
+----+----------+-----+-----------+--------+
| id | name     | age | address   | salary | 
+----+----------+-----+-----------+--------+ 
| 1  | Ramesh   | 32  | Ahmedabad | 20000  | 
| 2  | Khilan   | 25  | Delhi     | 15000  | 
| 3  | kaushik  | 23  | Kota      | 30000  | 
| 4  | Chaitali | 25  | Mumbai    | 35000  | 
+----+----------+-----+-----------+--------+ 
Fetched 4 row(s) in 0.62s

同様に、から4つのレコードを取得できます。 customers 以下に示すように、オフセット5の行から始まるテーブル。

[quickstart.cloudera:21000] > select * from customers order by id limit 4 offset 5; 
Query: select * from customers order by id limit 4 offset 5 
+----+--------+-----+----------+--------+ 
| id | name   | age | address  | salary | 
+----+--------+-----+----------+--------+ 
| 6  | Komal  | 22  | MP       | 32000  | 
| 7  | ram    | 25  | chennai  | 23000  | 
| 8  | ram    | 22  | vizag    | 31000  |
| 9  | robert | 23  | banglore | 28000  | 
+----+--------+-----+----------+--------+ 
Fetched 4 row(s) in 0.52s

を使用して、2つのクエリの結果を組み合わせることができます。 Union インパラの条項。

構文

以下は、の構文です。 Union Impalaの節。

query1 union query2;

名前の付いたテーブルがあると仮定します customers データベース内 my_db 内容は以下の通りです−

[quickstart.cloudera:21000] > select * from customers; 
Query: select * from customers 
+----+----------+-----+-----------+--------+ 
| id | name     | age | address   | salary | 
+----+----------+-----+-----------+--------+ 
| 1  | Ramesh   | 32  | Ahmedabad | 20000  | 
| 9  | robert   | 23  | banglore  | 28000  | 
| 2  | Khilan   | 25  | Delhi     | 15000  | 
| 4  | Chaitali | 25  | Mumbai    | 35000  | 
| 7  | ram      | 25  | chennai   | 23000  | 
| 6  | Komal    | 22  | MP        | 32000  | 
| 8  | ram      | 22  | vizag     | 31000  | 
| 5  | Hardik   | 27  | Bhopal    | 40000  | 
| 3  | kaushik  | 23  | Kota      | 30000  | 
+----+----------+-----+-----------+--------+ 
Fetched 9 row(s) in 0.59s

同様に、という名前の別のテーブルがあるとします。 employee 内容は以下の通りです−

[quickstart.cloudera:21000] > select * from employee; 
Query: select * from employee 
+----+---------+-----+---------+--------+ 
| id | name    | age | address | salary | 
+----+---------+-----+---------+--------+ 
| 3  | mahesh  | 54  | Chennai | 55000  | 
| 2  | ramesh  | 44  | Chennai | 50000  | 
| 4  | Rupesh  | 64  | Delhi   | 60000  | 
| 1  | subhash | 34  | Delhi   | 40000  | 
+----+---------+-----+---------+--------+ 
Fetched 4 row(s) in 0.59s

以下は、の例です。 unionImpalaの節。この例では、両方のテーブルのレコードをIDの順序で配置し、2つの別々のクエリを使用してそれらの数を3に制限し、UNION 句。

[quickstart.cloudera:21000] > select * from customers order by id limit 3
 union select * from employee order by id limit 3;

実行すると、上記のクエリは次の出力を返します。

Query: select * from customers order by id limit 3 union select 
   * from employee order by id limit 3 
+----+---------+-----+-----------+--------+ 
| id | name    | age | address   | salary | 
+----+---------+-----+-----------+--------+ 
| 2  | Khilan  | 25  | Delhi     | 15000  |
| 3  | mahesh  | 54  | Chennai   | 55000  | 
| 1  | subhash | 34  | Delhi     | 40000  | 
| 2  | ramesh  | 44  | Chennai   | 50000  | 
| 3  | kaushik | 23  | Kota      | 30000  | 
| 1  | Ramesh  | 32  | Ahmedabad | 20000  | 
+----+---------+-----+-----------+--------+ 
Fetched 6 row(s) in 3.11s

クエリが複雑すぎる場合は、次のように定義できます aliases 複雑なパーツに変換し、を使用してクエリに含めます with インパラの条項。

構文

以下は、の構文です。 with Impalaの節。

with x as (select 1), y as (select 2) (select * from x union y);

名前の付いたテーブルがあると仮定します customers データベース内 my_db 内容は以下の通りです−

[quickstart.cloudera:21000] > select * from customers;
Query: select * from customers 
+----+----------+-----+-----------+--------+ 
| id | name     | age | address   | salary | 
+----+----------+-----+-----------+--------+ 
| 1  | Ramesh   | 32  | Ahmedabad | 20000  | 
| 9  | robert   | 23  | banglore  | 28000  | 
| 2  | Khilan   | 25  | Delhi     | 15000  | 
| 4  | Chaitali | 25  | Mumbai    | 35000  | 
| 7  | ram      | 25  | chennai   | 23000  | 
| 6  | Komal    | 22  | MP        | 32000  | 
| 8  | ram      | 22  | vizag     | 31000  | 
| 5  | Hardik   | 27  | Bhopal    | 40000  | 
| 3  | kaushik  | 23  | Kota      | 30000  | 
+----+----------+-----+-----------+--------+ 
Fetched 9 row(s) in 0.59s

同様に、という名前の別のテーブルがあるとします。 employee 内容は以下の通りです−

[quickstart.cloudera:21000] > select * from employee; 
Query: select * from employee 
+----+---------+-----+---------+--------+ 
| id | name    | age | address | salary | 
+----+---------+-----+---------+--------+ 
| 3  | mahesh  | 54  | Chennai | 55000  | 
| 2  | ramesh  | 44  | Chennai | 50000  | 
| 4  | Rupesh  | 64  | Delhi   | 60000  | 
| 1  | subhash | 34  | Delhi   | 40000  | 
+----+---------+-----+---------+--------+ 
Fetched 4 row(s) in 0.59s

以下は、の例です。 withImpalaの節。この例では、両方のレコードを表示していますemployee そして customers 25歳以上の方 with 句。

[quickstart.cloudera:21000] > 
   with t1 as (select * from customers where age>25), 
   t2 as (select * from employee where age>25) 
   (select * from t1 union select * from t2);

実行すると、上記のクエリは次の出力を返します。

Query: with t1 as (select * from customers where age>25), t2 as (select * from employee where age>25) 
   (select * from t1 union select * from t2)
+----+---------+-----+-----------+--------+ 
| id | name    | age | address   | salary | 
+----+---------+-----+-----------+--------+ 
| 3  | mahesh  | 54  | Chennai   | 55000  | 
| 1  | subhash | 34  | Delhi     | 40000  | 
| 2  | ramesh  | 44  | Chennai   | 50000  | 
| 5  | Hardik  | 27  | Bhopal    | 40000  | 
| 4  | Rupesh  | 64  | Delhi     | 60000  | 
| 1  | Ramesh  | 32  | Ahmedabad | 20000  | 
+----+---------+-----+-----------+--------+ 
Fetched 6 row(s) in 1.73s

ザ・ distinct Impalaの演算子は、重複を削除して一意の値を取得するために使用されます。

構文

以下は、の構文です。 distinct オペレーター。

select distinct columns… from table_name;

名前の付いたテーブルがあると仮定します customers インパラとその内容は次のとおりです-

[quickstart.cloudera:21000] > select distinct id, name, age, salary from customers; 
Query: select distinct id, name, age, salary from customers

ここでは、RameshとChaitaliが2回入力した顧客の給与を確認できます。 distinct 演算子を使用すると、以下に示すように一意の値を選択できます。

[quickstart.cloudera:21000] > select distinct name, age, address from customers;

実行すると、上記のクエリは次の出力を返します。

Query: select distinct id, name from customers
+----------+-----+-----------+ 
| name     | age | address   | 
+----------+-----+-----------+ 
| Ramesh   | 32  | Ahmedabad |
| Khilan   | 25  | Delhi     | 
| kaushik  | 23  | Kota      | 
| Chaitali | 25  | Mumbai    |
| Hardik   | 27  | Bhopal    |
| Komal    | 22  | MP        | 
+----------+-----+-----------+
Fetched 9 row(s) in 1.46s