アマゾンウェブサービス-Redshift

Amazon Redshiftは、クラウド内のフルマネージドデータウェアハウスサービスです。そのデータセットは、数百ギガバイトからペタバイトの範囲です。データウェアハウスを作成する最初のプロセスは、と呼ばれる一連のコンピューティングリソースを起動することです。nodes、と呼ばれるグループに編成されています cluster。その後、クエリを処理できます。

Amazon Redshiftを設定する方法は?

以下は、AmazonRedshiftをセットアップする手順です。

Step 1 −次の手順を使用して、サインインしてRedshiftクラスターを起動します。

  • AWS管理コンソールにサインインし、次のリンクを使用してAmazonRedshiftコンソールを開きます- https://console.aws.amazon.com/redshift/

  • 画面の右上隅にある[リージョン]メニューを使用して、クラスターを作成するリージョンを選択します。

  • [クラスターの起動]ボタンをクリックします。

  • 「クラスターの詳細」ページが開きます。必要な詳細を入力し、レビューページまで[続行]ボタンをクリックします。

  • 確認ページが開きます。[閉じる]ボタンをクリックして終了し、クラスターが[クラスター]リストに表示されるようにします。

  • リストからクラスターを選択し、クラスターステータス情報を確認します。このページには、クラスターのステータスが表示されます。

Step 2−クラスターへのクライアント接続を許可するようにセキュリティグループを構成します。Redshiftへのアクセスの承認は、クライアントがEC2インスタンスを承認するかどうかによって異なります。

EC2-VPCプラットフォームのセキュリティグループに対して、次の手順に従います。

  • Amazon Redshiftコンソールを開き、ナビゲーションペインで[クラスター]をクリックします。

  • 目的のクラスターを選択します。その構成タブが開きます。

  • [セキュリティ]グループをクリックします。

  • [セキュリティグループ]ページが開いたら、[受信]タブをクリックします。

  • [編集]ボタンをクリックします。以下のようにフィールドを設定し、[保存]ボタンをクリックします。

    • Type −カスタムTCPルール。

    • Protocol −TCP。

    • Port Range−クラスターの起動時に使用したものと同じポート番号を入力します。デフォルトでは、AmazonRedshiftのポートは5439です。

    • Source − [カスタムIP]を選択し、0.0.0.0 / 0と入力します。

Step 3 − RedshiftClusterに接続します。

Redshift Clusterに接続するには、直接またはSSLを介して2つの方法があります。

直接接続する手順は次のとおりです。

  • SQLクライアントツールを使用してクラスターを接続します。PostgreSQLJDBCまたはODBCドライバーと互換性のあるSQLクライアントツールをサポートします。

    以下のリンクを使用してダウンロードしてください- JDBC https://jdbc.postgresql.org/download/postgresql-8.4-703.jdbc4.jar

    ODBC https://ftp.postgresql.org/pub/odbc/versions/msi/psqlodbc_08_04_0200.zip または64ビットマシンの場合はhttp://ftp.postgresql.org/pub/odbc/versions/msi/psqlodbc_09_00_0101x64.zip

  • 次の手順を使用して、接続文字列を取得します。

    • Amazon Redshiftコンソールを開き、ナビゲーションペインで[クラスター]を選択します。

    • 選択したクラスターを選択し、[構成]タブをクリックします。

    • 次のスクリーンショットに示すように、クラスターデータベースのプロパティの下にJDBCURLが表示されたページが開きます。URLをコピーします。

  • 次の手順を使用して、クラスターをSQL Workbench / Jに接続します。

    • SQL Workbench / Jを開きます。

    • [ファイル]を選択し、[接続]ウィンドウをクリックします。

    • [新しい接続プロファイルの作成]を選択し、名前などの必要な詳細を入力します。

    • [ドライバーの管理]をクリックし、[ドライバーの管理]ダイアログボックスが開きます。

    • [新しいエントリを作成]ボタンをクリックして、必要な詳細を入力します。

  • フォルダアイコンをクリックして、ドライバの場所に移動します。最後に、[開く]ボタンをクリックします。

  • [クラス名]ボックスと[サンプルURL]ボックスは空白のままにします。[OK]をクリックします。

  • リストからドライバーを選択します。

  • [URL]フィールドに、コピーしたJDBCURLを貼り付けます。

  • それぞれのフィールドにユーザー名とパスワードを入力します。

  • [自動コミット]ボックスを選択し、[プロファイルリストの保存]をクリックします。

AmazonRedshiftの機能

以下はAmazonRedshiftの機能です-

  • Supports VPC −ユーザーはVPC内でRedshiftを起動し、仮想ネットワーク環境を介してクラスターへのアクセスを制御できます。

  • Encryption − Redshiftに保存されているデータは、Redshiftでテーブルを作成するときに暗号化および構成できます。

  • SSL − SSL暗号化は、クライアントとRedshift間の接続を暗号化するために使用されます。

  • Scalable−数回クリックするだけで、Redshiftデータウェアハウス内のノード数を要件に応じて簡単にスケーリングできます。また、パフォーマンスを低下させることなく、ストレージ容量を拡張できます。

  • Cost-effective− Amazon Redshiftは、従来のデータウェアハウジング手法に代わる費用効果の高い方法です。先行投資、長期契約、オンデマンドの価格体系はありません。