DynamoDB-データパイプライン

データパイプラインを使用すると、テーブル、ファイル、またはS3バケットとの間でデータをエクスポートおよびインポートできます。もちろん、これはバックアップ、テスト、および同様のニーズやシナリオで役立つことがわかります。

エクスポートでは、データパイプラインコンソールを使用します。これにより、新しいパイプラインが作成され、Amazon EMR(Elastic MapReduce)クラスターが起動されてエクスポートが実行されます。EMRはDynamoDBからデータを読み取り、ターゲットに書き込みます。EMRについては、このチュートリアルの後半で詳しく説明します。

インポート操作では、データパイプラインコンソールを使用します。データパイプラインコンソールは、パイプラインを作成し、EMRを起動してインポートを実行します。ソースからデータを読み取り、宛先に書き込みます。

Note −使用されるサービス、具体的にはEMRとS3を考慮すると、エクスポート/インポート操作にはコストがかかります。

データパイプラインの使用

データパイプラインを使用する場合は、アクションとリソースのアクセス許可を指定する必要があります。IAMロールまたはポリシーを利用してそれらを定義できます。インポート/エクスポートを実行しているユーザーは、アクティブなアクセスキーIDと秘密キーが必要になることに注意する必要があります。

データパイプラインのIAMの役割

データパイプラインを使用するには、2つのIAMロールが必要です-

  • DataPipelineDefaultRole −これには、パイプラインに実行を許可するすべてのアクションが含まれます。

  • DataPipelineDefaultResourceRole −これには、パイプラインがプロビジョニングすることを許可するリソースがあります。

データパイプラインを初めて使用する場合は、各ロールを生成する必要があります。以前のすべてのユーザーは、既存の役割のためにこれらの役割を持っています。

IAMコンソールを使用してデータパイプラインのIAMロールを作成し、次の4つの手順を実行します-

Step 1 −次の場所にあるIAMコンソールにログインします。 https://console.aws.amazon.com/iam/

Step 2 −選択 Roles ダッシュボードから。

Step 3 −選択 Create New Role。次に、DataPipelineDefaultRoleをRole Name フィールドを選択し、 Next Step。の中にAWS Service Roles のリスト Role Type パネル、に移動 Data Pipeline、を選択します Select。選択するCreate Role の中に Review パネル。

Step 4 −選択 Create New Role