DynamoDB - ท่อส่งข้อมูล

Data Pipeline ช่วยให้สามารถส่งออกและนำเข้าข้อมูลไปยัง / จากตารางไฟล์หรือที่เก็บข้อมูล S3 แน่นอนว่าสิ่งนี้มีประโยชน์ในการสำรองข้อมูลการทดสอบและสำหรับความต้องการหรือสถานการณ์ที่คล้ายคลึงกัน

ในการส่งออกคุณใช้คอนโซล Data Pipeline ซึ่งสร้างไปป์ไลน์ใหม่และเปิดใช้คลัสเตอร์ Amazon EMR (Elastic MapReduce) เพื่อทำการส่งออก EMR อ่านข้อมูลจาก DynamoDB และเขียนไปยังเป้าหมาย เราจะพูดถึง EMR โดยละเอียดในบทช่วยสอนนี้

ในการดำเนินการนำเข้าให้คุณใช้คอนโซล Data Pipeline ซึ่งสร้างไปป์ไลน์และเรียกใช้ EMR เพื่อดำเนินการนำเข้า มันอ่านข้อมูลจากต้นทางและเขียนไปยังปลายทาง

Note - การดำเนินการส่งออก / นำเข้ามีค่าใช้จ่ายตามบริการที่ใช้โดยเฉพาะ EMR และ S3

การใช้ Data Pipeline

คุณต้องระบุการดำเนินการและการอนุญาตทรัพยากรเมื่อใช้ Data Pipeline คุณสามารถใช้บทบาทหรือนโยบาย IAM เพื่อกำหนดได้ ผู้ใช้ที่กำลังดำเนินการนำเข้า / ส่งออกควรจดบันทึกว่าพวกเขาต้องการรหัสคีย์การเข้าถึงที่ใช้งานอยู่และรหัสลับ

บทบาท IAM สำหรับท่อส่งข้อมูล

คุณต้องมีบทบาท IAM สองบทบาทเพื่อใช้ Data Pipeline -

  • DataPipelineDefaultRole - นี่คือการกระทำทั้งหมดที่คุณอนุญาตให้ไปป์ไลน์ดำเนินการให้คุณ

  • DataPipelineDefaultResourceRole - มีทรัพยากรที่คุณอนุญาตให้ไปป์ไลน์จัดเตรียมให้คุณ

หากคุณยังใหม่กับ Data Pipeline คุณต้องวางบทบาทแต่ละบทบาท ผู้ใช้ก่อนหน้านี้ทั้งหมดมีบทบาทเหล่านี้เนื่องจากบทบาทที่มีอยู่

ใช้คอนโซล IAM เพื่อสร้างบทบาท IAM สำหรับ Data Pipeline และดำเนินการสี่ขั้นตอนต่อไปนี้ -

Step 1 - เข้าสู่ระบบคอนโซล IAM ที่อยู่ที่ https://console.aws.amazon.com/iam/

Step 2 - เลือก Roles จากแดชบอร์ด

Step 3 - เลือก Create New Role. จากนั้นป้อน DataPipelineDefaultRole ในไฟล์Role Name และเลือก Next Step. ในAWS Service Roles รายการใน Role Type พาเนลไปที่ Data Pipelineและเลือก Select. เลือกCreate Role ใน Review แผงหน้าปัด.

Step 4 - เลือก Create New Role.