DynamoDB - Лучшие практики

Некоторые практики оптимизируют код, предотвращают ошибки и минимизируют затраты на пропускную способность при работе с различными источниками и элементами.

Ниже приведены некоторые из наиболее важных и часто используемых передовых практик DynamoDB.

Столы

Распределение таблиц означает, что наилучшие подходы распределяют операции чтения / записи равномерно по всем элементам таблицы.

Стремитесь к единообразному доступу к данным для элементов таблицы. Оптимальное использование пропускной способности зависит от выбора первичного ключа и шаблонов рабочей нагрузки элементов. Распределите рабочую нагрузку равномерно по значениям ключей секций. Избегайте таких вещей, как небольшое количество часто используемых значений ключей раздела. Выбирайте лучший выбор, например большое количество различных значений ключей секций.

Получите представление о поведении разделов. Оцените разделы, автоматически выделяемые DynamoDB.

DynamoDB предлагает использование пакетной пропускной способности, которое резервирует неиспользованную пропускную способность для «всплесков» мощности. Избегайте интенсивного использования этой опции, потому что пакеты быстро потребляют большие объемы пропускной способности; более того, он не является надежным ресурсом.

При загрузке распределяйте данные для повышения производительности. Реализуйте это путем одновременной загрузки на все выделенные серверы.

Кэшируйте часто используемые элементы для разгрузки операций чтения в кеш, а не в базу данных.

Предметы

Регулирование, производительность, размер и стоимость доступа остаются самыми большими проблемами при работе с элементами. Выбирайте столы "один ко многим". Удалите атрибуты и разделите таблицы в соответствии с шаблонами доступа. Вы можете значительно повысить эффективность с помощью этого простого подхода.

Сжимайте большие значения перед их сохранением. Используйте стандартные инструменты сжатия. Используйте альтернативное хранилище для больших значений атрибутов, таких как S3. Вы можете сохранить объект в S3, а идентификатор - в элементе.

Распределите большие атрибуты по нескольким элементам с помощью виртуальных частей. Это позволяет обойти ограничения размера элемента.

Запросы и сканирование

Запросы и сканирование в основном страдают от проблем с потреблением пропускной способности. Избегайте всплесков, которые обычно возникают в результате переключения на строго согласованное считывание. Используйте параллельное сканирование с ограниченными ресурсами (т. Е. Фоновая функция без регулирования). Более того, используйте их только с большими таблицами, а ситуации, когда вы не полностью используете пропускную способность или операции сканирования, предлагают низкую производительность.

Местные вторичные индексы

Индексы создают проблемы с точки зрения пропускной способности и затрат на хранение, а также эффективности запросов. Избегайте индексации, если вы не запрашиваете атрибуты часто. В прогнозах выбирайте с умом, потому что они раздувают индексы. Выбирайте только те, которые активно используются.

Используйте разреженные индексы, то есть индексы, в которых ключи сортировки не появляются во всех элементах таблицы. Они помогают запросам по атрибутам, отсутствующим в большинстве элементов таблицы.

Обратите внимание на расширение коллекции элементов (все элементы таблицы и их индексы). Операции добавления / обновления вызывают рост таблиц и индексов, и 10 ГБ остается пределом для коллекций.

Глобальные вторичные индексы

Индексы создают проблемы с точки зрения пропускной способности и затрат на хранение, а также эффективности запросов. Выбирайте распределение ключевых атрибутов, которое, как и распределение чтения / записи в таблицах, обеспечивает единообразие рабочей нагрузки. Выберите атрибуты, которые равномерно распределяют данные. Также используйте разреженные индексы.

Используйте глобальные вторичные индексы для быстрого поиска по запросам, запрашивающим небольшой объем данных.