SAP HANA - Информационное моделирование
Информационное моделирование SAP HANA; также известный как HANA Data Modeler, является сердцем системы HANA. Это позволяет создавать представления моделирования в верхней части таблиц базы данных и реализовывать бизнес-логику для создания содержательного отчета для анализа.
Особенности информационного моделирования
Предоставляет несколько представлений транзакционных данных, хранящихся в физических таблицах базы данных HANA, для анализа и бизнес-логики.
Информационное моделирование работает только для таблиц хранения на основе столбцов.
Представления информационного моделирования используются приложениями на основе Java или HTML или инструментами SAP, такими как SAP Lumira или Analysis Office, для целей отчетности.
Также можно использовать сторонние инструменты, такие как MS Excel, для подключения к HANA и создания отчетов.
Представления моделирования SAP HANA используют реальную мощь SAP HANA.
Существует три типа информационных представлений, определяемых как -
- Просмотр атрибутов
- Аналитический взгляд
- Расчетный вид
Строка против колоночного магазина
Представления SAP HANA Modeler можно создавать только в верхней части таблиц на основе столбцов. Хранение данных в таблицах столбцов - не новость. Ранее предполагалось, что для хранения данных в структуре на основе столбцов требуется больший объем памяти, а не оптимизация производительности.
С развитием SAP HANA, HANA использовала хранилище данных на основе столбцов в информационных представлениях и продемонстрировала реальные преимущества столбчатых таблиц по сравнению с таблицами на основе строк.
Колонка Store
В таблице хранилища столбцов данные хранятся вертикально. Итак, похожие типы данных объединяются, как показано в примере выше. Он обеспечивает более быстрые операции чтения и записи в память с помощью In-Memory Computing Engine.
В обычной базе данных данные хранятся в структуре на основе строк, то есть по горизонтали. SAP HANA хранит данные как в строчной, так и в столбцовой структуре. Это обеспечивает оптимизацию производительности, гибкость и сжатие данных в базе данных HANA.
Хранение данных в таблице на основе столбцов имеет следующие преимущества:
Сжатие данных
Более быстрый доступ для чтения и записи к таблицам по сравнению с обычным хранилищем на основе строк
Гибкость и параллельная обработка
Выполняйте агрегирование и вычисления на более высокой скорости
Существуют различные методы и алгоритмы того, как данные могут быть сохранены в структуре на основе столбцов - Сжатый словарь, Сжатый цикл и многие другие.
В Dictionary Compressed ячейки хранятся в виде чисел в таблицах, а числовые ячейки всегда оптимизированы по производительности по сравнению с символами.
В сжатой длине серии он сохраняет множитель со значением ячейки в числовом формате, а множитель показывает повторяющееся значение в таблице.
Функциональная разница - хранилище строк и столбцов
Всегда рекомендуется использовать хранилище на основе столбцов, если оператор SQL должен выполнять агрегатные функции и вычисления. Таблицы на основе столбцов всегда работают лучше при выполнении агрегатных функций, таких как Sum, Count, Max, Min.
Хранение на основе строк предпочтительнее, когда вывод должен возвращать полную строку. Приведенный ниже пример упрощает понимание.
В приведенном выше примере при выполнении функции Aggregate (Sum) в столбце продаж с предложением Where он будет использовать только столбец Date и Sales при выполнении SQL-запроса, поэтому, если это таблица хранения на основе столбца, она будет оптимизирована по производительности, быстрее, чем данные требуется только из двух столбцов.
При выполнении простого запроса Select на выходе должна выводиться вся строка, поэтому в этом сценарии рекомендуется сохранять таблицу как строку.
Представления информационного моделирования
Просмотр атрибутов
Атрибуты - это неизмеримые элементы в таблице базы данных. Они представляют собой основные данные и аналогичны характеристикам BW. Представления атрибутов представляют собой измерения в базе данных или используются для объединения измерений или других представлений атрибутов при моделировании.
Важные особенности -
- Представления атрибутов используются в представлениях аналитики и вычислений.
- Представление атрибутов представляет основные данные.
- Используется для фильтрации размеров таблиц измерений в аналитическом и расчетном представлениях.
Аналитический взгляд
Аналитические представления используют возможности SAP HANA для выполнения вычислений и функций агрегирования таблиц в базе данных. Он имеет по крайней мере одну таблицу фактов, которая имеет меры и первичные ключи таблиц измерений и окружена таблицами измерений, содержащими основные данные.
Важные особенности -
Аналитические представления предназначены для выполнения запросов по схеме "звезда".
Аналитические представления содержат по крайней мере одну таблицу фактов и несколько таблиц измерений с основными данными и выполняют вычисления и агрегирование.
Они похожи на информационные кубы и информационные объекты в SAP BW.
Аналитические представления могут быть созданы поверх представлений атрибутов и таблиц фактов и выполнять такие вычисления, как количество проданных единиц, общая цена и т. Д.
Просмотры расчетов
Представления вычислений используются поверх аналитических представлений и представлений атрибутов для выполнения сложных вычислений, которые невозможны с аналитическими представлениями. Представление вычислений представляет собой комбинацию базовых таблиц столбцов, представлений атрибутов и аналитических представлений для обеспечения бизнес-логики.
Важные особенности -
Представления вычислений определяются либо в графическом виде с использованием функции моделирования HANA, либо в виде сценария на языке SQL.
Он создан для выполнения сложных вычислений, которые невозможны с другими представлениями - атрибутами и аналитическими представлениями программы моделирования SAP HANA.
Одно или несколько представлений атрибутов и аналитических представлений используются с помощью встроенных функций, таких как проекты, объединение, объединение, ранжирование в представлении расчета.