Хранилище данных - OLAP
Сервер онлайн-аналитической обработки (OLAP) основан на многомерной модели данных. Это позволяет менеджерам и аналитикам получать представление об информации благодаря быстрому, последовательному и интерактивному доступу к информации. В этой главе рассматриваются типы OLAP, операции с OLAP, различия между OLAP и статистическими базами данных и OLTP.
Типы серверов OLAP
У нас есть четыре типа серверов OLAP -
- Реляционный OLAP (ROLAP)
- Многомерный OLAP (MOLAP)
- Гибридный OLAP (HOLAP)
- Специализированные SQL-серверы
Реляционный OLAP
Серверы ROLAP размещаются между реляционным внутренним сервером и клиентскими интерфейсными инструментами. Для хранения и управления данными хранилища ROLAP использует реляционную или расширенно-реляционную СУБД.
ROLAP включает в себя следующее -
- Реализация агрегационной навигационной логики.
- Оптимизация для каждой серверной части СУБД.
- Дополнительные инструменты и услуги.
Многомерный OLAP
MOLAP использует многомерные механизмы хранения на основе массивов для многомерных представлений данных. В хранилищах многомерных данных использование хранилища может быть низким, если набор данных разрежен. Поэтому многие серверы MOLAP используют два уровня представления хранилища данных для обработки плотных и разреженных наборов данных.
Гибридный OLAP
Гибридный OLAP - это комбинация ROLAP и MOLAP. Он предлагает более высокую масштабируемость ROLAP и более быстрое вычисление MOLAP. Серверы HOLAP позволяют хранить большие объемы данных с подробной информацией. Агрегации хранятся отдельно в магазине MOLAP.
Специализированные SQL-серверы
Специализированные серверы SQL предоставляют расширенный язык запросов и поддержку обработки запросов для SQL-запросов по схемам «звезда» и «снежинка» в среде только для чтения.
OLAP операции
Поскольку серверы OLAP основаны на многомерном представлении данных, мы обсудим операции OLAP с многомерными данными.
Вот список операций OLAP -
- Roll-up
- Drill-down
- Нарезать и нарезать
- Поворот (поворот)
Свернуть
Roll-up выполняет агрегирование куба данных любым из следующих способов:
- Поднимаясь вверх по иерархии понятий для измерения
- По уменьшению размеров
На следующей диаграмме показано, как работает сворачивание.

Свертывание выполняется путем подъема по иерархии понятий для местоположения измерения.
Первоначально иерархия понятий была «улица <город <провинция <страна».
При свертывании данные агрегируются по возрастанию иерархии местоположений от уровня города до уровня страны.
Данные сгруппированы по городам, а не странам.
Когда выполняется сведение, одно или несколько измерений из куба данных удаляются.
Детализация
Детализация - это операция, обратная свертыванию. Это выполняется одним из следующих способов -
- Путем снижения иерархии понятий для измерения
- Представляя новое измерение.
На следующей диаграмме показано, как работает детализация -

Детализация выполняется путем понижения иерархии понятий для измерения времени.
Первоначально иерархия понятий была «день <месяц <квартал <год».
При развертке измерение времени понижается с уровня квартала до уровня месяца.
Когда выполняется детализация, добавляются одно или несколько измерений из куба данных.
Он перемещает данные от менее подробных данных к более подробным данным.
Ломтик
Операция среза выбирает одно конкретное измерение из данного куба и предоставляет новый вложенный куб. Рассмотрим следующую диаграмму, которая показывает, как работает срез.

Здесь Slice выполняется для измерения «время» с использованием критерия time = «Q1».
Он сформирует новый субкуб, выбрав одно или несколько измерений.
Игральная кость
Dice выбирает два или более измерения из данного куба и предоставляет новый вложенный куб. Рассмотрим следующую диаграмму, которая показывает операцию игры в кости.

Операция кубика на кубе на основе следующих критериев выбора включает три измерения.
- (location = "Торонто" или "Ванкувер")
- (время = «Q1» или «Q2»)
- (item = "Мобильный" или "Модем")
Pivot
Операция поворота также известна как вращение. Он вращает оси данных в поле зрения, чтобы обеспечить альтернативное представление данных. Рассмотрим следующую диаграмму, на которой показана операция поворота.

OLAP против OLTP
Sr. No. | Хранилище данных (OLAP) | Операционная база данных (OLTP) |
---|---|---|
1 | Включает историческую обработку информации. | Включает ежедневную обработку. |
2 | Системы OLAP используются работниками умственного труда, такими как руководители, менеджеры и аналитики. | Системы OLTP используются клерками, администраторами баз данных или специалистами по базам данных. |
3 | Полезно при анализе бизнеса. | Полезно для ведения бизнеса. |
4 | Он ориентирован на выход информации. | Основное внимание уделяется данным в формате. |
5 | На основе схемы звезды, снежинки, схемы и схемы созвездия фактов. | На основе модели взаимоотношений сущностей. |
6 | Содержит исторические данные. | Содержит текущие данные. |
7 | Предоставляет обобщенные и консолидированные данные. | Предоставляет примитивные и очень подробные данные. |
8 | Обеспечивает обобщенное и многомерное представление данных. | Предоставляет подробное и однозначное реляционное представление данных. |
9 | Количество пользователей исчисляется сотнями. | Количество пользователей исчисляется тысячами. |
10 | Количество доступных записей выражается в миллионах. | Количество доступных записей выражается в десятках. |
11 | Размер базы данных от 100 ГБ до 1 ТБ. | Размер базы данных от 100 МБ до 1 ГБ. |
12 | Очень гибкий. | Обеспечивает высокую производительность. |