SAP HANA - Modelador de Informações
SAP HANA Information Modeler; também conhecido como HANA Data Modeler é o coração do sistema HANA. Ele permite criar visualizações de modelagem no topo das tabelas do banco de dados e implementar lógica de negócios para criar um relatório significativo para análise.
Características do Modelador de Informação
Fornece várias visualizações de dados transacionais armazenados em tabelas físicas do banco de dados HANA para fins de análise e lógica de negócios.
O modelador informativo funciona apenas para tabelas de armazenamento baseadas em colunas.
As visualizações de modelagem de informações são consumidas por aplicativos baseados em Java ou HTML ou ferramentas SAP como SAP Lumira ou Analysis Office para fins de relatório.
Também é possível usar ferramentas de terceiros como o MS Excel para se conectar ao HANA e criar relatórios.
As visualizações de modelagem do SAP HANA exploram o poder real do SAP HANA.
Existem três tipos de visualizações de informações, definidas como -
- Visualização de atributos
- Visão Analítica
- Vista de Cálculo
Armazenamento de linha vs coluna
As visualizações do SAP HANA Modeler só podem ser criadas na parte superior das tabelas baseadas em colunas. Armazenar dados em tabelas de colunas não é uma coisa nova. Anteriormente, era assumido que o armazenamento de dados em uma estrutura baseada em colunas requer mais tamanho de memória e não otimizado para desempenho.
Com a evolução do SAP HANA, o HANA usou armazenamento de dados baseado em coluna em visualizações de informações e apresentou os benefícios reais das tabelas colunares em comparação com as tabelas baseadas em linha.
Armazenamento de coluna
Em uma tabela de armazenamento de coluna, os dados são armazenados verticalmente. Portanto, tipos de dados semelhantes vêm juntos, conforme mostrado no exemplo acima. Ele fornece operações de leitura e gravação de memória mais rápidas com a ajuda do In-Memory Computing Engine.
Em um banco de dados convencional, os dados são armazenados em uma estrutura baseada em linha, ou seja, horizontalmente. SAP HANA armazena dados em estrutura baseada em linha e coluna. Isso fornece otimização de desempenho, flexibilidade e compactação de dados no banco de dados HANA.
Armazenar dados em tabelas com base em colunas tem os seguintes benefícios -
Compressão de dados
Acesso mais rápido de leitura e gravação às tabelas em comparação ao armazenamento convencional baseado em linha
Flexibilidade e processamento paralelo
Realize agregações e cálculos em alta velocidade
Existem vários métodos e algoritmos de como os dados podem ser armazenados na estrutura baseada em colunas - Dicionário compactado, Comprimento da execução compactado e muitos mais.
No Dicionário compactado, as células são armazenadas na forma de números em tabelas e as células numéricas sempre têm desempenho otimizado em comparação aos caracteres.
Em Run length compactado, ele salva o multiplicador com o valor da célula em formato numérico e o multiplicador mostra o valor repetitivo na tabela.
Diferença funcional - Armazenamento de linha vs coluna
É sempre aconselhável usar armazenamento baseado em coluna, se a instrução SQL tiver que realizar funções e cálculos agregados. As tabelas baseadas em colunas sempre têm um desempenho melhor ao executar funções de agregação como Soma, Contagem, Máx., Mín.
O armazenamento baseado em linha é preferido quando a saída deve retornar uma linha completa. O exemplo fornecido a seguir facilita a compreensão.
No exemplo acima, ao executar uma função Aggregate (Soma) na coluna de vendas com a cláusula Where, ela usará apenas a coluna Data e Vendas ao executar a consulta SQL, portanto, se for uma tabela de armazenamento baseada em coluna, terá desempenho otimizado, mais rápido como dados é necessário apenas em duas colunas.
Ao executar uma consulta Select simples, a linha inteira deve ser impressa na saída, portanto, é aconselhável armazenar a tabela como Linha com base neste cenário.
Visualizações de modelagem de informações
Visualização de atributos
Atributos são elementos não mensuráveis em uma tabela de banco de dados. Eles representam dados mestre e semelhantes às características do BW. Vistas de atributos são dimensões em um banco de dados ou são usadas para unir dimensões ou outras vistas de atributos na modelagem.
Recursos importantes são -
- As visualizações de atributos são usadas em visualizações analíticas e de cálculo.
- A visualização de atributos representa os dados mestre.
- Usado para filtrar o tamanho das tabelas de dimensão na visualização analítica e de cálculo.
Visão Analítica
As visualizações analíticas usam o poder do SAP HANA para realizar cálculos e funções de agregação nas tabelas do banco de dados. Ele tem pelo menos uma tabela de fatos que possui medidas e chaves primárias de tabelas de dimensão e circundadas por tabelas de dimensão que contêm dados principais.
Recursos importantes são -
As visualizações analíticas são projetadas para realizar consultas de esquema Star.
As visualizações analíticas contêm pelo menos uma tabela de fatos e várias tabelas de dimensão com dados mestre e realizam cálculos e agregações
Eles são semelhantes a Cubos de informações e objetos de informações no SAP BW.
As visualizações analíticas podem ser criadas em cima das visualizações de atributos e tabelas de fatos e realizam cálculos como número de unidades vendidas, preço total, etc.
Vistas de cálculo
As visualizações de cálculo são usadas em cima das visualizações analíticas e de atributos para realizar cálculos complexos, que não são possíveis com visualizações analíticas. A visualização de cálculo é uma combinação de tabelas de colunas básicas, visualizações de atributos e visualizações analíticas para fornecer lógica de negócios.
Recursos importantes são -
As visualizações de cálculo são definidas de forma gráfica usando o recurso de modelagem HANA ou com script no SQL.
Ele é criado para realizar cálculos complexos, que não são possíveis com outras visualizações - Atributo e visualizações analíticas do modelador SAP HANA.
Uma ou mais visualizações de atributos e visualizações analíticas são consumidas com a ajuda de funções embutidas como Projetos, União, União, Classificação em uma Visualização de Cálculo.