Conheça o Esquema Principal: Estrela vs. Floco de Neve

O esquema multidimensional é projetado para construir um modelo de sistemas de data warehouse.

O principal objetivo desses esquemas é atender às necessidades de bancos de dados maiores construídos para fins analíticos (OLAP).

Este método é usado para ordenar dados no banco de dados com uma boa disposição do conteúdo em um banco de dados. O esquema permite que os clientes façam perguntas associadas a negócios ou tendências de mercado.

Além disso, um esquema multidimensional representa os dados na forma de cubos de dados que permitem visualizar e modelar dados de diferentes perspectivas e dimensões.

É de três tipos, mas muitos confundem entre estrela e floco de neve. Assim, torna-se difícil para eles escolher o modelo preferível.

Se você é um deles, vamos discutir as diferenças entre os esquemas estrela e floco de neve, começando pela definição e entendendo seus benefícios, desafios, diagrama e características.

O que é um Esquema Multidimensional?

Schema refere-se à descrição lógica de um banco de dados completo e data marts. Inclui o nome dos registros e suas descrições, incluindo agregados e itens de dados associados.

Um banco de dados geralmente usa um modelo relacional para descrever, enquanto um sistema de data warehouse usa um modelo Schema.

O esquema multidimensional pode ser definido com Data Mining Query Language (DMQL).

Para definir os data marts e data warehouses, ele usa duas primitivas – definição de dimensão e definição de cubo.

O esquema multidimensional usa diferentes tipos de modelos de esquema. Eles são:

  • Esquema em estrela
  • Esquema de floco de neve
  • Esquema da galáxia

Vamos discutir o que são os esquemas estrela e floco de neve.

Star vs Snowflake: O que são?

O que é o Esquema Estrela?

Um esquema em estrela é um armazenamento de dados arquitetônico e modelo de inteligência de negócios que requer uma única tabela de fatos para armazenar dados medidos e transacionais. Ele também usa diferentes tabelas dimensionais menores para armazenar atributos sobre dados de negócios.

É nomeado de acordo com sua estrutura. Como uma estrela, a tabela de fatos ocupa seu lugar no centro do diagrama, e pequenas tabelas dimensionais ficam como galhos da mesa central para formar uma estrutura semelhante a uma estrela.

Cada esquema em estrela consiste em uma única tabela de fatos, mas em várias tabelas dimensionais pequenas. As tabelas de fatos incluem dados específicos e mensuráveis ​​que precisam ser analisados, como desempenho registrado, dados financeiros ou registros de vendas. Pode ser um snap de dados históricos de cada vez ou transacional.

Além disso, o esquema Star é o mais simples e fundamental entre os esquemas de data warehouses e data marts. É eficiente no tratamento de consultas básicas. O esquema em estrela geralmente suporta inteligência de negócios, consultas ad hoc, aplicativos analíticos e cubos de processamento analítico online.

O esquema em estrela também oferece suporte a contagem, média, soma e outras agregações de muitos registros. Os usuários podem filtrar e agrupar facilmente as agregações por dimensões. Por exemplo, os usuários geram consultas como “encontrar todos os registros de vendas em junho” ou “analisar a receita total do escritório XYZ em 2022”.

  Spin Reimagina os controles de música da tela de bloqueio do iPhone

O que é o Esquema Floco de Neve?

Um esquema de floco de neve é ​​um modelo de dados multidimensional que também pode ser conhecido como a extensão do esquema em estrela. Isso ocorre porque as tabelas de dimensão no esquema floco de neve são divididas em subdimensões.

Um esquema é um floco de neve se uma ou mais tabelas de dimensão não se vinculam diretamente à tabela de fatos, mas se conectam por meio de outras tabelas de dimensão.

Snowflaking é um fenômeno que normaliza as tabelas de dimensão em um esquema em estrela. Quando você normaliza todas as tabelas de dimensão, a estrutura resultante se assemelha a um floco de neve contendo uma tabela de fatos no meio da estrutura.

Em palavras simples, o esquema floco de neve consiste em uma tabela de fatos no meio do modelo, que é conectada a tabelas de dimensão, que são novamente vinculadas a outras tabelas de dimensão. Esse esquema é usado para aprimorar o desempenho das consultas.

O modelo é criado para consultas rápidas e flexíveis em relacionamentos e dimensões complexas. É útil para um para muitos e muitos para muitos relacionamentos entre vários níveis de dimensões.

Devido à maior aderência a mais padrões de normalização, você obterá mais eficiência de armazenamento. Mas a redundância de dados é insignificante e o desempenho é baixo em comparação com modelos de dados desnormalizados, como o esquema em estrela.

Star vs Snowflake: como eles funcionam?

Como funciona um esquema em estrela?

A tabela de fatos no meio do modelo estrela armazena dois tipos de informações – valores numéricos e de atributos de dimensão. Vamos entendê-los com um exemplo de banco de dados de vendas.

  • Os valores numéricos são exclusivos para cada linha e ponto de dados. Isso não se correlaciona ou se relaciona com os dados armazenados em outra linha. São fatos sobre uma determinada transação, como valor total, quantidade do pedido, hora exata, lucro líquido, ID do pedido etc.
  • Os valores de atributo dimensional não armazenam nenhum dado diretamente, mas armazenam valores de chave estrangeira para a linha em uma tabela dimensional. Diferentes linhas na tabela central farão referência a essas informações, como valor dos dados, ID do funcionário de vendas, ID da filial, ID do produto etc.

As tabelas de dimensão sempre armazenam informações de suporte da tabela de fatos. Cada tabela dimensional está relacionada à coluna de uma tabela de fatos junto com um valor dimensional e armazena dados adicionais sobre esse valor.

Exemplo: a tabela de dimensões do funcionário usa o ID do funcionário como o valor-chave e também contém informações, como nome, sexo, endereço e número de telefone. Da mesma forma, uma tabela de dimensões do produto armazena informações, incluindo nome do produto, cor, data de lançamento no mercado, custo de fabricação, etc.

Como funciona um esquema de floco de neve?

Pense em um design de floco de neve com uma caixa central e diferentes conexões através dessa caixa para diferentes pontos. Para manter data marts e data warehouses, o design do esquema de floco de neve entra em cena.

É semelhante ao esquema em estrela, mas com alterações de minutos. Ao contrário do esquema em estrela, o esquema em floco de neve estende suas tabelas de subdimensão, que são vinculadas a tabelas de dimensão.

O objetivo principal deste modelo é normalizar as informações desnormalizadas do modelo estrela. Dessa forma, ele pode resolver problemas comuns associados a um esquema em estrela.

  Como verificar a bateria do AirPods no iPhone, Apple Watch e Mac

No núcleo do esquema, você encontrará uma tabela de fatos vinculada às informações contidas nas tabelas de dimensões. Essas tabelas novamente irradiam para fora para tabelas de subdimensão que possuem informações detalhadas que descrevem as informações da tabela de dimensão.

Exemplo: O esquema floco de neve contém uma tabela de fatos de vendas e tabelas de localização da loja, linha, família, produto e dimensão de tempo. As dimensões de mercado consistem em duas tabelas de dimensão, com a loja como uma tabela de dimensão primária e a localização da loja como a tabela de subdimensão. A dimensão do produto tem três tabelas de subdimensão mencionando uma tabela de subdimensão de produto, linha e família.

Estrela vs. Floco de Neve: Características

Características do esquema em estrela

  • O esquema em estrela pode filtrar dados de dados normalizados para atender às necessidades de armazenamento de dados. A chave exclusiva é gerada a partir das informações associadas para cada tabela de fatos para identificar cada linha.
  • Ele fornece cálculos e agregações rápidos, como a receita da receita obtida e o total de itens vendidos no final de cada mês. Esses detalhes podem ser filtrados de acordo com as necessidades, enquadrando as consultas adequadas.
  • É a medição de eventos que inclui valores numéricos finitos que consistem na chave estrangeira. Essas chaves estão relacionadas às tabelas dimensionais. Existem vários tipos de tabelas de fatos que são enquadradas com valores em um nível atômico.
  • A tabela de fatos da transação contém dados sobre eventos específicos, como vendas e feriados.
  • Os fatos de registro incluem determinados períodos, como informações da conta no final do ano ou a cada trimestre.
  • A tabela dimensional fornece dados detalhados sobre atributos ou registros encontrados na tabela central.
  • O usuário é capaz de projetar uma tabela própria de acordo com as necessidades.
  • Você pode usar o esquema em estrela para acumular tabelas de instantâneos.

Características do esquema de floco de neve

  • O esquema de floco de neve precisa de pouco espaço em disco.
  • Este modelo é fácil de implementar devido às suas tabelas de dimensões separadas e principais.
  • As tabelas de dimensão contêm pelo menos dois atributos para definir informações em vários grãos.
  • Devido a várias tabelas, o desempenho é baixo em comparação com o esquema em estrela.
  • O esquema floco de neve tem o mais alto nível de integridade de dados e baixas redundâncias devido à normalização.

Estrela vs. Floco de Neve: Vantagens

Vantagens do esquema em estrela

  • O esquema em estrela é a maneira mais simples entre os esquemas de data mart.
  • Tem uma lógica de relatório simples. Essa lógica está implícita dinamicamente.
  • Ele foi projetado usando cubos de alimentação aplicados por meio do Processo de Transação Online para fazer com que os cubos funcionem com eficiência e eficácia.
  • O esquema em estrela é formado com lógica simples e consultas fáceis de extrair do processo transacional.
  • Ele oferece desempenho aprimorado para aplicativos de relatórios.
  • Ele é implantado para controlar a recuperação rápida de dados.
  • As informações filtradas e selecionadas podem ser aplicadas facilmente em diferentes casos.

Vantagens do esquema de floco de neve

  • O esquema em estrela é usado para desenvolver o desempenho da consulta devido a menos requisitos de armazenamento em disco.
  • Oferece maior escalabilidade nas relações entre componentes e níveis de dimensão.
  • É mais fácil de manter.
  • O esquema em estrela oferece recuperação rápida de dados.
  • É um esquema de dados comum e simples para armazenamento de dados.
  • Ajuda a melhorar a qualidade dos dados.
  • Os dados estruturados reduzem a questão da integridade dos dados.

Star vs. Snowflake: Limitações

Limitações do esquema em estrela

Tem um alto estado desnormalizado e de integridade. Todo o processo entrará em colapso se o usuário não atualizar os dados. A segurança e as proteções também são limitadas. Além disso, o esquema em estrela não é tão flexível quanto o modelo analítico. Não oferece suporte eficiente para vários relacionamentos.

  Como obter o Stock Gnome Shell no Ubuntu 17.10

Limitações do esquema de floco de neve

A principal limitação que você encontrará com o Snowflake são os esforços adicionais de manutenção devido ao número crescente de tabelas de pequenas dimensões. Muitas consultas complexas tornam difícil encontrar os dados necessários. Além disso, o tempo de implementação da questão é alto devido às tabelas mais altas. Este modelo também é rígido e exige maiores custos de manutenção.

Estrela vs. Floco de Neve: Diferenças

Estrela e Floco de neve são tipos de esquema multidimensional, mas possuem estruturas e propriedades diferentes. O primeiro é como uma estrela, e o segundo se assemelha a um floco de neve, definindo seus nomes.

No esquema em estrela, apenas uma única junção cria um relacionamento entre a tabela de fatos central e as tabelas de dimensões laterais. Por outro lado, no esquema floco de neve, várias junções são necessárias para vincular às tabelas de dimensão.

O esquema em estrela geralmente é usado quando você tem menos linhas na tabela de dimensões, enquanto o esquema em floco de neve é ​​usado quando uma tabela de dimensões é relativamente grande.

O diagrama abaixo diferencia os dois modelos e como as tabelas de dimensões e a tabela de fatos estão vinculadas em esquemas diferentes.

ParâmetrosEsquema em estrelaSnowflake SchemaDisk spaceEsquema em estrela usa mais espaço em disco.Esquema em floco de neve usa menos espaço em disco.Redundância de dadosTem alta redundância de dados.Tem baixa redundância de dados.NormalizaçãoAs tabelas de dimensão são desnormalizadas, o que significa repetir o mesmo valor dentro da tabela.As tabelas de dimensão são totalmente normalizado.Desempenho da consultaLeva um tempo mínimo para executar as consultas, resultando em melhor desempenho.Leva mais tempo do que o esquema em estrela para a execução da consulta, tornando-o menos eficiente do que o esquema em estrela.Complexidade da consultaA complexidade da consulta é baixa.A complexidade da consulta é maior que o esquema em estrela.ManutençãoDevido à alta redundância de dados, manter o esquema em estrela é um pouco difícil.Devido à baixa redundância de dados, é fácil manter e alterar o esquema em floco de neve.Integridade dos dadosA integridade dos dados é alta porque os dados são armazenados de forma redundante onde vários existem cópias nas tabelas de dimensão. A integridade dos dados é baixa, pois normaliza completamente as tabelas de dimensão. Hierarquias As hierarquias para as tabelas de dimensão no esquema em estrela são armazenadas na tabela de dimensão.As hierarquias são divididas em tabelas de dimensão separadas.Design de banco de dadosTem um design de banco de dados simples.Tem um design de banco de dados muito complexo.Tabela de fatosVárias tabelas de dimensão cercam uma tabela de fatos. A tabela de fatos é cercada por tabelas de dimensão que também são cercadas por tabelas de subdimensão. Configurar esquema Star é fácil de projetar e configurar, pois os relacionamentos diretos os representam. Por outro lado, o esquema floco de neve é ​​um pouco complexo de configurar. Processamento de cubosO processamento de cubos é mais rápido.Devido à junção complexa, o processamento de cubos é um pouco lento.Chaves estrangeirasTem um número mínimo de chaves estrangeiras.Tem o número máximo de chaves estrangeiras.

Conclusão

Os esquemas Star e Snowflake são úteis em diferentes setores. Então, decidir qual é o melhor entre eles é baseado em seus requisitos.

O esquema em floco de neve é ​​a extensão do esquema em estrela, onde normaliza as tabelas de dimensão no esquema em estrela.

O esquema em estrela é simples em design, executa consultas mais rapidamente e a configuração é fácil. Por outro lado, o esquema floco de neve é ​​mais fácil de manter, ocupa menos espaço em disco e é menos propenso a problemas de integridade de dados.

Portanto, um esquema em estrela pode ser a melhor opção se você precisar de um design simples, menos chaves estrangeiras e processamento de cubo mais rápido. Mas, se você precisar de menos espaço em disco, baixa integridade de dados e baixa manutenção, o esquema floco de neve pode ser mais adequado.

Você também pode explorar algumas das melhores soluções de banco de dados gráfico.