Está a iniciar a sua jornada no Power BI ou pretende aprofundar os seus conhecimentos? O ideal é começar pela modelagem de dados, avançar para a análise e, finalmente, extrair conclusões práticas a partir dos relatórios do Power BI.
A modelagem de dados é fundamental em qualquer projeto de análise. Ela constitui a base para as visualizações e painéis que são apresentados aos utilizadores finais.
Tal como outras ferramentas de análise, o Power BI necessita de modelagem de dados para a integração, transformação e estabelecimento de relações entre tabelas, adição de cálculos e outras operações.
Continue a ler para dominar a modelagem de dados no Power BI, incluindo um guia passo a passo para criar um modelo de dados.
O que é modelagem de dados?
A modelagem de dados consiste na criação de uma representação simplificada de estruturas de dados, relações e atributos, interligando componentes como tabelas, linhas e colunas.
Este processo auxilia na organização e compreensão dos dados, facilitando o seu armazenamento, recuperação e análise. Um modelo de dados bem estruturado suporta o desenvolvimento de bases de dados, software e sistemas.
A modelagem envolve a identificação de entidades, a definição das suas características e a demonstração das ligações entre elas, visando a deteção de padrões e a extração de conclusões úteis. Esta etapa é essencial para garantir a precisão dos dados e apoiar a tomada de decisões.
Qual a importância para a análise de dados no Power BI?
A modelagem de dados é indispensável em ferramentas de análise como o Power BI. Esta ferramenta depende de modelos bem estruturados para gerar visualizações e *insights* significativos.
Ao adotar princípios de modelagem, é possível conectar, transformar e visualizar dados de diversas fontes de forma eficiente. A modelagem no Power BI também garante a precisão e relevância dos dados apresentados.
A modelagem de dados facilita a tomada de decisões baseada em dados e potencia a capacidade de análise de ferramentas como o Power BI, fornecendo *business intelligence* de valor.
Tipos de modelagem de dados
#1. Modelagem Conceptual de Dados
Esta abordagem foca-se na visão geral dos dados, representando-os de forma abstrata, sem considerar detalhes técnicos ou de implementação. A modelagem conceptual alinha os dados com os objetivos da organização e auxilia as partes interessadas a compreender o propósito e significado dos dados.
#2. Modelagem Física de Dados
A modelagem física de dados centra-se na implementação técnica do armazenamento e recuperação de dados. Esta modelagem especifica estruturas como tabelas, índices e restrições a serem utilizadas num sistema de base de dados.
#3. Modelagem Lógica de Dados
A modelagem lógica de dados estabelece a ligação entre a modelagem conceptual e a física. Serve como um modelo para o design da base de dados e facilita a comunicação entre as equipas técnicas e as partes interessadas, mantendo a integridade e consistência dos dados.
Técnicas de modelagem de dados no Power BI
#1. Esquema Estrela
O esquema estrela é uma técnica comum no Power BI, onde uma Tabela de Factos central contém as métricas principais, rodeada por Tabelas de Dimensões que fornecem contexto aos dados. O nome “estrela” deve-se à posição central da Tabela de Factos, ligada às Tabelas de Dimensões, como os raios de uma estrela.
#2. Cardinalidade
A cardinalidade define a relação entre tabelas no Power BI, especificando quantos valores únicos de uma tabela correspondem a valores de outra. As opções incluem um-para-um, um-para-muitos e muitos-para-um. A escolha correta da cardinalidade é fundamental para uma modelagem precisa.
#3. Direção do filtro cruzado
A direção do filtro cruzado determina como um filtro aplicado a uma tabela afeta os dados de outra tabela relacionada. Existem duas direções principais:
Única
Numa direção de filtro cruzado única, os filtros fluem numa única direção, normalmente da Tabela de Dimensões para a Tabela de Factos. Isto garante que a filtragem na tabela de dimensões afeta a tabela de factos, mas não o contrário.
Bidirecional
A direção bidirecional permite que os filtros fluam em ambas as direções, entre tabelas de factos e dimensões. Esta opção pode ser útil em certas situações, mas deve ser usada com cuidado, pois pode gerar resultados inesperados se não for corretamente controlada.
#4. Esquema Floco de Neve
Crédito da imagem: Aprenda.Microsoft.Com
O esquema floco de neve é uma extensão do esquema estrela, onde as tabelas de dimensões são normalizadas em subdimensões. Este método cria um esquema mais estruturado, mas mais complexo. Embora reduza a redundância de dados, pode exigir mais esforço para navegar no Power BI.
#5. Tabelas de pesquisa
Tabelas de pesquisa são tabelas de dimensões que contêm informações de referência, como detalhes de produtos ou dados geográficos. São usadas para enriquecer os dados das tabelas de factos, fornecendo contexto adicional para análise.
#6. Tabelas de dados
Tabelas de dados são um termo usado por vezes em vez de tabelas de factos. Contêm os dados primários, incluindo métricas e chaves externas, servindo de base para a criação de relatórios e visualizações do Power BI.
Vantagens da modelagem de dados no Power BI
- A modelagem permite a ligação de várias tabelas, possibilitando a análise de todo o conjunto de dados, a criação de relatórios e a elaboração de painéis.
- Modelos bem estruturados possibilitam a criação de visualizações atraentes e informativas no Power BI.
- Os utilizadores podem interagir facilmente com os dados quando existe um modelo de dados subjacente.
- Modelos de dados otimizados agilizam a consulta de grandes volumes de dados, com milhões de registos.
- É possível analisar grandes conjuntos de dados, examinando todas as tabelas, quando existe um modelo bem estruturado.
- Modelos de dados podem ser facilmente ligados entre si ou consultados em relatórios diferentes, facilitando a análise de dados de alto nível.
- Pode-se controlar e proteger dados confidenciais, ao mesmo tempo que se mantém acesso público a outras partes do modelo, através de gestão de acesso baseada em funções.
- Em projetos onde os dados aumentam constantemente, provenientes de PDVs, aplicações e mercados retalhistas, é essencial criar um modelo antes de analisar o conjunto de dados em expansão.
Como modelar dados no Power BI
Criar um modelo de dados no Power BI é um processo simples. Siga os passos seguintes:
Importar o seu conjunto de dados para o Power BI
Comece por importar os seus conjuntos de dados para o Power BI. Pode importar vários conjuntos de dados ou um único com múltiplos objetos, como tabelas, colunas e linhas.
O Power BI analisará automaticamente os dados e criará um modelo inicial com base nos cabeçalhos de colunas ou tabelas.
Para importar dados, siga estes passos:
- Abra o aplicativo Power BI Desktop.
- Deverá ver o espaço de trabalho do Power BI e um ecrã inicial.
- Clique em “Obter dados”.
- Na janela “Obter dados”, selecione a categoria de dados desejada no painel esquerdo e o tipo de fonte no painel direito.
- A opção de tipo de fonte padrão é “Tudo”.
- Como o meu conjunto de dados está numa pasta de trabalho do Excel, vou selecionar “Pasta de trabalho do Excel” e clicar em “Conectar”.
- Na janela “Abrir”, navegue até ao ficheiro Excel e clique duas vezes para importar para o Power BI.
- Agora deverá ver a janela “Navegador”.
- Selecione os objetos que deseja importar para o relatório do Power BI.
- Clique em “Carregar” para concluir a importação de dados para o Power BI.
Criar um modelo de dados do Power BI
Ao clicar em “Carregar” no Navegador, o Power BI inicia a análise, cria modelos de objetos de dados e leva-o para o separador de visualização de relatórios.
Clicando em “Visualização de tabelas” no painel esquerdo, terá acesso às visualizações tabulares de todos os objetos de dados importados.
O Power BI não guarda automaticamente o seu trabalho. Deverá clicar em “Ficheiro” e depois em “Guardar” para salvar o ficheiro no seu computador.
Vamos agora aprofundar o processo de modelagem de dados. Siga estes passos:
- Clique no separador “Exibição do modelo” no painel esquerdo do Power BI.
- Verá o modelo de dados padrão criado pelo Power BI.
- No exemplo, é um esquema em estrela, com uma tabela de factos central e tabelas de dimensões à sua volta.
- O Power BI nem sempre cria as conexões necessárias corretamente.
- No exemplo, não conectou a tabela de factos à dimensão “Table24”, embora existam colunas com nomes semelhantes (“Geography” e “Geo”).
- Isto aconteceu porque os nomes não correspondiam exatamente.
- Para conectar “Table24” aos dados principais, arraste o objeto “Geo” da “Table24” para o elemento “Geography” da tabela de factos.
Parabéns! Criou um modelo de dados no Power BI. Consulte o significado dos símbolos nas linhas de relacionamento:
- Um asterisco na extremidade da tabela de factos e o número 1 na extremidade da tabela de dimensões indicam uma conexão um-para-muitos.
- Uma seta na linha de conexão indica a direção do filtro. Quando a ponta da seta aponta para a tabela de factos, os filtros da tabela de dimensões afetam a tabela de factos.
- Quando existem duas setas, o filtro afeta as tabelas em ambas as direções (tabelas de factos e dimensões).
Visualizar os dados
Agora pode visualizar os seus dados para extrair conclusões práticas:
- Clique no separador “Visualização de relatório”.
- Escolha um gráfico na secção “Visualizações” à direita.
- Selecionei um gráfico de colunas empilhadas.
- Expanda os conjuntos de dados no canto inferior direito do Power BI.
- Arraste e solte itens nos campos do eixo X e Y do editor de gráficos.
- O Power BI irá criar automaticamente o gráfico.
Casos de uso da modelagem de dados no Power BI
Criar relatórios holísticos
Para criar relatórios ou painéis multidimensionais no Power BI, use a funcionalidade de modelagem. Dados isolados podem não ser suficientes, mas combinando dados de diferentes fontes, obtém-se uma melhor visualização.
Integrar dados
Se tiver vários conjuntos de dados ou tabelas numa pasta de trabalho do Excel ou numa base de dados SQL, pode combiná-los num esquema estrela ou floco de neve para obter uma visão unificada e enriquecer a sua análise.
Limpeza e transformação de dados
A necessidade de limpeza e transformação de dados torna-se evidente ao criar modelos no Power BI.
Por exemplo, se o Power BI não conseguir conectar tabelas relacionadas, pode haver incompatibilidade nos cabeçalhos das colunas. Assim, sabe que precisa corrigir esses erros.
Outro exemplo seria a existência de elementos extra nas tabelas. Se o conjunto de dados tiver apenas 4 regiões geográficas (EUA, CA, Reino Unido e DE), mas o modelo mostrar um extra em branco, isso pode dever-se a espaços desnecessários nos nomes, que o Power BI classifica como uma nova região.
Controlar a visibilidade dos dados
Pode restringir o acesso a dados nos relatórios usando o separador “Exibição do modelo”. Clicando no ícone de olho em cada cartão de dados, pode ocultar ou exibir a tabela.
Se um cartão tiver mais de uma coluna, também é possível personalizar a visibilidade dessas colunas.
Manipular tabelas de dados selecionadas
Cada tabela na interface do modelo de dados inclui um ícone de “Mais opções” (três pontos), onde poderá efetuar as seguintes ações:
- Criar nova medida ou coluna
- Atualizar dados
- Gerir relacionamentos
- Atualização incremental
- Gerir agregações
- Entre outras opções
Conclusão
Este artigo descreve como criar um modelo de dados no Power BI, de forma a visualizar grandes conjuntos de dados em relatórios ou painéis.
Neste artigo abordamos as diferentes técnicas de modelagem de dados no Power BI e os passos para criar um modelo de raiz. Siga os passos e crie rapidamente o seu próprio modelo de dados.
De seguida, apresentamos os melhores cursos de análise de dados para iniciar uma carreira em ciência de dados ou análise de dados.