7 dicas para revisão de projetos de Data Warehouse Por Diego Elias
No desenvolvimento de um projeto de Data Warehouse (DW) devemos nos preocupar com a qualidade e confiabilidade transmitidas pelas informações que serão armazenadas. Afinal de contas, sem isso, o DW pouco valor trará para a organização.
Para que o DW tenha sucesso, é importante estarmos alinhados a vários pontos que são indispensáveis no projeto. Lembrando que o esquecimento ou desatenção poderá colaborar para desencadear um processo de falta de credibilidade e, consequentemente, fracasso.
Por isso, ao “final” de um projeto de DW é recomendável, como boa prática, revisar alguns dos pontos que são fundamentais para a efetiva utilização das informações armazenadas. Pois como nós sabemos, o DW é umas das principais tecnologias usadas para a consolidação de um solução de Business Intelligence (BI).
Neste artigo iremos entrar em uma visão mais técnica e entender onde devemos nos atentar para que possamos minimizar os riscos de um mau resultado. Vamos então conhecer agora alguns desses aspectos, que serão importantes para você obter sucesso na implementação de um DW na sua empresa.
1. Granularidade
O grão é uma das mais importantes definições na modelagem de dados do DW. Trata-se do menor nível da informação e é definido de acordo com as necessidades levantadas no início do projeto. Quanto maior for a granularidade, menor será o detalhe (ou maior será a sumarização). Quanto menor for a granularidade, maior será o detalhamento (ou menor será a sumarização).
Esse é um ponto importante, já que afeta diretamente no volume de dados e consequentemente na performance das consultas e respostas. A maior flexibilização das respostas com o menor detalhamento tem o custo de processamento. Por isso deve ser encontrado um ponto de equilíbrio, pois o maior detalhamento não será sempre a melhor estratégia.
Deve-se revisar, levando em consideração a necessidade dos usuários para que seja encontrado o melhor custo/benefício para a solução.
2. Dimensão de tempo
A Dimensão temporal (ou Dimensão data para alguns) é a mais importante perspectiva para a análise dos dados. Sem ela é difícil fazer a averiguação preditiva dos fatos. É imprescindível para a análise das ocorrências durante o tempo.
Logo, é importante que seja avaliado a conformidade, analisando os níveis de detalhes exigidos para essa Dimensão, mantendo a coerência de definição entre os diversos Data Marts.
3. Slow Changing Dimension
O SCD tem papel fundamental para a visualização de informações históricas e armazenamento de versões dos dados de acordo com variações no tempo. Ele retrata as Dimensões que sofrem atualizações em seus campos e os classifica pelo tipo de mudança existente em cada uma delas.
Por isso devemos revisar as Dimensões e verificar se o tipo de SCD corresponde ao que realmente o negócio necessita.
4. Conformidade dos dados
Não só a Dimensão de tempo precisa estar conforme, como também as outras Dimensões requisitadas entre as tabelas Fatos.
A conformidade propicia o compartilhamento semântico de uma mesma Dimensão entre vários Data Marts, mantendo a consistência das informações geradas pelas diferentes análises. Além disso, a conformidade centraliza as alterações, e permite uma otimização no uso dos recursos computacionais. A conformidade de Dimensões é imprescindível para um projeto evolutivo de DW exitoso.
Por isso verifique a conformidade dos dados dimensionais, mantendo assim a coerência e consistência entre as informações geradas pelo DW.
5. Chaves substitutas
Chaves substitutas ou artificiais (surrogate keys), são chaves desprovidas de inteligência de negócio. São utilizadas como artificio para o versionamento dos dados e junção entre tabelas Fatos e de Dimensões.
É importante não esquecê-las, pois sem elas seu DW poderá acabar armazenando dados incoerentes. Além disso, corre-se o risco de perder informações valiosas no decorrer do tempo, já que o versionamento é devido principalmente a imutabilidade das chaves artificiais.
6. Modelo Dimensional
Revise também o modelo dimensional resultante na busca de erros que só são evidentes após a implementação do DW. Verifique a existência de relacionamentos desnecessários e duplicidade de informações sem propósito e que oneram a performance das análises e consultas.
7. Qualidade dos dados
A qualidade dos dados é um dos aspectos mais importante no processo de construção do DW. Devemos analisar os dados armazenados a procura de inconsistências e deformidades.
Caso seja detectado alguma anormalidade nos dados, o processo de ETL deverá ser verificado e revisado para garantir que as informações armazenadas possuam valor para a utilização na tomada de decisão empresarial.
Com essas dicas fica mais fácil evitar problemas na entrega de um projeto de DW. Não devemos negligenciar esses pontos pois são fundamentais para o funcionamento pleno da solução.
Continue acompanhando os artigos se inscrevendo AQUI. Aproveite e conheça também o eBook BI Como Deve Ser - O Guia Definitivo, através do site www.bicomodeveser.com.br.
Até o próximo artigo!