Complementando o que foi visto no artigo anterior sobre a arquitetura de DW, a escolha da implementação do DW vai diferir muito em termos técnicos além de ser um fator muito importante na organização.
A implementação Bottom Up segue, teoricamente, por ser mais fácil e menos custosa de ser implementada do que a Top Down, sendo muito usada, até pelo retorno rápido de investimento. Ela permite que o planejamento e a construção dos Data Mart´s possam ser realizados antes mesmo que a infra-estrutura do DW (Data Warehouse) seja definida. O propósito desta implementação é a construção de DW incremental a partir do desenvolvimento de DM independentes.
O processo para construção começa com o ETL para um ou mais DM´s, que são modelados com base em um modelo dimensional. Um ponto negativo para tal implementação é a falta de um gerenciador que garanta padrões únicos de metadados, mesmo com a independência dos Data Marts, além de se tornar crítico na interferência junto aos sistemas transacionais, pelo processo de ETL.
A figura a seguir mostra a arquitetura de um Data Warehouse, considerando uma implementação botton-up:
Figura 1: Arquitetura de Data Wareshouse com implementação botton-up
Botton-Up é quando a situação é inversa. Por definição de estratégia empresarial, é dado preferência em criar um banco de dados para apenas uma área. Com isso os custos são bem inferiores de um projeto de DW completo. A partir da visualização dos primeiros resultados é dado sequência para outra área e assim sucessivamente resultando em um Data Warehouse, ou seja, segundo Kimball, direto aos Data Mart´s.
Vantagens e desvantagens da arquitetura
Vantagens
- Implementação rápida: a construção dos DM é altamente direcionada, permitindo um rápido desenvolvimento. Normalmente, pode ser colocado em produção em um período de 6 a 9 meses.
- Retorno rápido: a arquitetura baseada em DM com incremento demonstra rapidamente seu valor, permitindo uma base para investimentos adicionais com um nível mais elevado de confiança.
- Manutenção do enfoque da equipe: a elaboração de DM´s permite que os principais negócios sejam enfocados inicialmente, sem que haja gastos no desenvolvimento de áreas que não são essenciais ao problema.
- Herança incremental: a estratégia de DM´s incrementais obriga a entrega de recursos de informação passo a passo, o que permite a equipe crescer e aprender, reduzindo os riscos etc.
Desvantagens
- Perigo de legamarts: um dos maiores perigos da Administração de DW é a criação de DM´s independentes, que com isso o advento das ferramentas de drag and drop facilitou o desenvolvimento de soluções individuais de acordo com as necessidades da empresa, as quais podem não considerar a arquitetura de forma global. Desse modo, os DM´s independentes transformam-se em DM legados ou legamarts.
- Desafio de possuir a visão de empreendimento: durante a construção dos DM´s incrementais é necessário que se mantenha um rígido controle do negócio, como um todo. Esse controle requer um maior trabalho ao extrair e combinar as fontes individuais do que utilizar um DW.
- Administrar e coordenar múltiplas equipes e iniciativas: normalmente esse tipo de arquitetura emprega o desenvolvimento de DM´s em paralelo, no entanto, isso pode conduzir a uma rígida administração, tentando coordenar os esforços e recursos das múltiplas equipes, especialmente nas áreas de regras e semântica empresariais.
- A maldição de sucesso: a arquitetura com DM´s incrementais carrega a “maldição de sucesso”. Nesses casos, os usuários finais dos DM´s encontram-se felizes querendo mais informação para seus DM´s e ao mesmo tempo outros usuários de outros DM´s aguardam o incremento de seus DM´s. Isso conduz a equipe de DM a vencer desafios de recurso e de administração.
Implementação Combinada
Esse tipo de implementação tem como finalidade integrar a arquitetura top-down e a bottom-up, e nessa abordagem efetua-se a modelagem de dados do Data Warehouse de visão macro, sendo o passo seguinte a implementação de partes desse modelo. Essas partes são escolhidas por processos ou atividades da área de interesse e constituem os Data Marts.
Podemos dizer então que cada Data Mart pode ser gerado a partir do macromodelo de dados do Data Warehouse e integrado ao modelo físico do mesmo Data Warehouse.
A principal vantagem é a garantia da consistência dos dados, que é obtida em virtude dos modelos de dados para os Data Marts serem únicos, possibilitando, a partir disso, o mapeamento e o controle dos dados.
Características da Implementação Combinada:
- Implementação
Planejamento Top-Down
Processos de Negócio
- Desenvolvimento Bottom-Up
Um Data Mart de cada vez
Cada Data Mart encarado de forma evolutiva
Complexidade do modelo
Volume de dados
Investimentos
- Gestão de Metadados
Coerência entre os vários Data Marts
Podemos concluir que qualquer implementação dessa arquitetura para ambiente de Data Warehouse requer basicamente uma infra-estrutura bem definida e centralizada para que o desenho dessas soluções seja realizado de acordo com a construção dos DM´s.
No próximo artigo irei abordar um tema importante para a construção de ambientes de DW, que é a modelagem de dados. Até a próxima!
Referências Bibliográficas:
Tecnologia e Projeto de Data Warehouse, Felipe Nery Rodrigues Machado, 2007.