Objetivo de um Data Warehouse

PorEduardo Moreira em

O Data Warehouse é um local onde se concentram informações de toda a empresa e onde as pessoas podem obter tais informações de forma integrada, portanto as informações de diferentes setores estão correlacionadas sempre que isto for possível.

O objetivo de um Data Warehouse é
suprir as necessidades posteriores à informatização
de uma empresa de médio e grande porte. Uma empresa que
se inicia pequena, gerencia suas informações de
forma simples, com planilhas e documentos, pois o volume de informações
é pequeno. Com o decorrer de seu crescimento e o aumento
do volume de vendas ou transações, ela passa a ter
a necessidade de obter sistemas de controle empresarial destinado
ao seu ramo de atuação no mercado.

Com estes novos sistemas que irão
abranger quase todos os departamentos da empresa ela consegue
se consolidar como uma empresa que controla bem seus processos
internos e externos que interagem com os clientes, fornecedores
e parceiros de negócio. Após um tempo do funcionamento
destes sistemas e o crescimento dos objetivos dos empresários
é comum surgir problemas no entendimento de certas informações,
dificuldade de cruzar informações que estão
alocadas em sistemas diferentes, inconsistência de informações
entre departamentos diferentes. Tais problemas acontecem freqüentemente
com todas as empresas que já se equiparam tecnologicamente.

O Data Warehouse vem como um passo seguinte para fornecer soluções a problemas como:

Inconsistência de informações entre departamentos, a falta de padronização e o motivo dos sistemas não se relacionarem diretamente geram discrepâncias que fazem com que as mesmas informações existentes em departamentos distintos sejam diferentes. Isto gera um problema de confiança nas informações contidas nos sistemas, e se um empresário pretende tomar decisões estratégicas, ele tem que ter confiança nos dados em que está consultando.

Dificuldade em acessar as informações de formas diferentes, o fato de várias informações estarem contidas em sistemas diversos, planilhas e documentos, e até mesmo em partes do mesmo sistema em que não se relacionam, torna extremamente difícil a tarefa de consultar as informações de formas distintas.

Dificuldade em acessar certos dados específicos, é comum a existência de vários relatórios que demonstram as transações das empresas em vários setores, mas certas informações que são necessárias para tomar decisões estratégicas são difícil de serem agrupadas. O que precisamos é extrair apenas as informações que são realmente importantes.

Confiança em certas informações da empresa. Existem informações que são trabalhadas diariamente, a estas informações temos garantia que são confiáveis, mais existem informações que sabemos que não são confiáveis, estas informações ou não deveriam existir no sistema ou deveriam ser tratadas com maior responsabilidade para poderem ser utilizadas.

Estes problemas e preocupações são tão grandes que determinam as necessidades fundamentais de um Data Warehouse. Portanto vejamos como um Data Warehouse resolve tais problemas e fornece soluções para os empresários:

As informações em um Data Warehouse são sempre consistentes, isto significa que quando os usuários consultarem as informações, mesmo fazendo relacionamentos distintos entre elas, seus valores serão retornados igualmente ou proporcionais aos relacionamentos feitos. Se dois usuários solicitarem as vendas de um determinado mês e um relaciona estas vendas com as promoções que foram feitas e o outro usuário relaciona estas vendas com o estoque, os resultado total das vendas deve ser o mesmo em ambas consultas.

O Data Warehouse é um local onde deve se publicados dados confiáveis, o Data Warehouse é um ponto central das informações dentro da empresa, portanto todas informações existentes nele devem ser confiáveis. As informações não devem ser apenas coletadas dos sistemas e acumuladas no Warehouse, as informações devem ser extraídas dos sistemas legados, limpas, transformadas, padronizadas e certificarem a qualidade dos dados antes dos dados serem publicados. O gerente de qualidade é o responsável por certificar que as informações estão em estado apropriado para uso, não permitindo que informações incompletas, não padronizadas e inconsistentes sejam carregadas no sistema.

O processo entre a extração dos dados dos sistemas e a inclusão deles no warehouse faz diversas modificações e consistência para garantir a qualidade dos dados, mas quando as informações não são atualizadas com a devida freqüência nos sistemas de origem, e quando estas informações não são tratadas com importância, não existe solução que este processo possa fazer para garantir a qualidade e a integridade destas informações, a única coisa que pode ser feita é não carregar estas informações para que não exista inconsistência nos dados.

Quando se implanta um Data Warehouse em uma empresa de forma consistente eliminando as informações que não são confiáveis, é comum perceber que certas informações seriam valiosas para tomadas de decisões se elas tivessem uma melhor qualidade, então um processo de reengenharia é iniciado, ou seja, estas informações começam a serem tratadas com maior cautela e dada a sua devida importância a elas nos sistemas de origem gerando uma confiança na informação, assim estas podem ser incorporadas no Data Warehouse. Deste modo o warehouse tem um papel fundamental nos esforços de reengenharia dentro das empresas, impulsionando de forma evidente os benefícios desta reestruturação.

Propriedades e Características de um Data Warehouse

Existem quatro propriedades básicas características de um Data Warehouse, estas são:

Um warehouse é Orientado a assunto;
Um warehouse é Integrado;
Um warehouse não é volátil;
Um warehouse é variável com o tempo;

Estas propriedades são que diferencia um Data Warehouse de outros sistemas convencionais de apoio a decisão.

– Orientação a Assunto

Os sistemas tradicionais são sistemas transacionais e estão voltados para processos e aplicações especificas, já o Data Warehouse foca sua modelagem para assuntos específicos dentro dos segmentos da empresa. Estes assuntos são informações especificas dos setores da empresa.

Os warehouse são feitos para responder abordagens sobre certos assuntos como, saber mais sobre as vendas da empresa, ou sobre os resultados das atuações das equipes de marketing em determinadas regiões, então o warehouse é feito para responder perguntas sobre certos assuntos como: “Quais foram os melhores clientes em um determinado período?”, “Qual foi o lucro obtido sobre uma campanha de em uma determinada região?”. É possível cruzar assuntos e obter respostas de assuntos mistos, com um Data Warehouse feito para abordar assuntos como vendas para clientes, e atuações das equipes de marketing, podemos obter respostas a assuntos como: “Quais foram os clientes que no ano passado tiveram um grande aumento nas suas compras em resposta a uma campanha de marketing que neste ano não obtiveram um aumento significativo (10% por exemplo) este ano em resposta a mesma campanha?”

– Integrado

Um Data Warehouse armazena dados de várias fontes de dados, dentre elas sistemas transacionais, planilhas e arquivos, mas é comum que as informações sejam cadastradas em formatos e padrões diferentes nas diversas fontes de dados, para ser possível relacionar informações entre os sistemas, estas informações devem ser previamente tratadas antes de serem armazenadas no warehouse, neste processo diversas atividades são feitas, tais como:

Conversão de datas para um formato único;
Resolver conflitos entre nomes;
Conversão de medidas.

Exemplos destas informações que estão armazenadas de formas distintas nas diferentes fontes de dados são:

Sexo de uma pessoa, os sistemas podem cadastrar o sexo como, (Masculino, Feminino), (Homem, Mulher), (M,F),(H,M) ou até (0,1). No warehouse deve ser adotado um padrão e feita a conversão dos dados antes dos dados serem inseridos no Data Warehouse.

Tamanho da embalagem, os sistemas podem cadastrar os tamanhos como Metro, Centímetro, Polegada e novamente deve-se padronizar e converter estas informações antes de serem inseridas no warehouse.

Intervalo entre transações, os intervalos podem ser armazenados como Segundo, Minuto, Hora, e um padrão deve também ser definido.

Estas padronizações fornecem a forma pela qual as informações de diversos sistemas e fontes de dados podem ser relacionadas em um Data Warehouse dando assim a ele a propriedade de ser integrado.

– Não Voláti

Em um warehouse somente existem duas
operações a serem feitas, Cargas de dados e Consulta.
Dizer que um Data Warehouse não é volátil
significa que as informações cadastradas não
são atualizadas, o que é feito é que um novo
registro é gravado e este passa a ser utilizado de um certo
tempo em diante, isto possibilita que consultas realizadas para
um certo período sempre retornarão o mesmo resultado,
pois os registros não foram atualizados. Guardando um histórico
confiável e relacionado com as informações
que lhes são consistentes, assim o warehouse não
é somente consistente e integro na atualidade, mas no decorrer
de todo o tempo.

Exemplo de atualização do endereço de um cliente.

Em uma determinada data um cliente muda-se de endereço, no sistema de dados operacional isto significa uma atualização nos campos de endereçamento do cliente, no warehouse significa a inclusão de um novo registro.

Tabela Clientes no Data Warehou

Razão Social

Endereço

Numero

Região

Data do Registro

Empresa Alfa

Rua XYZ

10

Norte

01/10/2000

Empresa Alfa

Rua Nova

32

Sul

05/08/2005

Os relatórios que solicitarem os clientes até a data de 05 de Agosto de 2005 trarão os produtos vendidos a Empresa Alfa como sendo frutos de resultados das campanhas das equipes de marketing da região Norte e posteriormente a esta data as vendas serão atribuídas as equipes responsáveis pela região Sul.

A propriedade de não volatilidade de um Data Warehouse lhe permite faze comparações confiáveis entre períodos distintos que um sistema de dados operacional não permite.

– Variável com o tempo

Ser variável com o tempo significa somente que os Data Warehouses mantém um histórico por muito mais tempo que um sistema de dados operacional ou transacional, enquanto os sistemas OLTP guardam históricos por um curto período, para não reduzir a performance do sistema, os warehouses guardam um histórico por muito tempo, assim possibilitando que analises de tendências ao longo do tempo sejam feitas com suas informações.

De 0 a 10, o quanto você recomendaria este artigo para um amigo?

 

Deixe um comentário! 4

4 comentários

Comentários

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Comentando como Anônimo

  1. Ótimo artigo! Fiquei surpreso com o poder dos DataWareHouse, mas sugiro que no próximo artigo, sejam publicadas mais informações sobre Data WareHouse, tais como: Desempenho, tipos, como são feitas as “tabelas”, etc.

  2. Estarei colocando artigos sobre fundamentos do Data Warehouse, sobre como montar as tabelas dimensionais, casos práticos de warehouse assim como estudo de casos e dimensionamento e até como montar equipes para planejar e desenvolver um Warehouse com eficiencia. Peço que aguarde as próximas matérias.

  3. Bom dia, estou montando minha monografia sobre data warehouse e achei seu artigo muito interessante. gostaria de saber se você poderia disponibilizá-los para que eu possa utilizá-los como referências bibliográficas de embasamento.

    Atenciosamente,

    Guilherme

leia mais
Este projeto é mantido e patrocinado pelas empresas: