Data Warehouse (DW) é um banco de dados com grande volume de informações que auxilia na tomada de decisão. Geralmente usada por grandes empresas. Os dados são coletados de sistemas transicionais OLTP (Online Transaction Processing) que pode ser traduzido como Sistemas Transicionais de Processamento de Transações em Tempo Real. Nesses sistemas estão todas as transações realizadas pela empresa. E tem por objetivo manter uma série histórica para uso posterior dando suporte ao Business Intelligence (BI).
O Data Warehouse é considerado não volátil pois lida com dados consolidados. As séries históricas armazenadas não podem ser alterados, somente visualizadas. Caso seja necessário realizar alguma alteração terá que ser feita uma retificação. Assim as consultas e análise de dados podem ser realizadas nos dados históricos armazenados.
Principais Características
Traduzido para o português Data Warehouse quer dizer armazém de dados. Uma das características principais é a centralização de informações. Com as informações disponíveis assim pode-se dizer que são Orientados por assunto ou tema além de variar com o tempo. Como por exemplo: setores, produtos, marcas, funcionários, consumidores, fornecedores, etc. São integrados pois todas as variáveis já foram padronizadas, não restando dúvidas quanto a que nomenclatura usar. Por exemplo: a variável data pode ser representada de várias formas: dia/mês/ano, ano/mês/dia, mês/dia/ano. Ao ser inserida e consolidada no DW deve ser escolhida uma forma padrão que será sempre usada para representar tal variável, por exemplo definir a forma dia/mês/ano como a escolhida. Devido a necessidade de dar auxílio a tomada de decisão gerenciais não pode restar dúvida sobre os dados disponíveis no DW, cabendo ao responsável apenas interpretar os dados e não precisar pensar sobre o que cada informação quer dizer.
São elementos de um data warehouse: ferramentas para extração, carregamento e transformação (ELT – Extract, Transform and Load), banco de dados relacional, recursos de data mining (mineração de dados), e outros.
Qual a diferença entre um data Warehouse e um Data Mart
Os Data Marts (repositórios de dados) tem características similares aos Data Warehouse. No entanto em escala menor, com menos informações separados por setores, categorias, asssuntos, etc. E geralmente os dados vem de uma única fonte. Enquanto o DW é amplo e visa organizar o máximo de informações disponíveis de várias fontes e o posterior processamento analítico dos dados. Ou seja um DM é um sub-conjunto do DW.
Conclusão
Inicialmente o conceito acadêmico foi definido na década de 1980, mas com o passar do tempo houve uma evolução significativa da quantidade de dados que podem ser armazenados. Assim Como das ferramentas que podem ser usadas para comparar as informações.
Deixe um comentário