Atualmente, no campo da anĂĄlise de dados e BI, nĂŁo Ă© mais possĂvel nĂŁo atender a um conceito como o DATA VAULT. No entanto, na minha opiniĂŁo, hĂĄ alguma falta de informaçÔes sobre esse tĂłpico, principalmente no segmento de idioma russo da Internet.
VocĂȘ pode encontrar artigos interessantes sobre a aplicação do DATA VAULT em empresas, mas o bĂĄsico e a metodologia nĂŁo sĂŁo abordados adequadamente.
No segmento inglĂȘs, as coisas estĂŁo muito melhores. VocĂȘ pode comprar livros de autores e inventores da metodologia DATA VAULT, mas tambĂ©m existem artigos de domĂnio pĂșblico focados no bĂĄsico.
Sendo inspirado por um desses artigos, tentarei transmitir as coisas bĂĄsicas da metodologia DATA VAULT em russo.
VAULT DE DADOS - as origens
O principal pré-requisito para o surgimento do DATA VAULT foi a crescente variabilidade do ambiente e a necessidade de responder rapidamente a essas alteraçÔes. Por exemplo, hå uma nova fonte de dados com granulação de dados anteriormente granular no EDW (Enterprise Data Warehouse). SupÔe-se que a metodologia DATA VAULT permitirå adicionar rapidamente dados de uma nova fonte. Além disso, o uso do DATA VAULT é mais fåcil de construir um sistema que permite armazenar dados históricos.
Anatomia DATA VAULT
Uma diferença importante entre o DATA VAULT e outras abordagens para a construção de data warehouses Ă© a necessidade de carregar dados em um estado de origem idĂȘntico. O processo de transferĂȘncia de dados de fontes para o DATA VAULT nĂŁo envolve nenhuma transformação ou adição. A abordagem DATA VAULT implica a possibilidade de reconciliação com a fonte. O processo de transformação de dados serĂĄ realizado posteriormente, ao criar data marts com base no DATA VAULT.
Hubs (HUBS)
HUBs sĂŁo o nĂșcleo do DATA VAULT. Os HUBs configurados corretamente permitem combinar diferentes fontes de dados no seu repositĂłrio corporativo. Ă importante que as fontes sejam independentes. Com base nisso, cada HUB deve ter sua prĂłpria chave comercial (Chave Comercial), nĂŁo associada a outros objetos de negĂłcios.
HUBâ , .
, , , VIN .
DATA VAULT, . , .
HUBâ , :
- â ;
- â ;
- HUB â , DATA VAULT, ;
- â , HUBâ .
(LINKS)
â DATA VAULT. , , , .
DATA VAULT LINKâ. , HUBâ LINKâ. LINKâ .
LINKâ , HUBâ.
LINK HUBâ . LINK HUBâ, LINK HUBâ.
, HUB LINK :
- , , HUBâ, , , LINKâ ;
- HUBâ;
- , HUBâ;
- ;
- .
(SATELLITES)
, , . SATELLITE .
:
- HUBâ;
- SATELLITE â SATELLITE timestamp.
SATELLITE â .
, , HUBâ , HUBâ , SATELLITE , .
DATA VAULT, , :
- (HUB) = ;
- (LINK) = , ;
- (SATELLITE) = .
HUB â - .
LINK â .
SATELLITE â .
DATA VAULT , , .
, DATA VAULT Raw DATA VAULT, , . Business DATA VAULT, , : PIT BRIDGE . Business DATA VAULT , .
:
- Na publicação de Kent Graziano , que além de uma descrição detalhada contém diagramas do modelo;
- Livro: Criando um data warehouse escalĂĄvel com o DATA VAULT 2.0.