Conceptos básicos de Data Vault

Actualmente, en el campo del análisis de datos y BI, ya no es posible no cumplir con un concepto como DATA VAULT. Sin embargo, en mi opinión, hay cierta falta de información sobre este tema, especialmente en el segmento de Internet en ruso.


Puede encontrar artículos interesantes sobre la aplicación de DATA VAULT en las empresas, pero los conceptos básicos y la metodología no están cubiertos adecuadamente.


En el segmento de inglés, las cosas están mucho mejor. Puede comprar libros de autores e inventores de la metodología DATA VAULT, pero también hay artículos de dominio público que se centran en lo básico.


Inspirándome en uno de estos artículos, intentaré transmitir los elementos básicos de la metodología DATA VAULT en ruso.


Bóveda de datos: los orígenes


El principal requisito previo para la aparición de DATA VAULT fue la creciente variabilidad del entorno y la necesidad de responder rápidamente a estos cambios. Por ejemplo, hay una nueva fuente de datos con granulación de datos previamente granular en EDW (Enterprise Data Warehouse). Se supone que la metodología DATA VAULT le permitirá agregar rápidamente datos de una nueva fuente. Además, usar DATA VAULT es más fácil de construir un sistema que le permita almacenar datos históricos.


Bóveda de datos de anatomía


Una diferencia importante entre DATA VAULT y otros enfoques para construir almacenes de datos es la necesidad de cargar datos en un estado de origen idéntico. El proceso de transferencia de datos de las fuentes a DATA VAULT no implica ninguna transformación o adición. El enfoque DATA VAULT implica la posibilidad de reconciliación con la fuente. El proceso de transformación de datos se llevará a cabo más tarde, cuando se construyan marts de datos basados ​​en DATA VAULT.


Hubs (HUBS)


Los HUB son el núcleo de DATA VAULT. Los HUB configurados correctamente le permiten combinar diferentes fuentes de datos en su repositorio corporativo. Es importante que las fuentes sean independientes. En base a esto, cada HUB debe tener su propia clave comercial única (Clave comercial), no asociada con otros objetos comerciales.


HUB’ , .


, , , VIN .


DATA VAULT, . , .


HUB’ , :


  • – ;
  • – ;
  • HUB – , DATA VAULT, ;
  • – , HUB’ .

(LINKS)


– DATA VAULT. , , , .


DATA VAULT LINK’. , HUB’ LINK’. LINK’ .


LINK’ , HUB’.


LINK HUB’ . LINK HUB’, LINK HUB’.
, HUB LINK :


  • , , HUB’, , , LINK’ ;
  • HUB’;
  • , HUB’;
  • ;
  • .

(SATELLITES)


, , . SATELLITE .
:


  • HUB’;
  • SATELLITE — SATELLITE timestamp.

SATELLITE – .


, , HUB’ , HUB’ , SATELLITE , .



DATA VAULT, , :


  • (HUB) = ;
  • (LINK) = , ;
  • (SATELLITE) = .

HUB — - .


LINK — .


SATELLITE — .
DATA VAULT , , .


, DATA VAULT Raw DATA VAULT, , . Business DATA VAULT, , : PIT BRIDGE . Business DATA VAULT , .
:


  1. Sobre la publicación de Kent Graziano , que además de una descripción detallada contiene diagramas del modelo;
  2. Libro: construcción de un almacén de datos escalable con DATA VAULT 2.0.

All Articles