数据保管库基础知识

当前,在数据分析和BI领域,不再不可能满足诸如DATA VAULT这样的概念。但是,我认为,关于此主题的信息有些缺乏,尤其是在互联网的俄语部分。


您可以找到有关DATA VAULT在公司中的应用的有趣文章,但没有充分介绍其基础知识和方法。


在英语部分,情况要好得多。您可以购买DATA VAULT方法的作者和发明者的书籍,但公共领域中也有一些文章针对基础知识。


受到其中一篇文章的启发,我将尝试用俄语传达DATA VAULT方法的基本知识。


DATA VAULT-起源


出现DATA VAULT的主要先决条件是环境的可变性不断增加,并且需要快速响应这些变化。例如,EDW(企业数据仓库)中有一个新的数据源,该数据源具有以前的粒度数据粒度。假定DATA VAULT方法将使您能够快速添加新来源的数据。此外,使用DATA VAULT可以更轻松地构建一个允许您存储历史数据的系统。


解剖数​​据迷


DATA VAULT与其他构建数据仓库的方法之间的重要区别是需要以相同的源状态加载数据。将数据从源传输到DATA VAULT的过程不涉及任何转换或添加。DATA VAULT方法意味着与源进行对帐的可能性。当基于DATA VAULT构建数据集市时,数据转换过程将在稍后进行。


集线器(HUBS)


集线器是DATA VAULT的核心。正确配置的HUB允许您在公司存储中组合不同的数据源。来源是独立的,这一点很重要。基于此,每个HUB应该具有自己的唯一业务密钥(Business Key),而不与其他业务对象相关联。


HUB’ , .


, , , VIN .


DATA VAULT, . , .


HUB’ , :


  • – ;
  • – ;
  • HUB – , DATA VAULT, ;
  • – , HUB’ .

(LINKS)


– DATA VAULT. , , , .


DATA VAULT LINK’. , HUB’ LINK’. LINK’ .


LINK’ , HUB’.


LINK HUB’ . LINK HUB’, LINK HUB’.
, HUB LINK :


  • , , HUB’, , , LINK’ ;
  • HUB’;
  • , HUB’;
  • ;
  • .

(SATELLITES)


, , . SATELLITE .
:


  • HUB’;
  • SATELLITE — SATELLITE timestamp.

SATELLITE – .


, , HUB’ , HUB’ , SATELLITE , .



DATA VAULT, , :


  • (HUB) = ;
  • (LINK) = , ;
  • (SATELLITE) = .

HUB — - .


LINK — .


SATELLITE — .
DATA VAULT , , .


, DATA VAULT Raw DATA VAULT, , . Business DATA VAULT, , : PIT BRIDGE . Business DATA VAULT , .
:


  1. 肯特·格拉齐亚诺(Kent Graziano)出版物上,除了详细的说明之外,还包含该模型的图表;
  2. 书籍:使用DATA VAULT 2.0构建可扩展的数据仓库。

All Articles