Dasar-dasar Vault Data

Saat ini, di bidang analisis data dan BI, tidak mungkin lagi tidak memenuhi konsep seperti DATA VAULT. Namun, menurut saya, ada beberapa kekurangan informasi tentang topik ini, terutama di segmen Internet berbahasa Rusia.


Anda dapat menemukan artikel menarik tentang penerapan DATA VAULT di perusahaan, tetapi dasar-dasar dan metodologi tidak tercakup secara memadai.


Di segmen bahasa Inggris, segalanya jauh lebih baik. Anda dapat membeli buku oleh penulis dan penemu metodologi DATA VAULT, tetapi ada juga artikel dalam domain publik yang berfokus pada dasar-dasar.


Terinspirasi oleh salah satu artikel ini, saya akan mencoba menyampaikan hal-hal dasar metodologi DATA VAULT dalam bahasa Rusia.


DATA VAULT - asal-usulnya


Prasyarat utama untuk munculnya DATA VAULT adalah meningkatnya variabilitas lingkungan dan kebutuhan untuk cepat menanggapi perubahan-perubahan ini. Misalnya, ada sumber data baru dengan granulasi data yang sebelumnya granular di EDW (Enterprise Data Warehouse). Diasumsikan bahwa metodologi DATA VAULT akan memungkinkan Anda untuk dengan cepat menambahkan data dari sumber baru. Selain itu, menggunakan DATA VAULT lebih mudah untuk membangun sistem yang memungkinkan Anda untuk menyimpan data historis.


DATA DATA Anatomi


Perbedaan penting antara DATA VAULT dan pendekatan lain untuk membangun gudang data adalah kebutuhan untuk memuat data dalam kondisi sumber yang identik. Proses transfer data dari sumber ke DATA VAULT tidak melibatkan transformasi atau penambahan apa pun. Pendekatan DATA VAULT menyiratkan kemungkinan rekonsiliasi dengan sumbernya. Proses transformasi data akan dilakukan nanti, ketika membangun data mart berdasarkan DATA VAULT.


Hub (HUBS)


HUB adalah inti dari DATA VAULT. HUB yang dikonfigurasi dengan benar memungkinkan Anda untuk menggabungkan berbagai sumber data dalam penyimpanan perusahaan Anda. Adalah penting bahwa sumber-sumbernya independen. Berdasarkan ini, setiap HUB harus memiliki kunci bisnis yang unik (Kunci Bisnis), tidak terkait dengan objek bisnis lainnya.


HUB’ , .


, , , VIN .


DATA VAULT, . , .


HUB’ , :


  • – ;
  • – ;
  • HUB – , DATA VAULT, ;
  • – , HUB’ .

(LINKS)


– DATA VAULT. , , , .


DATA VAULT LINK’. , HUB’ LINK’. LINK’ .


LINK’ , HUB’.


LINK HUB’ . LINK HUB’, LINK HUB’.
, HUB LINK :


  • , , HUB’, , , LINK’ ;
  • HUB’;
  • , HUB’;
  • ;
  • .

(SATELLITES)


, , . SATELLITE .
:


  • HUB’;
  • SATELLITE — SATELLITE timestamp.

SATELLITE – .


, , HUB’ , HUB’ , SATELLITE , .



DATA VAULT, , :


  • (HUB) = ;
  • (LINK) = , ;
  • (SATELLITE) = .

HUB — - .


LINK — .


SATELLITE — .
DATA VAULT , , .


, DATA VAULT Raw DATA VAULT, , . Business DATA VAULT, , : PIT BRIDGE . Business DATA VAULT , .
:


  1. Pada publikasi Kent Graziano , yang selain deskripsi rinci berisi diagram model;
  2. Buku: Membangun Gudang Data yang Skalabel dengan DATA VAULT 2.0.

All Articles