Back to Blog
三大常見的 Data Mart (資料市集) 的種類?
2021/09/07

我們前一篇提到了資料市集以及資料倉儲的差異,這邊將會介紹資料市集 (Data Mart) 常見的種類,由於在企業數據相當複雜,使用資料市集的使用方式也會因為場景不一樣。

1. 依賴型資料市集

依賴型資料市集是指在建置資料倉儲時,會把所有的資料先進到資料倉儲 (Data Warehouse) 中,然後把所需要各單位的資料從資料倉儲裡面拉出來到各個資料市集中。

所以資料市集通常內部的資料都是從資料倉儲內重新組織或加總後放進到資料各個不同的資料市集中。

在資料市集中可以如何使用:

  1. 針對業務邏輯使用:在 Data Mart 中使用者不需要擔心會動到其他單位的數據,由於已經把資料獨立抽出 Data Mart業務單位可以針對業務邏輯獨立撰寫。
  2. 萃取數據:可以針對業務場景在萃取出需要使用的數據再做加工

所以在這個情境下所有的資料市集 (Data Mart) 都與資料倉儲有依賴性,資料都是從資料倉儲中萃取出來。

2. 獨立型資料市集

獨立型資料倉儲就像字面的意思所述,它並非從資料倉儲中萃取出數據,而是從營運系統中直接萃取,針對單一的主題或業務場景進行數據萃取與數據加工。

獨立型的資料市集並非如此困難,通常在短期使用上,需求會直接針對 Production 資料對獨立型的資料市集做數據加工。

3. 混合型資料市集

混合型的資料市集,即是資料源會來自於資料倉儲或是從營運系統中進行彙整與萃取。這樣可以針對企業內部的數據做比較彈性的數據整合,不用所有資料都進入到資料倉儲而是混合性的使用。

CannerFlow 資料虛擬化 - 快速建立獨立與混合型資料市集 (Data Mart)

使用 CannerFlow 可以快速達到:

  1. 混合型資料市集:整合資料倉儲及各種不同資料源。
  2. 獨立型資料市集:可直接 Table-to-Table 的進行資料複寫,把 Production 資料直接進行抽離。
  3. 依賴型資料市集:CannerFlow 可以建置在任何的資料倉儲解決方案。

No reproduction without permission, please indicate the source if authorized.

Share to your friends!

Follow Us
CannerFlow Platform
Connecting data lakes, databases, files, clouds as one data platform.
Learn More
Contact Us
Want to connect with us and talk to us? Contact us now!
Request Now