Back to list
什麼是 Data Fabric?
2022/07/18

台灣企業在今年最流行的資料管理技術,莫過於由市場分析公司 Gartner 所發布的 "What are the 12 top strategic technology trends, 2022 — and why are they valuable?" 中第一名的 2022 數據新趨勢 「Data Fabric」,引發不少台灣企業相當高的詢問度,大家都想知道到底有什麼好處以及適不適合導入。

什麼是數據經緯(Data Fabric)

根據 Gartner 的文章定義, Data Fabric 架構是實現數據管理和集成現代化的關鍵,需要 Data Fabric 提供跨平台和業務用戶的靈活、彈性的數據源集成,使數據在任何需要的地方都可用,無論數據位於何處。Data Fabric 可以使用分析來學習並積極推薦應該在哪裡使用和更改數據。這可以 將數據管理工作減少多達 70%

data fabric pic

我們可以將 Data Fabric 相關重點技術 列為以下四點:

  1. 調的到:透過資料虛擬化,讓原始資料得以在資料源中被調用。
  2. 找的到:將資料目錄分類、標籤,創建企業內部專門的資料圖譜。
  3. 管的到:將資料存取權限、對接統一管理,並且使用軌跡得以被完整追蹤,保障使用中的安全性。
  4. 用的到:讓資料消費者自助使用的資料平台,盡量是 No code 或是 Low code,降低使用門檻。

廣義來說,當然可以將 Data Fabric 視一個介於業務應用以及後段資料儲存的中台角色,既可以完成 「跨工作平台」、「授權業務用戶使用」、「彈性集成數據」,讓數據分析應用規模化,但是他更強調的是「在任何地方都可以調用數據」以及「彈性化集成使用」,而這一切都與 「資料調用管理」 息息相關。

為什麼「調用」擺在第一位?

為什麼把「調用」作為首置位?「調用 」這是所有分析的起始,最容易被忽略的一步,也是目前最耗費人力的階段。因為企業資料是動態的,大至新增系統,小至元數據欄位異動,這些幾乎天天都在發生。若企業內部的數據源變化,遠大於資料處理速度,以固定整理方式會需要更多人為管理以及時間。例如資料庫種類疊代、Schema 的變動、連帶數據單位的應用數據格式與 Schema 格式的產生變動。尤其是在運用 ETL/ELT 搬運資料時,來源 Schema 或種類變化時會造成下游資料集連帶錯誤擴散、不穩與更新問題,造成末端使用者採用錯誤數據。

我們可以想像的到,未來將會是前後端輸入與輸出變動的狀態下,仍舊需要維持統一且可擴充性的數據權控、欄位級別的權控,也就是將「資料、應用、人」三者重新串起關聯性,方可應付變動性這麼高的情境。

Data Fabric 可以讓人打破過去的工作流程,有別於以往,需要很明確定義所需的資料樣貌,再從頭把資料彙整、轉換、整合到最後,最終進入到所使用的應用工具;未來是可以直接從大量數據資料中,找尋未知的新創可能性,並且驗證與實踐。

數據孤島與集中化的完美平衡點

如果現在都可以透過 Data Fabric 的架構打造完美的調用平衡點,那麼,我們回頭思考一個問題,如果都調用的到,那麼是否有需要選擇單一管理方式?如果要求所有資料都要從同一個單一集中化的平台做輸入與輸出,其所犧牲的是企業創新速度。

答案是很明確的。透過 Data fabric 能從「源頭端的數據整合」,保持高彈性與敏捷性,因此無論是單一集中、或是分散式管理,都只是管理手段,最重要的是找的到正確資料,並且可以被合理調用,讓企業未來在不斷的數據迭代中兼具擴充性與嚴謹管理。

想了解如何透過 Canner 實踐 Data Fabric 架構。 Canner Enterprise 針對資料調用管理所設計的 四大架構 ,正是呼應 Data Fabric 的需求,讓資料可調、讓人可使用,並且有完整的權控機制,企業在新一代的大數據時代下,快速挖掘更好的數據商機。

本公司圖文版權所有,轉載請註明出處。

Share to your friends:
申請試用 Canner
申請試用