Back to Blog
企業數據生態系
2021/07/13

數據生態系是結合資訊基礎建設及應用程式從而實現資料獲取、聚合及分析的一套系統。以下圖為例,每一區塊皆代表數據生態圈的一個工作類別,企業若能縮短整個數據流程同時兼顧資訊安全及符合規範,企業能更了解他們的客戶,更快地將數據轉換成商業價值。

  1. 資料源 – 原始資料的來源比如製造業生產設備數據和產線環境數據、金融業的交易記錄及系統數據、行銷業的用戶網路行為Log或第三方數據等等。
  2. 即時串流數據 – 隨著技術的創新,數據能以串流方式即時傳送並處理,如:影音播放程式、線上遊戲或即時交易平台所產生的數據。
  3. 輸入與整合 – 原始資料若含的雜質過多,則需要第一層清洗及處理,通常透過CDC(Change Data Capture)或ETL (Extract, Transfer, Load)等方式的資料處理。
  4. 分析數據管理與儲存 – 前面清洗過的數據或者內部系統的數據通常會先儲存到Data Warehouse、Data lake、Object Storage或Operation Data Storage 等地方以作後面的不同處理及應用。
  5. 資料探索、查詢 – 為能輕鬆管理Metadata、取用正確的數據、 提升數據分析的品質,如Data Catalog或Data Refinery的功能節省數據工程師的時間。
  6. 應用層 – 在前面儲存好的資料因應不同的使用單位及使用目的,有分儀表板、AutoML、分析、BI (Business Intelligence)工具或其他視覺化圖表、系統警示系統等。
  7. 智能應用 – 應用層的數據可以說是第一層的資料挖掘、第二層的挖掘則是將應用層的數據做進階的智能應用如:客戶360度透視、生產製造或研發智能、設備健康預測智能、金融交易監控等。
  8. 資訊管理與數據治理 – 此需求在整個生態圈都涵蓋,不同產業在不同國家有相對應的法規需遵守,企業內部不同數據使用單位也有不同的規範,資訊管理與數據治理至關重要,因此企業考量到Business glossary 、Governance Catalog及Policy & Rules等。
  9. 資料安全 (Auth, user roles, monitoring, etc…) – 數據的安全不論是在雲端或地端,一直是資訊單位最謹慎以對的,他們希望透過系統介面管理使用者的角色、權限及監控其對數據使用狀況。

建立一個現代化的數據生態圈能夠為企業帶來以下效益:

  1. 成本節省 – 透過上雲,簡化並一致化數據獲取、儲存及使用的環境可節省資本支出和Data warehouse的支出。
  2. 高回報率 – 企業可藉由加快現有數據應用,並挖掘過往沒有善加利用的歷史數據,產生更有效更快速的獲利模式。
  3. 貼近客戶 – 企業能更了解客戶的行為、快速因應市場變化、調整商業決策,讓產品或服務的開發更符合客戶的需求及偏好。
  4. 流程優化 – 企業可藉由更深更廣的數據分析及數據運用,包含自動化及智能的導入,可優化企業生產、製造、流通及營銷的各種流程。
  5. 縮短Time to market 及 Time to value - 透過導入AI可更快取得市場透視。從數據到產品上市及數據到商業價值的時間都大幅縮短。

No reproduction without permission, please indicate the source if authorized.

Share to your friends!

Follow Us
CannerFlow Platform
Connecting data lakes, databases, files, clouds as one data platform.
Learn More
Contact Us
Want to connect with us and talk to us? Contact us now!
Request Now