Back to Blog
AI 測試與如何有效數據原型、迭代應用
2021/07/06

由於現在數據應用場景越來越廣泛,每個不同的部門需要以及使用場景不一樣會複製許多資料備份在企業內部中。尤其是在 AI/ML 的場域企業內的資料副本不斷地快速增加在不同的單位中。

企業為了要導入 AI 智能會在企業中複製很多不同的資料備份給各單位使用

AI 開發常見需要的使用場景

1. 測試資料管理 (Test Data Management)

在 AI 應用中,測試以及實驗數據非常多且雜,在企業內部有許多的數據迭代以及數據週期等數據應用需求,所以需要在各種不同的地方放入測試與實驗數據。所以在 AI/ML 應用場域中會有一個大場景就是『測試資料管理』。

2. 分析應用加速

在建立 AI 模型會做許多不同維度的數據分析與與應用,所以會比過去在 BI 的應用頻率還高非常多,在一個 AI 模型的建立會不斷用不同的 aggregate data 或是不同的數據聚合後做加值分析,這時候分析的速度就很重要。

現今企業的挑戰

1. 資料量級越來越大

數據量級越來越大,要如何同時兼顧成本、速度、與應用都可以達到平衡是一個大挑戰。

2. 更多應用場景,代表資料副本大量增加

應用場域以及在數據應用的複雜度增高非常多,代表在各單位的資料副本不斷加劇,增高企業內部的副本複雜度不斷墊高。

3. 實體搬遷數據越來越慢

現在我們看到許多在製造業與金融業,數據量大的資料庫實體搬遷數據有時需要數十小時,或數天。

解決方案:虛擬數據渠道

使用資料虛擬化,以及虛擬數據渠道來解決企業現在所面臨的 AI 挑戰:

  1. 解決資料量級不斷增高問題
  2. 解決資料來源越來越雜的問題
  3. 解決應用場景複雜度增高問題
  4. 資料副本不斷加高
  5. 實體搬遷越來越慢

虛擬數據渠道四階段

  1. 資料獲取 (Capture)
    1. 直接獲取
    2. 漸進式更新
  2. 數據轉換 (Transform)
    1. 數據遮罩
    2. 數據過濾
    3. 數據加值
  3. 虛擬化 (Virtualize)
    1. 快速分享
    2. 快速傳輸
    3. 減少副本儲存
    4. 提高數據品質
  4. 輸出應用 (Output)
    1. 優化輸出各式應用
    2. 自動化流程輸出

使用 CannerFlow 資料虛擬化來加速您現在企業的 AI 應用吧!

No reproduction without permission, please indicate the source if authorized.

Share to your friends!

Follow Us
CannerFlow Platform
Connecting data lakes, databases, files, clouds as one data platform.
Learn More
Contact Us
Want to connect with us and talk to us? Contact us now!
Request Now