微軟發佈 Data Formulator:AI 顛覆數據可視化,讓數據「說話」更輕鬆
IT之家 2 月 15 日消息,科技媒體 marktechpost 昨日(2 月 14 日)發佈博文,報導稱微軟 Microsoft Research 團隊提出 Data Formulator,通過概念驅動的方法有效地解決了數據轉換的持續挑戰。
現有挑戰
IT之家註:Charticulator、Data Illustrator、Lyra 等現代可視化工具,以及 ggplot2、VegaLite 等庫,通常需要「整潔數據」作為輸入,意味著每個可視化變量都是一列,每個觀察值都是一行。
如果不是這種格式,用戶就需要進行數據轉換,即使原始數據完整無缺。這需要編程專業知識以及 tidyverse、pandas 或 Wrangler 等專業工具,導致工作流程低效,不斷切換數據轉換和可視化步驟。
Data Formulator
Data Formulator 引入「概念綁定」範式,用戶將數據「概念」綁定到可視化通道。概念可以來自現有列,也可以按需創建。

創建新概念有兩種方法:自然語言提示(用於數據推導)和基於示例的輸入(用於數據重塑)。用戶選擇圖表類型並映射所需概念後,Data Formulator 的 AI 後端會推斷必要的數據轉換並生成候選可視化結果。
系統為多個候選結果提供解釋性反饋,用戶可以通過直觀的界面檢查、優化和迭代可視化結果。結合自然語言和編程示例,用戶可以使用熟悉的配置工具,同時訪問強大的轉換功能。
測試結果
用戶測試結果表明 Data Formulator 在任務完成度和可用性方面表現出色。參與者平均在 20 分鐘內完成所有分配可視化任務,其中任務 6 由於涉及 7 天移動平均值計算而耗時最長。
展望未來,這種概念驅動的可視化方法有望影響下一代可視化數據探索和創作工具,有可能消除可視化創建中長期存在的數據轉換障礙。
參考