Denodo創始人葉蘇斯:AI降低數據管理使用門檻 數據編織應用迎“黃金期”

以生成式AI為代表的人工智能新技術,正引領全球新一輪生產力革命,對企業數據管理及數據價值開發的質量與效率提出新的挑戰。

21世紀經濟報導記者注意到,數據編織(Data Fabric)作為解決數據質量難題、釋放生成式AI潛力的重要技術趨勢,正受到越來越多企業的關注。

所謂數據編織,是一種分佈式數據管理架構,集成來自不同數據源的數據,安全提供不同數據對象的“集成視圖”,將“集成數據”用於分析和操作。數據編織相關技術的應用能提供值得信賴的數據基礎,提高生成模型的相關性和準確性,成為解決企業AI部署難題的重要路徑。

去年7月,阿里雲曾宣佈與數據管理領域的領導者Denodo達成技術合作,後者以邏輯數據集成和管理能力而聞名。

近日,Denodo(Angel Viña)創始人葉蘇斯與21世紀經濟報導記者展開對話,探討了AI浪潮下中國企業數字化轉型的數據管理新範式。

葉蘇斯認為,傳統數據管理方式產生的數據孤島,會導致尋找業務的時間過長,從而導致實現價值的時間也會更長;同時,混合多元的數據生態,導致了數據資產不能夠得到充分利用,數據治理異常複雜。

“邏輯數據管理作為新的管理方式,可以打破數據孤島,讓用戶輕鬆獲得訪問的權限,同時通過簡化和格式轉換提高數據的時效性,幫助用戶提高決策效率,建立更加突出的競爭優勢。”葉蘇斯說道,同時,生成式AI降低了數據管理的使用門檻,大大拓展了數據編織的應用規模。生成式AI與數據編織互利共進,正為數據管理市場帶來更大的發展機遇。

葉蘇斯。資料圖葉蘇斯。資料圖

《21世紀》:Denodo數據編輯的核心優勢是什麼?有哪些實際應用空間?

葉蘇斯:首先我們既注重客戶的信息保護,從不一樣的語義層對信息進行處理和保護,涉及的領域很多,包括航空、交通運輸、醫藥等各個對信息需求巨大的行業,通過技術使數據可以更加透明,並且正確傳輸給客戶。

以醫藥行業為例,醫藥公司在進行藥物的生產、商品化、零售運營的過程中,會用到大量數據,比如說賽諾菲(Sanofi),需要海量的數據支持各個流程監管,以及後期處理等環節。後續生產的產品要進入到醫院端,還得去病床前做各種臨床數據驗證,不同的階段比如臨床應用的這些治療有沒有應答等。在這個過程中,首先要獲取各種健康相關的數據,然後在每一個垂類中,針對不同行業面臨同樣的難點、痛點,獲得高質量並且不違規、不會涉及隱私侵犯的數據。

再如IT相關領域,我們可以支持數據遷移、相關數據的合規使用、建模過程等。我們還有這些數據的提取過程、抽像過程,這個過程能夠符合公司數據現代化、架構現代化需求。同時我們還有一些關鍵用例,支持用戶體驗提升,因為收集了海量的終端客戶數據之後,我們可以在客戶體驗管理上做得更好、更上一層樓。我們還有一些後勤運輸提高的案例,因為數據(量)提高之後,我們在運營安排上可以進行實時調整等。

在風險管理方面,我們也做得很棒,在數據提取的過程中,你得確保它是合規的,數據的交換也得符合當地法律法規要求。

還有一點就是我們創造額外價值,也叫數據民主,就是數據要開放給新的用戶,大家是平等的,這些數據你可以用你所需要的格式去提取。而當前很多情況中,當消費者和用戶使用數據時,他們無法在IT層看到這些數據。

《21世紀》:數據編織如何保障數據安全?

葉蘇斯:Denodo平台提供的是能力、工具,不是一個負責實施或者是做數據安全的企業,客戶會用我們提供的能力,但他們得為自己的安全負責,舉個例子,如果說數據市場是一個機場,我們就屬於給它提供傳送帶或者其他類型產品的廠家,這個傳送帶怎麼安裝,裝在哪裡,是機場負責的;旅客的行李當中是否有危險品、違禁品,也是由機場負責檢查,我們提供的只是一個傳送帶而已。

再看數據編織,數據編織有非常多的優秀能力可以提供給顧客,讓它在應用之後提高安全水平。有些客戶對安全性要求較高,我們會基於這方面的需求,提供更好的管理工具,比如幫助他們找到更可靠的數據或資源。

總的來說,我們作為信息傳送帶,任務是通過語言處理、信息構架等,在合法合規的框架下去傳輸信息,並且傳輸更快的信息給到客戶。

《21世紀》:數據編織效果如何衡量?你們的企業用戶會關心哪些指標?

葉蘇斯:我們認為最關鍵、最核心的問題就是如何將數據更好傳輸給我們的客戶,特別是將數據中心的各個環節進行連接。很多公司有大量的核心數據,如何獲取並連接這些數據非常關鍵。對於我們來講,信息數據中心要做的事情就是要統一進行升級,將獲取和連接的過程簡化,高效率地將核心數據傳遞到客戶當中。

在當前的時代,客戶更關注的是時效性和成本問題,這也是數據編織能夠完成的目標——將所有有用的信息編織到一塊,以一個合規、安全的方式提供給我們的客戶。

因為不同的客戶,使用的技術不一樣,格式不一樣,最終所呈現出來的效果也是不一樣的。對於生產製造業企業來說,他們希望以不同的形式去革新他們的產品,以便從各個維度滿足他們客戶的需求。我們會結合他們過往的分析報告,幫助他們進行數據分析,去找到他們的客戶最感興趣的點,幫助他們滿足客戶的需求。

《21世紀》:人工智能對於數據編織應用市場會帶來何種影響?

葉蘇斯:無AI不數據,AI在學習訓練的過程中需要大量的數據。當前市場上有各種各樣的大模型,大模型需要有上下文、需要結構數據幫助其構建各種場景、瞭解各種業務和功能,而Denodo在這個過程中是非常好的橋樑。

Denodo能夠做的是,我們擁抱人工智能基礎設施,將AI與我們Denodo的功能性進行了結合。當然我們現在還處在發展過程中,部分技術還沒有特別成熟,但AI作為很好的賦能機制,我們有些客戶已經在嚐試將AI與Denodo進行結合,實現應用,在這過程中相關機制會不斷完善。

《21世紀》:當前生成式AI面臨算力不足等問題,這是否會影響到數據編織的運用?當前數據編織應用到了爆髮式的“黃金時間”了嗎?

葉蘇斯:現在,我們所擁有的信息,需要傳輸的信息,遠遠比平台獲取的信息更大。比如在中國,有一些生產領域,企業已經有了一些積累,在後續不斷髮展壯大的過程中,需要專注於不同客戶的需求,進行更針對性的持續突破,還要將這些成功的案例、成功的模式去移植到其他國家,把生意做到全球化,我想這個過程都需要數據,需要真實的數據。

因為在全球的模式之下,不同國家、地區的數據是完全不一樣的,供應鏈也完全不一樣,所以我們必須要去進行優化、革新,將數據放進信息池當中。

在這樣的願景之下,我們完全有理由相信,我們處於一個黃金時期,特別是對於信息管理來說,信息的體量非常大,我們會看到不一樣的信息,不一樣的功能影響我們所從事的行業和生意,其中就包括客戶信息、供應鏈信息和技術信息等。

剛剛我們也提到了我們在系統中用了語義層的方式進行信息監管、篩選和更新,類似的語義語境下的大模型,會涉及很多信息的傳輸和更新,並且還得針對不一樣的客戶群體進行實時信息傳輸。信息大爆炸給數據編織帶來發展黃金期。

《21世紀》:當前數字化轉型正在成為發展新質生產力的重要抓手,在推進數字化轉型方面,你認為現階段廣大企業的信息技術架構還存在哪些痛點?

葉蘇斯:數據加速業務成長意味著能夠讓數據的轉化和傳輸都更加高效,關鍵就是把數據部署在業務所需要的維度,就是需要什麼數據就給他導出什麼數據,只有這樣才能夠哺育後期的創新。當然數字轉型是一個很大的詞,我們關注的數字轉型的含義,是如何跟我們產生聯繫。

對於我們來說,可能就是把更好的數據開放給終端用戶,提升用戶體驗,特別是在進行用戶交互和供應商溝通時,我們希望在數據處理的過程中更加有性價比,通過低成本、降本增效,讓更多設備終端體驗更好,你可以理解為供應鏈優化或者是能力提升,以便我們在數據源利用、數據源轉化上,提供給客戶,可以輔助用於明智決策的數據。

在目前的過程中,我們確實通過數據代理終端獲取了更多的數據,每一個公司都會用到一定的數據化或者數字化方式,幫助我們構建數字底座,同時支持公司的多個數據系統。