外灘大會 | 2030年我國數據產業規模有望達7.5萬億元
繼土地、勞動力、資本、技術之後,數據已成為全球企業爭相追逐的「第五元素」,成為推動產業轉型升級的提速器。與此同時,數據作為AI核心3個支柱之一,提高數據數量、安全和多樣性,對提升大模型性能、推動產業落地至關重要。今年外灘大會上,「金塊」數據要素、加速數據要素價值蝶變成為政產學研界共同關注的焦點,一批賽前分析性的數據加工產品、平台亮相,提供可持續、高質量的數據燃料。
「金塊」數據要素,上海走在前列
不久前,北京交通大學聯合清華大學、北京大學、中國軟件評測中心、華為等11家單位共同發佈國內首部《數據產業圖譜(2024)》,首次全面展示我國數據產業的基本內涵、構成、主體及特徵。
北京交通大學信息管理理論與技術研究中心特聘教授張向宏在外灘大會上對此進行分享。他介紹,我國數據產業近年來實現快速增長,2023年,產業規模已達2萬億元;2020年至2023年間,年均增長率高達25%。目前,我國現有數據領域相關企業已超過19萬家,上市數據企業主要集中在北京、廣東、上海、浙江、江蘇5地。「展望未來,預計2024年至2030年間,我國數據產業將保持20%以上的年均增長率,到2030年,產業規模有望達到7.5萬億元。」張向宏說。
「金塊」數據要素,上海走在前列。作為推動數據要素市場建設的重要平台,上海數據交易所發佈全球首個數據交易所交易規則體系,牽頭建設全國首條數據交易鏈,2023年數據產品交易額超11億元。「上海數據交易所積極構建數據產品和數據資產雙市場,活躍的產品市場成為交易融資的重要基礎。同時,在數據要素和金融要素間起到橋樑作用。」上海數據交易所副總經理章健表示。
值得一提的是,數據作為資產進入企業資產負債表,成為「點數成金」的第一步。章健談到,今年上半年,A股上市公司中已有44家實現數據資產「入表」。
高質量數據成AI產業戰略製高點
當前,數據質量已成為提升大模型性能、產業落地等所面臨的主要矛盾。
複旦大學計算機科學技術學院教授、上海市數據科學重點實驗室主任肖仰華談到,當前大模型已邁入分級時代,但目前對於數據的挖掘和應用仍相對粗放且效率低下,而隨著大模型發展,數據原料還面臨消耗過快的挑戰。
「現在我們的大模型只有知性,而缺乏理性。它只不過記住了更多事實,卻沒有變得更聰明。」在肖仰華看來,在原始數據上思考、關聯、融合所產生的大量合成數據具有很大潛力,不僅有助於緩解數據饑荒,用這些偏重思維過程的數據去訓練大模型,對於提升其理性至關重要。
圍繞數據質量、安全和多樣性,一批新型數據服務產品在大會上亮相,為企業提供數據合成、隱私安全、多模態數據處理能力。如對標Scale AI,螞蟻數科發佈新一代數據標註產品,向企業客戶提供AI驅動的全流程數據服務。
如何實現數據大規模安全可信流通是數據要素市場發展的核心議題之一。業界普遍認為,未來高價值數據的深度融合,需要以密態計算技術保障安全流轉。為此,螞蟻密算科技發佈「隱語云」大數據密算平台,基於自研的密態計算技術體系,為高價值、高敏感數據提供全生命週期的密態流通和密態研發,防止數據泄漏和濫用。
談及數據要素價值變現,肖仰華認為,以傳統技術手段去實現數據價值變現會面臨非常多的挑戰,借助AI大模型則可以事半功倍。「把繁重的數據處理工作交給AI,這將會是數據價值變現的一個重要思路。比方說數據治理,傳統企業邁出這一步代價很大,但如果用行業數據去調教大模型,它可以成為數據管理員和運維師。在數據開放、數據深度挖掘和利用等各個環節,都可以嘗試用AI大模型去構築數據變現的新引擎。」
文:本報記者 周淵
圖:視覺中國
編輯:施薇