對話浪潮信息董事長彭震:發展AI不能僅靠芯片 系統創新更重要

“人工智能可能是我們這一輩子面臨的最大的產業機遇。”浪潮信息董事長彭震在近日舉辦的浪潮信息生態夥伴大會上表示。

在其看來,人工智能對整個社會生產力帶來了根本性改變。“人工智能改變了生產力三要素,使得勞動者不僅僅是人,而是變成了‘人+人工智能’;生產資料從傳統意義上的有形要素變成無形,也就是數據;勞動工具則從過去人的肢體延伸,成為大腦的延伸,也會產生智慧。”

根據權威機構的預測,AI在2023年到2030年間累計對GDP產生的影響將是蒸汽機在1830年至1910年間對整個經濟影響的4.5倍。

“今天我們感覺AI沒有那麼大的顛覆性,是因為人工智能還在快速向人類學習。當某一天人工智能的智慧超越了人類,我們就會發現AI將以迅雷不及掩耳之勢改變世界,而且這種改變是不可逆的。”彭震表示。

談及如何發展人工智能,彭震在接受21世紀經濟報導記者採訪時稱,人工智能由算力、算法和數據三要素構成,是系統發展的結果。所以,人工智能的突破要從這三個方向一起來發力,而不是只揪住某一方面。

彭震。資料圖彭震。資料圖

如今,千億參數成為大模型智能湧現的臨界點,隨著參數規模越大,湧現的能力就越大。但同時,參數規模越大,也意味著計算複雜度越高,因此需要的算力規模也變得越來越大。

過去幾年,整個算力市場發生了巨大的變化,尤其是以英偉達為代表的算力芯片公司,成為社會關注的焦點。

但彭震向記者表示,人工智能的算力設計起點已經到了萬卡級別,這個時候單卡的性能雖然重要,但已不具有決定性,因為人工智能是一個龐大的系統。

可以佐證的數據是,如果從2017年Transformer模型誕生算起,按照摩爾定律(每18個月芯片性能翻一番)推算,芯片性能只提升了8倍,但同樣的時間里,人工智能計算的性能提升了超過1000倍。

彭震以浪潮信息的源2.0大模型為例稱,“我們在某個芯片上面跑得很糟糕,但在把數據並行、流水線並行等重新優化後,效率直接提升33%。而如果要把一個芯片性能提升33%,至少要製程迭代一次才行。”

這足以說明,算力的驅動不僅僅源於芯片,而是整個系統的全面提升。比如在算法層面,大模型的精度從過去的FP32開始,逐步發展到今年的FP8,未來會走向FP4,這種訓練算法的創新,使算法對算力需求不斷變小,進而大幅提升了算力效率。

另外在計算架構層面,從簡單的CUDA核心到Transformer引擎,張量計算變成多維矩陣計算,整個計算體系針對矩陣計算進行了優化,讓整體性能提升了1000倍。

彭震表示,隨著模型參數量越來越大,大規模人工智能計算可能需要十幾萬卡,那個時候,單顆芯片的性能在其中扮演的角色越來越不重要,集群的效率則變得越來越重要。

而集群的效率,受互聯、散熱、整體優化效率等影響。比如傳統的計算機體系限制了異構加速器的擴展性,所以需要發展基於新一代開放總線技術的融合架構體系結構;集群節點間的並行產生大量的通信需求,對網絡性能要求很高,這則需要發展超級AI以太網。

除了算力,數據在人工智能發展中扮演的角色也越來越重要。甚至有人發明了一個詞彙,叫“數據霸權”,是指誰掌握了數據,就掌握了人工智能智慧湧現的話語權。

但是現在,人類所產生的已知數據對大模型來講是遠遠不夠的。對此,彭震向記者表示,未來通過AI技術合成數據會成為一個主要趨勢。

“AI合成數據更多是基於現實,通過算法很嚴謹產生的數據。比如算法工程師把二維圖片做成三維,然後從不同角度去產生新的圖片,這樣就生成了大量合成數據。”彭震說道。

有預測數據顯示,到2030年,人工智能使用的合成數據將超過真實數據。屆時,數據的使用成本也將大幅降低,比如目前,人工標註一張圖片需要6美元,而使用合成數據只用6美分。

正因如此,彭震提出,要發展人工智能,應該以系統為核心,在算力、算法、數據三個方面協同發展。

他還特別提到算法的重要性,“算法是智慧湧現的關鍵,所以算法的領先是具有決定性的。今天大模型的Transformer架構、Diffusion架構,都是顛覆性的,所以在算法層面要不斷投入,激發創新力量。”

對於目前很多人工智能生態傾向於閉源,彭震認為,這種封閉不利於產業創新,開源開放才是產業生存之道。

在互聯網時代,IT技術的快速發展,開源開放起到了巨大的作用。在人工智能領域,開源也同樣起到了積極促進作用,比如很多人工智能芯片都是採用OAM結構,Meta發佈的LLaMA2開源平台也被眾多大模型所引用。

彭震表示,開源開放使人工智能領域迸發出大量創新企業。從曆史來看,很多技術、文明誕生的初期,都是百舸爭流、百家爭鳴,這些企業在競爭中不斷完善自己,也推動整個產業進步,最終通過市場之手自然淘汰,讓用戶選擇最後留下的技術和企業。