從雲棲大會,透視中國AI水面下的暗湧
2024雲棲大會上,極少在公開場合露面的阿里CEO、阿里雲董事長兼CEO吳泳銘對AI的未來發展提出了積極的觀點。他認為過去22個月,AI發展速度已超任何歷史時期,「但我們依然還處於AGI變革早期」。面向未來,他提出生成式AI最大的想像力,「絕不是在手機屏幕上做一兩個新的超級app,而是接管數字世界,改變物理世界。」
此刻距離OpenAI發佈ChatGPT已過去22個月。全球AI技術圈和創投圈經歷了一個完整週期:技術奇點爆發引發狂熱追捧,再到創新曲線放緩,失望和質疑聲音浮現。如今隨著OpenAI發佈o1模型,AI深入各行各業,市場的信心正在重新爬升。吳泳銘的此次發聲,在當下的冷暖切換期,無疑更具參考意義。
如何看待這一次AI革命浪潮?AGI的最終形態會是什麼?我們如何把握這一次技術革命?
吳泳銘發言和這屆雲棲大會變成了最好的解題集。主論壇成為AI創業者的舞台,阿里雲請來了國內大模型、自動駕駛和人型機器人的明星創業者和科學家。走進雲棲小鎮,阿里雲幾乎搬來了中國AI圈所有的創業公司和產品,4萬平米的展區,擠滿了全球百餘款AI應用。400多場並行話題及論壇中,150餘場和大模型相關。在世界機器人大會爆火的人形機器人,在雲棲再次當上了頂流。
上一屆雲棲大會,焦點還在AI上遊的算力和生態。這一屆雲棲成為中國AI產業的微縮地圖。AI開始走出服務器,深入千行百業。始於2009年的雲棲大會,見證了每一波中國科技潮水的方向,也給出了理解當下的線索。
01 悄然演進的新產業革命
ChatGPT爆火後,如何定義這一浪潮的級別,成為全球頂級大腦熱議的話題。其中,互聯網是個熱門對比維度。
A16Z創始人 Marc Andreessen提出過一個有趣的觀點:互聯網通過連接現有的計算機來促進新計算機的創建,而AI尤其是大模型,則更像是一種新型計算機。
對於這個全球記者採訪提綱里的CEO熱門問題,吳泳銘給出了進一步的延伸。他認為,過去三十年,互聯網浪潮的本質是連接,互聯網連接了人、信息、商業、服務等等,通過連接提高了世界的協作效率,創造了巨大的價值,改變了人們的生活方式。但生成式AI是通過給生產力供給增加智能,從而為世界創造更大的內在價值。「這種價值創造,可能是移動互聯網連接價值的十倍、幾十倍。」
吳泳銘給予AI浪潮如此之大的預期,很大原因在於作為中國最大雲廠商的掌舵者,他可以親眼見證中國AI市場水面之下的暗流湧動。正如他在雲棲大會上提到:
「今天我們接觸到的所有客戶、所有CTO,幾乎都在用AI重構自己的產品。大量新增需求正在由GPU算力驅動,大量存量應用也在由GPU重新編程。在汽車、生物醫藥、工業仿真、氣象預測、教育、企業軟件、移動APP、遊戲等行業,AI計算正在加速滲透。」
傳統AI焦點在於模擬人類的感知,生成式AI卻將機器智能躍升到了思考推理和創造的維度。吳泳銘在演講中進一步解釋道:
「生成式AI讓世界有了一個統一的語言——Token。它可以是任何文字、代碼、圖像、影片、聲音。AI模型可以通過對物理世界數據的Token化,理解真實世界的方方面面,比如人類行走、奔跑、駕駛車輛、使用工具的動作,繪畫、作曲、寫作、表達、教學、編程的技巧。理解之後,AI就可以模仿人類去執行物理世界的任務。這將帶來新的產業革命。」
互聯網本質上只改變了人類「連接」另一個人類、信息、商業、服務的形態,但大模型同時改造前端的交互界面,和後端的生產環節。很多悄然開始的產業革命,並不容易被普通人所察覺。
以深勢科技為例。這家公司是「AI for Science」科學研究範式的頭部踐行者,運用人工智能和多尺度模擬仿真算法,結合先進計算手段求解重要科學問題,為人類文明最基礎的生物醫藥、能源、材料和信息科學與工程研究打造新一代微尺度工業設計和仿真平台。
基於深勢科技發佈的Uni-Mol分子構象大模型,可實現分子生成、性質預測等多種通用能力。在藥物發現領域,基於Uni-Mol開發的虛擬動力學分子生成方法VD-Gen,能直接在蛋白靶點空腔中生成具有高結合親和力的分子。
基於阿里雲高性能計算,深勢科技將單次預測能支持的最大氨基酸序列長度提升至 6.6k,覆蓋99.992%已知的蛋白序列。
來自廣東的拓斯達工業機器人公司,則將傳統的工業機器人控制軟件與通義大模型結合,讓工業機器人在指令控制、傳感反饋、知識學習等方面具備了新能力。在 3C、鋰電、光伏等行業的自動化生產場景中,集成了大模型能力的拓斯達六軸工業機器人,可以與現場工程師通過語言交互,無代碼完成碼垛、噴塗、裝配等複雜任務。
生成式AI的想像力正在徐徐展開。物理世界的大部分事物都會具備AI能力,形成下一代的全新產品,並與雲端AI驅動的數字世界連接產生協同效應。
02 生成式AI的機會在改變物理世界
2008年,移動互聯網誕生,2012年獲得全行業共識,這中間走過了五年。ChatGPT引發的生成式AI創業熱潮,幾乎是從第一天誕生起就達到了全球性共識,全球科技巨頭都在不計成本火速投入。
一大原因在於,移動互聯網只做到了物理世界的聯網,但生成式AI可以真正改造物理世界。吳泳銘在雲棲大會上指出,「我們不能只停在移動互聯網的視角看未來。生成式AI最大的想像力,絕不是在手機屏幕上做一兩個新的超級app,而是接管數字世界,改變物理世界。」
汽車行業正在發生這樣的變革。之前的自動駕駛技術,是靠人來寫算法規則,幾十萬行代碼,仍然無法窮盡所有的駕駛場景。小鵬汽車董事長、CEO何小鵬在雲棲大會現場提到,自動駕駛從1925年開始研發,但接近百年時間都只能做到特定場景下使用。「一個人無法用規則去面對世界上所有的場景,即使僅僅在開車這一個專業的業務。」
採用「端到端」的大模型技術訓練後,AI模型直接學習海量人類駕駛視覺數據,讓汽車具備了超越大部分司機的駕駛能力。何小鵬表示:「對於最普通的用戶,從現在到未來的36個月,可以讓我們每一個人在每一個城市都像老司機一樣開車。」
宇樹科技CEO王興興也分享了類似的感受,他曾經非常反對做人形機器人,直到大模型的出現看到了新的可能。
過去讓大模型實現跟人類一樣的複雜操作基本是無解的,因為人類動作是無窮的。即使是端茶、倒水這樣的簡單場景,就涉及到幾百種細微動作。過去都要依靠人類專家手動編程,大模型為機器人提供了一種可能性——機器人能夠形成理解事物本質及其處理方法的世界模型。
人型機器人帶來的好處有兩方面,首先,今天生活的世界是圍繞人類行為所優化的,人形可以讓機器人最大程度上適應環境,其次,通用機器人在製造方面存在巨大的規模效應。只有大規模製造,從而獲得成本優勢,才能真正實現機器人的真正普及。
吳泳銘指出:「機器人將是下一個迎來巨變的行業。未來,所有能移動的物體都會變成智能機器人。它可以是工廠里的機械臂、工地裡的起重機、倉居里的搬運工、救火現場的消防員、家庭里的寵物狗。」
在吳泳銘的暢想里,未來,工廠里會有很多機器人,在AI大模型的指揮下,生產機器人。現在每個城市家庭里有一輛車,未來每個家庭可能會有兩三個機器人。
AI驅動的數字世界連接著具備AI能力的物理世界,將會大幅提升整個世界的生產力,對物理世界的運行效率產生革命性的影響。而這一切來臨的快慢,取決於AI基礎設施的進化速度。
03 我們仍處於AI大基建時期
歷史上每一波應用的噴湧而出,前提都是基礎設施的完善。4G、5G和智能手機的普及,帶來了短影片呼嘯而來的大爆發。公路、鐵路基建,催生了中國領先全球的電商、物流業。
以互聯網基建為例。截止到今年6月,中國光纜線路總長度達6712萬公里,中國互聯網寬帶接入端口11.7億個,我國移動電話基站總數達1188萬個,5G基站總數達391.7萬個。
AGI應用的繁榮,同樣勢必根植於一個健全的大一統的算力基建之上。從2012年的AlexNet模型到2017年的AlphaGo Zero,算力消耗足足翻了30萬倍。而ChatGPT橫空出世的背後是,微軟Azure雲上的數萬張A100芯片,成本高達數億美元。
根據OpenAI的研究報告,自2012年開始,AI訓練需要的算力每隔 3-4 個月便會翻番,到 2018 年,訓練所耗費的算力更是增長了大概 30 萬倍,而相比之下,摩亞定律在同樣的時間里只有 7 倍的增長。
當物理世界被納入AI改造的範疇後,訓練和推理所需的算力成本更會爆髮式增長。
這讓雲計算天生地跟AIGC綁定在了一起。雲計算的算力集中、靈活部署、按需付費、成本較低等特點,儘管不能解決全部問題,但幾乎是算力短缺昂貴的背景下的唯一答案。無論是訓練還是推理,大模型都離不開雲。
吳泳銘在雲棲大會上提到,在新增算力市場上,超過50%的新需求由AI驅動產生,AI算力需求已經佔據主流地位。這一趨勢還會持續擴大。過去一年,阿里雲投資新建了大量的AI算力,但還是遠遠不能滿足客戶的旺盛需求。
CPU主導的計算體系正在加速向GPU主導的計算體系轉移,AI計算正在加速滲透千行百業。當前,行業前沿模型訓練計算量每年增長4~5倍,中國AI算力規模2022~2027年復合增長率高達33.9%;模型參數以10倍速增長,模型數據集以50倍速增長,對存力也提出了更高需求。
為提升智駕大模型訓練效率,小鵬汽車早在2022年就攜手阿里雲在烏蘭察布建成中國最大的自動駕駛智算中心,將自動駕駛模型訓練效率提升了超600倍。而近兩年內,由於大模型技術快速發展,阿里雲已將此智算中心的算力儲備擴張超4倍至2.51Eflops,為小鵬汽車提供穩定高效的算力底座,支撐了大模型快速迭代,實現智駕「全國都好用」。
本屆雲棲大會上,「全球首款AI汽車」小鵬P7+也亮相了2024雲棲大會。這款車搭載了業內領先的端到端大模型。過去2年,小鵬汽車與阿里雲共建的AI算力規模提升超4倍。何小鵬表示,將繼續深化與阿里雲的AI算力合作,加速推動端到端大模型拓展自動駕駛上限,提升下限。
吳泳銘無疑清晰地看到了這一趨勢。自宣佈「AI驅動、公共雲優先」以來,阿里雲大刀闊斧地進行投入AI基礎設施建設。在今年的雲棲大會,他再次強調:
「阿里雲正在以前所未有的強度投入AI技術研發和基礎設施建設。我們的單網絡集群已拓展至十萬卡級別,正在從芯片、服務器、網絡、存儲到散熱、供電、數據中心等方方面面,重新打造面向未來的AI先進基礎設施。」
本次雲棲大會,阿里雲展示了AI驅動的全系列產品家族升級。
最新上線的磐久AI服務器,支持單機16卡、顯存1.5T,並提供AI算法預測GPU故障,準確率達92%;阿里雲ACS首次推出GPU容器算力,通過拓撲感知調度,實現計算親和度和性能的提升;為AI設計的高性能網絡架構HPN7.0,可穩定連接超過10萬個GPU ,模型端到端訓練性能提升10%以上;阿里雲CPFS文件存儲,數據吞吐20TB/s,為AI智算提供指數級擴展存儲能力;人工智能平台PAI,已實現萬卡級別的訓練推理一體化彈性調度,AI算力有效利用率超90%。
同時,阿里雲宣佈通義千問三款主力模型再次大幅降價,最高降幅85%,百萬tokens價格低至0.3元。過去半年,阿里雲百煉平台持續降低大模型調用的門檻,進一步推動大模型的普惠。
模型成本與整個社會的創新之間是一個結構明確的蹺蹺板。伴隨AI基礎設施成本下降一同發生的,則是蹺蹺板另一端創新的噴湧而出。