直擊雲棲大會:阿里雲推出最強開源模型,主力模型再降85%
文 | 新浪科技 周文猛
又是一年雲棲大會。9月19日至9月21日間,阿里雲2024雲棲大會正式舉辦。
本屆雲棲大會上,阿里雲發佈了通義千問新一代開源模型Qwen2.5。據悉,Qwen2.5全系列涵蓋多個尺寸的大語言模型、多模態模型、數學模型和代碼模型,每個尺寸都有基礎版本、指令跟隨版本、量化版本,總計上架100多個模型。
一年前,國內人工智能行業還在為百模大戰的激烈程度感到焦慮。而今,阿里雲一家企業累計上架的模型數量,便超過了100款。與此同時,阿里雲還宣佈了三款通義千問主力模型再次降價,部門模型較行業價格低84%,再次推動大模型價格競爭升級。
在與新浪科技溝通中,阿里雲智能集團CTO周靖人表示,“上架這麼多的AI模型,其實是希望把選擇留給開發者,讓他們結合自己的業務和場景去做出權衡,選擇最適合自己的模型。”與之相似,再次推動大模型價格下探,“初衷是希望把AI技術紅利給到企業級用戶和開發者,讓他們有效地展開各種AI應用研發。”
此外,在2024雲棲大會展館現場,阿里雲在邀來百川智能、月之暗面Kimi、智譜AI、零一萬物等AI創企參展的同時,也集中展示了旗下通義千問、通義萬相、魔搭、阿里雲AI搜索等產品,開放開源的同時,也正積極下場實踐,積極地參與行業競爭。
三款主力模型降價,大模型價格再探底?
“最開始我們只推出兩款模型時,我們得到開發者社區的反饋是——希望推出更多的版本,因為有的人可能希望模型能力更強,有的則希望推理效率更高,這次我們就能夠把整個模型系列更多的選擇權,留給了開發者。”周靖人對新浪科技表示。
據介紹,相比Qwen2,阿里雲此次開源的Qwen2.5全系列模型都在18T tokens數據上進行預訓練,整體性能提升18%以上,擁有更多的知識、更強的編程和數學能力。在MMLU-rudex基準(考察通用知識)、MBPP 基準(考察代碼能力)和MATH基準(考察數學能力)測試中,Qwen2.5-72B模型得分高達86.8、88.2、83.1。
宣佈通義千問系列模型“全尺寸”升級的同時,本屆雲啟大會,阿里雲再次宣佈旗下三款通義千問主力模型降價:Qwen-Turbo價格直降85%,低至百萬tokens 0.3元,Qwen-Plus和Qwen-Max分別再降價80%和50%。降價後,Qwen-Plus性價比同等規模較行業價格低84%。同時,阿里雲百煉平台還為所有新用戶贈送超5000萬tokens及4500張圖片生成額度。
今年以來,伴隨生成式AI的快速發展,阿里雲頻頻因大規模產品降價引發行業關注。今年2月,阿里雲宣佈全線下調雲產品售價,平均降幅超20%,最高降幅達55%;4月,阿里雲宣佈海外市場全線降價,覆蓋全球13個地域節點部署的核心雲產品、500多個產品規格,平均降幅23%,最高降幅59%;5月,阿里雲旗下通義千問多款商業化及開源模型進行大幅降價,其中Qwen-Long API輸入價格降至0.0005元/千tokens,直降97%;輸出價格降至0.002元/千tokens,直降90%。
系列降價舉措下,百度智能雲、騰訊雲、火山引擎等雲廠商的陸續參與降價,直接推動國內AI大模型及與之密切關聯的雲計算領域捲入了激烈的價格競爭中。
周靖人指出,阿里雲降價主要是通過技術優化實現的,通過把模型推理效率、雲基礎設施能力、模型結構等各方面能力提升上來,進而實現對於模型推理成本的進一步下降。“我們希望把AI技術的紅利給到我們的企業級用戶和開發者,因為我們認識到,需要有效推動整個AI行業的發展,只有這樣才能更有效地展開各種各樣的AI應用研發。”
在周靖人看來,阿里雲推動AI大模型價格戰的下探,與公司的開源戰略、魔搭戰略、全尺寸出新策略等都是一脈相承的,邏輯都是希望把AI能力能夠賦能給更多的開發者、企業。
推出“AI搜索平台”,定位B端搜索
2024雲棲大會現場,伴隨400多場並行話題和論壇展開之時,阿里雲還邀請到了百川智能、月之暗面Kimi、智譜AI、零一萬物等知名AI大模型創企參展,集中展示了各家的技術、產品以及應用創新。
與此同時,阿里雲也展示了旗下通義千問、通義萬相、魔搭社區等產品應用,在倡議開放、開源的同時,也不忘親自下場“創造”實踐,積極參與生成式AI的行業競爭。
值得注意的是,在集中展示阿里雲底層技術的“計算”B館,阿里雲還首次展出了隸屬於計算事業部的“AI搜索平台”產品,一度令人產生阿里雲將要殺入搜索領域,開始做搜索的疑惑。
新浪科技瞭解到,目前,阿里雲“AI搜索平台”主要定位於B端搜索,致力於為企業級客戶提供內部知識庫檢索、RAG增強等技術能力。與Google、百度等通用搜索並不具備正面競爭關係。
不同於傳統IT時代,AI時代對基礎設施的性能、效率要求更高,CPU主導的計算體系已快速向GPU主導的AI計算體系轉移。阿里雲在全面重構底層硬件、計算、存儲、網絡、數據庫、大數據等基礎設施能力時,也正積極投身參與到AI應用研發,AI場景適配、融合等工作中,致力於構造起全新的AI時代基建。
據阿里巴巴集團董事兼CEO、阿里雲智能集團董事長兼CEO吳泳銘開幕式上介紹,“當前的新增算力市場中,超過50%以上的算力需求現在都由AI驅動產生,AI算力的需求滲透率已經超過50%,已經佔據主導地位,未來這一趨勢還會持續地擴大。”
積極擁抱AI的同時,阿里雲也正全面投入升級AI大基建中。“為應對GPU算力的指數級增長需求,尤其是即將爆發的推理市場,阿里雲已經準備好了。”周靖人表示。