阿里雲周靖人:發佈通義千問2.5,堅持做開源大模型

作者:金旺

2023年4月,通義千問正式面世,阿里的大模型征程就此進入大眾視野。

在過去一年里,阿里雲通義千問對內經曆了多次產品升級和迭代,對外經曆了百模大戰和持續開源。

時隔一年後,5月9日,阿里雲在北京召開AI智領者峰會,大會上,阿里雲CTO周靖人正式發佈了通義千問2.5版本,與此同時,“通義千問APP”正式更名為“通義APP”。

在這一年,全球不需要大量基礎大模型成為共識,有競爭力的基礎大模型開始收斂到10家以內,對於阿里雲來說,如何圍繞基礎大模型和開源大模型打造出更完善的生態就成了一個關鍵問題。

總結過去一年發展曆程,周靖人在大會上指出,“從2022年9月發佈通義系列模型以來,如今我們的API日調用量已經過億。”

在這個過程中,阿里雲通義系列大模型已經服務了包括新浪微博、中國一汽、完美世界、藍淩科技在內的9萬家企業用戶。

其中,作為阿里雲通義千問最早的用戶,微博目前已經將大模型技術應用到了AI評論、AI明星陪聊、虛擬角色帳號、星座大模型、信息流廣告創意生成等場景,據微博COO、新浪移動CEO王巍透露,借助AIGC技術,微博打造了官方評論機器人“評論羅伯特”。

如今,“評論羅伯特”擁有超百萬粉絲,已經成了百萬粉絲博主。

作為剛剛因電動汽車發佈爆紅全網的小米,同樣是阿里雲通義大模型的用戶。

據悉,小米的人工智能助手小愛同學基於阿里雲通義大模型在強化其在圖片生成、圖片理解等方面的多模態AI生成能力,並在小米汽車、音箱、手機等多類硬件產品中落地應用。

小米集團小愛總經理王剛指出,“通過使用大模型技術,小愛同學活躍用戶次日留存率提升了10%,中長尾問答類問題的回答滿意度從30%-40%提升到了80%。”

大會上,阿里雲正式對外發佈了通義千問2.5,全新的通義千問2.5在各方面性能上進行了一系列升級:

在文檔處理能力方面,通義千問2.5單次可處理多達1000萬字的長文檔,可以同時解析100份不同格式的文檔;

在音視頻理解能力方面,通義千問2.5可以精準高效地進行音視頻文件的識別理解、摘要總結、多語言翻譯,可同時上傳處理50個音視頻文件;

在智能編碼能力方面,通義千問2.5集成了通義靈碼,可以幫助用戶隨時隨地在手機上寫代碼、讀代碼、學習編程技能。

發佈會現場,周靖人還將通義千問2.5與自家的通義千問2.1版本和GPT-4 Turbo進行了性能對比。

從大會上的對比數據可以看到,相較此前的通義千問2.1版本,通義千問2.5的理解能力、邏輯推理、指令遵循、代碼能力分別提升了9%、16%、19%、10%;而在OpenCompass的測評結果中,通義千問2.5的得分也已經追平GPT-4 Turbo。

在這次大會上,阿里雲還對通義大模型進行了品牌升級,“通義千問APP”正式更名為“通義APP”,通義APP集成通義大模型全棧能力,並免費為所有用戶提供服務。

作為開源大模型的堅實擁躉,自2023年8月以來,阿里雲陸續開源了十數款模型,據官方公佈數據顯示,目前通義開源模型下載量已經超過了700萬。

也是在這場發佈會上,阿里雲官方表示,通義千問最新開源的1100億參數模型在多個基準測評收穫最佳成績,超越Meta的Llama-3-70。

據悉,目前阿里雲通義系列模型參數規模橫跨5億到1100億,小尺寸模型有0.5B、1.8B、4B、7B、14B參數規模,可用於手機、PC等端側設備部署;大尺寸模型有72B、110B參數規模,能支持企業、科研級應用。

此外,阿里雲還開源了視覺理解模型Qwen-VL、音頻理解模型Qwen-Audio、代碼模型CodeQwen1.5-7B、混合專家模型Qwen1.5-MoE。

此外,作為阿里雲構建的模型開源社區——魔搭(ModelScope)已經擁有模型數量超過4500個,用戶規模超過500萬。

周靖人在大會上表示,“今天我們可以很自豪地講,阿里雲是全球唯一一家既在持續做(大)模型開發,又做大量(大)模型開源的公司。”