商湯李星治:端側模型大有可為

新京報貝殼財經訊(記者韋英姿)7月3日,在2024新京報貝殼財經年會「‘通’往未來 向新有AI」主題論壇上,商湯科技數字文娛事業部副總裁李星治出席並在特別分享環節中表示,服務應用代表了當前大模型行業的痛點和難點。「我們講大模型、講AI這麼久,大模型新勢力做了一兩年,到底該往什麼方向變現?」李星治拋出這樣的問題。

商湯科技數字文娛事業部副總裁李星治

首先,他認為沒有算力儲備談大模型就是空中樓閣。數據顯示,商湯人工智能超算中心目前有45000卡,峰值算力12000P。

其次,他表示大模型廠商需要有較強的產品能力。以商湯為例,其大語言模型具備MoE(混合專家模型)結構、上下文文本等能力,「能夠與創業媒體合作,生成短期和深度報導」。

他還提出端側模型的重要性,並基於數據安全、成本、諮詢鏈的角度認為「端側大有可為」。他表示,將模型能力移植到端側應用,幾B的模型代替上百B的,將產生更快速度等意義。例如商湯日日新大模型功能移植到秒畫APP(AI內容創作社區平台)後,生成一張512K圖片僅需2秒。

如何發展端側應用?李星治建議:兼顧更多國內主流互聯網應用,上下兼容更多手機機型,對模型生產廠商來說,則是在算力平台的兼容性上向下兼容。

值得注意的是,商湯科技也在近期成為新京報貝殼財經「AI萬人迷」數字人技術合作夥伴。同時,在7月3日AI主題論壇發佈的《中國AI大模型測評報告——公眾及傳媒行業大模型使用與滿足研究》中,商湯AI數字人技術也入選為經典案例。當天,「AI萬人迷」在貝殼財經年會開幕禮上發佈了《2024上半年中國企業家信心指數》。

校對 楊許麗