商湯科技大語言模型出爐:名為「商量SenseChat」

新京報貝殼財經訊(記者羅亦丹)國內大語言模型又添一員。

2023年4月10日,商湯科技舉辦技術交流日活動,分享了以「大模型+大算力」推進AGI(通用人工智能)發展的戰略佈局,並公佈了商湯在該戰略下的「日日新SenseNova」大模型體系,推出自然語言處理、內容生成、自動化數據標註、自定義模型訓練等多種大模型及能力。其中,商湯最新研發的大語言模型被命名為「商量SenseChat」。

作為千億級參數的自然語言處理模型,「商量SenseChat」在活動現場展示了多輪對話和超長文本的理解能力。商湯也展示了語言大模型支持的幾項創新應用,包括:編程助手,可幫助開發者更高效地編寫和調試代碼;健康諮詢助手,為用戶提供個性化的醫療建議;PDF文件閱讀助手,能輕鬆從複雜文檔中提取和概括信息。

商湯科技董事長兼CEO徐立表示:「在AI大模型時代,數據、算法和算力這三要素也在經歷新的演變,大模型參數量將以指數級的速率提升,而數據量隨著多模態的引入也將大規模增長,因此就必然會導致對算力需求的劇增。我們以AI大裝置SenseCore打造AGI時代的基礎設施,並基於此將大模型體系命名為‘日日新SenseNova’,寓意‘苟日新、日日新、又日新’,希望在模型的迭代速度及處理問題的能力上可以日日更新,不斷解鎖AGI的更多可能。」

活動上,商湯不僅展示了「日日新SenseNova」大模型體系下的語言大模型,還展示了AI文生圖創作、2D/3D數字人生成、大場景/小物體生成等一系列生成式AI模型及應用,並公佈了商湯依託AI大裝置SenseCore實現「大模型+大算力」融合創新的研發體系。

商湯展示了「日日新SenseNova」的各種AI文生圖創作、2D/3D數字人生成、大場景/小物體生成等一系列生成式AI模型及應用,其中「秒畫SenseMirage」文生圖創作平台,展現了光影真實、細節豐富、風格多變的強大的文生圖能力,可支持6K高清圖的生成;客戶還可根據自身需求訓練生成模型。

「如影SenseAvatar」AI數字人影片生成平台,僅需一段5分鐘的真人影片素材,就可以生成出來聲音及動作自然、口型準確、多語種精通的數字人分身。

「瓊宇SenseSpace」和「格物SenseThings」3D內容生成平台,可以高效低成本生成大規模三維場景和精細化的物件,為元宇宙、虛實融合應用打開新的想像空間。

「AGI催生了新的研究範式,即基於一個強大的多模態基模型,通過強化學習和人類反饋不斷解鎖基模型新的能力,從而更高效地解決海量的開放式任務。AGI將實現從‘數據飛輪’到‘智慧飛輪’的演進,最終邁向人機共智。」商湯科技聯合創始人、首席科學家王曉剛表示。

編輯 王雨晨

校對 柳寶慶