商湯科技大語言模型出爐：名為「商量SenseChat」

新京報貝殼財經訊（記者羅亦丹）國內大語言模型又添一員。

2023年4月10日，商湯科技舉辦技術交流日活動，分享了以「大模型+大算力」推進AGI（通用人工智能）發展的戰略佈局，並公佈了商湯在該戰略下的「日日新SenseNova」大模型體系，推出自然語言處理、內容生成、自動化數據標註、自定義模型訓練等多種大模型及能力。其中，商湯最新研發的大語言模型被命名為「商量SenseChat」。

作為千億級參數的自然語言處理模型，「商量SenseChat」在活動現場展示了多輪對話和超長文本的理解能力。商湯也展示了語言大模型支持的幾項創新應用，包括：編程助手，可幫助開發者更高效地編寫和調試代碼；健康諮詢助手，為用戶提供個性化的醫療建議；PDF文件閱讀助手，能輕鬆從複雜文檔中提取和概括信息。

商湯科技董事長兼CEO徐立表示：「在AI大模型時代，數據、算法和算力這三要素也在經歷新的演變，大模型參數量將以指數級的速率提升，而數據量隨著多模態的引入也將大規模增長，因此就必然會導致對算力需求的劇增。我們以AI大裝置SenseCore打造AGI時代的基礎設施，並基於此將大模型體系命名為‘日日新SenseNova’，寓意‘苟日新、日日新、又日新’，希望在模型的迭代速度及處理問題的能力上可以日日更新，不斷解鎖AGI的更多可能。」

活動上，商湯不僅展示了「日日新SenseNova」大模型體系下的語言大模型，還展示了AI文生圖創作、2D/3D數字人生成、大場景/小物體生成等一系列生成式AI模型及應用，並公佈了商湯依託AI大裝置SenseCore實現「大模型+大算力」融合創新的研發體系。

商湯展示了「日日新SenseNova」的各種AI文生圖創作、2D/3D數字人生成、大場景/小物體生成等一系列生成式AI模型及應用，其中「秒畫SenseMirage」文生圖創作平台，展現了光影真實、細節豐富、風格多變的強大的文生圖能力，可支持6K高清圖的生成；客戶還可根據自身需求訓練生成模型。

「如影SenseAvatar」AI數字人影片生成平台，僅需一段5分鐘的真人影片素材，就可以生成出來聲音及動作自然、口型準確、多語種精通的數字人分身。

「瓊宇SenseSpace」和「格物SenseThings」3D內容生成平台，可以高效低成本生成大規模三維場景和精細化的物件，為元宇宙、虛實融合應用打開新的想像空間。

「AGI催生了新的研究範式，即基於一個強大的多模態基模型，通過強化學習和人類反饋不斷解鎖基模型新的能力，從而更高效地解決海量的開放式任務。AGI將實現從‘數據飛輪’到‘智慧飛輪’的演進，最終邁向人機共智。」商湯科技聯合創始人、首席科學家王曉剛表示。

編輯王雨晨

校對柳寶慶