AI大模型掀起“軍備競賽”,商湯“日日新”如何先發製人?

ChatGPT引發的大模型熱潮依然洶湧,吸引著企業和資本爭相湧入。

在市場喧囂之前,商湯科技在對AI基礎設施SenseCore大裝置進行研發投入的路上已經走過了多年,甚至顯得有些孤獨。

2023年,AI賽道被重新點燃,厚積薄發的商湯科技終於曬出了深耕AI領域多年的成果。4月10日,商湯分享了以“大模型+大算力”推進AGI(通用人工智能)發展的戰略佈局,並公佈了“日日新SenseNova”大模型體系,推出自然語言處理、內容生成、自動化數據標註、自定義模型訓練等多種大模型及能力。

在活動現場和直播平台上,商湯大模型引發了觀眾轟動:“超出預期”“主播和UP主要失業了”。更有投資者發出感歎:商湯大模型目前幾乎秒殺前期已經發佈的其他大模型。

對商湯科技而言,從2014年成立開始,其對大模型及相關技術的積累就貫穿企業生命線之中。此間,質疑也好、讚譽也罷,商湯始終堅持著自己的獨特發展路徑。

多年前瞻佈局

2022年末,大模型ChatGPT橫空出世掀起市場熱潮,資本終於意識到了超大模型的研發價值。一夜之間,AI投資再度火熱,國際大廠紛紛入局;二級市場上,人工智能概念股更被炒作得“沸反盈天”。

但,人工智能產業發展永遠不是依靠投機和市場情緒的追逐,技術才是“硬道理”。

“在商湯,我們這麼多年來一直在積極投入建設超大規模的算力,也一直在訓練越來越大的模型。”商湯科技董事長兼CEO徐立在技術交流日上表示。

2018年,商湯開始了AI大模型的研發,一年之後已經具備了千卡並行的系統能力。那兩年是商湯在大模型研發的起步。2019年,商湯自研了一個10億參數的CV大模型,實現了當時業界最好的算法效果。

2022年,商湯科技人工智能計算中心(AIDC)在上海臨港正式投用,成為SenseCore大裝置的重要算力基座,也是亞洲最大的人工智能計算中心之一。

經過5年的探索,商湯建設的AI大裝置已處於業界領先,大裝置上總共有27000塊的GPU芯片卡,可以輸出5.0 exaFLOPS的總算力,是亞洲目前最大的智能計算平台之一。基於大裝置的能力,商湯已構建了計算機視覺、自然語言處理、AI內容生成、多模態、決策智能等多個領域的大模型,持續演進能力並廣泛支持各種應用。

至今,商湯科技仍保持著穩定、高水平的研發投入。2022年,商湯科技研發投入達到40.14億元。同時在2022年,商湯科技的人均研發效率持續提升,人均每年研發模型數相較於2021年進一步提高了90%,達到9.35個。

商湯此次發佈的“日日新SenseNova”大模型體系下的語言大模型,以及AI文生圖創作、2D/3D數字人生成、大場景/小物體生成等一系列生成式AI模型及應用,是商湯大模型技術突破的最新動向,更是這些年商湯依託AI大裝置SenseCore實現“大模型+大算力”融合創新研發體系下的成果展示。

具體來看,在“日日新SenseNova”模型下,各應用各有特色,比如:

“秒畫SenseMirage”文生圖創作平台,展現了光影真實、細節豐富、風格多變的強大的文生圖能力,可支持6K高清圖的生成;客戶還可根據自身需求訓練生成模型。

商湯表示, “秒畫SenseMirage”是一個包含商湯自研AIGC大模型和便捷的LoRA訓練能力,並提供第三方社區開源模型加速推理的創作平台,旨在為創作者提供更加便利、完善的內容生產創作工具。

“秒畫SenseMirage”不僅融合了超10億參數的商湯自研文生圖生成模型,還支持一鍵導入多個平台的開源模型或上傳用戶本地模型並對其進行特異性推理加速優化,結合自研模型及訓練能力,用戶可免除本地化部署流程,並基於開源模型自訓練模型,高效地生成更多樣的內容。

在商湯技術交流會現場演示環節中,不僅演示了基於商湯自研AIGC模型的作圖(MiaoHua team作品),也介紹了用戶可導入開源模型並通過秒畫平台對該模型加速推理(作畫)的能力”。

商湯秒畫文生圖效果

“如影SenseAvatar”AI數字人視頻生成平台,僅需一段5分鍾的真人視頻素材,就可以生成出來聲音及動作自然、口型準確、多語種精通的數字人分身。

“瓊宇SenseSpace”“格物SenseThings”3D內容生成平台,可以高效低成本生成大規模三維場景和精細化的物件,為元宇宙、虛實融合應用打開新的想像空間。

大模型驅動產業升級

依靠領先的“大模型+大裝置”技術路徑,商湯科技在國內人工智能領域拔得頭籌,建起以AI賦能的四大業務板塊——智慧生活、智能汽車、智慧商業與智慧城市,搶先實現商業化。

商湯發佈的2022年報顯示,營收來源呈現多頭並進的趨勢,業務收入格局更為均衡健康。

其中,智慧生活業務在2022年出現爆炸式增長,營收規模同比增長130%,收入金額達到9.55億元,衝擊10億元大關。另一項同比增長達到59%的收入來源為智能汽車業務。該項業務貢獻收入從上年同期的1.84億元一口氣增長至2022年的3億元。

兩項業務在商湯科技的營收貢獻也有較大提高,占比分別從2021年的9%和4%提升至25%和8%。原先收入占比較高的智慧商業與智慧城市業務,在2022年收入占比與智慧生活和智能汽車兩大新興業務呈現板塊輪動趨勢。

不難發現,商湯更專注在服務B端客戶。商湯認為,AI大模型發展最本質的是要解決生產力的進步問題。而在上述業務增長的背後,到處可見商湯大模型的身影。

比如商湯“SenseAuto絕影”智能汽車平台,以SenseCore商湯Al大裝置為基石,以SenseAuto Empower絕影賦能引擎為底座,通過智能車艙、量產智能駕駛及車路協同構成全棧體系,全面賦能國內外車企客戶的智能化升級戰略。目前來看,商湯絕影智能駕駛覆蓋L1-L4的全棧自研自動駕駛技術。接下來,商湯的目標是打通L1至L4的全棧軟件算法能力。

智慧生活業務更是商湯科技賦能生產力升維的生動體現。去年公司智慧生活整體收入大幅增長,主要是智慧生活AI內容生成(AIGC)、AI傳感器、AI ISP芯片、智慧醫療四項產品實現商業化突破。披露的數據顯示,在智能手機和智能終端領域,商湯科技提供AI SDK、AI傳感器和AI ISP芯片的產品組合,為客戶提供強大的AI能力。2022年,搭載商湯AI SDK的新增量產智能手機達4.5億台。

隨著商湯科技“日日新”大模型體系不斷優化,未來將更大程度上驅動產業升級。

從技術交流日來看,“日日新SenseNova”為政企客戶提供了多種靈活的API接口和服務,包括圖片生成,自然語言生成,視覺感知通用任務與標註服務。客戶可根據實際應用需求,調用“日日新SenseNova”大模型的各項AI技術能力,低門檻、低成本、高效率地實現各類AI應用。

“日日新SenseNova”也已為商湯的自身業務帶來了諸多突破。例如在智能駕駛領域,基於視覺大模型,商湯實現了可識別3000類物體的BEV環視通用感知算法的實車量產,也構建了感知決策一體化的自動駕駛多模態模型,帶來更強的環境、行為、動機解碼能力。

更大範圍內破局AGI

商湯科技在AI領域留給外界的想像不止於此。

市場人士認為,“日日新SenseNova”帶來的這些強大而易用的內容生成能力,將會改變內容生產行業的生產範式,突破內容創意的天花板,將會重塑內容生產行業生態並打開新的增長空間。

浙商證券就指出,大模型將商湯在CV領域的深厚積累予以變現,多模態實力超預期看好商湯充分利用CV技術經驗,通過跨模態和三維化相結合形成模型差異化競爭優勢,並在遊戲、直播等領域打開商空間。

值得注意的是,無論是語言大模型,還是文生圖或數字人生成,都離不開大規模AI基礎設施的算力支持。商湯AI大裝置SenseCore,擁有行業領先的算力輸出能力、超大模型訓練及大規模推理能力,將會成為AGI和大模型時代的基礎設施服務領導者。

當前業界訓練大模型,對大算力的需求非常旺盛,真正好用的基礎設施十分稀缺。“在AI大模型時代,數據、算法和算力這三要素在經曆新的演變,大模型參數量將以指數級速率提升,而數據量隨著多模態的引入也將大規模增長,因此必然會導致對算力需求的劇增。”徐立表示。

“我們以AI大裝置SenseCore打造AGI時代的基礎設施,並基於此將大模型體系命名為‘日日新SenseNova’,寓意‘苟日新、日日新、又日新’,希望在模型的迭代速度及處理問題的能力上可以日日更新,不斷解鎖AGI的更多可能。”他補充道。

據悉,基於AI大裝置SenseCore和“日日新SenseNova”大模型體系,商湯麵向行業夥伴提供涵蓋自動化數據標註、自定義大模型訓練、模型增量訓練、模型推理部署、開發效率提升等多種大模型即服務。

“基於預訓練大模型的自動化數據標註可實現相較於人工數據標註近百倍的效率提升。”商湯科技聯合創始人、大裝置事業群副總裁陳宇恒介紹,“而模型推理部署服務可將大模型推理效率提高100%以上,降低用模型提供服務的成本。”此外,商湯也向行業開發人員開放大量預訓練模型及AI開發工具鏈,全面賦能開發效率。

“AGI催生了新的研究範式,即基於一個強大的多模態基模型,通過強化學習和人類反饋不斷解鎖基模型新的能力,從而更高效地解決海量的開放式任務。AGI將實現從‘數據飛輪’到‘智慧飛輪’的演進,最終邁向人機共智。”商湯科技聯合創始人、首席科學家王曉剛表示:“商湯已建立了全棧的大模型研發體系,並已在多個行業場景中落地,場景的多樣性,任務的複雜度,數據的豐富度均充分展示了我們大模型的能力和未來潛力。”

可以說,在當前的AI競賽中,商湯科技因其長期主義和獨特的技術路徑,找到了關鍵破局點,走出了一條新商業模式。