商湯“日日新SenseNova 5.0”宣佈升級，大模型性能超越GPT-4 Turbo

04月23日 21:34 新浪網 tech-auto-hilite

新浪科技訊 4月23日晚間消息，在商湯科技SenseTime技術交流日活動上，商湯發佈“雲、端、邊”全棧大模型產品矩陣，以滿足不同規模場景的應用需求，同時宣佈升級“日日新SenseNova 5.0”大模型體系，綜合能力全面對標GPT-4 Turbo。

據介紹，基於超過10TB tokens訓練、覆蓋大量合成數據，全新的“日日新SenseNova 5.0”（以下簡稱：日日新5.0）採用混合專家架構，推理時上下文窗口可以有效到 200K 左右。

本次更新主要聚集增強了知識、數學、推理及代碼能力，全面對標 GPT-4 Turbo，主流客觀評測上達到或超越 GPT-4 Turbo。在多模態能力上，商湯多模態大模型的圖文感知能力在多模態大模型權威綜合基準測試MMBench中綜合得分排名首位，在多個知名多模態榜單MathVista，AI2D，ChartQA，TextVQA，DocVQA，MMMU 取得領先成績。

商湯科技董事長兼CEO徐立表示：“商湯在尺度定律的指導下，會持續探索大模型能力的KRE三層架構（知識-推理-執行），不斷突破大模型能力邊界。”（文猛）