深勢科技發佈全球首個統一三維生成和理解的跨尺度科學模型 Uni-3DAR,能碾壓擴散模型 256%

深勢科技與北京科學智能研究院、北京大學,推出全球首個通過自回歸下一 token 預測統一 3D 結構生成與理解的科學大模型 Uni-3DAR。

Uni-3DAR 整體架構

該模型創新性地解決了 3D 建模領域數據表示割裂和任務建模孤立兩大核心痛點:第一,數據表示不統一,第二,建模任務不統一。

為此,Uni-3DAR 提出同時創新構建兩大核心技術:

1、Compressed Spatial Tokens 統一微觀與宏觀 3D 結構:Uni-3DAR 提出了一種層次化、由粗到細的 token 化方法,充分利用了 3D 結構固有的稀疏性,通過八叉樹分解、精細 token 化與二級子樹壓縮,不僅大幅降低了數據表示的複雜度,而且實現了從微觀到宏觀 3D 結構的統一表示,為後續自回歸生成與理解任務提供了高效、通用的數據基礎。

2、Masked Next-Token Preiction 統一生成和理解的自回歸框架:基於 Masked Next-Token Prediction,此設計使不同任務對應的 token 在模型內部彼此獨立、互不幹擾,從而支持聯合訓練。同時,自回歸特性也便於將其他模態數據(例如自然語言文本、蛋白質序列、儀器信號等)統一到單個模型,進一步提升模型的泛化能力和實用性。

該框架首次將自回歸範式引入 3D 建模領域,打破生成與理解的邊界,並支持與文本、蛋白質序列等多模態數據融合。未來計劃拓展至宏觀力學(如氣候模擬)、多模態科學模型開發(融合科學文獻與實驗數據),推動構建「物理世界通用語言」,加速藥物設計、新能源材料等領域的顛覆性創新。