專訪朱嘉明:大模型快速高質發展,未來兩三年或邁向2.0時代
伴隨著人工智能的快速發展,各種大模型技術也持續飛躍,尤其是自國產大模型DeepSeek的推出,低成本、高效能的AI產品以席捲之勢融入我們生活和工作的方方面面。然而,在這個過程中,就業替代、信息虛假傳播等倫理與社會問題也逐漸浮現並引發關注和思考。
如何看待大模型目前發展的階段?各行各業紛紛與DeepSeek等大模型深度融合,這是機遇還是挑戰?大模型發展背後,如何平衡其成本、效率和創新的問題?新京報圍繞相關話題採訪了經濟學家、橫琴數鏈數字金融研究院學術與技術委員會主席朱嘉明。

經濟學家、橫琴數鏈數字金融研究院學術與技術委員會主席朱嘉明。
新京報貝殼財經:自DeepSeek火爆之後,各種大模型蜂擁而來,怎麼看待當前大模型推出的速度和質量?
朱嘉明:整體來看,大模型正在呈現數量和質量兩個方面的演進。第一,在大模型的數量方面,加速增長,根據人工智能研究機構Epoch AI的統計數據,在ChatGPT推出的2022年,訓練算力超過1023次浮點運算的模型有22個,在2024年,這樣的模型已經有99個。第二,在大模型的質量方面,從2025年開始,大模型研發已經完成了從粗放到集約的歷史轉型,即從主要通過不斷增大參數量和數據規模來提升模型性能,轉變為強調算法架構創新、數據預處理與微調策略,以及硬件與能效的協同提升,乃至關注大模型的實際落地收益與相應的組織結構調整。
需要澄清的是,大模型領域雖然不存在權力的直接干擾,但並非無政府主義狀態,而是有嚴格且多元的標準體系與規範網絡共同構建的有序生態。只有滿足這些技術、倫理、平台和法律的要求,大模型才能獲得廣泛認可與應用。全世界全面滿足技術標準、社區準則和法律法規要求的大模型極為有限。大多數的人工智能生成式模型,其實是在開源大模型基礎上,針對應用目標的垂直領域進行參數優化的產物。
2025年的大模型研發還有一個更為重要的特徵:大模型正在展現前所未有的多模態的推理能力。大模型從語言中心向「內在多模態」架構轉變,強調跨模態主動推理和交互式反饋,以提升模型在複雜場景下的適應能力。新一代模型能夠同時處理文本、圖像、音頻、影片等多種格式,將各模態輸入映射到統一的嵌入空間,實現跨模態理解與推理。例如,OpenAI的o3模型支持對場景圖像進行空間變換(如縮放、旋轉)、圖文問答及工具調用,顯著增強了視覺+文本推理的深度和廣度。
大模型的發展方向變得越來越明朗。未來兩到三年里,隨著腦科學不斷揭示大腦運作的奧秘,量子技術也在加速成熟,兩者都有望與現有的AI大模型產生深度融合和交叉創新。這種新一輪的「碰撞」不僅會提高模型的計算效率和推理能力,還可能催生出更接近人類思維模式的智能體系,標誌著「大模型2.0時代」的來臨。與此同時,以大模型為核心的AI技術正在迅速走向市場。研發與部署成本持續降低,使得企業和個人都能更輕鬆地使用這些先進系統。無論是在智能家居、醫療診斷還是教育輔助中,這些模型正以前所未有的速度融入日常生活,悄然改變人們的工作與娛樂方式。
新京報貝殼財經:如何理解該標準?
朱嘉明:大模型研發是存在標準的。大模型的發展離不開一套由業界、學術界和標準組織共同製定並不斷更新的評估與認證標準。這些標準在形成過程中依賴多方參與與共識,並隨著模型能力的提升不斷推進,體現了「標準-挑戰-突破-再標準」的動態循環。首先,領先團隊或企業發佈具有顯著創新的大模型,確立行業新基準;之後,其他團隊圍繞該基準發起攻關,改進模型架構、訓練方法或多模態融合技術;然後,關鍵技術或應用場景取得新的性能躍遷,推動模型達到更高水平;最後,突破成果成為新的行業標杆,開啟下一輪競爭與共創循環。
這一循環模式使得大模型生態不但在性能上不斷升級,也在標準體系、數據集構建與測試方法等方面同步演進,形成良性、共贏的技術創新環境。
新京報貝殼財經:目前國內的大模型處於什麼階段?
朱嘉明:國內大模型已進入普及化和大眾化階段,使用人數持續快速增長,應用正從通用場景向金融、工業、政務、司法、民生等行業縱深滲透。但嚴格來說,這隻是起步,真正的產業深度結合仍需更多落地探索,預計在下半年以後隨著政策供給和資金投入的進一步加碼,產業化部署和規模化應用將顯著提速。
國內大模型呈現互補功能格局,沒有單一模型能在所有指標上全能表現。不同類型的人工智能模型協同並進的體系正在形成,以滿足不同場景的多元需求。
在物理形態領域,中國已實現關鍵技術突破並大規模部署工業機器人。2023年中國安裝了逾27萬台工業機器人,是日本的6倍、美國的7倍,佔全球安裝量的51%。
新京報貝殼財經:大模型1.0和2.0的根本區別是什麼?
朱嘉明:大模型的1.0時代主要基於深度學習中的Transformer架構,不斷在規模和微調技術上迭代;而2.0時代則有望突破Transformer本身的限制,通過引入類腦計算和量子計算等全新範式實現性能和效率的跨越。
自從OpenAI的GPT系列模型問世,以Transformer為核心的大模型進入1.0時代。該階段主要依靠不斷擴大參數規模、豐富訓練數據,以及引入人類反饋強化學習、稀疏注意力和混合專家等技術提升生成質量與效率。DeepSeek憑藉多步預測和計算稀疏化手段,將推理性能追平Llama 3.1,而最新「o3」版本通過激進剪枝與並行化策略,進一步降低了延遲與成本。
然而,隨著算力投入回報遞減,大模型研發人員已將目光投向2.0時代。下一代模型將突破Transformer固有的二次方複雜度限制,採用線性化或稀疏化注意力,實現更長上下文的高效管理;並有望在類腦神經形態芯片上通過異步、事件驅動的架構顯著提升能效。同時,量子-經典混合計算模式正逐步成熟,通過可參數化量子電路完成部分推理,在文本分類和語言建模任務中展現出與傳統模型相當卻更低能耗的潛力。
新京報貝殼財經:DeepSeek在成本控制上展現出巨大優勢,怎麼看待大模型推出背後成本和效率、創新的關係?
朱嘉明:DeepSeek在控制AI模型成本方面展現出顯著優勢,但對其創新成本的簡單比較忽略了代際演進和不同發展階段的成本結構差異。第一代創新往往伴隨著高昂的資源投入,而後續迭代則能借助先行經驗和技術優化實現「後進優勢」。在「0到1」階段,大量基礎設施建設和未知風險必然推高成本;進入「1到10」階段後,通過流程標準化和效率優化則有可能降低單位成本。儘管成本是衡量AI競爭力的重要指標之一,但並非唯一標準。為了持續保持領先,DeepSeek在下一步模型研發中仍需投入更高性能的芯片和基礎設施,這意味著其成本將呈上升趨勢。綜合來看,DeepSeek的成本控制策略在當下確立了競爭優勢,但其長期成本曲線依然受創新代際、更高性能需求以及基礎設施投入的推動而上揚。成本雖是重要指標,但需與性能、可持續性和技術迭代等多重因素並重評估。
新京報貝殼財經:AI 和大模型的發展如何重塑全球產業結構和經濟格局?
朱嘉明: AI作為一種全新工具,不僅催生出全新的產業形態,還將傳統行業置於必須適應其運作邏輯和基礎設施的境地,從而實現對傳統行業的重塑,而不是簡單地在既有框架下進行升級或改造。
需要注意到,智能體經濟與人機協同網絡正在興起。第一,AI 智能體正在脫離「應答者」身份,成為可以主動調度、決策與協作的經濟參與者,構建出以「智能體總線」為入口的分佈式運行環境。第二,垂直領域智能體憑藉對行業語言和需求的深度理解,率先掌握了資源配置與入口控制權。第三,不同智能體之間的價值交換與協作,正在孕育一種全新的「組織結構」,即人-機智能體共生的經濟網絡。
新京報貝殼財經:AI 和大模型廣泛應用的同時,也帶來了算法偏見、就業替代、信息虛假傳播等倫理與社會問題,怎麼看待這些問題的出現?
朱嘉明:AI在實現大規模數據處理和決策優化方面展現出顯著優勢,但也伴隨算法偏見和虛假信息傳播等風險。這些問題雖真實存在,卻並非AI應用的主流,而通過技術改進與制度治理可望在可預見的時間內得到有效緩解。各國正加速推進法規框架,以規範AI基礎設施建設與運行;與此同時,隨著業界經驗積累和公眾認知提升,對AI的誤解與誇大也將逐步消退。
AI本質上是一套處理海量、多源、高速數據的方法論,能夠彌補傳統手段在規模與複雜度上的不足。但是,公眾與決策者對AI的理解尚不均衡,部分「想像中的」風險被過度放大。
總體來看,AI正處於技術落地與社會認知的「雙重夾擊」中,隨著標準化制度的建立與技術自身演進,算法偏見和虛假信息等問題將逐步得到控制,AI處理大數據的核心優勢將更為凸顯。
新京報貝殼財經記者 胡萌 編輯 陳莉 校對 盧茜