百度王海峰:文心一言用戶規模達4.3億
封面新聞記者 孟梅 付文超
“文心一言的用戶規模達到4.3億。”11月12日,以“應用來了”為主題的百度世界2024在上海舉辦,百度首席技術官王海峰在會上宣佈了這一數據。除用戶規模外,王海峰還解讀了文心大模型最新技術及應用,如檢索增強的文生圖、無代碼產品秒噠、文心快碼等。
大會現場,繼百度創始人李彥宏宣佈文心大模型日均調用量已超過15億,王海峰公佈了文心一言用戶規模達到4.3億。自去年3月16日發佈文心一言以來,百度文心大模型不斷升級,知識增強、檢索增強以及智能體等技術也在不斷進化。
據王海峰介紹,在檢索增強方面,百度研發了“理解-檢索-生成”協同優化的檢索增強技術,提升了大模型技術及應用效果;面向不同應用場景的生圖需求,進一步研發了檢索增強的文生圖技術,既可以生成精確的圖片,也可以進行泛化生圖。
那麼,大模型是如何做到這一點的呢?
首先,基於大模型對用戶的需求進行分析理解,自動規劃精確或泛化方案,比如對哪些實體進行增強;接著在增強階段,對需要增強的實體,檢索並選擇相應的參考圖。最後在生成階段,自研了多模可控生圖大模型,一方面,通過局部注意力計算,在保持實體特徵不變的情況下,實現了圖像的高泛化生成,比如根據牛頓的肖像,生成繪本風格的牛頓;另一方面,通過整體注意力計算,進行高精確的圖像生成,比如生成圖中的汽車跟原圖片保持完全一致。
同時,王海峰分享了多智能體在代碼場景里的應用——秒噠和文心快碼。秒噠採用了智能體的中心化模式,其中的代碼智能體通過場景知識的增強,提升了複雜代碼生成的質量與穩定性,高效實現用戶需要的功能。智能代碼助手文心快碼升級至3.0版本,現場王海峰進一步演示了文心快碼完成系統的功能開發、代碼測試和問題修復等能力。在開發全流程中,多個智能體流水線協同,大幅提升了程式員的工作質量和效率。
大模型、智能體等技術發展迅速,而這些技術如何更高效率、更低門檻應用於產業呢?
據瞭解,面向產業需求,百度打造了文心大模型矩陣,包括ERNIE 4.0 Turbo等旗艦大模型、ERNIE Speed等輕量模型,以及基於基礎模型生產的系列思考模型和場景模型,滿足不同應用的需要。而在這背後,文心大模型和飛槳深度學習聯合優化,持續創新,提升了模型效果、訓練效率和推理性能,支撐了文心大模型的廣泛應用。王海峰現場披露,飛槳文心開發者數量已達1808萬,服務了43萬家企業,創建了101萬個模型。