5分鐘直出46頁論文!GoogleDeep Research完爆OpenAI,最強Gemini 2.5加持

新智元報導  

編輯:桃子 犀牛

【新智元導讀】GoogleDeep Research重大升級,搭載全球頂尖Gemini 2.5 Pro模型。5分鐘生成46頁學術論文、複雜報告轉為10分鐘播客。性能超OpenAI DR 40%,價格僅為其1/10。

今早,GoogleDeep Research迎來史上最強升級,正式搭載了Gemini 2.5 Pro全球頂尖模型。

這一次,新版本在以下方面得到顯著的提升:

  • 分析推理:邏輯更清晰,結論更有深度

  • 信息整合:從海量數據中快速提煉要點,化繁為簡

  • 報告洞察力:生成的報告不僅詳盡,還能提供獨到的見解。

GoogleCEO劈柴哥轉發力撐。首席科學家、Gemini負責人Jeff Dean也出來為Deep Research站台。

可見Google內部對這款產品的重視程度。

相較於OpenAI DR,Google在整體性能上飆升超40%。此外,在指令遵循、全面性、完整性、寫作質量方面,GoogleDeep Research性能躍升很大。

在內部測試中,GoogleDR生成的報告深受評估者青睞,程度遠超其他領先DR工具2倍多。

這意味著,不論你需要分析複雜問題,還是撰寫高質量報告,DR都能得心應手,節省數小時的時間。

不過,這次的升級將率先為Gemini Advanced訂閱用戶開放,僅需19.99美元,要比OpenAI DR(200美元/月)整整便宜10倍。

只需登錄網頁版、安卓版、或是iOS版GeminiApp,均可第一時間體驗新功能。

而現在,已經有一大批網民開啟測試,效果足夠驚豔。

5分鐘搞掂46頁論文+播客

量子物理學家、AI研究科學家ChrisUniverse第一時間對Gemini 2.5 Pro驅動的Deep Research做了測試。

體驗之後他被深深震撼到了,「我們正處於技術和信息爆炸的奇點,速度前所未有。」他寫道。

作為一名物理學家,ChrisUniverse讓GoogleDR研究了過去五年納米技術的突破。

僅僅這一個提示,GoogleDR就自己找到並研究了339個網站,生成了一篇長達46頁的完整學術論文。

論文列舉了5個全球知名的納米技術實驗室,詳細總結了他們過去五年的重要技術突破以及未來的計劃。

論文地址:論文地址:

https://docs.google.com/document/d/1uxexZharvJJ8ScVFmhrDrFfiYtiSmQ9oeYkZBBxwDZ8/edit?tab=t.0

除此之外,論文中還通過表格對這五家研究機構做了詳細的橫向對比。

如果擔心AI的幻覺問題,那也沒關係,GoogleDR在結尾列出了十幾頁的數據來源鏈接。

這還不算完,如果你看到這份46頁的論文比較頭疼,那麼再加一句提示詞,GoogleDR立馬幫你把論文轉成一個10分鐘的播客!

這樣你就可以把一篇枯燥的學術論文變成一個類似真人的對話訪談,聽著理解其中內容。

更厲害的是,所有這些過程一共還不到5分鐘!

ChrisUniverse表示,現在自己瞭解了全球頂尖的5家納米科技公司,包括它們的核心實驗室、突破性成果,以及未來5年的重點方向。

「這些信息要是放在2年前,可能得花我幾天甚至幾週時間去研究,說不定還更久。」他說。

ChrisUniverse自己也沒想到GoogleDR如此好用,已經好到讓他無話可說了。

另一位AI大佬Kol Tregaskes提供一個話題——如何讓AGI與人類價值觀對齊,GoogleDR在極短時間內,直出46頁報告。

他表示,這次改進比Gemini 2.0版本加持DR報告長度更多,而且與OpenAI DR相當。這從側面印證了,Google基準測試中,DR的完整性是最強的。

而且,在報告文末,一共引用了138參考鏈接,在生成過程中查閱了足足179個參考網站,對於人類來說,一個時間根本看不完。

報告地址:https://docs.google.com/document/d/1e4qMho_5p-yfCx6Dqx8BhjW79qEg4C30uj1f1SKCA8k/edit?tab=t.0

禾頓商學院教授Ethan Mollick將課堂一項作業扔給GoogleDR——為一種採用新型光譜技術、成本75美元的食物熱量檢測設備進行定價及總體可獲取市場(TAM)分析。

他驚喜地發現,Gemini 2.5加持的DR不僅完美完成分析,還提供更多深度洞察。

要知道,這類分析通常消耗數小時。

雖然一片叫好之聲,網民Giulio Leone也指出了GoogleDR的一點問題。

他表示,雖然Gemini 2.5 Pro加持的DR非常強大,但一旦達到token數量限制,報告就會中斷。

Giulio認為,Google應該讓報告的生成可以無縫銜接,否則會在嚴肅的研究中受限。

勝券在握,DeepMind註定會贏?

不難看出,在AI激烈角逐中,GoogleDeepMind正以無可匹敵的優勢嶄露頭角。

從數據到硬件,從模型到人才戰略,他們似乎已經掌握了通往AGI的所有關鍵要素。

幾天前,Artificial Analysis一份報告中,展示了Google在應用、基礎模型、雲服務、加速器硬件四大關鍵領域全面開花。

網民@ai_for_success分析稱,GoogleDeepMind具備了海量的數據優勢,依託Google生態系統的龐大資源,為訓練更強大、更智能AI提供堅實基礎。

而目前,DeepMind擁有業界公認的最優模型陣容,涵蓋了多個領域。

比如,綜合性能最強的旗艦模型Gemini 2.5 Pro;推理模型Gemini 2.0 Flash兼具速度與實用性;Veo 2成為影片生成領域的翹楚。

不僅如此,他們還手握TPU這張王牌,專為深度學習任務優化,性能和效率遠超傳統GPU。

再加上Google自身龐大的分發渠道,能夠讓DeepMind的成果無縫集成,迅速抵達全球用戶。Google Cloud更是為AI提供高效部署平台。

這不,一年一度Google Cloud Next今晚將在拉斯維加斯召開,屆時還會帶來更多新品。

與此同時,Google開發者關係負責人Logan Kilpatrick也在頻頻暗示這周的重大發佈。

在人才方面,GoogleDeepMind更是通過激進的「競業禁止協議」,牢牢地鎖住了AI頂尖人才。

據BI爆料,DeepMind部分英國員工在離職後,需遵守長達6-12個月的競業協議,在此期間不得為競爭對手工作。

為了確保這些人才不流向對手,他們甚至還會為部分員工提供「花園休假」(garden leave),即在競業期繼續支付薪金,但員工務虛工作。

與其讓人才立即跳槽至對手公司,Google寧願花錢讓他們休假一年。

一位前DeepMind員工無奈地表示,「在AI這個圈子,一年後再入職,誰會簽你」?

的確,在AI日新月異的當下,6個月空窗期就可能讓人錯誤無數機會,更不用說整整一年。

就連微軟AI副總Nando de Freitas曾公開抨擊了這種做法,稱其為「濫用權力」。

Google這種做法,無非只有一個目的,在AGI競賽中拔得頭籌。

前Google員工甚至表示,「當前AI熱潮如同『太空競賽』,這是我職業生涯中看到如此瘋狂的戰爭。領先6個月或是1年,可能就意味著一切」。

大模型、人才、數據、硬件,GoogleDeepMind幾乎在這場終極賽的每個環節,都佔據了製高點。

AGI終點尚不明朗,但至少現在,他們已經手握勝券的所有籌碼。

參考資料:

https://x.com/GeminiApp/status/1909721519724339226

https://x.com/testingcatalog/status/1909725934846116209

https://x.com/ChrisUniverseB/status/1909744703504793952

https://blog.google/products/gemini/deep-research-gemini-2-5-pro-experimental/?utm_source=tw&utm_medium=social&utm_campaign=og&utm_content=&utm_term=