OpenAI首席科學家Nature爆料:AI自主發現新科學,世界模型和RL是關鍵

近日,《自然》雜誌獨家專訪了OpenAI首席科學家Jakub Pachocki,他揭示了推理模型、強化學習如何賦予AI自主發現科學的能力,並分享了AI如何在五年內重塑科學研究與經濟格局的雄心。

ChatGPT推出後,迅速震驚了全球。

自那以後,OpenAI一直站在AI技術發展的最前沿。

去年9月,他們推出o系列模型,再次引領AI推理的浪潮。

到今天,推理模型已成主流。

最新、最強的模型,比如o3、Gemini 2.5 Pro、DeepSeek-R1,都是推理模型。

這些模型可以通過思維鏈(CoT),一步一步地「思考」來解決問題。比如,幫助研究人員潤色文章、編寫代碼、回顧文獻,甚至是提出假設。

可以說,OpenAI的迅速崛起極大推動了這次的AI革命。

在這其中,有個人一直在OpenAI扮演著關鍵角色。雖然很少有人聽說過他。

這就是OpenAI的首席科學家Jakub Pachocki。

2024年以來,Jakub Pachocki一直是OpenAI的首席科學家2024年以來,Jakub Pachocki一直是OpenAI的首席科學家

Pachocki在2017年從學術界加入到OpenAI。在此之前,他是一名理論計算機科學家和競技程序員。

現在,Pachocki領導一項最先進的AI系統開發,這些系統旨在解決科學、數學和編程中的複雜任務。

就在昨天,《自然》雜誌對Pachocki做了一次專訪,探討了AI能否做出獨立研究、通用人工智能(AGI),及公司即將推出的開源模型等熱門話題。

文章地址:https://www.nature.com/articles/d41586-025-01485-2?utm_source=x&utm_medium=social&utm_campaign=nature&linkId=14414809

以下是採訪精彩對話。

推理模型有多重要?

現在,你能和一個AI對話,但它還只是個需要不斷被引導的助手。

我(Pachocki,下同)覺得接下來這種情況會有很大改變。

我們已經看到,像OpenAI的Deep Research這種AI工具,可以在沒有人監督的情況下持續工作10到20分鐘,給出一份有用的結果。

但是,目前用於解決這些需求的計算量還不大。

強化學習有多重要?

第一階段的ChatGPT版本涉及一個無監督的預訓練階段。在這個階段,模型會吞下海量的數據,並構建出某種「世界模型」。

然後,我們通過使用人類反饋的強化學習,訓練出一個有用的AI助手。

最近在推理模型上的進展,可以看作是更加重視強化學習的結果。

這樣,我們就不只是在提取知識,還使模型能夠找到自己的思考方式。

一個問題是,我們是否應該繼續將這些學習階段分開來考慮。

推理模型不是在真空中學習如何思考的,它們根植於一個預訓練模型。

我的很多關注點在於如何將模型的不同階段、方法結合起來,理解它們之間的相互作用。

模型真的會思考嗎?

首先,我們需要清楚,AI的運行方式與人腦不同。

預訓練的模型學到了一些關於世界的知識,但它並沒有真正理解它是如何學會這些事情的,也搞不清它學習這些事情的時間順序。

但我堅信我們有充分的證據表明模型能夠發現新科學

我會說這是一種「推理」,但這並不意味著它跟人類的推理方式一樣。

在探索AI推理能力的同時,OpenAI也在考慮如何通過開源模型推動科學進步。

奧特曼說的新開源模型

對於這個問題,我特別興奮。尤其是能給研究人員提供一個開源的模型權重(他們可以下載並進一步訓練)。

隨著這些模型變得越來越強大,我們越來越有責任去理解在不同的方式下部署它們會如何影響大家。

我覺得要發佈頂尖的前沿模型並開源權重會很睏難,因為有安全方面的顧慮。

我想我們(OpenAI)發佈的模型得比現有的開源模型更好。

AGI的定義是什麼?何時達到?

我對AGI的定義及時間預期都發生了很大的變化。

剛進研究生院時,我覺得AGI的一個裡程碑是能精通圍棋,得花上幾十年的時間。

結果,2016年這個目標就實現了。這對我來說簡直是震撼世界的時刻。

2017年加入OpenAI時,我還是公司里對AGI最大的質疑者之一,但新的突破接踵而來。

在圖靈測試上,我們已經取得了很多的進展。數學和問題的解決能力也進步很快,我覺得最難的基準測試也會很快被突破。

所以,我現在思考的下一個重大里程碑——是AI能產生實實在在、可量化的經濟影響,特別是能夠創造全新的科學研究

這對我來說是最接近我心目中AGI的感覺。我們現在正聚焦於此,我預計在5年內會有非常大的進展。今年,人工智能可能還不會解決主要的科學問題,但幾乎可以自主地編寫有價值的軟件。

據報導,微軟和OpenAI已同意使用經濟指標來衡量AGI的進展,具體目標是實現1000億美元的投資回報。這種方式與Pachocki定義的AGI相匹配。

Pachocki的願景表明,AI不僅將成為科學研究的助手,更可能在未來五年內重塑全球經濟與創新格局。

參考資料: 

https://www.nature.com/articles/d41586-025-01485-2?utm_source=x&utm_medium=social&utm_campaign=nature&linkId=14414809 

本文來自微信公眾號「新智元」,作者:新智元,36氪經授權發佈。