強如Operator也怕驗證碼,1450元花得值嗎?第一波實測來了
夢晨 發自 凹非寺
量子位 | 公眾號 QbitAI
要花1450元才能玩到Operator,讓本來滿滿期待的大夥,一下難受住了。

而交了錢的各位,開始興奮的曬出各種測試結果。
有網民分享,Operator通過瀏覽網頁在3分鐘之內幫打找到了附近牙醫診所,回報了地址和電話。

也有人讓它作為研究助手,在arXiv上挨個打開每篇論文,看完後輸出總結。

也有「壞人」專門出難題,看AI如何應對:讓Operator到ChatGPT官網使用Operator會如何?
但沒想到OpenAI預判了他的預判,直接給出一個嘲諷式報錯。
試得好,下次別試了。

強如Operator,上網衝浪時也會被驗證碼難住,但好在它學會了向人類用戶求助:
我遇到了一個驗證碼……你能接管並幫我搞掂嗎?

沒錯,這隻是一個早期預覽版。
參與發佈直播的基礎研究貢獻者(Fundamental Research Contributor)Casey Chu認為,它會犯錯誤,但它讓你提前窺見未來。
而且他的這個帖子,就是Operator寄幾發的,成功套娃了:

核心貢獻者(Core Contributor)Yilong Qin認為,測試時間計算的Scaling Law在這裏繼續發揮威力。
給Agent更多時間,它會內省、更新、一遍又一遍地嘗試直至最終成功。

同為核心貢獻者的姚順雨表示,有了強化學習的新範式,Operator的進步速度會像從o1-preview到o3一樣。

同時他介紹,Agent是OpenAI(甚至是AI)誕生以來就有的目標,在發展過程中做了多次嘗試。
但只有發現GPT和草莓(o1)兩種新範式後,Agent的潛能才真正被解鎖。
2025年將是Agent之年。

他為什麼這麼說?還要從OpenAI成立之初講起。
OpenAI的十年Agent之路
早在2016-2017年,OpenAI就通過Word of Bits和Universe探索了讓AI操作瀏覽器上網。
Word of Bits由OpenAI與史丹福大學合作,參與者包括大家熟悉的Karpathy和Jim Fan、史丹福大學副教授Percy Liang等,以及姚班校友施天麟。

施天麟只在OpenAI工作了一年,隨後在2017年創辦了Cresta,業務正是AIAgents方向,專注於為客服中心提供各種AI助手。
2024年11月,Cresta完成1.25億美元D輪融資,總融資金額達到2.7億美元。

OpenAI Universe則是一個Agent訓練和測試的平台。他們從李飛飛的ImageNet上受到啟發,希望能把圖像識別任務上的快速進步複製到Agent領域。
2017年的Universe已經能讓AI完成一些簡單的瀏覽器操作,以及玩Atari遊戲等任務。

但隨後不久,OpenAI就把主要精力從強化學習轉向了語言模型GPT系列上。
2021年底,到了GPT-3時代,OpenAI不忘初心推出WebGPT,使用基於文本的Web瀏覽器更準確地回答開放式問題。

這項研究把GPT-3回答開放式問題的真實性和有用性從20%-30%提升到了40%-80%,但仍未達到人類平均水平。

WebGPT的作者中,有4位也出現在最新的Operator貢獻名單里,分別是歐陽龍,Christina Kim,Reiichiro Nakano,Kevin Button。
其中Reiichiro Nakano(中野禮一郎)是Operator項目的研究主管之一,也出現在了發佈直播中。

△Sam Altman,Yash Kumar,Casey Chu,Reiichiro Nakano
最新的Operator背後模型命名為CUA(Computer Use Agent),與此前的探索相比,有了幾項重大突破:
-
多模態理解帶來「感知」能力,由GPT-4o提供。
-
長上下文作為「任務視野」,讓Agent能連續執行任務長達20分鐘。
-
o1式的思維鏈推理,這種內心獨白使模型能夠評估其觀察結果、跟蹤中間步驟並動態適應。
參與、觀察了整個十年發展過程的Karpathy總結到:
Operator之於數字世界,就像人形機器人之於物理世界。
在數字世界的發展速度要比物理世界更快,因為翻轉比特的成本相比移動原子只有約1/1000。
……
與其說2025年是Agent年,不如說2025-2035年是Agent的十年。

World of Bits
https://proceedings.mlr.press/v70/shi17a/shi17a.pdf
Universe
https://openai.com/index/universe/
WebGPT
https://openai.com/index/webgpt/
Operator
https://openai.com/index/openai-gym-beta/
參考鏈接:
[1]https://www.reddit.com/r/singularity/comments/1i8fi3l/openai_operator_finds_me_an_in_network_dentist/
[2] https://x.com/omarsar0/status/1882545077219926031
[3]https://x.com/liambolling/status/1882565960697282812
[4]https://x.com/caseychu9/status/1882507704566235407
[5]https://x.com/yilongqin/status/1882507643669123230
[6]https://x.com/liambolling/status/1882565960697282812
[7]https://x.com/karpathy/status/1882544526033924438