OpenAI發佈可獨立操作電腦的智能體 智譜已「搶跑」
新京報貝殼財經訊(記者羅亦丹)香港時間1月24日,OpenAI首席執行官山姆·奧特曼現身直播間,演示了OpenAI的新智能體Operator(操作員)。根據演示,該智能體可以在用戶向電腦端輸入一段需求後,自動開始執行任務。用戶即便「放開雙手」,智能體也可以自動執行下去,其所有操作可以在桌面上顯示。

例如,當直播人員在對話框中輸入去某飯店訂桌的需求後,Operator自動打開網頁進入了預訂網站,搜索到餐廳並完成了網上預訂。而上傳一張寫有「雞蛋、蘑菇」等食物的購物清單後,Operator就自動打開了瀏覽器去買菜網站上進行搜索並將這些食物放進了購物車。不過值得注意的是,在付款環節其會要求用戶手動操作。
山姆·奧特曼表示,Operator的發佈是OpenAI進入Level 3(等級三)的開始,在未來幾週和幾個月內還將推出更多智能體。根據此前OpenAI發佈的「從人工智能到通用人工智能的五個等級」,等級三是智能體,等級四是可以進行創新的人工智能,等級五則是能夠完成組織工作的人工智能。
不過,值得注意的是,在OpenAI發佈Operator前一天,國內AI「六小虎」之一的智譜更新了其電腦智能體大模型GLM-PC(中文昵稱為牛牛),該AI代理智能體早在去年11月就已經開放內測,並在今年1月23日進行了深度思考模式的更新。有開發者對貝殼財經記者表示,Operator在影片中所展示的內容,GLM-PC也完全可以做到。
二者的相同之處在於, 輸入的模態(圖像感知)、輸出的操作空間(點擊、滾動、輸入)一致,並且都做了敏感性檢測,讓用戶在敏感時刻(例如確認提交等)接盤操作,以及都有推理和一定程度的自反饋。不同之處在於,Operator現階段主要針對網頁,而GLM-PC針對電腦的任何操作(也包括瀏覽器)。
編輯 王進雨
校對 柳寶慶