OpenAI蘋果化:ChatGPT就是iOS ,幾分鐘造出的Agent要代替App

作者|週一笑

郵箱|zhouyixiao@pingwest.com

當地時間10月6日,OpenAI在舊金山舉辦DevDay 2025開發者大會。在大會正式開場前5小時,AMD與OpenAI的合作消息公佈,OpenAI將在未來數年部署高達6GW(千兆瓦)的AMD Instinct GPU。AMD已向OpenAI發行最高1.6億股認股權證,行權條件與芯片部署進度及股價里程碑掛鉤,如果OpenAI全額行權,可能獲得AMD約10%的股權,AMD股價一度暴漲30%。

有開發者「抽水」「又被資本操作搶戲」,也有人認為這是刻意編排,先講底層算力,再講上層工具,恰好符合OpenAI從芯片到模型到應用的一體化敘事。

回到這次DevDay上,OpenAI發佈了Apps SDK(在ChatGPT內構建應用的完整框架)、AgentKit(快速構建AI Agent的工具套件)、Codex正式版以及GPT-5系列和Sora2等模型的API。Sam Altman開場公佈了一組增長數據,開發者數量從2023年的200萬增長到400萬,翻了一番。ChatGPT的周活躍用戶從1億飆升至8億,增長了8倍;API每分鐘處理的token量從3億暴漲到60億,這是20倍的增長。

8億周活意味著超級應用,這個體量已經具備了成為平台的基礎設施。DevDay中Apps SDK是最值得關注的重點,它標誌著ChatGPT更像一個平台和操作系統了。Altman的判斷很直接,AI已經從人們玩耍的東西,變成了人們每天構建的東西。這次DevDay的目標,就是讓更多開發者能直接在ChatGPT上構建應用和Agent,並且在這個擁有8億用戶的平台上開發和分發。

OpenAI開始蘋果化了。

Apps SDK:在ChatGPT內做應用

OpenAI曾經嘗試過讓開發者在ChatGPT上構建應用,那就是2023年推出的GPTs。但GPTs本質上只是Prompt模板,能力有限且生態混亂,已經被OpenAI放棄。去年底Anthropic推出了MCP開放標準,試圖為AI應用互操作性提供統一框架,而今天發佈的Apps SDK,則是OpenAI基於MCP標準,再次嘗試讓ChatGPT成為一個應用平台。

Apps SDK是一個完整的開發框架,讓開發者能在ChatGPT內部構建真正的交互式應用。開發者可以用TypeScript或JavaScript編寫後端邏輯,通過MCP接口連接數據、觸發操作,並渲染完全交互式的用戶界面。這不是簡單的API調用,而是在ChatGPT對話框里運行的「小程序」。

舉幾個現場演示的例子就能明白它的能力,Coursera應用可以在對話中嵌入影片播放器,用戶邊看課程邊向ChatGPT提問;Zillow能展示可篩選的交互地圖,用戶說「找帶院子的三居室」,地圖實時過濾結果;Canva則能直接根據對話生成海報,並把海報轉換成完整的PPT。

OpenAI還推出了應用對話(Talking to Apps)機制。Apps SDK提供了一套API,允許第三方應用將內部上下文實時暴露給ChatGPT。當你在Coursera應用里看到影片第5分鐘,ChatGPT知道你正在學什麼章節,當你在Zillow地圖上點開某套房子,ChatGPT能準確理解你關注的是哪個地址、什麼價位。深度集成讓對話式交互真正有了實用價值。

現場演示中,當演示者說「Spotify,給我週五派對做個歌單」,ChatGPT自動調出Spotify應用,屏幕上顯示「使用Spotify生成此答案」的提示,幾秒後歌單就出現在對話框里,可以直接點擊播放。整個過程流暢自然,就像在iOS上切換App一樣。

首批合作應用包括Booking.com、Expedia、Figma、Spotify、Zillow、Canva和Coursera,未來幾週還會加入DoorDash、Uber、Target、OpenTable等。Apps SDK今天開放預覽版,開發者可以在Developer Mode中測試應用。今年晚些時候,OpenAI將開放正式提交通道,並提供應用目錄供用戶瀏覽。

面向Apps SDK開發者的設計規範配圖

Altman還透露了商業化計劃,Apps SDK未來將支持新的Agentic Commerce Protocol,允許用戶直接在ChatGPT內部即時結賬。

很多人會問GPTs不是已經失敗了嗎,Apps SDK會重蹈覆轍嗎?GPTs門檻接近零代碼,但能力也被局限,回覆始終是一條條消息。

Apps SDK則是代碼為中心。開發者需要在自己的服務器上編寫真正的應用代碼,實現MCP服務器接口,聲明OAuth 2.0登錄和交互式UI組件。ChatGPT只是把App嵌入對話流里,真正的邏輯、狀態管理和數據存儲都在開發者手中。Apps可以彈出富交互組件(地圖、表單、影片播放器)、長時間保持session,並可在後台自行拉取和推送數據。換句話說,GPTs是模板,Apps in ChatGPT是完整的小程序。

GPTs和GPTStore既不像App Store那樣標準化,也不像插件那樣通用,多數GPT缺乏區別化價值,用戶難以形成持續使用習慣,開發者又難以變現、用戶難以發現優質內容,最終生態陷入空轉。

Apps SDK則完全不同。開發者必須通過實名驗證、服務器驗證和功能測試才能上架。審核前置,並引入了年齡分級和權限管理,類似App Store的標準。Altman還暗示會有更正式的收入分成方案。

在ChatGPT上,一個新的iOS的雛形就這樣長了出來。

AgentKit:8分鐘造出的Agent

Apps SDK構建的是ChatGPT的應用生態,而AgentKit則是OpenAI給開發者提供的Agent開發工具箱。Altman的判斷是,AI已經從「你提問的系統」進化到「能為你做很多事情的系統」,也就是Agent。但他也坦言,符合定義的Agent成功落地的很少。

AgentKit是一個完整的工具套件,包含四個核心組件:

Agent Builder,這是一個可視化畫布平台,讓開發者能像使用Canva一樣拖拽設計Agent的邏輯、步驟和工作流。它建立在OpenAI的Responses API之上,支持if-else邏輯節點、循環、用戶審批節點、文件搜索和數據轉換等模塊化組件。開發者可以從預設模板開始(如客服機器人、數據增強、文檔對比),也可以從零搭建自定義流程。

ChatKit,一個可嵌入的聊天界面組件。開發者可以把這個界面集成到自己的網站或應用中,帶來ChatGPT級別的對話體驗,同時保留自己的品牌、工作流和產品特色。它能處理流式響應、管理對話線程、顯示模型思考過程,讓集成聊天UI的複雜工作變得簡單。

Connector Registry,一個企業級的連接管理中心。管理員可以通過控製麵板統一管理Agent如何連接內部工具和第三方系統,設置權限、監控使用情況,同時保證安全性和合規性。

Agent Evals(評估工具),提供性能測量和優化能力。包括逐步追蹤評分(Trace Grading,理解Agent的決策步驟)、評估數據集、自動化提示詞優化,以及在OpenAI平台上直接對外部模型運行評估的能力。

在現場OpenAI工程師Christina Huang8分鐘的演示中。她從零開始,用Agent Builder構建了一個名為Ask Froge的DevDay網站Agent。快速地將一個靜態的會議網站創建一個智能問答助手,以提升用戶體驗。

她先設置了Agent的基本指令,然後添加了預構建的Guardrails(防護欄)用於PII信息掩碼,接著連接了DevDay的日程數據,最後加入了自定義Widget來顯示會議時間表。整個過程不到8分鐘,Agent就部署到了DevDay官網,觀眾可以現場訪問使用。

企業案例中,零售巨頭Albertsons用AgentKit構建了幫門店經理分析銷量的Agent,當某個品類銷量下降(比如冰淇淋),系統會基於季節性趨勢、歷史數據和外部因素(天氣、節假日)給出診斷和建議。營銷軟件公司HubSpot則用它改進了Breeze AI客服工具,Agent能整合知識庫、查找當地治療方案和保險政策細節,生成更有針對性的回覆。Box、Canva和Evernote也已開始使用該平台。

Altman說這是我們當初造第一個Agent時希望擁有的工具。降低門檻的邏輯很清晰,讓更多人能造Agent,OpenAI才能搶佔Agent開發生態的製高點。

而這個生態的門檻因為模型能力提升而足夠低的時候,app就會被agent們替代。

Codex和模型更新

除了應用和Agent,OpenAI還宣佈了一系列基礎設施更新。

Codex正式可用,OpenAI的軟件工程Agent Codex結束研究預覽,進入通用可用(GA)階段。Codex現在運行在專門訓練的GPT-5-Codex模型上,這個模型在代碼重構和代碼審查等Agentic編程任務上表現更出色。自8月初以來,Codex的日均消息量增長了10倍,已處理超過40萬億個token。

過去兩三個月裡,開發者社區能明顯感覺到Codex很火。一方面,OpenAI用GPT-5-Codex把”AI代碼這條垂直賽道往前推了一步,在代碼質量和推理能力上形成優勢,另一方面,Codex提供了價格透明、場景統一、穩定可預期的開發體驗。相比之下,不少開發者抱怨Claude Code存在限流、質量波動等問題,甚至有人已經把主要精力轉到Codex上。這次正式發佈,是OpenAI在代碼生成領域持續發力的一步。

OpenAI展示了內部數據,工程師在使用Codex後,每週完成的Pull Request數量提升了70%,幾乎所有OpenAI的PR都經過Codex審查。Codex還新增了三個企業功能:Slack集成(可以直接在團隊頻道里讓Codex寫代碼或回答問題)、Codex SDK(讓開發者在自己的工作流中嵌入Codex能力)、以及管理工具(包括環境控制、監控和分析儀表板)。

模型和API更新方面,GPT-5 Pro API向所有開發者開放,這是OpenAI目前最智能的模型,專為需要高精度和深度推理的場景設計,如金融建模、法律文件分析和醫療診斷,定價為每百萬輸入token 15美元、每百萬輸出token 120美元。

OpenAI剛剛發佈全新的Sora 2模型及同名Sora App,應用上線後迅速走紅,Sora 2、Sora 2 Pro API也進入預覽階段,這個新一代影片生成模型在可控性上有巨大飛躍,能根據詳細指令生成風格化、構圖精良的影片,還能配上豐富的聲音景觀、環境音頻和同步音效。Sora 2 輸出每秒 0.1 美元,Pro 輸出每秒0.3 美元。

GPT-Realtime-Mini則是一個更小、更便宜的語音模型,比之前的高級語音模型便宜70%,但音質和表達力保持一致。OpenAI認為語音將成為人們與AI互動的主要方式之一,更經濟的模型能讓語音應用更快普及。

平台化的野心

這次DevDay最重要的信號是,ChatGPT不再只是一個Chatbot,而是正在成為一個完整的應用平台。Apps SDK讓開發者能觸達8億用戶,AgentKit降低了Agent開發門檻,Codex提升了軟件開發效率。OpenAI正在構建一個從應用分發、開發工具到基礎設施的完整生態。

蘋果推出App Store時,沒人想到十年後會有幾百萬個App。OpenAI推出了Apps SDK,現在的問題不是Agent是否會替代App,而是開發者們是否真的會來,在ChatGPT上「Build something new」。