OpenAI對標DeepSeek的開源模型要來了?奧特曼放話本週連放大招,突發新規限制使用

在最近的一次採訪中,OpenAI CEO Sam Altman 透露,ChatGPT 的周活躍用戶數已突破 4 億。他表示,全球約 10% 的人口在使用 OpenAI 的產品,這也意味著用戶總數接近 8 億。

然而,亮眼成績單背後卻是難掩的焦慮。這種「不安全感」最直觀的體現是,隨著今年 AI 競爭日趨白熱化,Sam Altman 在 X 平台發文宣傳的頻率也顯著增加。

一大早醒來,我們就看到 Altman 在 X 平台發文稱:

我們為你準備了很多精彩內容,就在接下來這一週!明天就正式開啟,敬請期待!

熟悉的配方,相似的味道,這已經是 Altman 第 N 次這樣預告了,按照慣例,這些「精彩內容」通常雷聲大雨點小,實際效果有待觀察。

不過,根據近期爆料,本週 OpenAI 的新品似乎確實有些看頭。

GPT-4.1:GPT-4o 多模態模型的全面升級版本,同時還將推出精簡版模型,包括 mini 和 nano 兩個版本。

o3、o4 mini、o4 mini high

Mogao:在圖像生成模型評測平台 Artificial Analysis 的Text-to-Image Arena 中以 1164 的高分力壓 GPT-4o。

A-SWE:宣稱具備「自主能力」的軟件工程師,可以獨立開發應用。

一款強大的接近前沿水平的開源模型。

GPT-4.1「偷跑」?還有一大波新模型來襲

在 OpenAI 的產品線中,大語言模型的更迭無疑是最值得關注的焦點。

去年 5 月,OpenAI 正式推出了多模態語言模型 GPT-4o,該模型可處理文本、音頻和圖像的任意組合輸入,並生成相應輸出。

前幾天 ,據 The Verge 報導,GPT-4.1 預計將於下週發佈,作為現有 GPT-4o 多模態模型的全面升級版本,同時還將推出精簡版模型,包括 mini 和 nano 兩個版本。

而在 GPT-4.1 發佈前,一款名為「Optimus Alpha」的神秘模型也因為在 AI 模型聚合平台 OpenRouter 的優異表現,而被認為是 OpenAI「偷跑」的 GPT-4.1 測試版。

據官方給出的數據顯示,Optimus Alpha 支持 100 萬token的上下文窗口,最大輸出為 32K,首個 Token 延遲中位數僅有 0.8 秒,輸出速度中位數為每秒 20.65 個 Token。

目前該模型已經處理了超過 1000 億 Tokens。

介紹中還提到,Optimus Alpha 主要面向現實世界中的任務,並提及了編程。當我們直接對話詢問其「你是誰,來自哪個版本的模型」,它表示自己是由 OpenAI 開發的 ChatGPT,基於 GPT-4 打造。

而據網民發現,Optimus Alpha 與此前的 Quasar Alpha 模型(目前已下線)似乎有著相似的關係。

此前,有網民發現在試圖用 Quasar Alpha 進行中譯英違規操作時,模型的拒絕回答方式與 OpenAI 的 GPT-4o 十分相似,而該違規操作似乎只有 OpenAI 的模型會出現拒絕。

據 AI 研究員 Sam Paech 發現,Quasar Alpha 與 GPT-4.5-preview 十分相近。

Altman 也曾發文暗示了 Quasar Alpha 的身份或為 OpenAI 模型的一員。

據實際測試,Optimus Alpha 再次重現了上述的中譯英違規問題。同時,Paech 也在最新的譜系圖中加入了 Optimus Alpha,而與其最接近的模型是上個月剛更新的 ChatGPT-4o。

從時間上顯示,Quasar Alpha 的下架時間是 Optimus Alpha 上線次日。結合上述信息來看,Optimus Alpha 與 GPT-4.1 之間或許存在某種聯繫,甚至很有可能是 GPT-4.1 的提前泄露版本。

此外,AI 工程師 Tibor Blaho 在挖掘 ChatGPT 網頁代碼時,也發現了 o4 mini、o4 mini high 以及 o3 的相關信息。

考慮到 The Verge 報導稱 o3 和 o4 mini 計劃於下週亮相,以及 Altman 也曾表示,o3 和 o4-mini 將很快發佈,顯然,發佈時間極有可能就在本週。

當然,基於 OpenAI 一貫的「畫餅」風格,通常在發佈現有產品後,還會拋出一個更大的「餅」,此前,Altman 宣稱 GPT-5 發佈暫緩,可能在幾個月之後才發佈,或許在本週,我們將看到更多消息。

力壓 GPT-4o,神秘 AI 圖生模型現身

在大語言模型之外,AI 圖像生成領域也出現了一些新動向。

一款名為 Mogao 的神秘 AI 圖像生成模型在評測平台 Artificial Analysis的Text-to-Image Arena 中以 1164 的高分力壓 GPT-4o,一舉登頂排行榜首位。

作為一個評估文本到圖像生成模型的平台,重要性頗高的 Text-to-Image Arena 通過收集人類偏好數據,參與者根據提示詞比較兩張生成圖像,選出更符合要求的那張。

每個模型生成超過 700 張圖像,涵蓋人物肖像、群體、動物、自然和藝術等多種風格。平台基於超過 4.5 萬條人類偏好數據,計算各模型的 Elo 分數,形成排行榜。

此前,OpenAI 憑藉 GPT-4o 全新的多模態生成能力,尤其是其吉卜力風格的圖像生成,狂攬百萬新用戶,其應用下載量、活躍用戶數和應用內訂閱收入也再創新高。

因此,嚐到甜頭的 OpenAI 趁勢推出新圖像模型,顯然也在情理之中。

更早些時候,Altman 發文暗示 OpenAI 正在開發「Image gen V2」。網民 @JasonBotterill3 也發現,當讓 GPT-4o 與 Mogao 基於同一提示詞生成圖片時,則會得到十分相似的視角。

據體驗過後的網民表示,Mogao 在文本生成方面表現平平,依然屬於擴散模型的範疇。並且,Mogao 的命名讓人聯想到莫高窟,也有觀點猜測其可能源自國內的 AI 廠商。

此外,OpenAI 近期更新了 API 訪問規則。未來,用戶需通過身份驗證(使用 OpenAI 支持國家/地區頒發的政府身份證件,且每 90 天一個證件只能驗證一個組織)才能訪問其最新大模型。

未通過驗證將影響模型使用,而訪問規則的收緊,或許也是為了本週 OpenAI 發佈的新產品護航。

All In Agent,AI 程序員 A-SWE 或登場

根據 OpenAI 的五級 AGI 理論,以 ChatGPT 為代表的聊天機器人屬於第一層,但正如 Altman 所強調的,ChatGPT 不是 AGI,它無法自主學習、改進自身或獨立完成複雜任務。

相比之下,處於第三層級的 Agent 則已經展露了 AGI 的雛形,能夠自主地執行任務、做出決策,並在較長時間內適應變化,且無需持續的人類監督。

OpenAI 算是國內外最早一批佈局 Agent 賽道的廠商之一。

除了早些時候發佈的 Operator,OpenAI CFO Sarah Friar 今年 3 月份在倫敦高盛峰會上的採訪影片也透露了一些細節:

接下來我們要推出的是我們稱之為 A-SWE 的產品。順便說一句,我們的營銷水平確實不是最強的(笑),A-SWE 指的是『自主型軟件工程師(Agentic Software Engineer)』。

她表示,A-SWE 不只是像現在 Copilot 那樣輔助你團隊中的軟件工程師,而是真正具備「自主能力」的軟件工程師,它可以獨立為你開發一個應用。

只需要像給普通工程師一樣提交一份 PR(Pull Request),它就能獨立完成整個開發過程。

它不僅能完成開發,還能做所有工程師最討厭的那些工作:它會自己做 QA(質量保障)、自己測試並修復 bug、還會寫文檔——這些通常很難讓工程師主動去做的事。所以,你的工程團隊戰鬥力將被極大地放大。

口號與現實之間往往存在差距。儘管 OpenAI 也曾渲染 AI 將取代程序員,但在 OpenAI 的招聘板塊,程序員的需求依然居高不下。

當然,觀察 OpenAI 新產品的動態,就不能僅局限於它一家。其他 AI 廠商的最新發佈同樣值得關注,屆時很可能會上演「狙擊」與「反狙擊」的精彩較量。

比方說,隨著 DeepSeek R2 的發佈臨近,Sam Altman 上週末也承認 OpenAI 在這方面行動較晚,強調他們正在開發一款強大的接近前沿水平的開源模型。

開源 AI 部署平台 Ollama 的官方推文也間接印證了這一消息,暗示 OpenAI 在開源戰略上即將有實質性的動作。

如無意外,本週將再次上演各家 AI 巨頭「秀肌肉」的名場面,從模型升級到開源策略,AI 產業的競爭正在全面鋪開,APPSO 將第一時間帶來最新報導。

你覺得 OpenAI 會發佈哪些新產品,也歡迎在評論區下方評論。

我們正在招募夥伴

📮 簡曆投遞郵箱hr@ifanr.com

✉️ 郵件標題「姓名+崗位名稱」(請隨簡曆附上項目/作品或相關鏈接)