永別了，GPT-4！

04月12日 12:51 新浪網 tech-auto-hilite

新智元報導

編輯：Aeneas 好睏

【新智元導讀】GPT-4時代，落幕了！它將被GPT-4o完全取代。而下週，我們也極有可能迎來GPT-4.1、o3 滿血版以及o4-mini這些新模型。大模型進化史，再次迎來關鍵節點。

猝不及防地，GPT-4就這樣退出歷史舞台了。

4月10日，OpenAI正式宣佈，即將從ChatGPT中移除兩年前推出的GPT-4。

從4月30日起，GPT-4將被當前的預設模型GPT-4o完全取代。

不過，懷念GPT-4的用戶們也不必悲傷，它仍然可以通過OpenAI API繼續使用。

不過，在GPT-4退休之前，人們的注意力很可能就會轉向ChatGPT的新模型。

如今各種爆料已經傳得漫天飛，據說，GPT-4.1（包括GPT-4.1-mini、GPT-4.1-nano和GPT-4.1），去年12月宣佈的o3 「推理」模型，以及o4-mini全新推理模型都要來了。

遙想2023年3月14日，GPT-4正式發佈，席捲全球，在全球掀起滔天巨浪，然後在兩年內，引爆了全球AI大模型的寒武紀大爆發。

它的出現，開啟了一個全新的時代，見證了一場技術井噴的大爆發，鋪墊了後續無數OpenAI大模型的繁榮。

如今，這座燈塔終於要退出了。

GPT-4，已成歷史塵埃

Perplexity CEO Aravind Srinivas最近表示，AI的進步已經跨越了臨界點——三個月的時間，彷彿就已經跳過了一章歷史。

「我們應該期待，在今年賸餘的時間里，變化會來得更快。」

的確，就在過去短短三個月裡，我們迎來了DeepSeek R1、原生圖像生成、o3-mini等重磅炸彈，如今2025年也不過剛過去了四個月。

在AI圈的眾多消息中，連GPT-4的退出都顯得不那麼驚爆了。

昨天的更新日誌中，OpenAI表示，現在GPT-4o已經成為了GPT-4合格的繼任者。

近期的升級，提升了它的指令跟隨、問題解決和對話流暢性。評估中，GPT-4o在寫作、編碼、STEM等方面始終優於GPT-4。

確實，現在很多人都已經不記得，自己上一次用GPT-4是什麼時候了。

雖然它確實給很多人帶來了美好的回憶，甚至讓人一度以為AGI已經來了。

還記得2023年3月，GPT-4推出時全網歡呼的盛況嗎？

當時，它在ChatGPT和微軟的Copilot網頁版聊天機器人中上線，引起全網驚呼。

這個模型具備多模態能力，能同時理解圖像和文本，正式開啟了AI「看圖說話」的時代，這在OpenAI的模型中尚屬首次，可謂石破天驚。

相比於GPT-3.5，GPT-4是一次更重大的認知躍遷。

它是首個在專業學術基準中達到哈佛、史丹福畢業生水平的大模型。

它在數學、醫學、法律之類的考試中擊敗大多數人類；在SAT、LSAT、美國律師資格考試中交出驚人答卷，能達到TOP 10%。

它的多模態架構，也為後續的模型演進提供了核心藍本。

從此，大模型能力的閾值徹底提升至可用級，引爆了全球的AI應用生態，將生成式AI市場從百億規模推升至萬億的量級。

它推動了Code Interpreter的誕生，為開發者提供了無限助力，間接推動了開源生態。

那時，幾乎每天一個勁爆消息。那是OpenAI的高光時刻，它的一舉一動都牽動著全世界的目光。

當時，全網都在猜測GPT-4的訓練成本。後來奧特曼透露，GPT-4的訓練成本超過了1億美元。

終於，在23年11月，速度更快、成本更低的GPT-4 Turbo上線，接替了它的地位。

GPT-4，經典高光時刻

還記得這些輝煌時刻嗎？

下一個模型是GPT-4.1

就在前一天，The Verge獨家爆料稱，OpenAI正準備發佈一系列全新模型——包括GPT-4.1（含GPT-4.1 mini和GPT-4.1 nano）、滿血版o3，以及神秘的o4系列（o4-mini、o4-mini-high）。

其中，作為多模態模型GPT-4o改進版的GPT-4.1，最快將在下週面世。

目前，AI工程師Tibor Blaho已經在ChatGPT網頁代碼中發現了對這些模型的引用。

不過，GPT-4.5都來了，為什麼下一個卻是GPT-4.1？這個越來越倒退的命名規則，實在令人摸不到頭腦。

它在OpenAI大模型譜繫上，實在有點前不著村後不著店，不知該放在什麼位置。

有人讚歎道：看到從GPT-1到o系列以及更高級別的演變，展示了不斷增加的複雜性和能力。這就像觀察人工智能的進化史！

關於GPT-4.1，現在坊間已經有了蛛絲馬跡。

比如有人發現，在ChatGPT的模型列表中，竟然已經出現了GPT-4.1這個選項。

這就意味著，此前泄露的小道消息是真的！這就讓大家非常興奮。

但也有人懷疑該網民是造假，把網址從GPT-4o改為了GPT-4.1。

為了證實清白，這名網民大方分享出了自己和GPT-4.1的對話鏈接。

因此大家確認，這名網民並沒有撒謊，或偽造截圖，因為順著這個對話鏈接檢查，會發現model-slug確實是GPT-4.1。

很快，有越來越多的人發現自己也能用GPT-4.1了。

此外，也有網民推測，奧特曼口中的「Quasars Alpha」，就是GPT-4.1。

為保o3發佈，測試時間大幅縮短

而FT的報導也再次證實，滿血版o3下週很可能再次上線。

知情人士透露，由於Meta、Google、xAI這些對手逼得實在太緊，OpenAI為了保持自己的技術優勢並從中獲利，不得不加快模型的發佈速度。

為此，曾經需要數月時間進行的模型「評估」——測試模型的風險和性能，如今已被壓縮到了只有短短的幾天。

比如即將退休的GPT-4，就有著長達6個月的評估期。其中一些危險能力，正是在測試進行了兩個月後才被發現的。

但現在給到的時間和資源，已經不足以進行全面的測試來識別和規避風險了。

此前，OpenAI曾承諾構建定製版的模型來評估潛在的濫用風險，例如是否可能助長生物病毒提高傳播能力。

但這種方法成本很高，不僅要聘請外部專家，還要創建諸如病毒學這類的專業信息數據集，並將其「喂」給模型來進行微調，消耗大量的工程師和計算資源。

很明顯，OpenAI不想在這件事上花太多精力——他們只對能力較弱的舊模型做了微調，沒有用到更強、更先進的模型上。

比如，在1月份發佈的o3-mini安全與性能報告中，只提到了GPT-4o只會在微調後才能執行某項生物學任務。至於o1和o3-mini如何，OpenAI卻隻字未提。

另外，還有一個令人擔憂的問題是，安全測試針對的並不是最終向公眾發佈的模型，而是更為早期的「檢查點」（checkpoints）。在這之後，模型還會繼續更新來提升性能和能力。

面對這些質疑，OpenAI回應稱，其評估流程已通過引入自動化測試等方式提高了效率，從而縮短了所需時間。

「雖然目前還沒有一套公認的方案，但OpenAI採用的方法肯定是最優的，並且已在報告中公開透明地進行了說明。」

此外，OpenAI還表示，測試所用的檢查點與最終發佈的版本「基本一致」。

參考資料：

https://x.com/whylifeis4/status/1910719046665884006

https://www.ft.com/content/8253b66e-ade7-4d1f-993b-2d0779c7e7d8

OpenAI will soon phase out GPT-4 from ChatGPT