Others

奧特曼「草莓」模型跳票，OpenAI淩晨大新聞，把網民整懵了

08月09日 12:45 新浪網 news-china-auto-hilite

機器之心報導

編輯：澤南、杜偉

GPT-5 大模型？不要太著急。

昨晚，很多人徹夜未眠，都在等待 OpenAI 的「大新聞」。

因為在本週三，OpenAI 創始人、CEO 山姆・奧特曼突然在 X 上發了一張照片。

奧特曼雖然偶爾會發一些心靈雞湯，但大多數的推文都是在宣傳公司的產品，人們看法很快達成了一致——此中必有深意。

有人展開解讀：四個紅草莓，其中還有一個未成熟的青色草莓，這不妥妥地是在說下一代 AI 大模型 GPT-5 要來了嗎？

奧特曼在回應網民時也在暗示，驚喜馬上就來。

這激起了人們的好奇心，預測 GPT-5 發佈的時間從草莓成熟所需要的 4 到 6 個星期，很快開展到了就在明天。

那就不用等了。今天淩晨，答案揭曉了。

OpenAI 發佈了基於最新一代大模型 GPT-4o 的全面安全評估。

新發佈的 GPT-4o System Card 是一份研究文件，概述了 OpenAI 在發佈最新模型之前採取的安全措施和風險評估。

GPT-4o 於今年 5 月公開發佈。在首次亮相之前，OpenAI 使用了一組外部紅隊或試圖尋找系統弱點的安全專家來查找模型中的關鍵風險。

在如今的大模型領域，這是一種相當標準的做法。新的安全測試將更多的精力集中在 GPT-4o 的音頻功能上，OpenAI 檢查了一系列風險，例如 GPT-4o 可能會創建未經授權的某人聲音複製、色情和暴力內容或複製的受版權保護的音頻片段（比如一段流行音樂）。如今結果的發佈似乎意味著語音功能即將全面上線。

值得關注的是，根據 OpenAI 自己製定的框架，研究人員認為 GPT-4o 新增的語音對話能力在整體上並不會顯著增加風險，但個在別領域上具有「中等」風險。

具體來說，總體風險水平取自四個總體類別中的最高風險評級：網絡安全、生物威脅、說服力和模型自主性。除了說服力之外，所有這些都被認為風險較低，研究人員發現 GPT-4o 的一些寫作樣本可能比人類書寫的文本更能左右讀者的觀點 —— 儘管該模型的樣本總體上並不更有說服力。

GPT-4o 是 OpenAI 推出的最新一代自回歸全向模型，它接受文本、音頻、圖像和影片的任意組合作為輸入，並生成文本、音頻和圖像的任意組合的輸出。它在文本、視覺和音頻方面進行端到端訓練，這意味著所有輸入和輸出都由同一個神經網絡處理。

OpenAI 表示，GPT-4o 可以在短短 232 毫秒內響應音頻輸入，平均反應時間為 320 毫秒，與人類對話中的響應時間相似。它在英文和代碼文本上的表現與 GPT-4 Turbo 相當，在非英語語言文本上的表現有顯著提升，同時 API 速度也更快、價格便宜 50%。與現有模型相比，GPT-4o 在視覺和音頻理解方面尤其出色。

OpenAI 發言人 Lindsay McCallum Rémy 表示，System Card 包括由內部團隊創建的準備情況評估，以及 OpenAI 網站上列出的外部測試人員，即模型評估與威脅研究 (METR) 和 Apollo Research，這兩家公司都在為 AI 系統建立評估。

評估方式。

這不是 OpenAI 發佈的第一個 System Card。此前，GPT-4、具有視覺能力的 GPT-4 和 DALL-E 3 也經過了類似的測試，研究結果也已發佈。但 OpenAI 此次發佈新版本 dSystem Card，可能是由於一直以來自身在安全方面被批評做出的應對。

許多人呼籲 OpenAI 需要更加透明，不僅應該公開模型、訓練數據（如是否使用 YouTube 影片訓練），還包括其安全測試的過程。在 OpenAI 和許多領先的人工智能實驗室所在的加州，州參議員正希望通過一項法案來規範大型語言模型，其中包括限制公司如果其人工智能被用於有害方式，將承擔法律責任。但 GPT-4o System Card 帶給外界的最大信息是，儘管有一群外部 Red Team 成員和測試人員，但其中很多都依賴於 OpenAI 自己來評估自己。

與此同時，OpenAI 也宣佈任命卡耐基梅隆大學（CMU）機器學習系教授兼主任 Zico Kolter 為公司董事會成員。Zico 的工作主要集中在人工智能安全性、一致性和機器學習分類器的穩健性上，專業知識涵蓋新型深度網絡架構、數據理解對模型影響的創新方法，以及評估 AI 模型穩健性的自動化方法。

果然網民們紛紛表示「不滿意」。有人發問，你要發的「草莓」（可能的下一代大模型）呢？PS：果然沒有草莓。