OpenAI上線ChatGPT高級語音模式,並發佈包含14種語言的數據集

近日,OpenAI 在 AI 全球化進程中邁出了重要一步。

該公司不僅上線了 ChatGPT 的高級語音模式(AVM,Advanced Voice Mode),還發佈了一個包含 14 種語言的多語言數據集,用於評估語言模型的性能。

這兩項舉措都旨在提升 AI 技術的全球可及性和實用性。

OpenAI 宣佈,將其 AVM 擴展到更多付費用戶。這一音頻功能使得用戶與 ChatGPT 的交流更加自然,初期將向 ChatGPT Plus 和 Teams 客戶推出。企業和教育客戶將於下週開始獲得訪問權限。

作為推廣的一部分,AVM 進行了設計改版。目前,藍色的躍動球體作為這項功能的顯示,取代了 OpenAI 在 5 月份展示該技術時所用的黑點。

如果對用戶開放 AVM 功能,用戶會在 ChatGPT 應用程序中的語音圖標旁邊收到一個彈出窗口。

此外,ChatGPT 還新增了 5 個用戶可以嘗試的聲音,分別是:阿伯(Arbor)、梅普爾(Maple)、索爾(Sol)、斯普魯斯(Spruce)和維爾(Vale)。

在此基礎上,ChatGPT 的聲音種類的總數已達到 9 個,幾乎與Google的 Gemini Live 一樣多。

有意思的是,其命名的來源受到大自然的啟發,這也許是因為想讓 ChatGPT 用起來感覺更親切。

值得注意的是,OpenAI 在春季更新時展示的「天空(Sky)」聲音並未出現在此次更新中。原因在於,著名演員斯嘉麗·莊臣(Scarlett Johansson)提出了反對。

莊臣在電影《她》(Her)中扮演了一個 AI 系統,她聲稱 Sky 的聲音與她自己的聲音太過相似。

作為回應,OpenAI 迅速下架了 Sky 的聲音,稱其從未打算模仿莊臣的聲音,儘管當時有幾名員工在推文中提到了這部電影。

(來源:OpenAI)

OpenAI 對媒體表示,從公佈 AVM 的 alpha 測試起,他們已經進行了一系列改進。

與此前相比,目前,ChatGPT 的語音功能對口音的理解力更佳,對話也更流暢、更快速。

此外,OpenAI 把 ChatGPT 的部分定製功能擴展到 AVM,例如允許用戶定製 ChatGPT 的回應方式。

然而,ChatGPT 的影片和屏幕共享功能尚未在此次推廣中出現。該功能本應允許 GPT-4 同時處理視覺和聽覺信息。目前,OpenAI 還沒有提供何時推出這些多模態功能的時間表。

除了高級語音模式,OpenAI 還在開放數據平台 Hugging Face 上發佈了多語言大規模多任務語言理解(MMMLU,Multilingual Massive Multitask Language Understanding)數據集。

這個新的評估工具是在 MMLU 基準測試的基礎上發展而來。

MMLU 原本只針對英語,測試 AI 系統在數學、法律和計算機科學等 57 個學科領域的知識。而新的 MMMLU 數據集則囊括了中文、阿拉伯語、德語和孟加拉語等 14 種語言。

通過將這些多樣化的語言納入新的多語言評估中,尤其是在其中一些語言的訓練數據資源有限的情況下,OpenAI 為多語言 AI 能力設立了新的基準。

這一基準測試可能會為該技術帶來更公平的全球訪問機會。一直以來,AI 行業因無法開發出能理解全球數百萬人使用的語言的語言模型而受到批評。

直到最近,AI 研究主要集中在英語和少數幾種廣泛使用的語言上,導致許多低資源語言被忽視。

OpenAI 決定將包括斯瓦希里語和約魯巴語在內的語言收錄其中,這些語言雖然使用者眾多,但在 AI 研究中經常被忽視。這也標誌著,AI 技術正朝著更具包容性的方向發展。

為了確保 MMMLU 數據集的準確性,OpenAI 聘請了專業人工翻譯,這比依賴機器翻譯的同類數據集更為精確,特別是在訓練資源較少的語言中。

通過依靠人類的專業知識,OpenAI 確保該數據集為評估多語言 AI 模型提供了更可靠的基礎。

對於企業而言,MMMLU 數據集提供了在全球背景下對其自身 AI 系統進行基準測試的機會。

隨著公司向國際市場擴張,部署能夠理解多種語言的 AI 解決方案的能力變得至關重要。

無論是客戶服務、內容審核還是數據分析,在多種語言中表現良好的 AI 系統都可以通過減少溝通摩擦和改善用戶體驗,來提供競爭優勢。

除了發佈 MMMLU 數據集,OpenAI 還啟動了 OpenAI 學院(OpenAI Academy)項目,以進一步履行其對全球 AI 可及性的承諾。

(來源:OpenAI)

據介紹,該學院旨在投資開發人員和以使命為導向的組織,這些組織正在利用 AI 來解決其社區中的關鍵問題,特別是在低收入和中等收入國家。

學院將提供培訓、技術指導以及 100 萬美元的應用程序編程接口(API,Application Programming Interface)信用點,以確保當地 AI 人才能夠訪問前沿資源。

通過支持瞭解其地區獨特社會和經濟挑戰的開發人員,OpenAI 希望賦予社區能力,以構建為當地需求量身定製的 AI 應用程序。

參考資料:

OpenAI rolls out Advanced Voice Mode with more voices and a new look

OpenAI tackles global language divide with massive multilingual AI dataset release

運營/排版:何晨龍