速遞|剛剛,OpenAI 發佈了高級語音模式!
週二,OpenAI 宣佈向更多 ChatGPT 付費用戶推出「高級語音模式」(Advanced Voice Mode,簡稱 AVM )。
目前,OpenAI 提供了兩種類型的語音對話 —— 標準語音和高級語音:
1)高級語音:目前正在向 Plus 和 Team 用戶逐步推出。該功能使用 GPT-4o 的原生音頻技術,能夠實現更加自然的實時對話,並捕捉非語言線索(例如語速),還能作出情感化的回應。
Plus 和 Team 用戶每天對高級語音的使用量有限制,包括語音輸入和輸出。企業版和教育版的用戶將在下週開始獲得該功能。
2)標準語音:適用於所有登錄 ChatGPT的用戶,並可以通過 iOS、macOS 和Android 應用使用。
標準語音通過多種模型生成響應,包括將語音轉錄為文本,再傳遞給模型進行回答。
儘管標準語音不像高級語音那樣具備原生多模式功能,但它仍然使用 GPT-4o 和 GPT-4o mini。需要注意的是,標準語音中的每一次提示都會計入消息限制。
要開始語音對話,需要選擇屏幕右下角的「語音」圖標:
當開始高級語音對話時,用戶將被帶到一個屏幕,屏幕中心有一個藍色球體:
AVM 將在一週內逐步向所有 Plus 和 Team 用戶推送。在等待期間,OpenAI 還增加了「自定義指令」、記憶功能、五種新語音和改進的口音支持,還可以用超過 50 種語言說「抱歉,我遲到了」。
此外,ChatGPT 還新增了五種可供用戶體驗的語音:Arbor、Maple、Sol、 Spruce 和 Vale,加上之前的 Breeze、Juniper、Cove 和 Ember,ChatGPT 語音總數達到了九種,幾乎趕上了Google Gemini Live 的數量。
-
Arbor – 隨和且多功能
-
Breeze – 生動活潑
-
Cove – 沉著且直接
-
Ember——自信而樂觀
-
Juniper – 開放而樂觀
-
Maple——開朗、坦誠
-
Sol – 精明且放鬆
-
Spruce——冷靜而肯定
-
Vale——聰明且好奇
OpenAI 表示,自從 AVM 的有限 alpha 測試發佈以來,已經進行了多項改進。據稱ChatGPT的語音功能現在對口音的理解能力更強,且對話更加順暢和迅速。
OpenAI 還將 ChatGPT 部分定製功能擴展到了 AVM,包括「自定義指令」,允許用戶個性化 ChatGPT 的響應方式,以及「記憶功能」,讓 ChatGPT 能夠記住之前的對話以供以後參考。