ChatGPT高級語音模式正式上線 有9種聲線可選

【TechWeb】9月25日消息,OpenAI週二宣佈,ChatGPT高級語音模式(Advanced Voice Mode)正式上線,向所有付費訂閱用戶開放。這項功能使ChatGPT的語音更自然。

OpenAI將首先向ChatGPT的Plus和Teams客戶推出,企業和教育客戶將於下週獲使用權限。

ChatGPT還將推出五種不同風格的新聲音,用戶可以試用: Arbor、Maple、Sol、Spruce 和 Vale。這使得ChatGPT的可選聲音總數達到了9個,另外四種是Breeze、Juniper、Cove 和 Ember。

OpenAI還增加了自定義指令、記憶、改進的口音等新功能,ChatGPT還可以用50多種語言說, 「對不起,我來晚了」。

OpenAI原計劃6月底推出此功能,但因為需要更多時間來準備,推遲發佈。

ChatGPT的高級語音模式能夠理解並回應情緒和非語言暗示,讓我們更接近與AI進行實時、自然的對話。OpenAI在5月份首次展示了GPT-4o,以及這種超現實的「高級語音模式」。

GPT-4o能在232毫秒內對音頻輸入做出反應,平均反應時間為320毫秒,這與人類在對話中的反應時間相近。高級語音模式不需要像當前的ChatGPT語音模式那樣將語音轉換為文本,再轉換成語音,從而降低了交互延遲。