ChatGPT高級語音模式正式上線有9種聲線可選

09月25日 11:14 新浪網 news-china-auto-hilite

【TechWeb】9月25日消息，OpenAI週二宣佈，ChatGPT高級語音模式（Advanced Voice Mode）正式上線，向所有付費訂閱用戶開放。這項功能使ChatGPT的語音更自然。

OpenAI將首先向ChatGPT的Plus和Teams客戶推出，企業和教育客戶將於下週獲使用權限。

ChatGPT還將推出五種不同風格的新聲音，用戶可以試用： Arbor、Maple、Sol、Spruce 和 Vale。這使得ChatGPT的可選聲音總數達到了9個，另外四種是Breeze、Juniper、Cove 和 Ember。

OpenAI還增加了自定義指令、記憶、改進的口音等新功能，ChatGPT還可以用50多種語言說，「對不起，我來晚了」。

OpenAI原計劃6月底推出此功能，但因為需要更多時間來準備，推遲發佈。

ChatGPT的高級語音模式能夠理解並回應情緒和非語言暗示，讓我們更接近與AI進行實時、自然的對話。OpenAI在5月份首次展示了GPT-4o，以及這種超現實的「高級語音模式」。

GPT-4o能在232毫秒內對音頻輸入做出反應，平均反應時間為320毫秒，這與人類在對話中的反應時間相近。高級語音模式不需要像當前的ChatGPT語音模式那樣將語音轉換為文本，再轉換成語音，從而降低了交互延遲。