【觸不到的她】OpenAI發布GPT-4o 可與用戶語音對話

在香港時間周二凌晨,OpenAI 在春季發布會上宣布ChatGPT迎來重大更新。大眾迎來的不是 GPT-5 發布, 也不是 AI 搜尋引擎,而是 OpenAI 宣布推出名為 GPT-4o,可與用戶語音對話的 AI 模型。

OpenAI 技術總監 Mira Murati 在發布會上宣布,推出名為 GPT-4o 的全新旗艦 AI 模型。GPT-4o 具備文字、語音、影像處理能力,輸入模式可為文字、語音、影像的任意組合,同時亦能以這三種不同模式輸出。

根據官方介紹,GPT-4o 能夠處理50種不同語言,而其運行速度是 GPT-4 Turbo 的兩倍。在 GPT-4o 中的「o」代表「omni」。「omni」一詞源自拉丁語「omnis」,意為「全能」而在英語中,「omni」常被用作詞根,有「全部」、「所有」、「全方位」等意思。

GPT-4o 能在 232 毫秒内對語音作出反應,與人類對話的反應時間相近。從發布會直播片段可見,OpenAI 職員與 GPT-4o 的互動自然,亦能由輸入的語音中識別用家情緒,例如 GPT-4o 能從急促的喘氣聲判斷對方「緊張」。

GPT-4o 將免費向公眾開放,包括 OpenAI 的免費用戶。同時,OpenAI 亦公布將發表桌面版的 ChatGPT,但最初只會推出 Mac 版本。 

原文

你或許有興趣
【商業熱話】傳開設香港網購業務 山姆變相攻港?
【中美貿易戰】拜登傳加中國電動車關稅至102.5%
【談判策略】iPhone傳引入ChatGPT 棄Google Gemini?
【減輕工作量】報告:75%知識型工作者日常工作用AI
【的士加價】紅的落旗或只加2元 業界無奈接受

如欲觀看更多相關文章,請瀏覽 Business Digest