「國內首個端到端通用語音 AI 大模型」心辰 Lingo 發佈,號稱中文效果比 GPT-4o 更出色

IT之家 9 月 6 日消息,西湖心辰昨日發佈了心辰 Lingo 語音大模型,號稱是「國內首個端到端通用語音大模型」。

官方表示,針對心辰 Lingo 端到端語音大模型的能力,在多個領域和中文上進行增強,使得心辰 Lingo 的中文語音效果,相較 GPT-4o 更為出色。心辰 Lingo 於 8 月 24 日開啟內測,至今已經有超千家企業用戶預約測試。

相比較傳統 湯臣S,端到端語音大模型則是一種更為全面的技術,不僅可以語音識別,還集成了自然語言處理、意圖識別、對話管理以及語音合成等多個環節,實現了從語音輸入到語音反饋的完整交互過程。

心辰 Lingo 語音模型技術能力上具備以下三個特點:

  • 原生的語音理解:能夠識別語音中的文字信息與其他重要特徵,如情感、語氣、音調等

  • 多種語音風格表達:可以根據上下文和用戶指令,自適應調整語音的速度、高低、噪聲強度,並能夠生成對話、歌唱、相聲等多種風格的語音響應

  • 語音模態超級壓縮:採用具有數百倍壓縮率的語音編解碼器,降低計算和存儲成本

IT之家注意到,目前心辰 Lingo 語音大模型仍需通過內測申請,申請鏈接如下:https://lingo.xinchenai.com/

廣告聲明:文內含有的對外跳轉鏈接(包括不限於超鏈接、二維碼、口令等形式),用於傳遞更多信息,節省甄選時間,結果僅供參考,IT之家所有文章均包含本聲明。