「國內首個端到端通用語音 AI 大模型」心辰 Lingo 發佈，號稱中文效果比 GPT-4o 更出色

09月06日 18:59 新浪網 news-china-auto-hilite

IT之家 9 月 6 日消息，西湖心辰昨日發佈了心辰 Lingo 語音大模型，號稱是「國內首個端到端通用語音大模型」。

官方表示，針對心辰 Lingo 端到端語音大模型的能力，在多個領域和中文上進行增強，使得心辰 Lingo 的中文語音效果，相較 GPT-4o 更為出色。心辰 Lingo 於 8 月 24 日開啟內測，至今已經有超千家企業用戶預約測試。

相比較傳統湯臣S，端到端語音大模型則是一種更為全面的技術，不僅可以語音識別，還集成了自然語言處理、意圖識別、對話管理以及語音合成等多個環節，實現了從語音輸入到語音反饋的完整交互過程。

心辰 Lingo 語音模型技術能力上具備以下三個特點：

原生的語音理解：能夠識別語音中的文字信息與其他重要特徵，如情感、語氣、音調等
多種語音風格表達：可以根據上下文和用戶指令，自適應調整語音的速度、高低、噪聲強度，並能夠生成對話、歌唱、相聲等多種風格的語音響應
語音模態超級壓縮：採用具有數百倍壓縮率的語音編解碼器，降低計算和存儲成本

IT之家注意到，目前心辰 Lingo 語音大模型仍需通過內測申請，申請鏈接如下：https://lingo.xinchenai.com/

廣告聲明：文內含有的對外跳轉鏈接（包括不限於超鏈接、二維碼、口令等形式），用於傳遞更多信息，節省甄選時間，結果僅供參考，IT之家所有文章均包含本聲明。