支持中英雙語及 40 種方言任意混說，中國電信 TeleAI 星辰語音大模型升級

11月03日 09:37 新浪網 news-china-auto-hilite

IT之家 11 月 3 日消息，中國電信人工智能研究院（TeleAI）在今年 5 月發佈業內首個支持 30 種方言自由混說的語音識別大模型 —— 星辰超多方言語音識別大模型。

時隔不到半年，TeleAI 星辰語音大模型的多方言能力再次升級，攻克了湛江話、宜賓話、洛陽話、煙台話等方言，將方言種類從 30 種提升至 40 種，並引入對英文的識別。

與傳統的有標註訓練方法相比，TeleAI 通過預訓練語音識別模型，利用海量無標註數據進行預訓練，再通過少量有標註數據進行微調。

由於方言語音數據普遍存在無標註數據多而有標註數據少的特點，這種「預訓練 + 微調」的模型方案與方言場景的需求能夠高度契合。

TeleAI 還在模型結構和成本優化上進行了創新，實現對人工標註數據的需求量大幅降低約 50 倍，且保障模型效果與有監督訓練的方言模型水平相當。

IT之家附 GitHub 開源地址：https://github.com/Tele-AI/TeleSpeech-ASR

廣告聲明：文內含有的對外跳轉鏈接（包括不限於超鏈接、二維碼、口令等形式），用於傳遞更多信息，節省甄選時間，結果僅供參考，IT之家所有文章均包含本聲明。