MiniMax發佈新語音模型Speech-02,宣佈性能超OpenAI

新浪科技訊 5月16日晚間消息,近日,AI獨角獸MiniMax稀宇極智發佈新一代語音大模型Speech-02,宣佈該模型在國際最權威的兩項語音評測榜單Artificial Analysis和Hugging Face TTS Arena 上,超越OpenAI、ElevenLabs等國際巨頭,登上雙榜榜首。

據介紹,Speech-02在語音模型核心技術指標:字錯率WER和相似度SIM等客觀指標上取得了SOTA結果,用戶盲聽主觀評價反饋也更自然、真實。

基於技術與足夠泛化的模型能力,Speech-02為用戶帶來了超擬人、個性化、多樣性的語音服務。Speech-02可通過文生音功能給定自然語言文本描述生成符合描述的音色;通過聲音參考功能,對任意給定語音實現靈活控製,進行感情、語速、音高、語種等無縫切換;同時支持粵語、葡萄牙語、法語等32個語種,甚至在同一段語音里也可以實現多個語種間的自如切換。

值得關注的是,Speech-02性能登頂同時其商用定價僅為全球頭部語音模型ElevenLabs的四分之一,具有高性能和性價比雙重優勢。(文猛)