精準學將公佈中國首個語音端到端大模型

08月23日 14:05 新浪網 news-china-auto-hilite

教育科技公司精準學宣佈，公司已在AI語音交互技術上取得領先性的突破，成功訓練了中國首個語音端到端大模型「心流知鏡-s(V02)」，可直接實現語音輸入-語音輸出的交互，使其更適配輔學場景，使大模型達到「真人老師」級別的自然對話交流體驗。

「心流知鏡-s(V02)」使用端到端語音結構，避免了級聯ASR+LLM+湯臣S方式額外延遲，同時也更好的改善純文本模型損失的情感節奏等豐富信息，接近人類的語音交互體驗。

精準學也提供時間表開放基礎模型供學術和非商用使用，致力於為中文 AI社區的科研和技術探索作出貢獻。

「心流知鏡-s(V02)」的發佈，不僅將在高質量中文語音Codec 和中文自監督預訓練Encoder 基礎設施上填補中文開源社區的空白，還將在全球範圍內成為首個開放給技術社區的語音端到端大模型。

精準學將於近期對外展示這項技術的應用成果。5月，公司獲得了阿里2億元投資，目前其AI輔學機Bong系列已在天貓京東上線。不久後用戶也可以在精準學AI輔學機上體驗到這項技術突破成果。