精準學將公佈中國首個語音端到端大模型

教育科技公司精準學宣佈,公司已在AI語音交互技術上取得領先性的突破,成功訓練了中國首個語音端到端大模型「心流知鏡-s(V02)」,可直接實現語音輸入-語音輸出的交互,使其更適配輔學場景,使大模型達到「真人老師」級別的自然對話交流體驗。

「心流知鏡-s(V02)」 使用端到端語音結構,避免了級聯ASR+LLM+湯臣S方式額外延遲,同時也更好的改善純文本模型損失的情感節奏等豐富信息,接近人類的語音交互體驗。

精準學也提供時間表開放基礎模型供學術和非商用使用,致力於為中文 AI社區的科研和技術探索作出貢獻。

「心流知鏡-s(V02)」的發佈,不僅將在高質量中文語音Codec 和中文自監督預訓練Encoder 基礎設施上填補中文開源社區的空白,還將在全球範圍內成為首個開放給技術社區的語音端到端大模型。

精準學將於近期對外展示這項技術的應用成果。5月,公司獲得了阿里2億元投資,目前其AI輔學機Bong系列已在天貓京東上線。不久後用戶也可以在精準學AI輔學機上體驗到這項技術突破成果。