獲國家科學技術進步獎一等獎的AI技術厲害在哪?業內人士:將支援虛擬員工等未來智能產品創新

封面新聞記者 歐陽宏宇

6月24日,2023年度國家科學技術獎在京揭曉,共評選出250個項目。記者注意到,在本次國家科學技術獎各獲獎項目中,與人工智能、大模型技術相關聯的項目明顯增加,涉及多語種智能語音、智能車聯網、智慧高速、超級計算等應用場景。其中,“多語種智能語音關鍵技術及產業化”項目獲2023年度國家科技進步獎一等獎,也是過去十年來人工智能領域的首個國家科學技術進步獎一等獎。

自深度學習引發全球人工智能浪潮以來,語音交互、自然語言、機器視覺等基礎技術獲得大發展。在諸多技術中,多語種智能語音技術對於支撐人機交互、人類語言互通及國家安全等需求具有重大戰略意義,但也面臨著如何突破複雜場景“雞尾酒會”效應典型難題,以及如何基於自主可控的平台、實現國產軟硬件的語音產業鏈自主可控等問題。

據介紹,在“多語種智能語音關鍵技術及產業化”項目中,實現了四大關鍵技術突破。項目中,科大訊飛聯合中國科學技術大學、清華大學、華為等高校及企業通過多通道語音信號時空分離建模方法和多維度語音屬性解耦表徵方法,實現語音信號中內容、噪聲等高度耦合的多維屬性特徵解耦,提升複雜場景下語音識別準確率。

同時,基於多語種通用音素體系和基本語言單元,構建了多語種統一音素韻律體系,提升了小語種語音系統性能。

此外,以語音語義互增強的魯棒口語理解技術,和多源知識增強的可信文本生成技術,提升了複雜場景和深層次的語義理解準確率。

“這個項目突破了複雜場景語音技術大規模使用門檻,實現了語音技術從中英文到多語種的拓展。”項目相關負責人透露,這一技術成果不僅可應用於會議場合,還首次實現智能語音在國產芯片上的訓練和推理性能,也在中國品牌“走出去”中發揮了關鍵推動作用。

據瞭解,項目提出了硬件親和的變長輸入算子融合和聯合統一量化感知訓練技術,解決了智能語音技術硬件平台的“卡脖子”問題。

目前,該技術已支援了華為等主流手機廠商和奇瑞、比亞迪、長安等主機廠,出海產品多語種問題,並在智能軟硬件方面開創了翻譯機、辦公本、智能錄音筆等智能硬件新品類。

“通用人工智能時代,多語種智能語音關鍵技術中的創新可以和大模型技術相互補充、促進。”專家表示,大模型技術可以在複雜語義理解、長文本建模能力上進一步提升語音識別、合成和翻譯的效果,同時基於其強大的語義理解、知識問答、多輪對話、多模態建模能力,也能進一步大幅提升智能語音技術的使用場景和應用價值,支撐實現語音同傳、自動客服、輔學答疑、家庭醫生、虛擬員工、陪伴機器人、服務機器人等等未來智能產品創新。