用人工智能解鎖高質量發展密碼(走進民營企業看創新③)

4月17日,在日本大阪世博會中國館,科大訊飛翻譯產品總監孫境廷向各國嘉賓介紹訊飛翻譯機2.0的功能。
受訪者供圖

3月27日,在安徽省合肥市科大訊飛人工智能體驗館,科大訊飛演示經理張欣雅展示AI智能產品。
本報記者 楊俊峰 攝

2025年3月,在安徽省合肥市萬象城,孩子在科大訊飛工作人員(右一)的指導下體驗訊飛AI學習機。
受訪者供圖
「跨越語言障礙,每個中國人都能帶您領略《清明上河圖》的盛世煙火;跨越語言障礙,每個英國人都能與您分享莎士比亞十四行詩中的韻律;跨越語言障礙,每個愛斯賓奴都能為您解讀聖家族大教堂的設計密碼……每種語言都是獨特綻放的美麗花朵,在世博會這座人類文明的花園中,我們希望用AI(人工智能)助大家跨越語言障礙。」
4月17日,在日本大阪世博會中國館,科大訊飛股份有限公司(以下簡稱「科大訊飛」)AI主持人沐沐現場向各國嘉賓展示科大訊飛最新的AI語音實時同聲傳譯功能,每提到一個國家,沐沐便會切換該國語言,其自然的表情、標準的口型、地道的口音和流暢的表達引發各國觀眾陣陣驚歎。有外國觀眾感歎:「中國的AI技術,在大阪世博會的舞台上驚豔了世界。」這一高光時刻的背後,是科大訊飛26年如一日的技術深耕。
成立於1999年的科大訊飛,是一家專注研發智能語音和人工智能的中國科技企業。多年來,科大訊飛一直從事智能語音、計算機視覺、自然語言處理、認知智能等人工智能核心技術研究並保持國際前沿水平。科大訊飛積極推動人工智能源頭核心技術研發和產業化落地,致力於「讓機器能聽會說,能理解會思考,用人工智能建設美好世界」,積極擁抱「智能湧現」的大模型時代。近日,本報記者走進科大訊飛,探尋這家民營企業的創新故事。
AI+溝通
「讓每個聲音都能被聽懂」
「今天給大家介紹我最新拍攝的紀錄電影《再會長江》。我用了10年時間記錄了中國長江6300多公里的風土人情,想通過一條河來展現中國十年的變化。」
今年4月初,日本紀錄片導演竹內亮去法國採風,在巴黎,這位曾經被中國外交部新聞發言人點過讚的日本導演,與一位意大利導演展開了一場「奇妙」的創作研討會。
研討會上,竹內亮導演用流利的中文,與意大利導演和他來自世界各地的學生進行了一次跨語種交談。會場上,中文、英語、意大利語、葡萄牙語等各種語言的聲音交織在一起,大家聊得其樂融融,完全不受語種障礙的影響。
促成這一充滿科技感的場景變為現實的,是科大訊飛雙屏翻譯機2.0,基於科大訊飛在關鍵技術上的突破和應用,這款翻譯機搭載星火語音同傳大模型,結合其卓越的降噪技術,可以幫助用戶在嘈雜環境下實現精準的實時翻譯。
「實時翻譯是我對這款翻譯機最滿意的地方,」竹內亮對本報記者說,「翻譯的延遲時間只有幾秒鍾,聽眾幾乎不需要等待就能聽到翻譯內容,這種語言對語言的實時翻譯,把我們開國際會議跨語種溝通的時間縮短了至少50%。」
4月17日,訊飛雙屏翻譯機2.0在大阪世博會中國館正式亮相。在向各國嘉賓推薦這款翻譯機時,科大訊飛AI主持人沐沐說:「我們相信真正的翻譯技術不只是字句的轉換,還應成為文明之間對話的引路人。能在世界文明薈聚的舞台上與諸位共同開啟人類溝通變革的新篇章,科大訊飛深感榮幸。」
除了語言翻譯、拍照翻譯外,訊飛雙屏翻譯機2.0在同聲字幕、演講翻譯、錄音翻譯等新功能上的拓展,使其能更廣泛地應用於各種使用場景。
在跨國線上會議場景,「同聲字幕」功能可實時雙語字幕翻譯,幫助用戶跟上會議思路並實時參與討論。在現場提案場景,面對多人的講解可應用「演講翻譯」,訊飛翻譯機搭配領夾麥,雙語字幕可呈現在大屏幕上,方便現場多人實時查看。而訊飛雙屏翻譯機的錄音翻譯功能,支持回聽回看,配合翻譯機的導出功能,實現從實時溝通到信息歸檔的信息管理閉環。
訊飛雙屏翻譯機2.0是科大訊飛在智能語音技術研發上的一個縮影。在數字化時代,智能語音技術已成為連接人與機器的重要橋樑,它不僅促進了信息交流,還極大地推動了人工智能技術的廣泛應用。自創業之初,科大訊飛便立誌於實現人機之間的無障礙溝通,通過長期的源頭創新和產業化應用,不斷推動智能語音技術的發展。
科大訊飛副總裁、消費者事業群常務副總裁趙翔對本報說:「2016年,科大訊飛推出全球首款AI翻譯機,開創了一個全新品類。我們的翻譯機服務過2022年北京冬季奧運會、2023年布達佩斯世界田徑錦標賽和2024年巴黎奧運會‘中國之家’活動。為數百萬用戶架起文化溝通的橋樑,提供超過10億次翻譯服務,走遍了全球200多個國家和地區。」
在數百萬科大訊飛翻譯機的用戶中,有一位在中國杭州做商用飲水機生意的老闆讓趙翔印象深刻。他說:「這位老闆不會說英語,曾在與外國人的溝通中鬧過很多笑話。後來,他用上了訊飛翻譯機。再後來,這位平凡的中國創業者,把自己的飲水機賣到了英國倫敦、阿聯酋艾巴紮比、美國紐約的國際機場。現在,他的公司營收做到了每年2億元人民幣。小小的翻譯機,幫助他的生意走出國門,走向世界。」
「在世博園里,大家用訊飛翻譯機可以深度體驗每個國家不同的文化。走出世博園,拿著訊飛翻譯機更可以跨越語言障礙、走遍全球,無論是暢談跨境生意,還是看遍美好風景,都可以準確快速地與世界各國的人溝通。」趙翔說,「AI技術的發展不僅是為了‘技術更強’,更是為了‘應用落地’時能讓每個人、每個企業在這個時代走得更遠。在AI技術迅猛發展的今天,我們想向全球夥伴發出邀約:讓我們攜手努力,讓每個聲音都能被聽懂,讓每次交流都充滿信任。」
AI+算力
核心源頭技術持續突破
研發人工智能,科大訊飛的態度是什麼?
科大訊飛董事長劉慶峰對本報說:「在這個時代,信心比什麼都重要。一定要有一批人敢於在算法的源頭上、未來的核心技術上做創新,有這個膽氣、勇氣和決心,無論人工智能還是科技產業才有更大的未來。」
近年來,科大訊飛始終把核心源頭技術自主創新放在戰略高度,每年將營業收入的20%左右用於研發,走過了人工智能發展道路上的一個又一個關鍵節點:
2008年,首次讓機器的語音合成超過普通人說話水平;
2012年,首次讓機器的語音評測超過人類專家水平;
2015年,首次讓機器的語音識別超過人類速記員水平;
2017年,「智醫助理機器人」首次通過國家執業醫師資格考試綜合筆試測試,並超過96.3%的人類考生;
2018年,首次讓機器翻譯的中英語音翻譯達到CA湯臣I全國翻譯專業資格(水平)考試二級合格標準;
2019年,首次在國際權威的機器閱讀理解SQuAD2.0比賽中超過人類平均水平;
2022年,首次在OpenBookQA知識推理挑戰賽中單模型超過人類平均水平。
依託認知智能全國重點實驗室的技術和應用積累,以及成建製的研發團隊,2023年5月6日,科大訊飛正式對外發佈訊飛星火大模型(以下簡稱「訊飛星火」),訊飛星火具備文本生成、語言理解、知識問答、邏輯推理、數學能力、代碼能力、多模態能力等七大核心能力。
2023年10月24日,科大訊飛與華為聯合發佈了國內首個全國產算力平台「飛星一號」。2024年10月24日,基於全國首個國產萬卡算力集群訓練的全民開放大模型訊飛星火4.0 Turbo正式發佈,根據真實數據背靠背的測試,七項核心能力在中文領域全面超過GPT-4 Turbo,代碼能力和數學能力超越GPT-4o;同時,國產超大規模智算平台「飛星二號」正式啟動。
2025年1月,業界首個基於全國產算力平台訓練的深度推理大模型——訊飛星火X1正式發佈,利用更少算力實現業界一流效果;訊飛星火4.0 Turbo底座升級,行業正選混域知識搜索技術;推出業界首個具備端到端語音到語音同傳能力的大模型——星火語音同傳大模型,最快語音同傳時延5秒以內,達到人類專家譯員的水平。
2025年4月,訊飛星火X1全新升級,實現了數學、代碼、邏輯推理、文本生成、語言理解、知識問答等通用任務效果顯著提升,在模型參數比業界同類模型小一個數量級的情況下,整體效果對標OpenAI o1和DeepSeek R1,再次證明了基於國產算力訓練的全棧自主可控大模型具備登頂業界最高水平的實力和持續創新的潛力。
2024年,科大訊飛作為第一完成單位的「多語種智能語音關鍵技術及產業化」項目獲得2023年度國家科學技術進步獎一等獎。
「2025年,我最想推動的是完全自主可控的通用人工智能生態體系建設。」劉慶峰說,在他看來,自主可控是AI發展的底氣,也是中國在全球競爭中掌握主動權的關鍵。
AI+行業
持續助力民生和產業高質量發展
如何讓因材施教的教育夢想照進現實?如何讓一座城市實現和諧可持續發展?如何讓一家企業不斷提質增效、實現產業煥新?如何讓優質醫療資源惠及更多人?如何讓一家工業企業實現智能化轉型升級?
近年來,科大訊飛一直在AI+行業的探索中,尋找這些問題的答案。
基於人工智能核心技術,科大訊飛多年來持續賦能教育、醫療、金融、汽車、城市、運營商、工業等行業賽道並取得廣泛成效,持續助力民生和產業高質量發展。
在教育領域,科大訊飛為5萬餘所學校、1.3億師生提供智慧教育產品和解決方案,以人工智能助力因材施教。
在醫療領域,科大訊飛致力為醫生打造AI診療助理、為居民打造AI健康助手。科大訊飛「智醫助理」在全國多個省(自治區、直轄市)、超過670個區縣實現了常態化應用,累計輔助診斷達9.1億次,輔助醫生修正診斷超160多萬次,提醒不合理處方8600多萬次。
在金融領域,科大訊飛已賦能包括國有銀行、國有保險集團、股份製銀行和頭部城商行、農商行在內的200多家金融機構,運用大模型等AI技術提供智能客服、智慧營銷、智能風控、代碼開發等場景化應用,為客戶提升服務體驗和運營效能,助力金融高質量發展。
在汽車領域,科大訊飛為一汽、東風、長安、奇瑞、廣汽、長城等數十家車企提供座艙智能語音服務,累計前裝搭載超6500萬套,平均月活用戶超過2700萬人,年在線交互次數突破168億次。訊飛座艙智能語音解決方案已覆蓋23個海外語種,助力國內車企出海超過60個國家和地區。
在城市領域,科大訊飛為全國330多個城市提供智慧城市解決方案,服務了全國超4900家政企單位,助力城市實現數字化轉型。
在運營商領域,科大訊飛提供智慧家庭服務,日語音交互次數達8000萬次。通過訊飛星火大模型為運營商用戶提供AI速記、AI秘書等智能通話解決方案。
在工業領域,科大訊飛為全國10個省份20多個地市提供基於工業感知、工業認知、工業大模型、能源大模型等工業AI技術的產品和解決方案。目前,在高端裝備製造業、能源行業等場景陸續打造出行業示範應用。
科大訊飛承建的智能語音國家人工智能開放創新平台,是國家首批四大新一代人工智能開放創新平台之一。截至2025年3月31日,訊飛開放平台已開放808項AI產品及能力,聚集超過834.3萬人的開發者團隊,總應用數超過320萬,累計覆蓋終端設備數超過41.7億台,AI大學堂學員總量達到80.8萬人,鏈接超過1000萬人的生態夥伴。
2023年5月6日,訊飛星火正式發佈以來,已新增超過424.9萬人的開發者,其中大模型直接相關的開發者人數超過128.7萬,企業級用戶超過77萬人。2024年1月30日,星火開源-13B正式在華為昇思開源社區聯合正選上線,這是業界首個基於全國產算力平台「飛星一號」研發的開源大模型。目前,科大訊飛已在全國建設33個人工智能科技孵化器和產業加速中心,孵化了1678家科技創業企業,產值達417.71億元,為AI創業團隊提供產業落地支撐。
「2025年,我們比以往任何時候都更有信心!」劉慶峰表示,訊飛星火的戰略生態位非常清晰:堅持自主可控、面向民生剛需以及賦能科研與生產。「聚焦自主可控的底座能力和重點應用賽道,以長期主義精神保持戰略定力」,在通用人工智能發展的新階段,科大訊飛將繼續做全棧自主可控的人工智能大模型研發主力軍。(記者 楊俊峰 徐靖)
《人民日報海外版》(2025年04月24日 第 05 版)
