科學家×創業者|雲知聲梁家恩:創業不能“成於技術又敗於技術”

·“對於技術型的創業者來說,一定要走出技術本身。創業我們不能‘成於技術又敗於技術’,因為技術在整個商業鏈條里只占三分之一。”

雲知聲智能科技股份有限公司董事長兼CTO梁家恩

2022年11月底,ChatGPT的橫空出世震撼世界。雖然一直在關注GPT的學術論文和研發動態,但真正看到機器對人類拋出的問題應答如流,雲知聲智能科技股份有限公司董事長兼CTO梁家恩仍然有刷新認知的感覺。他意識到這是自己研究人工智能25年來行業里最大的技術突破,重要程度超越了當年深度學習霸榜ImageNet和AlphaGo打敗李世石。

半年後的2023年5月,雲知聲“山海大模型”發佈,並展示出了語言生成、語言理解、知識問答、邏輯推理等通用能力。雲知聲表示,未來將以山海大模型為基礎,打造MaaS(模型即應用)模式的解決方案,增強物聯、醫療等行業能力,目標是山海大模型年內通用能力比肩ChatGPT,並在醫療、物聯、教育等多個垂直領域能力超越GPT-4。

人工智能獨角獸企業雲知聲成立於2012年,以智能語音識別、自然語言理解、知識圖譜等全棧AI技術為核心,面向智慧物聯與智慧醫療兩大領域提供以對話式AI技術為基礎的產品服務與綜合解決方案。梁家恩為雲知聲創始人、董事長兼CTO,模式識別國家重點實驗室專委會委員。2019年開始,梁家恩帶領雲知聲科研團隊多次參與國家重點研發計劃“科技創新2030”新一代人工智能重大項目,並以全球首款面向物聯網的人工智能芯片研發技術獲得了“吳文俊人工智能科技進步獎”,大規模知識圖譜的醫療行業應用獲北京市科技進步一等獎。近日,上海長三角商業創新研究院與複旦大學管理學院聯合主辦的知新工程“三尺講台計劃”中,以雲知聲的企業發展作為了實戰案例樣本。梁家恩表示,“我們認為通用人工智能的時代已經到來了。”

大模型打開了10倍以上商業天花板

ChatGPT的出現,讓梁家恩意識到,“大模型+大數據”的威力在過去被低估了。無監督預訓練大模型通過指令調優和人工反饋強化之後表現出的通用智能潛力,較之以往出現了重大的範式變化,是雲知聲此次下定決心攻克大模型的關鍵。

“過去10年,所有的智能系統都要先定義一個特定的目標,再去收集足夠的相應數據來優化模型和解決問題,現在你已經無需定義一個特定的目標了,機器可以通過無監督預訓練學習到足夠強的語言和知識,從而在少量樣例情況下學會解決各種問題,並與人類規範對齊。”梁家恩表示,“大模型的框架已經改變了一種範式,所以我們不能還停留在過去的框架思考問題,技術框架必須做遷移,這是我們下定決心做大模型的關鍵點。”

梁家恩介紹,山海大模型希望能先構建通用大模型的強大基礎能力,然後將其應用在雲知聲專長的醫療、物聯等特定的行業場景中,提升大模型的嚴謹度,讓其能夠有效解決行業問題。

梁家恩舉例介紹,過去AI用於醫療場景時,只能等醫生寫完病曆後審核病曆裡面有沒有問題,用於給保險理賠時判斷用藥和操作規範,審核報銷和保單等,這在計算機領域屬於判決式的問題;也有醫療版語音病曆錄入,但只能醫生說什麼寫什麼。有了大模型框架之後,這個領域就能擁有生成式的能力。類似於自動生成會議紀要,並為紀要自動做摘要和翻譯的功能一樣,醫生只需輸入很少內容,比如病人的血壓值,後面的東西AI就可以自動補全。在醫生和患者對話的過程中,大模型就可以自動提取有效信息,並自動生成病曆。

“大模型應用在行業之後,產品的智商會更高,靈活度更強,也能做很多過去做不了的事情,幫我們釋放更多受限於技術的潛在用戶需求,”梁家恩感慨道,“大模型為我們打開了商業天花板至少10倍到百倍的空間。”

從技術到產品規模化十年探索

“今天我們有資格說自己能追上大模型的浪潮,也是因為2016年看見AlphaGo的時候,我就覺得大計算一定是未來的趨勢了。”梁家恩向澎湃科技表示“技術肯定是我們的根據地,我們作為技術公司,技術必須保持一流水準,對技術的發展方向我們不能踩錯點。”

雲知聲最初是一個算法團隊,但為了讓產品能夠規模化落地,逐步涉足硬件和芯片。之後為瞭解決行業性問題,把技術能力拓展到知識圖譜和超算平台。梁家恩表示,“這些都是超出我們最初的能力範圍的,但我們必須去做,這不是我們主觀給自己增加難度,而是客觀上就需要把鏈條補齊,才能有效解決行業問題。”

入局研發大模型並不是雲知聲第一次做出的重大戰略抉擇。2012年剛創業時,雲知聲便在To B(企業服務)和To C(消費者服務)的賽道抉擇之間,選擇了To B,從此為行業夥伴打造智能化產品和解決方案。梁家恩發現,語音交互放在手機上,不砸錢推廣就沒人會用,活躍度不足2%,但放在智能電視上,不需要推廣活躍度就可以保持在30%-40%。

物聯網的產品化並不容易,應用場景差異很大。梁家恩介紹,雲知聲的語音交互在手機上做的已經不錯,所以他一開始覺得用於空調的語音交互兩個月就能完成。但實際上,把設備放在三五米之外,噪音和信噪比的差別很大。“我們一方面要擴展麥克風陣列的能力去降噪,另一方面還需要成本可控,”梁家恩表示,“這裡面前後磨了我們一兩年的時間,才達到可量產的軟硬一體遠場交互方案。”物聯時代的到來,意味著聯網能力提升,交互成本降低,於是雲知聲開始佈局“雲端芯”戰略,希望能夠接入更多的設備、用戶和場景,也面臨更複雜的應用問題。隨著業務的發展,公司需要構建完整的智慧物聯解決方案,自主研發智能交互專用芯片,以降低規模化拓展的成本。

2016年,雲知聲團隊意識到,光把智能交互問題解決,還不足以構建足夠的商業空間,需要真正解決行業深層問題,才有更大商業價值。於是,開始構建超算平台和行業知識圖譜,並在醫療垂直領域解決業務深層問題,“醫療是我們見過的最嚴肅的應用場景,知識密度非常高,如果能拿下這一領域,對我們的技術來說也是一個製高點的掌握。”

項目成功了之後能不能規模化,同樣也是雲知聲面臨的一大問題。梁家恩介紹,“我們在做醫院的時候,第一、第二家醫院做的都還可以,但如果遷移到不同的醫院,就會遇到差異化問題。不同醫院的底層系統都不一樣,關注的業務重點也不一樣,醫院水平層次各異,有的是綜合醫院,有的是專科醫院,這些都是都會影響我們規模化的關鍵點。”

在對技術推崇之餘,梁家恩同時也強調了產品化的重要性,他表示,“產品化能力才是商業上能不能規模化的關鍵。大家不會為技術買單的,只會為產品買單,技術是我們的根基,但我們也會把我們的技術優勢通過工程優化和應用抽像,轉化為產品優勢。”

創業不能“成於技術又敗於技術”

梁家恩本科畢業於中國科技大學,在中科院自動化所獲得模式識別與智能系統專業博士學位後,留所負責語音識別核心技術研發及其產業化,在國家863語音識別核心技術評測中多次獲第一名,並帶領團隊在廣電、安全、教育等領域實現智能語音技術的產業化應用。

“我一直希望能夠學以致用,把學的知識能在產業裡面應用起來,而不只是發一些論文,做一些評測。”對這段經曆,梁家恩這樣表示。

2008至2010年在中科院工作期間,梁家恩所做的最大的語音識別項目是成功將機器評分應用到了江蘇省全省和浙江省溫州市的中考英語口語考試之中。梁家恩介紹,這是國內第一個能大規模應用的AI評分場景,覆蓋了百萬級的考生。項目很有影響力,也貼近民用,適合市場化。但在當時的中科院體系中,這個項目很難商業化,因此2010年梁家恩便從中科院跳槽去了盛大創新院,隨後又離開盛大開始創業。

雖然已經創業十餘年,但梁家恩還是一直以“理工男”和“技術人”自居,他向澎湃科技表示:“我的興趣愛好還是一直在技術上面,通過技術創新解決產業關鍵問題是我最大的追求。我們4個創始人都是AI領域博士,現在只有我繼續堅守AI技術研發,其他合夥人都已經轉型,去解決AI技術產業化閉環上的各種業務問題,共同打通商業化閉環。”

“對於技術型的創業者來說,一定要走出技術本身。”對於創業以來的轉變,梁家恩表示,“創業我們不能‘成於技術又敗於技術’,因為技術在整個商業鏈條里只占三分之一。所以,首先要在思維模式上把技術放到整個商業閉環的邏輯里去考慮,從而去佈局我們的整個技術、產品和商業化體系,不能只考慮技術環節的局部優化。第二就是在複雜的商業閉環中,需要考慮更多人的因素,包括內部和外部的人,人理順事情才能理順。AI技術的商業化閉環鏈條是特別長的,需要大家統一目標,明確職責,有效求同存異和分工協作。”