市人大代表趙勇：運用大模型推動數字產業化發展

01月23日 19:52 新浪網 news-china-auto-hilite

新京報貝殼財經訊（記者羅亦丹）1月22日，市人大代表、北京格靈深瞳信息技術股份有限公司董事長兼首席執行官趙勇接受貝殼財經記者採訪。

趙勇代表新京報記者王飛攝

北京市政府工作明確提出2024年著力做好十一個方面工作，第三方面就是「做強做優做大數字經濟，更好賦能首都高質量發展」，其中要求統籌推進數字產業化和大力支持產業數字化。提升人工智能底層技術和基礎底座自主可控能力，推動人工智能模型對標國際先進水平，加快在政務、醫療、工業、生活服務等領域應用，保持人工智能研發應用領先水平。

報告中的這些內容引起了趙勇的關注。他表示，對於科技產業的發展，大語言模型和元宇宙是兩個此消彼長的概念。根據加端拿的光環曲線，任何產業的發展都會在短期內經歷技術爆發、泡沫高峰、願景落空、穩步爬升到實質性高產。在這個跌宕起伏的發展過程中，很多公司會趁著技術爆發參與進來，也會隨著泡沫破滅而退出，但少量有核心技術、產品化能力強且管理優秀的公司會堅持下來走出困境，並最終成為行業翹楚。

「我觀察過的所有行業發展都經歷了這個規律，大語言模型明年可能也會降溫，但它只要有價值，還會慢慢發展起來。」趙勇告訴貝殼財經記者。

貝殼財經記者注意到，多位代表都關注到當前國內大語言模型的發展，而對於當前國內「百模大戰」的局面，趙勇認為，可以作為基礎底盤平台的大語言模型，市場可能只需要幾個，而專業化的行業大模型則需要幾百個。

趙勇表示，大語言模型技術會在計算機視覺研究方面提供幫助。

「我們正在將純視覺大模型與純語言大模型進行關聯，形成一個圖文大模型。圖文大模型可以增加視覺模型訓練的泛化能力，這是非常有趣的事情。比如我們想描述一個女生長得漂亮，漂亮是一個抽像的、難以量化的詞彙。我們使用大語言模型，就可以搜索全世界所有的圖片，並從提到‘漂亮’的圖片里尋找視覺特徵的高維度共性，從而得到泛化能力很強的視覺理解能力。這可以大幅降低訓練模型的成本，並幫助我們快速收斂複雜模型的訓練，這將是未來的熱點。」趙勇告訴貝殼財經記者。

編輯趙方園

校對王心