智源王仲遠：人工智能迎來拐點，大模型推動通用人工智能演進

07月03日 19:02 新浪網 news-china-auto-hilite

北京智源人工智能研究院院長王仲遠

新京報貝殼財經訊（記者陳維城）7月3日下午，在2024新京報貝殼財經年會「‘通’往未來，向新有AI」論壇上，北京智源人工智能研究院院長王仲遠介紹，以2023年作為新的拐點，大模型從實驗室走向產業為標誌，有可能推動人工智能向通用人工智能方向演進。

「以2023年為界，過去的人工智能發展歷程可以稱之為弱人工智能，即人工智能只能針對特定場景，特定任務解決問題，如AlphaGo戰勝世界圍棋冠軍，但不能解決醫療問題和自動駕駛問題。」王仲遠解釋。

王仲遠表示，2023年之後，以大模型進入產業落地為標誌，有可能推動人工智能向通用人工智能方向演進。在過去七八十年人工智能發展的歷程中，可以看到每一次人工智能新浪潮的產生，都是以模型參數量、訓練樣本量和算力躍升帶來的人工智能重大發展。

王仲遠提到，過去幾年，大模型的參數量迅速增長， 2020年ChatGPT3是1750億參數，與人腦神經突觸差1000倍；去年的ChatGPT4已經縮小到100倍。大模型參數越來越接近人腦參數（神經突觸）規模。

面向未來，大模型技術持續迭代演進。王仲遠介紹，除了文本數據之外，影片、圖像、音頻可能是文本數據的十倍百倍，意味著大模型的發展遠沒到盡頭。

針對語言大模型幻覺問題，智源研究院自主研發了通用語義向量模型BGE系列，基於檢索增強RAG技術，實現數據之間精準的語義匹配，支持大模型調用外部知識的調用。

「面向未來，視覺和多模態大模型亟待突破。為了實現多模態、統一、端到端的下一代大模型，智源研究院推出了Emu3原生多模態世界模型。Emu3採用智源自研的多模態自回歸技術路徑，在圖像、影片、文字上聯合訓練，使模型具備原生多模態能力，實現了圖像、影片、文字的統一輸入和輸出。」王仲遠介紹。

校對柳寶慶