智源王仲遠:人工智能迎來拐點,大模型推動通用人工智能演進

北京智源人工智能研究院院長王仲遠

新京報貝殼財經訊(記者陳維城)7月3日下午,在2024新京報貝殼財經年會「‘通’往未來,向新有AI」論壇上,北京智源人工智能研究院院長王仲遠介紹,以2023年作為新的拐點,大模型從實驗室走向產業為標誌,有可能推動人工智能向通用人工智能方向演進。

「以2023年為界,過去的人工智能發展歷程可以稱之為弱人工智能,即人工智能只能針對特定場景,特定任務解決問題,如AlphaGo戰勝世界圍棋冠軍,但不能解決醫療問題和自動駕駛問題。」王仲遠解釋。

王仲遠表示,2023年之後,以大模型進入產業落地為標誌,有可能推動人工智能向通用人工智能方向演進。在過去七八十年人工智能發展的歷程中,可以看到每一次人工智能新浪潮的產生,都是以模型參數量、訓練樣本量和算力躍升帶來的人工智能重大發展。

王仲遠提到,過去幾年,大模型的參數量迅速增長, 2020年ChatGPT3是1750億參數,與人腦神經突觸差1000倍;去年的ChatGPT4已經縮小到100倍。 大模型參數越來越接近人腦參數(神經突觸)規模。

面向未來,大模型技術持續迭代演進。王仲遠介紹,除了文本數據之外,影片、圖像、音頻可能是文本數據的十倍百倍,意味著大模型的發展遠沒到盡頭。

針對語言大模型幻覺問題,智源研究院自主研發了通用語義向量模型BGE系列,基於檢索增強RAG技術,實現數據之間精準的語義匹配,支持大模型調用外部知識的調用。

「面向未來,視覺和多模態大模型亟待突破。為了實現多模態、統一、端到端的下一代大模型,智源研究院推出了Emu3原生多模態世界模型。Emu3採用智源自研的多模態自回歸技術路徑,在圖像、影片、文字上聯合訓練,使模型具備原生多模態能力,實現了圖像、影片、文字的統一輸入和輸出。」王仲遠介紹。

校對 柳寶慶