預見·科技|李彥宏談國內外AI大模型差距:最大區別在於應用|封面天天見

封面新聞記者 孟梅 歐陽宏宇

5月22日,百度創始人、董事長兼首席執行官李彥宏在法國巴黎舉辦的“歐洲科技創新展覽會”(Viva Technology)主論壇上表示,中國AI與西方的最大區別在於應用,中國有數百個基礎模型,但人們越來越多地在討論什麼是AI時代的超級應用。他介紹說,應用驅動了中國AI的快速發展。

VivaTech是歐洲最大科技創新盛會,從2016年創辦至今已至第八屆。在官方介紹中,將李彥宏稱為“AI的長期主義者”與“中國AI的頭號玩家”。他表示,自己是人工智能的長期信仰者;在中國,還有更多企業家致力於探索最能發揮生成式AI能力、能被數十億人使用的應用形態。

比起GPT-5

更重要的是超級應用

“很多人都在關注GPT-5的發佈時間,但我更感興趣的是,哪些應用可以充分利用大語言模型的所有能力。”在現場,李彥宏表示,在中國,無論是初創公司、還是互聯網大廠,都在努力尋找PMF(產品市場契合度),致力於探索最能發揮生成式AI能力、能被數十億人使用的應用形態。

他舉例說,在移動互聯網時代,有大量DAU達到數億、乃至十億的超級應用;但在人工智能時代,無論是美國、歐洲還是中國,超過1億日活的超級應用都尚未誕生。“超級應用最可能的形態是什麼?是一個聊天機器人、還是Copilot,目前還不確定。”

李彥宏介紹,自去年上線至今,文心一言的累計用戶已經達到2億,每天都有數千萬用戶在使用搜索、文庫等應用的AI功能。隨著這些用戶的快速增長,全新的AI應用形式會逐漸成型,成為超過1億DAU的超級應用,“未來與我們今天看到的大不相同。”

應用創新

驅動基礎模型創新

在李彥宏看來,關注應用並非是忽視基礎模型的發展,與之相反,AI應用與基礎大模型的發展相輔相成。

“應用的進步,可以推動基礎模型的創新,也有助於加快從互聯網時代向人工智能時代的轉變。”他以百度搜索、直播電商數字人等應用舉例說,應用端獲取真實的用戶需求和問題後,可以持續反饋模型,並由此推進基礎模型的技術迭代。

在基礎模型的數據訓練方面,李彥宏表示,超級應用誕生後,還可以促進大量數據生成,為大模型提供更加充沛的訓練數據。“有人說,隨著模型參數越來越大,我們很快就會用完所有現存的數據,但我認為,當超級應用誕生時,數據會大量生成,所以我並不擔心。”

談話中,李彥宏也提及了百度基礎模型的定位,“我們最主要的市場在中國,所以在中文上,我們一定要比世界上任何模型都做得好。現在,文心大模型4.0的中文能力已經超過了GPT-4。”

AGI時代還未到來

或需要十年以上

“我是人工智能的長期信仰者,”李彥宏回顧過往,早在30多年前的大學時期,就已學習了人工智能課程;創立百度後,他意識到AI是解決搜索引擎問題的核心技術,因為兩者的本質,都是讓機器理解人類語言。“所以在十多年前,我們就開始積極投入研發人工智能,尤其是與自然語言相關的人工智能。”

李彥宏以國產大模型應用為例談到,百度於2019年推出1億參數規模的文心大模型1.0版本,在2.0版本升級至10億參數,ChatGPT發佈後不久,即推出了3.0版本,發佈速度遠超全球其他上市公司,“是因為我們準備得更加充足、工程師非常努力,我們一直在朝著這個方向努力。長期的信念,讓我們為這樣的顛覆性創新做好了準備。”

不過,與李彥宏的預想相比,人工智能技術的進步速度並不算快,“過去幾年,每個人都對技術的發展速度感到震驚,但對我來說,它太慢了。”此前,他曾在另一場演講中提到,人工智能的概念首次提出至今已超過70年,曆經多次技術浪潮,但仍然未達到真正的“AGI時代”。

“很多人都在談論AGI(通用人工智能),他們說可能還要兩年或者五年,”李彥宏預測,但要真正抵達理想中的AGI時代,“我認為還要十年以上”。