把12個AI湊到一起打工,它們竟然搞起「小團體」?

各位老師、同學們,大家下午好!我是來自中國科學院計算機網絡信息中心的祝恒書。

今天非常開心能夠來到這裏和大家分享現在非常火的人工智能大模型的話題。為此,我還專門請我的女兒給今天的演講起了一個題目,叫《大模型來了,閣下又該如何應對?》。

今天這個報告,主要想跟大家探討一下,在像大模型這樣的新一代人工智能的浪潮下,我們每個人能夠做些什麼,以及我們未來還需要做些什麼?

在今天的報告開始之前,我給大家提一個問題:你心目中的人工智能是什麼樣的?

大家不用急著回答我的問題,我希望大家帶著這個問題,來聽今天的演講。我相信在最後,你們每個人應該都會有新的思考。

那麼接下來就進入今天的演講了。

從單一到通用

我從最近我們全家都在玩的一個遊戲說起。這款遊戲叫《原神》,是非常好的國產開放世界遊戲,我們全家都在玩。這款遊戲的音樂也非常好聽,還有很多富有哲學思考的內容。

在這個遊戲的最新章節中,有一個非常重要的人物,叫阿貝多,就是下圖右邊這個金髮的「少年」。

阿貝多是個什麼人物呢?他是蒙德西風騎士團調查小隊的隊長,還是一個非常厲害的煉金術師。另外,他還有一個不為人知的身份——他是一個人造人。

什麼叫人造人?就是由人所製造出來的人類。

這件事情聽起來特別玄幻。但是用機器製造一個人造人,其實是每一個做人工智能的研究者的終極夢想。

人工智能是什麼?人工智能的英文叫「Artificial Intelligence」,所以大家簡稱「AI」。從AI誕生到現在,它的定義一直在變。我自己最喜歡的定義,就是人工智能是人所創造出來的機器智能。它的關鍵是讓機器像人一樣,用智能的方式去思考並解決問題。但是,直接造出像阿貝多這樣的人造人,讓他解決所有問題,是一件非常困難的事情。

人工智能的科學家在過去的70年里做了大量的工作,選擇了逐步擊破。所以傳統的人工智能,通常只是解決某一個領域的單一問題。比如說,科學家們製造出了可以切菜、可以做手術的機械臂;製造出了可以空翻的機器人;今年(2025年)春晚上扭秧歌、扔手帕的機器人;還有各種各樣的自動駕駛、無人車……這些其實都是人工智能。

但是這些人工智能,通常只能解決某一個單一領域的問題。那麼,讓一個機器去解決通用領域的問題,這就是人工智能科學家一直所追求的夢想。

人工智能是從1956年的達特茅斯會議上提出來的,距今已經有將近70年的歷史了。我相信大家肯定也聽過很多人工智能的講座。那些老教授們經常會講,這70年里發生了幾次浪潮、幾次革命。

但是很遺憾,我是一個85後。在人工智能發展的前30年,我還沒有出生。人工智能前30年發生的事情,我也是道聽途說,所以沒有辦法跟大家準確地分享。我重點講講我出生以後的30年,人工智能領域發生了什麼事。

在我出生之後的這30年里,我覺得人工智能領域有三件非常值得銘記的大事。

第一件事,是1997年,IBM公司研發了一個超級計算機,叫深藍(Deep Blue)。這個計算機在國際象棋上戰勝了世界冠軍卡斯帕羅夫。這件事在我小學的時候引起了很大轟動,都寫到了考試卷里。

為什麼引起這麼大的轟動呢?因為國際象棋是一個智力運動,以前大家覺得讓機器在智力運動上戰勝人類,幾乎是不可能的。但是IBM通過超級計算製造出一個人工智能,戰勝了人類的冠軍,這非常厲害。

第二件事是過了20年之後,在2016年,Google投資了一個英國公司——DeepMind。這家公司開發了一個人工智能,叫AlphaGo,中文是阿爾法狗。這是一個下圍棋的人工智能,它在圍棋上戰勝了當時的世界冠軍李世石。後來它的改進版本,還戰勝了中國的世界冠軍柯潔。

這件事在當時引起了非常巨大的轟動,甚至開啟了一個全新的人工智能深度學習的時代。為什麼?因為圍棋的複雜度非常高,空間複雜度高達10360,這超過了宇宙所有原子的數量。所以大家一直認為,圍棋是人類智力運動皇冠上的明珠,是絕對不可能被人工智能戰勝的。最後,一個AI通過很精妙深度設計的算法,戰勝了人類。

據說當時在中國棋院流傳著一個段子:以前你形容一個人下棋下得「臭」,就說你棋下得就跟AI一樣。現在你說下得跟AI一樣,那人會說太榮幸了,這是在誇我。這雖然是個段子,但確實是這樣。

第三件事是,2022年10月30日,美國的一家名為OpenAI的公司發佈了一個生成式人工智能大模型,叫ChatGPT,它真正地開啟了大模型時代。

之後全球出現了百模大戰,中國出現了DeepSeek、豆包、文心一言、ChatGLM(智譜清言)等一大堆的模型,讓我們看到了通用人工智能的曙光。

通用人工智能的曙光

為什麼說大模型是通用人工智能的曙光呢?我相信大家都用過大模型。首先,你可以用自然語言跟它交互,問它各種問題。你可以問它,能不能幫我寫一首藏頭詩,裡頭要有人大附中這四個字,它能給你寫一首詩。

你還可以說,請用中學生能夠聽得懂語言,解釋一下什麼叫相對論,它也可以告訴你。

它還可以幫你畫畫。你說,請幫我用中國水墨畫的風格,畫一個人工智能的一個宣傳圖。大家用了可能覺得還不稀奇。

其實對我來說,大模型是讀懂年青人梗的一個特別好的東西。我現在發現,我跟我女兒交流的時候,經常不知道她在說什麼。我加她微信,她有時候給我發一張圖,說:「嗬嗬嗬,自己嚇自己。」我問女兒這是什麼意思,她嗬嗬嗬不講。

於是我就把這張圖發給了大模型,大模型就告訴我,這是現在年青人里流傳的一個段子,是一個短影片里的梗圖。所以我就把這張圖加到我的表情包里了。現在,我女兒有時候晚上發:「天黑了怎麼辦?」我就給她發:「嗬嗬嗬,自己嚇自己。」

大模型除了可以問答以外,還可以幹什麼?它還可以理解我們物理世界,去創造一個虛擬的世界。這個影片來自在去年(2024年)年初OpenAI發佈的一個文生影片大模型Sora。

這個影片是什麼意思呢?我寫一段文字,比如東京街頭上,一個時尚的女性在走。Sora就可以生成一個短影片,這是非常厲害的事。從人工智能科學家角度來說,這件事是跨時代意義的,因為它代表大模型能真正地理解人類的物理世界,而且能創造一個虛擬的世界。比如它知道了什麼叫做時尚、什麼叫做東京的街頭,它們的特點是什麼,而且知道人在街頭走,而不是在飛。這是非常厲害的事情。

當然,大家說這些可能都還不厲害。我們現在在上學,人工智能如果真的厲害,它去高考會怎麼樣?其實這件事,在兩年前,國內外的科學家們就去做了實驗。

首先是美國的科學家讓人工智能去考美國的高考SAT和美國的研究生考試GRE。考完的結果是什麼呢?大模型在語文上超過了90%的真人考生,在數學上超過了80%的考生,綜合成績能考進美國排名前30到50的學校。這至少相當於我們C9高校,是非常厲害的。

大家可能會說美國的高考不行,因為美國的題太簡單,那如果換成中國高考會怎麼樣?去年(2024年)就有中國的媒體做了一個實驗,用大模型去考去年(2024年)全國高考新課標一卷的文科考試,最後發現有四款大模型在河南省考進了一本線。

▲左:GPT-4 的 SAT/GRE 成績大致相當於能申請上美國 Top 30~50 的大學和研究生項目;右:四個AI大模型成功「衝上一本線」,理科普遍不及格,大模型更像文科生

從這裏,我們還可以看到很好玩的事——大模型在中國的高考上,數學、物理這些理科普遍不及格。它在美國能超過80%的人,在中國就不及格,這說明什麼?中國的題太難了,美國的題太簡單了。所以經常大家說,中國的初中生去美國,是碾壓美國的高中生的。

聽完這些以後,大家知道大模型非常厲害了。它能夠理解世界的知識,還創造了虛擬世界。

那麼,我們回到一開始的人造人。我們能不能通過大模型,去製造一個虛擬的世界?製造一群人造人來幫我們工作呢?這是我去年(2024年)給團隊的研究員們提的一個問題。於是,我們花了一點時間製造了一個人工智能科學家組成的實驗室。這個實驗室里有12個形態各異、能力各異、學科領域各不相同的AI科學家。

我們給了這些AI科學家一個任務,就是每天去幫我們讀論文,幫我們討論研究點,以及幫我們寫一些新的科研建議。

我們做出來的這個虛擬實驗室,一共有12個人造人,每天大家會自主上班,居然還有AI差點兒遲到了。它們每天會自己組織在一起開會、討論。我們還很人性,中午可以讓AI去吃個午飯休息一下。它們每天還會下班。

這裏的每一個小人兒,都不是我們寫的規則,而是完全通過大模型讓它自主地去從事任務。

我們給這些AI每天佈置任務,比如幫我讀一些最新的論文,幫我討論人工智能領域還有什麼新的學科交叉結合點。它們就會自主地去行動,自主地去工作,效率非常好。

而且,我們發現了非常好玩的社會化現象,不同的人工智能會互相聚在一起形成不同的社交群體,而且每一個不同的群體中,會出現一些小的領袖,跟我們人類社會非常接近。這告訴我們一個道理,領袖都是從群眾中憑能力成長起來的,人工智能也是一樣的。

訓練大模型,跟訓練人很像

講完這些以後,我們來點幹貨。跟大家講講大模型這麼厲害,它是怎麼被造出來的。當然這個在我們領域,不叫製造,叫訓練(training)因為我們訓練一個人工智能,就是給它各種歷史數據,讓它擬合,最後讓它去預測未來,跟訓練人是很像的。

那麼剛才介紹的像ChatGPT這樣的大語言模型,是怎麼被訓練出來的呢?它的核心本質是什麼?其實就是這個公式。

這個公式是什麼意思呢?其實就是給定前N個單詞或者前N個字母,去預測第N+1個單詞或字母的概率是多少。舉個例子,比如說前三個字是「人大附」,那麼第四個字到底是人大附中的「中」,還是人大附小的「小」呢?大模型就會根據全文的情況去推測、預測,給一個概率,這個就是人工智能。

怎麼去做這件事?我以大語言模型的訓練為例,給大家講講,我們是怎麼把它給訓練出來的。

為了訓練一個超級人工智能,我們有三個步驟。第一個步驟叫預訓練,就是給它讀萬卷書,把我們看過的所有書、所有材料都給人工智能,讓它去學、去讀。經過這個階段大模型,能夠理解很多世界的知識,但是還不會說話。

第二個步驟,就讓它閱讀範文。這個在專業領域,叫做有監督的微調。比如說寫一個關於河北的作文,這時候我們給人工智能一個範文,讓它跟著這個去學。經過這個訓練,大模型會說話了,也會寫作文了,但是寫得還不夠好。

最後一個階段,就是讓它實戰演練。人工智能寫完了,我們去打分,我跟它說寫得不好、不及格,重寫。那麼經過這樣的反復迭代、循環,我們也稱為基於人類反饋的強化學習的階段以後,大模型就會寫得很好了。最後,經過這三個階段,就產生了我們現在的大模型。

其實這個過程,跟我們學習非常像,同時跟我們每一個人學習語言的過程也非常像。不知道大家記不記得自己當年是怎麼學會說話的,但我觀察了我們家小孩長大的過程,覺得很像。一開始大人老跟她說,她就模仿,那時候她還不太會說話,但是會模仿。後來她上了幼兒園,去跟大家,跟老師、同學做交互,她就會說話了。在這個過程中,語言出現了湧現。

在這個過程中,我們還發現了一個非常有趣的現象:國外的大模型大量的訓練數據是英文,但是它的中文卻能說得很好。相反,中國的大模型主要的訓練數據是中文,但它的英文也能說得很好。這說明,人類的語言可能在基礎語法上是相通的。這個也印證了美國著名語言學家諾姆·祖姆斯基,在著作中提到的先天語法樹理論

這給大家一個什麼啟示呢?如果各位覺得自己英語學得不好,大概率是語文也沒有學好。如果你們語文學得很好,英語肯定也不會差。

大模型重塑工作和創新

大模型這麼厲害,那會不會對我們人類社會產生影響?會不會搶我們人類的飯碗?

現在媒體上已經有很多報導了,比如說因為AI很多公司裁員了,很多人要抵製AI。這個事變成了一個很好玩的研究課題。國外的OpenAI在《科學》(Science)雜誌上發表了一篇論文。他們得到一個很有趣的結論,說未來有80%美國勞動力的工作會受到人工智能的影響。

中國的一家科研機構預測,未來5年會有超過73%的工作,要求使用大語言模型。同時還得到了一個非常有趣的結論,那些知識密集型的、白領型的工作最容易受到影響。而那些勞動密集型的、工兵型的工作受到影響更小。

所以說「卷」到最後,居然工兵型才是「鐵飯碗」。這件事跟我們從小學習到的是反的。因為老師都跟我們說,你們不好好學習未來只能去刷碗,只能去當保安,最後工兵型被機器替代了。但現在有可能學到最後,學得最好,卻最有可能被替代。

為什麼會出現這樣一個反常識的結論?其實並不是這樣。因為大模型時代,它替代的實際上是「腦力勞動」中的「體力勞動」。

可能每個同學都覺得,做作業都是腦力勞動。但你們認真地想一下,做作業的時候真的都是腦力勞動嗎?很多時候很多題都做十遍二十遍了,家長說再複習複習 。你們累的根本不是腦,而是手、是胳膊。那其實大模型替代的,就是「腦力勞動」中的「體力勞動」,那些事務性、繁瑣的、常規的事情。

為什麼感覺工兵型的工作,好像被影響較小呢?那是因為工兵型的工作,早在一個多世紀之前的工業革命時期,基本該替代的就被替代了。那時候在英國甚至發生了工人因為怕機器搶他們工作,去打砸機器的盧德運動。

▲左:盧德運動,1811 (Luddite Movement);右:汽車替代馬車的時代啟示▲左:盧德運動,1811 (Luddite Movement);右:汽車替代馬車的時代啟示

事實上一個新技術的出現,不光會顛覆現有的一些工作,也會產生很多的創新,會創造一些新的工作機會。比如說汽車替代了馬車,但它也創造了司機,創造了道路養護,創造了汽車維修這些新的工作。所以汽車替代的永遠不是馬車伕,而是那些不願意改變,不願意創新的馬車伕。

因此,我們團隊做了一個研究工作,得到一個結論:大模型正在重塑我們工作和創新的邊界。

到底什麼叫創新?有人說我會畫畫,我會寫作文,我會寫小說這是不是就是創新呢?創作不等於創新。

大家可以看到,下面的兩張圖,都是以動物園為主題的兩幅畫,大家覺得哪一幅才是創新?

很多人可能覺得左邊很漂亮,其實左邊我是用大模型生成的。我給它寫了句話,請以梵高《星空》的風格幫我畫一幅動物園,大模型畫出來了。這裏的動物都是歷史上真實存在的,畫風也是模仿梵高的,它其實是一種模仿。

右間這幅是我在網上找的一個小學生的畫作。大家看這幅圖裡頭,有紅色的天、紅色的雲,還有不知道什麼動物,這其實創造了一個新的物種,這可能才是真正的創新。

所以,創新的核心是打破現有知識的邊界。大模型時代,我們每個人一定要去「卷」的是創新。只有「卷」創新,才能讓我們躲開那些「腦力勞動」中的「體力勞動」陷阱。

在最後,我再跟大家分享一下,在大模型時代我們每個人要做些什麼?要做好哪些準備?我在這裏給大家提兩點建議。

第一個建議叫知己知彼,百戰不殆。

我們現在已經進入了大模型時代,這是一個人智協同的時代。我們對這個東西不能避而不見了。比如說家長、老師說,大模型這麼厲害,會不會讓學生變得懶惰,會不會讓學生以後就抄作業了,所以不能用大模型。

我個人認為這是不對的。每個人一定要堅持用,積極地去用。因為只有你多用,才能知道大模型的邊界在哪裡,才能更好地批判性地去使用它。大模型確實有幻覺,但是它也能夠提升我們效率,是幫助我們創新的一個利器。

這裏最重要一點,是我們要知道大模型的能力邊界到底在哪裡。因此我們團隊針對大模型在科學領域的應用,開發了一個平台,叫「科學地平線」。

我們去看一下大模型在數理化天地生各個不同領域的學科能力到底怎麼樣。那麼有了這樣一個平台,我們就知道以後在做不同的研究時,要用什麼樣的人工智能了。

第二個建議,是要堅持終身學習。

現在我們是知識經濟時代,對於每個人來說,不變的就是要去學習,要去堅持地學習。有非常多新的知識、技能要我們去學習。

怎麼學習呢?我們團隊三年前在《自然》(Nature)子刊上發了一個工作,給了三條建議。

第一條建議叫學習要跨界,要敢於打破你自己的學習舒適區。比如說你數學學得好,要多學語文;語文學得好,英語應該就學得好;英語學得好,就要學學物理,一定要學會跨界。

第二個建議,學習不要盲目地去追逐熱門,要去做那些難而正確的事。從小老師說,學好數理化,走遍天下也不怕。當然學好語文、英語也很重要。那麼關鍵就是,我們要找到那些最基礎的東西,把基礎打好。

最重要是第三個建議,學習要學會長期的投資。我們的這篇文章中,提出了一個結論:10年的學習投入,能讓你的身價翻2.5倍。

這是非常有趣的一個結論,大家還記得在開場的時候,我問大家的那個問題嗎?

在你心目中,人工智能是什麼?

事實上,我覺得人工智能現在是什麼樣,以前是什麼樣不重要。我們更關心的是,人工智能的未來是什麼樣。

在我的眼裡,人工智能未來不僅會更強大,還會更溫暖,將是一個負責任的人工智能,叫Responsible AI。因為我們社會上有非常多的事情要解決,就像《蜘蛛俠》里說的,能力越大責任越重。我們的醫療健康、教育、社會治理,有很多問題都需要去解決,那麼人工智能就會成為大的幫助。這個工具,我們好的一個幫手,去幫助我們解決這個問題。

最後跟大家講一下,我從事人工智能這個領域研究的一個初衷和我的理想,就是AI For A Better World,人工智能讓世界更美好,謝謝大家。

本文來自微信公眾號:格致論道講壇,作者:祝恒書