“文心一言”和ChatGPT誰更聰明?我們幫你試了試 | 封面天天見

封面新聞記者 孟梅 歐陽宏宇

在ChatGPT的“繼任者”GPT-4發佈一天之後,3月16日,百度在北京公開展示了新一代知識增強大語言模型、生成式AI產品“文心一言”。

作為後來者,文心一言無法逃脫與ChatGPT對比的命運。此前,不少人認為百度是“全村的希望”,但也有網友用一張梗圖表達了對文心一言的擔憂。

之所以如此,在於Google此前急炫AI搜索肌肉時暴露出了若幹個瑕疵,導致了股價暴跌近8%;這次,在發佈會進行的同時,百度港股市值也大幅下跌超9%。

和ChatGPT一樣,文心一言是一個多模態大模型,包括文學創作、商業文案創作、數理邏輯推算等能力。那麼,這個中國版的ChatGPT到底實力如何?能否擔得起“全村的希望”?記者對文心一言和ChatGPT進行了實測。

中文檢索準確度高

文學創作偏理性

在文學創作上,文心一言一開場就被提問《三體》的文學常識。

看起來已是標準答案。再用同樣的問題問ChatGPT呢?

延續了“一本正經”胡說八道的習慣:直接把劉慈欣的籍貫都給改了。

下一個問題是對《三體》進行續寫。

看起來中規中矩,比較理性。然後是ChatGPT的答案。

自古“文無第一”,你對誰的續寫思路更有興趣?

能給公司起名字

更懂中文背後的寓意

接下來,文心一言展示了在商業文案創作上的能力。

比如,給新公司起個名字,並且還強調這個名字是有寓意的。

再看看ChatGPT的商業策劃能力。

看起來,ChatGPT對中文的理解還是相對膚淺。

解小學奧數題無壓力

還知道出錯了題

數學計算能力是考驗生成式大模型的一大難題。ChatGPT剛上線時,也翻了不少車。現場,文心一言被問到的是小學數學競賽常見的雞兔同籠問題。

值得一提的是,現場展示的第一題題目出錯了,文心一言也給與了及時反饋。修改了題目後,文心一言給出了詳細的解題步驟。

中文理解力更勝一籌

英文能力稍欠缺

作為紮根於中文世界的生成式AI,廣大網友對文心一言的中華文化理解力寄予厚望。那麼,其對中文的理解能力究竟如何?

用“洛陽紙貴”分別問文心一言和ChatGPT。

文心一言不但解釋了成語及其來源,還闡釋了背後的經濟學原理。

相比較而言,ChatGPT對中華文化的理解就要遜色一些。

只不過在闡釋經濟學原理上,與文心一言能力相當。

再看看雙方寫的藏頭詩。

文心一言的七絕略顯得“打油”。

ChatGPT給出的答案就更加離譜,似乎不理解“藏頭詩”是什麼含義。

據介紹,在英文上,文心一言雖然也能處理,但能力是顯著不如中文的。這或許和目前能用到的訓練數據有關。

不過,在發佈會後,百度港股股價也有所回升。對此,文心一言還解釋了個中緣由,不過話裡話外都是“客觀原因”。

不服氣的記者又問了一個關於“自己”的問題。答案卻是……

怪不得不少網友對文心一言展示出的能力不太滿意,甚至有人調侃,看完之後感覺“提前退休的日子看起來還可以緩一緩”。

不過也有網友表示,希望能給國產產品多一點時間和耐心。

在此之前,已經有超過650家生態合作夥伴宣佈加入文心一言,包括封面新聞、環球時報等媒體,以及企業和機構組織。這款中國造ChatGPT究竟好不好用,能走多遠,相信很快就會有答案。