“文心一言”和ChatGPT誰更聰明？我們幫你試了試 | 封面天天見

03月16日 19:31 新浪網 tech-auto-hilite

封面新聞記者孟梅歐陽宏宇

在ChatGPT的“繼任者”GPT-4發佈一天之後，3月16日，百度在北京公開展示了新一代知識增強大語言模型、生成式AI產品“文心一言”。

作為後來者，文心一言無法逃脫與ChatGPT對比的命運。此前，不少人認為百度是“全村的希望”，但也有網友用一張梗圖表達了對文心一言的擔憂。

之所以如此，在於Google此前急炫AI搜索肌肉時暴露出了若幹個瑕疵，導致了股價暴跌近8%；這次，在發佈會進行的同時，百度港股市值也大幅下跌超9%。

和ChatGPT一樣，文心一言是一個多模態大模型，包括文學創作、商業文案創作、數理邏輯推算等能力。那麼，這個中國版的ChatGPT到底實力如何？能否擔得起“全村的希望”？記者對文心一言和ChatGPT進行了實測。

中文檢索準確度高

文學創作偏理性

在文學創作上，文心一言一開場就被提問《三體》的文學常識。

看起來已是標準答案。再用同樣的問題問ChatGPT呢？

延續了“一本正經”胡說八道的習慣：直接把劉慈欣的籍貫都給改了。

下一個問題是對《三體》進行續寫。

看起來中規中矩，比較理性。然後是ChatGPT的答案。

自古“文無第一”，你對誰的續寫思路更有興趣？

能給公司起名字

更懂中文背後的寓意

接下來，文心一言展示了在商業文案創作上的能力。

比如，給新公司起個名字，並且還強調這個名字是有寓意的。

再看看ChatGPT的商業策劃能力。

看起來，ChatGPT對中文的理解還是相對膚淺。

解小學奧數題無壓力

還知道出錯了題

數學計算能力是考驗生成式大模型的一大難題。ChatGPT剛上線時，也翻了不少車。現場，文心一言被問到的是小學數學競賽常見的雞兔同籠問題。

值得一提的是，現場展示的第一題題目出錯了，文心一言也給與了及時反饋。修改了題目後，文心一言給出了詳細的解題步驟。

中文理解力更勝一籌

英文能力稍欠缺

作為紮根於中文世界的生成式AI，廣大網友對文心一言的中華文化理解力寄予厚望。那麼，其對中文的理解能力究竟如何？

用“洛陽紙貴”分別問文心一言和ChatGPT。

文心一言不但解釋了成語及其來源，還闡釋了背後的經濟學原理。

相比較而言，ChatGPT對中華文化的理解就要遜色一些。

只不過在闡釋經濟學原理上，與文心一言能力相當。

再看看雙方寫的藏頭詩。

文心一言的七絕略顯得“打油”。

ChatGPT給出的答案就更加離譜，似乎不理解“藏頭詩”是什麼含義。

據介紹，在英文上，文心一言雖然也能處理，但能力是顯著不如中文的。這或許和目前能用到的訓練數據有關。

不過，在發佈會後，百度港股股價也有所回升。對此，文心一言還解釋了個中緣由，不過話裡話外都是“客觀原因”。

不服氣的記者又問了一個關於“自己”的問題。答案卻是……

怪不得不少網友對文心一言展示出的能力不太滿意，甚至有人調侃，看完之後感覺“提前退休的日子看起來還可以緩一緩”。

不過也有網友表示，希望能給國產產品多一點時間和耐心。

在此之前，已經有超過650家生態合作夥伴宣佈加入文心一言，包括封面新聞、環球時報等媒體，以及企業和機構組織。這款中國造ChatGPT究竟好不好用，能走多遠，相信很快就會有答案。