“文心一言”和ChatGPT誰更聰明?我們幫你試了試 | 封面天天見
封面新聞記者 孟梅 歐陽宏宇
在ChatGPT的“繼任者”GPT-4發佈一天之後,3月16日,百度在北京公開展示了新一代知識增強大語言模型、生成式AI產品“文心一言”。
作為後來者,文心一言無法逃脫與ChatGPT對比的命運。此前,不少人認為百度是“全村的希望”,但也有網友用一張梗圖表達了對文心一言的擔憂。
![](http://n.sinaimg.cn/spider20230316/340/w641h499/20230316/e13c-16c8f65d9cc5f310b330788cb484a77e.jpg)
之所以如此,在於Google此前急炫AI搜索肌肉時暴露出了若幹個瑕疵,導致了股價暴跌近8%;這次,在發佈會進行的同時,百度港股市值也大幅下跌超9%。
![](http://n.sinaimg.cn/spider20230316/753/w771h782/20230316/1841-de8a9e74d66aac14f81d15b51bf96ba3.png)
和ChatGPT一樣,文心一言是一個多模態大模型,包括文學創作、商業文案創作、數理邏輯推算等能力。那麼,這個中國版的ChatGPT到底實力如何?能否擔得起“全村的希望”?記者對文心一言和ChatGPT進行了實測。
中文檢索準確度高
文學創作偏理性
在文學創作上,文心一言一開場就被提問《三體》的文學常識。
![](http://n.sinaimg.cn/spider20230316/620/w908h512/20230316/0250-gif90898b045ad463221936d5d71e0ea077.gif)
看起來已是標準答案。再用同樣的問題問ChatGPT呢?
![](http://n.sinaimg.cn/spider20230316/343/w869h274/20230316/1fb2-dbcd1fe98755120e4642014e0d7c422b.png)
延續了“一本正經”胡說八道的習慣:直接把劉慈欣的籍貫都給改了。
下一個問題是對《三體》進行續寫。
![](http://n.sinaimg.cn/spider20230316/200/w640h360/20230316/03cc-gifa6c6561ce7cd8e3c6d5bac9e0026e445.gif)
看起來中規中矩,比較理性。然後是ChatGPT的答案。
![](http://n.sinaimg.cn/spider20230316/61/w863h798/20230316/8ab3-d5594973f9bb45a9432f823b81d84d71.png)
自古“文無第一”,你對誰的續寫思路更有興趣?
能給公司起名字
更懂中文背後的寓意
接下來,文心一言展示了在商業文案創作上的能力。
比如,給新公司起個名字,並且還強調這個名字是有寓意的。
![](http://n.sinaimg.cn/spider20230316/200/w640h360/20230316/de3f-gife5b845d48613a4c2e09fc3256f309cd4.gif)
再看看ChatGPT的商業策劃能力。
![](http://n.sinaimg.cn/spider20230316/519/w864h455/20230316/7627-0a0fe0791142826cc47665f503206b04.png)
看起來,ChatGPT對中文的理解還是相對膚淺。
解小學奧數題無壓力
還知道出錯了題
數學計算能力是考驗生成式大模型的一大難題。ChatGPT剛上線時,也翻了不少車。現場,文心一言被問到的是小學數學競賽常見的雞兔同籠問題。
值得一提的是,現場展示的第一題題目出錯了,文心一言也給與了及時反饋。修改了題目後,文心一言給出了詳細的解題步驟。
![](http://n.sinaimg.cn/spider20230316/668/w939h529/20230316/f6e0-c86c4fda130e52b4f930059268197f92.png)
中文理解力更勝一籌
英文能力稍欠缺
作為紮根於中文世界的生成式AI,廣大網友對文心一言的中華文化理解力寄予厚望。那麼,其對中文的理解能力究竟如何?
用“洛陽紙貴”分別問文心一言和ChatGPT。
文心一言不但解釋了成語及其來源,還闡釋了背後的經濟學原理。
![](http://n.sinaimg.cn/spider20230316/599/w915h484/20230316/0bff-0730be3cfb9fc7d83522086a55affbf8.png)
![](http://n.sinaimg.cn/spider20230316/392/w913h279/20230316/e95f-487a95ee9114af00f99ff3a9b2e29e2e.png)
相比較而言,ChatGPT對中華文化的理解就要遜色一些。
![](http://n.sinaimg.cn/spider20230316/400/w866h334/20230316/2b2f-6735593493afc086ae82f267debdb9be.png)
只不過在闡釋經濟學原理上,與文心一言能力相當。
![](http://n.sinaimg.cn/spider20230316/456/w868h388/20230316/8553-44f555703075337680d3f18a2c712ddd.png)
再看看雙方寫的藏頭詩。
文心一言的七絕略顯得“打油”。
![](http://n.sinaimg.cn/spider20230316/325/w921h204/20230316/c493-bbd44f339e204c30360b550d84ff8dc7.png)
ChatGPT給出的答案就更加離譜,似乎不理解“藏頭詩”是什麼含義。
![](http://n.sinaimg.cn/spider20230316/327/w864h263/20230316/7302-ebb561d20a73785b48a887a1cda93e20.png)
據介紹,在英文上,文心一言雖然也能處理,但能力是顯著不如中文的。這或許和目前能用到的訓練數據有關。
不過,在發佈會後,百度港股股價也有所回升。對此,文心一言還解釋了個中緣由,不過話裡話外都是“客觀原因”。
![](http://n.sinaimg.cn/spider20230316/89/w1080h609/20230316/8b50-b29b6d86ef4148fb43780703e0c20757.jpg)
不服氣的記者又問了一個關於“自己”的問題。答案卻是……
![](http://n.sinaimg.cn/spider20230316/757/w1054h503/20230316/fc6e-6365851f36ced8a12b94f4b4fb24b2ca.png)
怪不得不少網友對文心一言展示出的能力不太滿意,甚至有人調侃,看完之後感覺“提前退休的日子看起來還可以緩一緩”。
![](http://n.sinaimg.cn/spider20230316/154/w799h155/20230316/1d09-789df53a95a00908d879d21259415967.png)
不過也有網友表示,希望能給國產產品多一點時間和耐心。
在此之前,已經有超過650家生態合作夥伴宣佈加入文心一言,包括封面新聞、環球時報等媒體,以及企業和機構組織。這款中國造ChatGPT究竟好不好用,能走多遠,相信很快就會有答案。