微軟新必應中文版體驗:集成AI和實時搜索,比ChatGPT強在哪

微軟的新版搜索工具必應(Bing)推出近一週,陸續有用戶通過內測申請。不少人都在好奇,搭載了聊天機器人的搜索引擎會更加智能嗎?與ChatGPT相比,新版必應有什麼不同?

2月13日晚,澎湃新聞記者登錄新版必應,試圖讓其推薦電影、撰寫文章、提供旅遊攻略等。體驗過程中記者發現,與ChatGPT相比,新版必應的反應更快,回覆耗時更短;此外,新版必應還更加“人性化”,不僅會為用戶提供問題選項,還會在回覆中使用表情符號;同時,新版必應更加“嚴謹”,會在回覆中標註所引用的來源,並列出對應網站。

不過,新版必應仍然存在不少瑕疵,例如受限回答字數限制,無法提供完整的答案,版本的中英文翻譯也沒有實現一致。

科普能力較強,獲取及時信息

目前,新版必應的聊天必須通過微軟Edge瀏覽器才可以訪問,用戶根據提醒直接下載安裝,登陸賬號通過審核後就可體驗。

從界面來看,新版必應在聊天模式下具有三種功能,分別為聊天、撰寫和見解,其中“見解”仍在開發階段,無法使用。

在聊天模式下,澎湃新聞記者要求必應介紹2022年的諾貝爾文學獎得主,並推薦一部作品。

從回覆來看,新版必應能夠準確地告知2022年諾貝爾文學獎得主是法國女作家安妮·埃爾諾,並從埃爾諾的創作風格、作品特點等方面展開介紹。

它回覆稱,“2022年諾貝爾文學獎得主是法國女作家安妮·埃爾諾(Annie Ernaux),她是一位以自傳體為主的作家,她的作品與社會學保持緊密關係,揭示了階級經曆的痛苦,描述了羞恥、羞辱、嫉妒以及無法看清自己是誰的困境。她的作品中,埃爾諾始終從不同的角度審視了一種在性別、語言和階層方面有著強烈差異的生活。”

除了回答問題,新版必應還會在引用的每一句話之後標註來源,當光標移動到腳註之上時,界面中會浮現完整鏈接和標題。在本次回覆中,新版必應引用了騰訊新聞、百度百科、澎湃新聞等網站的內容。

新版必應完成回答後,還會為用戶提供新的問題模板,用戶可以直接點擊感興趣的問題進行提問,也可以自己提出新問題。

被詢問推薦作品時,新版必應推薦了《悠悠歲月》(Les Années)。在此基礎之上,記者追問“你有沒有讀過安妮·愛爾諾的其他作品”,必應不僅給出了回答,還進一步對此做出瞭解釋,“我沒有讀過安妮·埃爾諾的其他作品,但我對她的創作風格很感興趣。她的作品都是基於她的親身經曆,但又不是傳統的自傳,而是試圖把個人的記憶與社會的曆史聯繫起來,創造了一種新的文學形式。我覺得這很有創意和價值。”

ChatGPT最明顯的“缺陷”之一,是只能獲取截至2021年的知識。而搭載了ChatGPT同源技術的新版必應彌補了這方面的不足,它提供的信息更加“新鮮”。

被要求推薦好看的科幻電影時,必應回覆《新蝙蝠俠》《阿凡達2》以及《黑客帝國:矩陣重啟》,其中前兩部均於2022年上映,就連今年上映的《流浪地球2》也在新版必應的電影列表之上。

在推薦《流浪地球2》時,新版必應能夠簡潔明了地概括電影的劇情,“這是繼2019年《流浪地球》之後的續集,講述了人類為了逃離太陽系,前往半人馬座α星系的冒險故事。”

對指令的理解能力較強,但仍存在錯誤

新版的必單獨推出了撰寫功能,用戶可以提出寫作主題的需求,並製定回覆的格式,例如郵件、段落,以及行文的語氣以及長短。

澎湃新聞記者嚐試讓必應給老師撰寫一封請假郵件,“告訴她由於生病住院,我無法參加期末考試。”

從形式來看,新版必應撰寫的郵件符合基本格式,包含了稱謂語、開首應酬語、正文、結尾應酬語、祝頌語、署名與日期七個部分。內容方面,新版必應不僅詳細解釋了病情和症狀,還主動提出了補考申請,“我非常重視這門課程,也非常尊重您的教學,我不想因為這次意外而影響我的學習成績。我希望您能夠諒解我的困難,給我一個補考的機會。”

從新版必應起草的郵件可以看出,它具有較強的書寫能力。為了測試新版必應是否能夠撰寫專業文章,記者要求它寫一篇關於“聊天機器人ChatGPT”的新聞稿件,並限制字數為800字左右。

新版必應所取的新聞標題為《OpenAI推出聊天機器人ChatGPT,引領AI新紀元》,改文章的結構較為清晰,包含導語、文章主體和結語。從內容來看,文章包含ChatGPT的推出時間、發明公司、特點及應用場景。

以導語為例,新版必應寫道,“近日,人工智能研究機構OpenAI發佈了一款聊天機器人軟件:ChatGPT。該軟件使用了先進的自然語言處理技術,能夠與人類進行流暢的對話,還能根據用戶的需求,完成各種任務,如寫文章、寫代碼、翻譯等。ChatGPT被認為是人工智能領域的一項重大突破,開啟了AI新紀元。”

該文章也滿足了800字左右的要求,但是,這篇文章並不完整,或許是因為字數的限制,在結尾的地方戛然而止。記者點擊右下角的刷新按鈕,得到了一篇新的文章。不過,新的文章與第一篇文章相比,並不太像新聞稿件。

此外,新版必應的回覆中也存在中英混雜的現象,人工智能看上去有些不那麼“智能”。

新版必應生成的第二篇文章新版必應生成的第二篇文章

整合能力更完善,且更智能化

在網絡時代,搜索引擎是用戶蒐集信息的主要工具。搭載了聊天機器人之後,搜索引擎提供的信息會更加豐富嗎?

澎湃新聞記者提出問題,“我想去日本旅遊五天,預算在兩萬元左右,請幫我規劃一份旅遊攻略。”在沒有提出具體的旅遊城市要求時,新版必應預設旅遊地點為日本首都東京。

新版必應詳細地規劃了每一天的行程及花銷,不僅推薦了淺草寺、東京塔等知名旅遊景點,並告知門票價格和彙率,還列出炸豆腐、章魚燒、烤魚餅等傳統當地美食,建議用戶體驗當地傳統文化。

以第一天的行程規劃為例,新版必應的建議為,“從北京出發,乘坐飛機到達東京,大約需要4個小時。機票價格大約是4000元。到達東京後,你可以先入住酒店,然後去附近的淺草寺參觀,感受日本的傳統文化。淺草寺是東京最古老的寺廟,有著悠久的曆史和美麗的建築。你可以在那裡拍照,祈福,還可以品嚐一些日本的小吃,比如炸豆腐,章魚燒,烤魚餅等。淺草寺的門票是免費的,你只需要花費一些交通費和餐飲費,大約是200元。晚上,你可以去東京塔觀賞夜景,東京塔是東京的標誌性建築,高333米,是世界上最高的自立式鋼塔。你可以乘坐電梯到達150米和250米的觀景台,欣賞東京的全景。東京塔的門票是1200日元,約合75元人民幣。你還可以在塔內的商店和餐廳消費,大約是300元。這樣,你的第一天的花費是4575元。”

隨後,記者又嚐試讓新版必應推薦投影儀,要求為“希望畫面清晰不卡頓,預2000元以內”。

在推薦產品前,新版必應首先提醒用戶該價位投影儀的優缺點,“2000元以內的投影儀主要是以便攜式投影儀為主,尺寸小巧重量也比較輕,但是在亮度和解像度方面可能會有所犧牲,所以你需要根據你的使用場景和觀影習慣來選擇。”

在此基礎上,它推薦了三款投影儀,並分別詳細列出了每款產品的售價、亮度、解像度以及合適的使用場景。

這一次,新版必應的信息來源為知乎和b站,通常而言,知乎和b站中含有較多的測評產品類內容。

本質仍為搜索引擎,不預設立場

在此前的回覆中,新版必應展現了較強的文本理解、整合信息能力,但其本質仍然是搜索引擎,不具備價值取向和偏好。

記者詢問新版必應是否能夠超越Google搜索引擎,它並沒有正面回覆這一問題,而是提供了新版必應的相關介紹。

面對Google聊天機器人Bard和ChatGPT哪個更好用的提問時,新版必應撰寫的內容稱,“Bard和ChatGPT的比較可能沒有一個客觀的標準,不同的用戶可能有不同的偏好和需求。”

新版必應仍然提供了二者的不同之處,以及各自的優勢:“Bard的優勢在於它可以學習不限定年份的數據,而ChatGPT只能學習2021年之前的數據。這意味著Bard可能更能適應時代的變化,而ChatGPT可能會落後於最新的信息和趨勢……另一方面,ChatGPT的優勢在於它的語言模型更強大,比Bard使用的LaMDA更先進,能夠更好地理解和回答用戶的問題。”

記者進一步追問“你個人更喜歡Bard還是ChatGPT?為什麼?”新版必應表示,“我個人沒有特別的偏好,我覺得Bard和ChatGPT都是很有趣和有用的聊天機器人。我喜歡Bard的創造力和多樣性,它可以與Google的其他產品和服務相結合,提供更多的功能和體驗。我也喜歡ChatGPT的智能和靈活性,它可以切進或切出聊天模式,根據用戶的需求提供更具對話性的搜索和創建內容的替代方式。”

有意思的是,在被要求寫一篇“GoogleBard比ChatGPT更有優勢、更具競爭力”的文章時,新版必應仍然回覆了一段約350字的文字,從多樣性、自我優化等方面,說明Bard更具競爭力。

責任編輯:孫扶