我讓AI幫我做了一份旅遊攻略,看看誰最貼心

出品|虎嗅科技組

作者|餘楊

編輯|苗正卿

頭圖|視覺中國

8月27日,中秋國慶假期調休消息衝上熱搜,網民總結:「上6休3上3休2上5休1上2休7再上5休1。」

乍一看還以為是新式繞口令,琢磨了一下,大致是說,今年的中秋和國慶,從9月9日開始,先是上6休3(中秋節),再是上3休2,接著上5休1,然後上2休7(國慶節),最後上5休1,接連5周調休。

複雜是複雜了點,但中秋國慶假期嘛,熱搜年年上,今年我準備把耳朵捂起來,不改變世界,只改變自己,給自己整點兒花活。

我讓AI幫我做了一份旅遊攻略,幫本 INTP 懶人做個計劃,測評一下大模型的「過日子」水平。

本次參與測評的玩家為:Kimi、文心一言、智譜清言、豆包。

Prompt是:今年中秋節假期我想去秦皇島旅遊,請給我製定一份旅遊攻略,包含住宿、飲食、交通、景區門票,預算控制在1000左右,3天2晚。

一共3個打分維度,分別是理解能力、攻略質量、使用體驗,額外設置驚喜點加分

接下來是Kimi、文心一言、智譜清言、豆包旅遊攻略生成的細節,老規矩,著急的朋友直接下拉到打分環節看總評。

01

Kimi

首先是Kimi,輸入prompt後,經過28秒左右的等待,我拿到了以下內容。

可以看到,Kimi給了簡單的行程安排和預算分配建議。住宿、飲食和景區門票的內容都可圈可點,煎燜子更是我在雨天秦皇島,和賣甑糕的本地老闆娘閑聊中收穫過的推薦。但是排進了第一天行程中,從邏輯上我理解無能。

在第二天和第三天的行程中,一天海邊沙灘娛樂,搭配小夜市,一天是日出和藝術館,搭配生活化海鮮餐,信息質量是不錯的。

在預算方面,按照Kimi給的中間值,700+400+75+160=1335,超預算約34%。最低值也是1070。

02

文心一言

再看文心一言,經過約47秒的等待,我拿到了住宿飲食推薦,景區和三天行程及預算等內容。

從文心一言提供的信息來看,屬於抓大放小型,相較於Kimi提供了住宿的大致片區,文心一言給出了具體的酒店名稱,抓取的商業信息較多。美食里則雜糅了食物名稱和商家名稱,如葉存利,其LLM或有待進一步提高。

去過秦皇島的朋友大概知道,秦皇島的景區分佈從北向南依次應該是1山海關、2市中心(近秦皇島火車站)、3北戴河(近北戴河火車站)、4南戴河阿那亞這幾個板塊,各個片區相距18km左右。

按照文心一言的安排,住在3,第一天1,第二天3,第三天2,如果從秦皇島站返回,這是一條不錯的路線,但如果從北戴河或機場離開,則不可避免的要折返。

不過,文心一言總結了每一個目的地的預算、遊玩時間、遊玩亮點,還是給不同需求的遊客提供了選擇的空間,不得不說優秀。

最後一部分是預算控制,從邏輯上講,飲食每日三餐平均100,3天2晚應該是300?這600塊是怎麼算出來的?令人欣慰的是,相較於Kimi,文心一言留出了往返交通費用,雖然這100顯然不夠省外票價。

總預算1583,和我要求的1000元左右,超出約58%。文心一言自己寫「略超出」,屬實是財大氣粗。

03

智譜清言

智譜清言的反應很快,約20秒我拿到了以下結果。

一目瞭然,智譜清言給出了一份非常 to C 的場景化的旅遊攻略,不僅考慮到了中秋3天假期里,往返交通也需要半天時間,還讓我吃上了早餐,行文從飲食和景區的排列也更有「人味兒」。

更值得一提的是,它是唯一一個給我提供了注意事項,讓我注意海鮮過敏,同時帶好防曬、雨傘和證件的「貼心」大模型。

而預算部分,智譜清言「很會過日子」,安排我住在4個片區中最經濟的市中心,去的是不要門票的老虎石海上公園,考慮到中秋的價格波動,總預算超出約20%也在合理範圍內。

04

豆包

豆包讓我等了約75秒,足足一分多鍾,但看完它的內容我略息怒了。

豆包的攻略是提綱挈領式的,節約了我的注意力。

第一天的行程中,「可以不買票在外面看一眼」也非常戳中貧民社畜。

行文以時間為軸,列出「地點+活動+預算」,雖然第二天沒讓我吃上午飯,但總體上信息的疏漏較少。

在住宿飲食和預算部分,住宿上豆包的攻略很精準,片區和我本地朋友的推薦語幾乎一樣。飲食也並不是「近年」炒起來的大熱,看了一眼搜索源,來自今日頭條轉載的「秦皇島旅遊文化發佈」,這是一個秦皇島市旅遊和文化廣電局官方帳號。

預算方面,按中間值計算是1100,最大值是1150。但是,它好像把交通忘了。

05

打分環節

每個維度5分,以維度為軸,按表現的排名賦分。

整體上,各家大模型的理解力都不錯。攻略質量上,智譜清言和豆包表現突出。

智譜清言攻略簡單明了,理解力cover,控制預算上,它最「會過日子」,額外還提供了注意事項的關懷,「體貼」力拉滿。

豆包行文「絲滑」,在當今這個信息爆炸的時代,節約注意力資源這一點太重要了,攻略格式打法滿分,顯現出「有零有整」的邏輯性,但在忘了交通預算上失了大分。

Kimi和智譜清言的生成速度是最快的,當然,他們的內容也相對簡單。

總的來說,作為一個懶得做計劃的P人,我不那麼嚴格,隨心跟著大模型走一遭並不壞。它幫我定好了大致的框架,也留有發揮的餘地,由於信息源綜合了官方網站和營銷網站,踩雷的空間也不大。

如果有人同行,而我是被push製定計劃的那位,大模型當然會提高我的效率,替忙著碼字搬磚的我,交上一份不那麼完美但也算及格的初稿,甚至彌補一些容易疏漏的點。

而從前玩不明白的我,也準備在旅程中,要求 AI 幫我介紹一下這個景點的歷史和文化,節約我自行搜索的注意力,讓我真正的休假。

我是餘楊,致力於發掘 AI 的實用場景,如果你也有觀點、想法或想看的測評,歡迎和我交流。如果你喜歡這期內容,別忘了一鍵三連,因為這是我探索更新的動力,我們下期再見~

如對本稿件有異議或投訴,請聯繫tougao@huxiu.com