Kimi 正在重新定義「AI 搜索」

人類負責提出好問題,搜索的體力活交給AI。

作者丨王悅

編輯丨陳彩嫻

AI搜索的故事是這麼講的:傳統搜索過程需要輸入關鍵詞,然後機械地反饋回來具有相關性的數十個藍色鏈接。AI搜索則不是返回鏈接,而是幫助總結好的內容、聚合一份「答案」。

為了讓這份答案看起來更加豐富,很多產品還提供更高級的深度搜索或研究模式。其實就是不管問什麼,AI 搜索引擎都會給出一份更長、更綜合的報告……這樣的AI高級搜索,倒是充分發揮了大模型的特長:拚湊大量的信息。

然而,這些內容看似豐富、信息量大,但實際有用的信息卻不多。用戶需要從大量的冗餘信息里,再挑選一遍有用的部分。

本來是10個藍色的鏈接,很容易辨別哪個信息源質量更高,現在是混在一起的一份形式主義的報告,要浪費更多時間才能從中再挑出有用的信息。

形式主義當然有它的用處,比如用來唬人。但大部分情況下,人們更傾向於盡快得到自己想要的信息,而不是東拉西扯,遲遲不入正題。

所以究竟AI搜索應該怎麼做?我們需要更多不同的答案,需要做更多方向探索。

巧了,國慶節剛過,就傳來了Kimi內測「探索版」的消息。找月之暗面的同學要了內測資格,體驗一番後,不得不說,這可能就是我們早該探索的AI搜索方向——讓AI自己去跟搜索引擎鬥智鬥勇,我們就能省下來時間,去想更好的問題。

先舉一個特別簡單的例子。我的問題看起來並不難,但你通過任何一個傳統搜索引擎和AI搜索來找到答案卻不那麼容易。

Kimi 探索版是怎麼辦的?它把我的搜索詞轉成了各種英文詞去搜索……就是這麼一個對人來說,有不小難度——不是每個人都能翻譯為標準的英文,大部分人也懶得自己去用翻譯軟件,或者讓AI先翻譯成英文——但特別適合AI的方法,就真的第一時間把我需要找的名單給找到了,而且很全,而且標註了索引來源,我可以第一時間去驗證真實性。這不就是AI該幹的事情嗎?

1

AI 還該幹什麼?

海量地搜、窮盡式地去搜,一次搞幾十個關鍵詞,搜幾百個網頁。搜到我看完就不想自己再打開搜索引擎輸入一個字了……

過去,為了找一個有用的信息,變換著各種搜索詞,打開無數瀏覽器標籤頁的日子,應該可以變得越來越少了。

人類只能串行工作,AI要發揮自己並行的優勢。當AI有了一定的智慧,又願意付出最大的力氣,大力出奇蹟就是必然了。

我們就拿這個問題測試一下:2024年《財富》中國科技50強企業中,哪些公司的總部在北京?這一問題中有時間、細分的對象、落地等多個關鍵詞。

Kimi 探索版只花了幾秒鍾,先找到了 50 家企業的列表,然後搜了每家公司的總部,看了 276 個網頁,找到了 8 家企業,然後再反思一把,把10個公司都找全了。

不得不說,這個事,很適合 AI 來幹。

而且居然還能「反思」,開始主動思考自己的回答質量,來對問題進行自我修正和迭代。

在問另一個問題的時候,又遇到一次Kimi的反思,這回不是補充更完整,而是給出來更多維度的參考資料。問題是「如果所有鋼琴都定期調律,估算一下北京需要多少名全職的鋼琴調律師」。如下所示:

再看一個例子。查詢 9 月上海迪士尼各個遊樂項目在一天不同時段的平均排隊時長,列成表格,再根據這個設計一條耗費排隊時間最少的遊玩路線。這一問題難在需要嵌套多個限制條件,Kimi 輸出結果的過程如下所示:

可以看到,Kimi 可以主動搜索閱讀 46 個網頁,並將其分為了 9 月上海迪士尼遊樂項目列表、各個遊樂項目在一天不同時段的平均排隊時長、設計耗費排隊時間最少的遊玩路線這幾個關鍵問題,分別瀏覽對應網頁,也可以看到後續仔細推演的過程。

相同的問題給到其他模型,得到下圖的結果。其搜索過程鏈條短、推理過程簡單,得出的搜索結果也相對單薄,沒有辦法直接拿到平均排隊時長的具體數據,只給出了預估表。

看來AI拆解一個用戶自然提問句子,分步驟來解決複雜問題的本事,正在變得更加可靠。

換個問題考驗一下 Kimi:如果我今年春節後的首個交易日開盤時買了比亞迪股票,對比一下,同期在上海黃金交易所投資黃金,截至9月最後一個交易日結束,哪個方案的收益更高?列個表格。

這一問題涉及到具體的時間限制、兩個主體的對比,放在日常生活中,也令人撓頭,都是需要反復推理、準確計算。Kimi 給出的回答是:

如果是一個人面對這一問題,通常需要在頭腦中拆分出比亞迪股票和上海黃金交易所黃金兩個主體,然後經歷多個搜索步驟,再拿出計算器計算。將這一問題完整拋給 Kimi ,它可以進行精密的思考、推理、計算,直接省掉了人力的多個步驟,極大提高了準確率和效率。

表現得還不錯。據說Kimi內部評估的結果是,面對真實用戶的長難問題,Kimi 探索版答題的正確率要高出其他國內外所有的主流 AI 產品至少 30%。

怪不得產品負責人會說,「如果 Kimi 搜不到的信息,那大概率用戶也很難自己通過傳統搜索引擎找到。未來搜索引擎會成為AI更擅長調用的工具,人只需要專注於提出好的問題,AI就可以結合模型本身的能力在龐大的互聯網中自主海量搜索,不斷反思迭代,更精準地找到所需答案。」

2

Kimi 探索版:AI搜索有了新答案

大約一年前,月之暗面發佈了支持輸入 20 萬漢字的智能助手產品 Kimi,當時創造了消費級 AI 產品所支持的上下文輸入長度的新紀錄。Kimi 多被用來處理長篇文獻、報告和進行創作,好用的能力贏得了用戶心智,Kimi 的用戶量也一躍而上,成為幾個創業公司里的頭牌,給其他公司帶來了不小的壓力。

最近幾個月,大家一直在等待 Kimi 的下一個動作會是什麼?他們自己好像反而沒那麼著急。直到最近,國慶節剛過,就傳來了Kimi內測「探索版」的消息。

今天,月之暗面正式發佈了 Kimi 探索版,強調的是 AI的自主搜索能力。提前用完之後,我覺得AI搜索有了新答案,而且這個答案應該是來自大量真實用戶的需求。

根據 Similarweb 數據,今年以來,在代表生產力的 PC 網頁端,Kimi 的月訪問量從 140 多萬提高到 2500 多萬,增長了 17 倍。目前 Kimi 的 PC 網頁版,也是國內 Al 助手產品中唯一月訪問量超過 2500 萬的產品。

自去年 10 月推出後,Kimi 以長文本能力為核心,也打造了多語言翻譯、多格式文件解讀、AI 搜索、編程輔助、整理表格等多個能力,在生產力場景中較為實用。Kimi 能夠快速閱讀並深入理解大量信息,輔助進行內容輸出,以此為基礎形成了核心競爭力,並在用戶心中錨定了「長文本」。

這種競爭力也給 Kimi 帶來了諸多真實用戶,無論是產品初期在小紅書上的自然破圈,還是逐漸形成的「自來水」,都表明 Kimi 解決了部分用戶的真實需求。這部分用戶大多是學術科研人群、互聯網從業者、程序員、自媒體與內容創作者、法律從業人員、教育工作者等知識工作者。

Kimi 探索版的市場可能會更大,因為它對使用者更加友好,複雜問題可以無腦拋給 Kimi 。Kimi 具備更高的易用性,隨後使用人群數量、範圍會進一步擴張。

Kimi 基本盤的能力可以滿足原本已有用戶,而 Kimi 探索版更強的搜索能力,則能夠滿足更日常的任務和問題,尤其是變量多、內容龐雜、限制條件多、主體複雜的調研分析類任務,解決這類任務則是知識工作者在日常知識積累、發現創造、探索世界的基礎。

3

繼續探索「月之暗面」

據說,AI搜索只是 Kimi 探索版的第一項能力,後續還會有其他新能力上線。盲猜一下,多模態能力應該也快到了。

本次迭代的 Kimi 新版本取名為「探索版」,這也與公司名「月之暗面」遙相呼應,寓意著繼續探索著月之暗面的神秘和未知,大膽追求技術上的突破創新,向那些雄心勃勃、具有革命性的計劃繼續進發。

Kimi創始人楊植麟曾表示:AGI 是新的登月計劃,長文本是登月第一步。在邁出了探索版的新一步之後,陪他一起登月的用戶可能會變得更多。