萬字長文分析:什麼是好的AI搜索產品?

最近在使用360AI搜索的時候遇到一個比較嚴重的產品設計問題,非常影響體驗。

在360AI搜索首頁,和普通搜索產品類似,有信息流和今日熱搜兩個模塊。

昨天偶然看到一條熱搜是「薪金四千月工作300h」,這個標題確實很吸引人,所以作者打開了這條熱搜想看看詳細信息,結果打開的頁面內容是這樣的:

標題和內容完全對不上!

原因也簡單,360AI搜索使用了大模型能力對輸入的信息進行了處理,而不是點擊這條熱搜新聞直接打開一個鏈接。

按照傳統的搜索引擎的做法一般是把關鍵詞「月薪4000工作300小時」匹配到各個新聞網站,然後用戶打開新聞網站查看詳細內容。

360這裡應該是只把熱點新聞的標題傳給模型處理工作流了,結果出現了這麼個驢頭不對馬嘴的結果。(可能是出於節約成本的做法,傳標題和傳全部正文消耗的token可能是百倍,不過後續的測試好像又推翻了這個猜測。)

這裡面的體驗問題不止一個,挨個分析一下:

1. 新聞信息是否適合用大模型處理後呈現?

用大模型處理新聞信息優點非常明顯,能夠在短時間內對大量新聞內容進行總結和提取關鍵點,節省用戶的時間。對企業來說也能減少對人工編輯和記者的依賴,降低成本。

但問題是:用戶讀新聞時一定需要節省時間嗎?類比一下看網絡小說可能更容易理解,某著名網文凡人修仙傳也可以用一句話總結出來:韓立(主角)經過千年修行終於渡劫成功飛昇仙界,全書完。這裏的小說完全可以類比具有娛樂屬性的新聞,不巧的是在所有新聞的被閱讀量佔比中,娛樂新聞遠多於嚴肅新聞。

當內容的細節被模型處理後丟失時,內容是否還能引起用戶消費的興趣是一個比較重要的問題。還以360AI搜索來說,處理前後的新聞分別是這樣的:

入口:

處理後:

處理前:

以作者閱讀處理前後的新聞的主觀感受來說,閱讀原文體驗更好,原因大概在於幾點:

1)文風:不同類型的新聞肯定會使用不同的文風,這種新聞和政務新聞和UC震驚部的新聞肯定文風都不一樣,但現在的AI搜索產品顯然還沒有做到根據不同新聞類型使用不同的文風來形成最後直面用戶的內容,因此文風一定程度上影響了閱讀體驗。

2)多媒體信息:原文中存在不少動圖,有的鏈接中還有影片,但經過模型處理的新聞只有文字,多種媒體類型的信息對閱讀的影響很大,在信息協同接收、情感傳遞、情緒影響等方面都會影響閱讀體驗。

現在有的AI搜索產品已經可以做到讀多種媒體信息,但很顯然還沒有任何一款產品能做到輸出多模態信息(準確地說是可以但很貴,某影片生成模型的生成5秒的影片成本在1.5元左右)

3)信息與場景的匹配錯位:用戶可能是在午休時間悠閑地刷著網頁,但看到的確實更偏向工作內容的結構化信息,情感投射一下就錯位了,這種體驗可能用戶講不清楚,但一定會明確地反應在主觀感受上。

現在各家AI搜索產品都以結構化的結果呈現方式作為賣點,但信息的呈現方式一定需要與場景匹配,也並非所有場景用戶的目的都是節省時間。

據說360AI搜索已經能夠識別4000種用戶意圖,聽起來很多,但以其目前覆蓋的用戶量和用戶使用時涉及到的場景來說,依然需要時間進行跨量級的意圖積累。畢竟讀新聞都可以再細分成多種意圖~

以上是對這個小案例的第一方面體驗分析,寫得比較長可能讀者朋友已經忘了問題本身,我們把話題拉回來一下,面對下圖的這個問題,第2方面的體驗問題是什麼?

2. 輸入信息無主語時,模型是否應該自主添加?

以上面的例子來說,用戶想看「薪金4000月工作300小時」的新聞,結果幫用戶算了一下「您的時薪是13.33元/小時」,話說這是咋判斷出來主體是用戶的?這個「您」字問題太大了。

這個例子只是略微有些負面體驗,但萬一哪天用戶打開的熱點新聞是「父親去世早全靠母親艱難撫養」怎麼辦?到時候把主體預設為用戶那負面體驗可就太嚴重了。

即使不考慮這種極端的負面事件,例如「衝進火場連救三人」這樣的新聞還是比較常見也比較容易上熱搜的。

長此以往經常被用戶看到主體與事件混亂的問題,會影響用戶對整個產品所提供信息的信任度,這對搜索產品太致命了。(目前用戶對AI搜索結果的信任也是個重要問題,不過如何構建信任這裏不展開了,有機會再寫吧。)

以上是對360AI搜索的這個小案例的體驗分析,其實其他AI搜索產品也有類似的問題,此處並無貶低360的意思,據作者所知360AI搜索的增速、迭代速度都非常牛逼。體驗上也遠超360其他產品…..

因為作者是做用戶體驗工作的,所以還是習慣從體驗的角度評價產品。

一、為什麼AI搜索產品成了共識?

AI類產品這麼多,為什麼只有AI搜索各個大廠都在做?

目前在討論AI和產品時,有一個比較明顯的結論:AI更多是作為新技術、新能力參與到產品中,而用戶的需求並未發生本質變化,所以要考慮的是如何用新能力解決為舊需求帶來新體驗。

在接近一年半之前,阿里原CEO張勇就提出:所有應用都值得用AI重做一遍,當時作者並未理解其含義,現在看來其實也有需求不變,變的是實現方式的意思在裡面。

AI搜索產品能成為共識,尤其是很多大廠的共識,當然要從市場規模 、用戶需求場景數量、發展潛力等方面考慮。只有這些指標都足夠大,才能讓各個大廠忍不住動心下場。

對於這些下場指標,看看Google、百度、360等公司答案就很明確了,不必多講,本文中作者主要想從用戶體驗方面聊聊這個問題。選擇這個角度的原因也正如上面所說,用戶需求基本不變時,AI產品能取代傳統產品關鍵博弈點就是在用戶體驗。

按作者的理解:功能只是代碼的結果,體驗才是用戶的結果,是用戶視角下最直觀的指標,是用戶很主觀地決定繼續使用或離開的原因。

下面是AI搜索產品和傳統搜索產品的體驗對比:

要對比傳統搜索和AI搜索,首先要回到用戶使用搜索產品的目的。

當用戶使用時,一定是帶有要解決的問題過來的,以完成一份產品分析為例,在傳統搜索產品中完整的鏈條大概是這樣:

根據用戶意圖複雜度的不同,一定會經歷上述過程3-6個環節,以及極端情況下無搜索結果,問題無法解決的情況。

由於互聯網行業多年的蓬勃發展和積累,以及數量龐大的用戶參與內容建設的過程中,無結果的情況比較少了,但在一些較垂直的領域依然是對體驗影響較大的問題,例如作者經常搜索人因工程與交互設計交叉領域相關的問題,很多時候都找不到答案。

就像用戶體驗的基礎是能解決問題一樣,搜索產品的體驗基礎是有答案。

傳統的搜索產品,由於其原理是先收錄千億數量級的網頁,當用戶搜索時進行匹配,所以只能在有答案的這部分場景下解決問題,且只能在上述「需求從產生到解決的過程」中2-3個環節中發揮作用。

面對無結果的問題,其實出現了不少優秀的解法和產品。例如百度做了提問產品,面對搜索結果需要用戶二次整合、答案質量差等問題,也有最佳答案、讚同數等設計。

甚至傳統搜索產品也很清楚自己只能解決上述完整流程中部分環節,也在向「搜索結果直接解決問題」這個方向努力,例如在百度中搜索「2024年法定假日」,搜索結果頁面的第一條信息就可以直接解決用戶的問題:

這種方案已經無需用戶從結果列表中做選擇再點擊打開,但是這種做法一是需要人工識別場景做特殊處理,二是只能直接解決簡單需求。三是與一些廣告和商業化的場景天然有矛盾(例如搜索優酷,可能第一個結果「必須」是愛奇藝),所以整體上對用戶體驗的提升很有限。

AI搜索產品由於其原理是使用預訓練的大模型生成內容,所以在無結果這部分長尾需求中體驗很好 ,而AI搜索產品最大的優勢,則是在解決一個需求的完整流程中覆蓋了更多環節,並用AI技術代替一部分人腦的工作,向All in one方向的體驗邁進了一步。

詳細列舉AI搜索產品的體驗優勢如下:

1)能夠跨媒體、跨模態得到信息

跨媒體、跨模態得到信息意味著答案更準確、知識庫更全面、專業領域答案效果更好。

舉個例子,如果我想知道‘XX書店有沒有座位’,傳統搜索引擎想回到這個問題,幾乎必須依靠人類用戶參與回答才行,但AI搜索如果找到了一張此書店的圖片,則可以使用OCR、ASR技術去讀圖得到信息,這張圖片可能在傳統搜索時期就已經存在,但當時圖片內的信息無法被利用起來,導致這個問題只能由用戶進行回答。這就是跨媒體得到信息輔助答案更準確的簡單案例。

在談論AI產品時,經常提到多模態的概念,作者發現很多人都把媒體類型和模態類型搞混了,這裏稍微明確一下:

文字、圖片、影片是不同的媒體類型,這些媒體中包含的信息都可以通過視覺模態由人類接收。

圖片、聲音、味道是不同的模態類型,其中的信息須通過視覺、聽覺、味覺等不同模態由人類接收。

模態在人機交互過程的嚴格定義是:信息傳遞的通道。

信息能夠在不同的媒體類型和模態類型之間相互轉換的意義體現在搜索過程的輸入與輸出環節,也體現在知識總量的積累上。

例如上面提到的從圖片中獲取信息給予用戶答案的例子,同理的場景也可以是從音頻中得到答案提供給用戶,假如某AI搜索產品和喜馬拉雅這樣的音頻產品結合,就可以在喜馬拉雅龐大的音頻數據庫中得到無數專業領域的信息。

2)覆蓋的需求場景範圍更大

這一點要分兩方面理解,第一方面是普通用戶能使用自然語言描述要搜索的複雜問題,傳統搜索產品雖然也有高級模式,但易用性較差、用戶觸達率極低,如下圖是百度的高級搜索模式,大家覺得普通用戶有多少人用過?

作者自己曾經參與的醫療產品中,也遇到過需要使用多字段條件判斷+維度關係+邏輯關係+多級括號來描述自然語言的例子,只能說那個操作複雜度即使對專業交互設計師也非常費勁,更別說普通用戶了。

第二方面是基於大模型的各種能力,衍生出了新的使用場景,例如在360AI搜索中有大量用戶是使用該產品的生成能力、改寫能力來解決自己的需求。用戶對搜索產品的心智在隨著搜索產品能力邊界的擴展而發生變化。

3)解決需求的鏈路變短,複雜度降低

AI搜索產品可以將多個網頁的內容聚合、總結並以結構化的方式呈現出來,這在整體流程中這些環節中做到了提效

在這些環節,AI 顯著提升了傳統搜索產品中信息分散在各處的問題,是AI搜索產品在當前階段與傳統搜索產品最大的區別之一。同時也在一定程度上減少了廣告的干擾。

未來各家一定會在AI搜索產品中加入廣告,具體時間取決於AI搜索產品的增速,相對於通用Chatbot,AI搜索產品在輸入輸出環節消耗的token更多,同樣輸入一句「產品設計原則」,AI搜索產品需要先拿到多個網頁的內容給到大模型,這個過程消耗的token可能是通用Chatbot的上百倍。面對這樣的成本,商業化是必然的結果。

在選擇網站-閱讀-更換網站-閱讀這些環節中,AI能力的加入顯著的使整個解決問題過程的複雜度降低,用戶不再需要曲折的在各個網站之間跳轉、分辨、總結。這一點在腦力工作中的體驗影響尤其大,能讓用戶更專注地完成工作。作者自己在寫作時就經常因為要查一個資料導致寫作思路中斷的問題,就是因為查資料的過程曲折又冗長,還得和整整兩屏廣告鬥智鬥勇。

4)信息呈現方式更多樣化

現在很多AI搜索產品的結果中都使用了思維導圖來顯示內容結構,有些還支持一鍵生成PPT,信息呈現方式的多樣化意味著在上述流程中的「二次加工」環節為用戶提供了更多支持。將完整流程中的更多環節的工作代替用戶完成了。

未來可能除思維導圖和PPT之外,常用的流程圖、拓撲圖、魚骨圖以及各種數據展示圖表可能都會根據意圖識別環節做出的判斷做匹配,或是支持以當前結果生成不同圖示。

在本文開頭的360案例中也曾經提到目前的答案基本是只有文字的,很多原文鏈接中的圖片、動圖消失了,這非常影響閱讀體驗,未來當模型的理解能力繼續提升後,應該也可以根據意圖和內容做交叉判斷選擇保留更多媒體類型的信息。

5)更友好的廣告體驗

傳統搜索產品的廣告顯示位置周邊的界面樣式是由第三方網站站長決定的,所以廣告樣式和內容樣式可能存在較大差異,廣告很明顯就能被辨別出來,突兀且生硬。

如下圖是微信公眾號文章中廣告(樣式不可控),和知乎官方廣告(樣式可控),大家看一下就能感受的到體驗的差距。

而AI搜索產品的結果頁內容是由自家的大模型生成的,內容樣式也是自家完全可控可定製的,因此可以與廣告統一視覺樣式,帶來更好的轉化效果並降低對用戶的干擾。

6)結果更準確、內容質量更高

這一點可以結闔第1)點理解,傳統的搜索產品由於結果大部分由第三方網站提供,所以對內容的準確度無法控制,對內容的質量更加無法控制。

而AI搜索產品的原理決定了其結果更準確,在用戶輸入搜索詞後,首先會由模型對問題進行改寫,例如搜索「2000元以下性能最強手機」,可能就會被改寫成「截至2024年7月,中國境內銷售的2000元以下性能最強的手機」,由系統補全了用戶下意識知道但沒有寫明的那部分信息。問題描述更準確了,結果自然就更準確了。

第二點原因則是現階段的AI搜索產品的結果並非單一來源,一般是經過多個內容來源聚合、對比、總結形成的,並且在選擇內容來源的時候可能根據問題類型選擇更可靠的源頭,例如新聞類信息可以來源於官媒、代碼類問題可以來源於CSDN。(人真的會下意識省略那些預設雙方都知道的信息,例如這段文字中的「第二點」這幾個字,其實我並沒有說過「第一點」,但並不影響大家理解~)

同時,基於節省token和反饋速度方面的考慮,並不會把所有檢索到的結果(例如10000篇)全部傳遞給模型處理,而是選擇其中的幾個(例如10篇)作為源信息,那麼在選擇這1000中選擇10篇時,可能就會按照來源網站、閱讀量、作者、互動量、相關性等指標進行選擇。

最終從10000篇中篩選出了閱讀量更高、被讚同更多、來自某幾個知名專業人士的文章傳遞給了大模型,所以能夠在篩選過程中保障AI搜索產品的結果可能更加準確、內容質量更高。

以上6點是AI搜索產品在用戶體驗上的優勢,下面繼續聊聊作者猜測的AI搜索產品未來的演進方向。

二、AI搜索產品的演進方向

為了得到更可靠的結論,依然從搜索的流程開始分析,傳統搜索產品的流程可以簡單示意為:

結合AI後在各個環節可做的事情如下:

1)輸入階段:擴充輸入方式

目前傳統搜索引擎基本支持了文字搜索和語音搜索,少數非廣域搜索產品還支持了以圖片搜索。

這裏要注意一點是:作者覺得單純的使用語音轉文字輸入問題並不能定義成語音搜索,這樣的做法只是改變了文字的輸入形式,但沒有改變信息總量,語音模態信息中的非文字信息沒有被整合進query。

未來則會提升已有搜索方式的可用性,如準確度提升、用時減少。同時基於用戶輸入信息做補全、糾錯和問題推薦(問題推薦應該已經有產品上線了)。

再之後可能會對這些搜索方式進行擴充,支持更多的媒體類型,例如動圖和影片,讀取其中的信息形成query。

但這並不酷!對人機交互的過程改變也非常有限,如果想再進一步則需要打破固有的思維,為什麼搜索一定需要以用戶主體輸入信息呢?

輸入過程完全可以變手動為自動,或者說輸入環節可能會在整個搜索流程中被透明化。

想一想當我們閱讀一篇「super黃的AI文章」時,如果結合具體用戶的歷史閱讀信息、當前的閱讀進度,在某個段落的停留時長等信息,就極有可能判斷出用戶對這個段落中的某個名詞含義有些模糊,此時如果直接將這個名詞的含義顯示出來。就做到了輸入階段的透明化(自動化)

當然這種階段的產品可能短時間不會出現,還是需要結合用戶的一些簡單行為做判斷,例如豆包中以劃詞搜索作為過渡方案。

在人機交互中,一般可以用行為來判斷意圖,要做到自動化的輸入過程則需要更大量獲知用戶的環境信息,例如用戶看到的界麵包含什麼信息,用戶所處的環境包含什麼信息,同時結合大量歷史數據、當下特徵數據就一定有可能判斷出用戶想問的問題。

舉一個生活中的例子,一個5歲的小朋友讀課文,遇到了一個「貔」字,同時小朋友的聲音停止了,那麼一款智能課本產品在得知閱讀進度、生僻字字庫、聲波消失等信息後,非常有可能直接告訴小朋友:這個字念pi,而不是需要小朋友主動詢問。這就做到了搜索過程中輸入環節的透明化(或者叫自動化/被動化)

在AI技術的具體應用上,意圖識別是非常重要的一部分能力,而意圖識別準確率的前提有一方面是多模態交互,準確地說是人機交互過程中人對機的多模態信息輸入。

信息的來源和模態變多了之後總量一定會變多,那麼在已知條件變多後,解題準確率(產品判斷用戶意圖的準確率)一定會提高。

就像人與人對話中語言文字只佔信息總量的一半左右。多模態交互解決了之前無法被機器接收到的那部分信息的問題,能從信息源上提升意圖識別的準確率。(這是AI搜索後續直鏈其他服務的基礎。)

不過這還只是把「模態」限制在了「人類信息通道類型」的範圍內,對機來說,可能不是「多模態」而是「超模態」,人僅有五感模態,但機器安裝傳感器後則可以有更多種信息通道如陀螺儀、GPS、紅外信號、人類無法感知到的電磁波、聲波……

所以從底層來說機的信息通道數量可以遠超人,那麼解決了中間層的算力和算法之後,意圖識別準確率很大概率可以達到人的水平,意圖識別的下一階段就是我們剛剛提到的意圖預測(智能課本獲知多個信息後預測了小朋友不會讀「貔」這個字)

意圖預測的意義就非常重要了,它可以變給出反饋為主動服務。這才是對人機交互過程的重要改變。此處作為一名交互設計師,真誠的點讚榮耀手機發佈會中人機交互那部分內容,非常酷!

稍微有點跑題,拉回來:以上這一小段是作者對AI搜索產品未來演進方向的猜測。除此之外可能在情感理解和跨多語言方面也會有更多意義此處就不展開了。下面繼續說查詢階段。

2)查詢階段:結合其他信息

目前的AI搜索在用戶輸入完成後,一般會對問題進行改寫,使其更精準或覆蓋更多用戶可能需要的信息,例如把「RAG」改寫成「RAG是什麼意思」,甚至改寫成「RAG在AI搜索產品中的具體含義」。

這樣一來就通過查詢階段的改寫進一步提升的輸入信息量,可以找到更加精準的信息。

這一點涉及到的技術問題,作者懂得不多,但基於「問題描述得越清楚答案就越精準」這一原理,作者猜測改寫的進一步做法是融合更多信息,而不只是對用戶在本次使用中輸入信息的修改擴展。

融合更多信息指的是融合用戶的個人信息、過去查詢過的問題、複製行為、寫作數據等等很多方面的歷史行為數據,再與用戶本次輸入的信息做融合判斷來獲取結果。

其實在現階段一些內容平台、電商網站的推薦算法已經非常精準了,往往我們正需要的內容/商品都會被主動推薦過來,這就是因為這些平台掌握了大量用戶的數據。

而AI搜索產品掌握的用戶數據類型和總量可能沒有電商產品那麼多。所以為了提升搜索準確度,作者猜測未來各個大廠可能會努力實現數據互通,但僅以當下的搜索產品商業模式來說,各個大廠還沒有足夠的利益能夠驅動達成這個目標。

所以作者的觀點是:AI搜索產品的商業模式和數據積累/互通可能會協同促進,如果AI搜索產品的答案中能夠為用戶推薦更精準的收費服務/商品,為廣告主帶來更高的轉化和營收,則現在的數據持有者有可能將掌握的數據提供給AI搜索產品。(當然也可以是數據主擴展業務自己做個同類產品。)

具體的使用過程還有很多細節需要協商,例如數據是否是直接可見的還是只提供特徵等等。

3)輸出階段:擴充輸出方式

輸出的方式同樣包括不同的模態、媒體、形式還有文件類型,目前各個產品支持腦圖和PPT,未來應該會支持流程圖、魚骨圖….來覆蓋更多用戶需求。

用戶voice用戶voice

同時對已支持形式的精細化改進也非常重要,例如目前只支持將答案中的腦圖作為圖片下載,其實無法滿足用戶編輯修改的需要,如果能生成xmind源文件或支持在網頁中對腦圖進行修改也非常有意義。

包括PPT的排版形式、精美程度其實目前的AI搜索產品都還做得比較弱,如果和Gamma這樣的產品對比,算是被按在地上摩擦了,即使和國產的比格PPT相比,也有很大差距。

面對創作場景,生成與內容相關的配圖也是很需要的能力,在把非常長的答案內容如何分割、提取與圖像相關的關鍵詞,以及保證全文中配圖視覺風格一致都是要考慮的問題。

以上說的是輸出階段支持不同的媒體形式,下面說輸出不同模態:

以文字形式輸出和以聲音形式輸出可以滿足不同的使用場景,例如當用戶設備的距離稍大時,視覺模態就無法幫助用戶有效接收信息。

在多任務場景中也可以使用不同模態的信息接收通道來獲得更好的協同體驗,使用戶可以把更多精力集中在主任務。

舉個例子現在很多人都有使用雙顯示器的需求,主要就是為瞭解決多任務協同的問題,這種方式相對於使用聲音通道進行多任務協同更適合需要更多時間理解內容的場景,如果只是想獲取一個簡單數據,完全可以用語音操控「小愛同學,幫我查一下百度2024年營收數據」並以聲音的形式接收直接寫到文章里,避免多界面切換帶來的割裂感。

再進一步,輸出階段還需要考慮到用戶對信息的儲存和分享等需求,甚至可以做多內容關聯輔助用戶後期再查找等需求。

按作者的理解,對信息的儲存最好能與筆記產品關聯起來,最好能做到無縫導入筆記,並與相關話題產生關聯。最簡單的做法可以是提取相同關鍵詞形成標籤,可以按標籤篩選內容。

對於分享的需求則需要考慮分享的渠道、分享的排版精緻化、分享時添加用戶需要的信息(如加入作者的ID、自媒體名稱甚至聯繫方式等等),以減少用戶的二次加工。

4)瀏覽結果階段:千意千面

這一階段是現在各個AI搜索產品重點發力的部分,主要使用大模型的總結能力和文生圖能力為用戶帶來更聚合、更清晰、結構化的結果瀏覽體驗。

但也同樣存在問題,上面曾經*·37-提到閱讀娛樂新聞的場景就不適合使用結構化、總結後的信息進行展示。

所以作者猜測當未來的AI搜索模型能夠識別出更多種、更細緻的用戶場景和意圖後,在界面呈現上會根據不同的場景和意圖做出對應的界面樣式。

目前結構化的結果顯示方式只適合閱讀場景中專業知識閱讀的細分場景,對於搜索產品來說覆蓋的場景數量太多了。看劇、下載文件、尋址等等場景都需要更細緻更個性化的界面設計,甚至如尋址這種場景都不需要界面設計,當對尋址意圖的判斷準確率夠高之後,完全可以在用戶搜索【優酷】時直接打開該網站。

從這個角度來說,千意千面的面完全可以不限制在頁面樣式上,包括整體流程都可以根據意圖做出區別。屆時結合上述其他猜想,可能搜索的流程會變得面目全非:

如果不從業務角度考慮的話,還可以根據用戶的審美對頁面設計中的字體、顏色、佈局等很多其他視覺樣式做出個性化呈現。同樣可以成為體驗提升的一部分,但要注意視覺統一性、品牌性與個性化之間的平衡。

5)結果複用與社區化

目前AI搜索產品的成本依然較高,按super黃與360負責AI業務的VP梁先生的博客公開的數據是每次搜索在0.2元左右。

粗糙的這個成本的構成視為輸入和輸出階段消耗的token,那麼對於類似的相似度達到一定標準的問題完全可以使用相同的答案。這樣可以降低輸出階段token消耗的成本。

對於相似但不達標的問題,之前已經生成的回答依然可以作為信息源參與新問題的結果生成,此時上一個問題生成的結果相當於把多篇內容提煉出與此問題匹配度更高的內容,可能同樣可以節省一部分token消耗。

當結果生成後,部分場景有可能用戶會對結果內容進行再次優化,如果此時能夠引導用戶將自己人工修改後的信息作為公開內容,允許被其他用戶訪問,那麼就可以將內容沉澱下來,形成內容社區,最終把內容社區產品與AI搜索產品融合。

傳統的搜索產品結果來源大多是第三方網站,所以搜索產品雖然是整個互聯網重要的流量入口,但也只能做做賣流量賣廣告的生意。其原因就是因為內容不是自己的,商業鏈路到搜索結果這一步就停了。

而AI搜索產品如果能將內容完成沉澱,形成類似小紅書、知乎這樣的內容社區則對產品天花板是一次巨大的提升。

簡單來講,搜索產品一般是有需求才使用,而內容社區產品則是有事沒事都可以逛一逛。

例如用戶喜歡看冷笑話,現在這個時間常規的路徑一般是在某內容社區關注了冷笑話類博主,而不是在百度搜索「冷笑話」。

第二意味著用戶留存。內容本身就是消費品,更可以在kol與消費者之間進行連接,兩方面都是留存的關鍵。其實內容消費產品的留存能力也不必多說,想想抖音和小紅書就知道了~

有些傳統的筆記產品也是這個思路,希望能把用戶創作的高質量筆記授權後公開顯示,基於大基數的用戶量形成內容社區,為筆記類產品突破天花板,變工具型產品為社區型產品。例如印象筆記就有源於筆記產品內容板塊的獨立的「識堂」產品。

對AI搜索產品來說,由於其創作內容更簡單,在內容全面性和大眾領域的內容質量也能達到一定標準,所以想按這個思路發展是更有機會的,最重要的是可以把自家消耗大量算力產出的內容沉澱下來,產生2次-N次被消費的價值。

通觀全篇,其實會發現數據的價值體現在AI搜索產品的各個環節,輸入環節可以結合用戶個性化數據把問題改寫的更清楚準確,匹配環節可以找到更多信息源,輸出環節決定了答案準確度和內容質量,搜索後服務環節甚至可以有突破搜索產品天花板的機會。

由此可見數據是AI搜索產品(甚至所有AI產品)的最重要競爭壁壘之二,另一方面毫無疑問是模型能力。

形成社區/搜索融合形態的產品後,更重要的意義是商業方面實現更多模式的收入構成,對於自家不涉及的業務依然可以像傳統搜索產品那樣出售流量變現,對於自家涉及的業務,完全可以變賣流量為賣產品,拿到更多利潤。

從這一點來說,AI搜索產品對規模越大、涉及業務越多的公司重要程度就會越高。再加上新一代流量入口的屬性,作者認為AI搜索產品是大廠必爭之地。

6)從搜索產品到全部產品

上面的5點我們討論的基本是AI搜索作為獨立搜索產品的演進猜測,但搜索+AI的能力其實可以體現在任何需要搜索功能的產品中。

如筆記產品,用戶積累了10年的筆記內容在查找和關聯時都是比較困難的問題,在相關內容聚合方面也非常需要AI能力。如果把AI能力加入之後可以實現更精準的搜索、模糊搜索、基於筆記內容的問答等等。

同樣地,對電商產品的搜索過程,基於對搜索關鍵詞的改寫可以做到更精準的商品匹配,於公司而言可以在企業級知識管理產品中發揮作用,對特定行業可以做科研文獻快速查找。

因此作者認為,廣義的AI搜索產品可能不是獨立產品,而是在眾多類型產品的查找場景中發揮作用。

搜索的本質是人的信息需求,而AI搜索的未來形態會分成兩種主要場景:

一種是基於已有直接可用信息的匹配,另一種主要場景是基於非直接可用內容的聚合+生成。

三、 AI搜索產品的核心體驗

嘮叨了這麼多,其實AI搜索產品的核心體驗已經很清晰了,按照用戶路徑的順序來說依次是:

輸入體驗、反饋速度、結果質量、接收體驗、搜索後服務,下面依次詳細介紹其影響因素:

1)輸入體驗

輸入體驗,首先指支持輸入的媒體/文件類型,文字、圖片、音頻、影片、動圖、文檔、鏈接….支持的類型越多則用戶的操作自由度越高、能覆蓋的場景越多,還可以減少輸入限制導致的用戶手動轉換格式的成本,所以支持輸入的媒體/文件類型越多體驗一定越好。

輸入體驗的第二方面是非文字信息理解能力,例如,當用戶使用語音方式搜索時是否能從語速、音量、停頓等其他方面獲取更多信息,使這些信息與語音轉化成文字的信息融合起來形成更準確的輸入Query。

第三方面是問題轉寫能力,同樣影響著輸入Query質量,例如用戶輸入的是「12400f和12490f相比」被轉寫為「對比12400f和12490f兩個CPU,兩者在性能和功耗、遊戲體驗等方面相比哪個好」其實可以更完善的描述問題並更多更準確的答案。輸入體驗並非指用戶輸入的體驗,而是指從用戶輸入直到將query信息輸入到模型這一過程的整體影響。

2)反饋速度

反饋速度由索引庫、模型效率、算力、服務器性能、網速、需要反饋給用戶的數據量等指標決定。

索引庫是一個包含產品信息的數據庫,其特殊的數據結構可以提升查詢效率,使查詢過程不需要掃瞄整個數據就能找到相關結果,對於複雜條件的查詢,也能做到更高效的完成。因此索引庫效率越高反饋時間越短。

模型效率則在輸出環節決定了結果內存的生成速度,不同模型生成內容的速度可能有明顯的快慢之分,因此模型效率同樣影響反饋速度。反饋速度越快則用戶能得到結果信息越快,體驗越好。

算力(用戶可用部分)直接影響了生成速度,算力在不同時間的需求量會有明顯差距,例如工作時間的需求量一定大於夜晚時段,在需求高峰時可考慮結合收費方式為付費用戶帶來更好的體驗,或採用其他對企業有益的用戶引導給予用戶優先使用權,kimichat在幾個月前就試水了打賞機制讓付費用戶在高峰時段能優先使用算力。

對於閑時算力,同樣可以預先生成用戶可能需要的內容或一些長尾問題,當用戶需要時直接顯示處理,以提高反饋速度。

同樣的服務器性能、網速也會事實上對反饋速度有較大影響,但兩個方面也適用於傳統搜索產品,非AI搜索產品獨有的體驗影響因素。

需要反饋給用戶的數據量這一指標是作者認為需要優化的重點,例如當用戶搜索「祖比斯在哪一年創立了蘋果公司」,可能用戶只是需要一個具體的年份信息,而不需要非常多的長篇大論,把蘋果公司和祖比斯的各種信息全部輸出一遍對用戶來說可能是沒有意義的信息。輸出這些信息的過程中既消耗了token增加了成本又影響力反饋速度。

某些場景下甚至可以沒有輸出信息,例如尋址場景用戶的最終目的就是打開一個網站,那麼沒有搜索結果頁面直接打開某網站是既低成本又短路徑的優秀體驗。

3)結果質量

結果質量由索引庫數據量、信息源選擇規則、信息源總量、模型質量、輸入query信息量、問題理解準確度等指標決定。

索引庫數據量越大,則匹配過程能找到回答用戶問題的信息總量就越多,就涵蓋更多用戶所需的答案。

信息源選擇規則影響了用於傳遞給模型的信息質量,面對同樣的問題,如果選擇了百度問答中的答案作為信息源頭或使用知乎作為信息源頭對結果質量的影響可想而知。

當然信息源選擇並非簡單選擇從百度獲取信息還是從知乎獲取信息,一般來說對於專業領域的問題可以從各種垂直網站獲取專業信息質量更好。對於普通問題,則可能會從內容的相關性、瀏覽量、作者身份、內容互動量、內容發佈時間…等很多維度的指標進行選擇,總體原則就是希望通過各種直接的或間接的指標抽像判斷出內容質量,將內容質量較好的一部分文章傳遞給模型進行總結和結構化加工。那麼很容易理解信息源選擇規則越合理結果質量越好、用戶體驗越好。

模型質量則在答案信息傳遞進模型後發揮作用,面對同樣的輸入信息各家的模型生成的答案可能會有很大不同,此時自然是模型質量越高結果質量越高、體驗越好。

同時模型質量的一部分指的是對自然語言的理解能力,面對用戶輸入的問題能否做到準確理解含義,明白用戶需要的是什麼,此處不得不再提一下360AI搜索,當我搜索「老虎圖片」的時候,居然不能直接定位到圖片結果,而是給我顯示了這樣的結果頁面:

首先頁面主題居然用文字給我描述了兩個圖片,然後給我推薦了老虎的其他相關信息,同時右上角的引導我點了十幾秒還是關不掉,體驗糟透了。

對問題的準確理解影響了後續流程如何推進,再舉個簡單的例子,當我輸入「優酷」的時候,是應該給我介紹一下優酷公司的信息還是應該直接給一個跳轉鏈接?

輸入query信息量是被模型處理前的信息量,此信息量越大一般結果質量會越好,但會存在一個臨界值,超過此臨界值後信息量的增加對結果質量優化將變得很有限,同時考慮到輸入類token的成本問題、模型處理所需時間問題,也不能將所有相關信息全部輸入給模型。需要界定一個合理數值,這也印證了數據源選擇規則的重要性。

4)接收體驗

接收體驗由可輸出的媒體/模態/格式類型、UI界面、二次加工時間、廣告體驗等指標決定。

可輸出的媒體類型和格式越多對用戶需求的覆蓋度越廣,屬於有和沒有的區別,省去了用戶二次轉換的時間,這方面的體驗的影響不必廢話。

可輸出的模態則略有不同,例如在駕車場景中,一定是以聲音模態輸出更符合該場景下用戶能接受的方式。在辦公室場景中則視覺模態更好。

所以支持不同模態的輸出一是匹配不同場景用戶適合接收信息的方式,二是多模態協同可以進一步提升信息傳遞的效率。

視覺模態接收信息的效率可以是聽覺的百倍以上,但聽覺模態具有被動性、注意力敏感性、環繞性等特點。

被動性指信息可以被動地由人進行接收,相比於視覺信息更不易被遺漏,注意力敏感性指聲音的變化能更快速的被用戶感知,環繞性指信息來源的位置可以由人周邊360°發起,都可以被人接收到。

基於視覺模態和聽覺模態的不同特點,多模態融合的方式可以各取其所長,幫助用戶同時處理多任務及各種場景下更輕鬆地接收信息。(多模態交互涉及的內容極多,可能需要另一篇萬字長文才能完全解釋清楚,這裏不多展開了。)

上面略微展開了一下信息以不同模態的特點,下面繼續說UI界面對接收體驗的影響。

UI界面是發展時間最長,被研究最深入的視覺通道信息傳遞方式,而視覺通道是人類90%以上接收信息的方式,因此單獨把UI界面作為影響接收體驗的因素之一。

廣義的UI設計包括排版、文字、圖形、動效、交互方式及其二級屬性,由於人類從外界獲取信息最主要的途徑就是視覺模態,所以UI界面是接收體驗中非常重要的一部分。

排版的方式決定了用戶獲取信息的先後順序、視覺壓力,文字的字體決定了獲取信息的難易程度(如草書和楷書)和美觀的感受,圖形可以更直觀地表達信息並附帶情感,動效可以引導用戶的注意力使視覺焦點始終位於目標信息,交互方式可以讓用戶更自然的得到隱藏信息、多環節信息。

舉個例子如token生成速度對UI界面的影響,現在很多Chatbot的生成答案時都是一個token一個token顯示到用戶界面上的,這種方式造成了很強烈的動態效果,會對用戶注意有嚴重干擾,影響信息接收效率。

目前token生成速度的價格差異主要體現在廠商定價階段,作者查了一下沒看到根據生成速度定價的廠商,從反饋速度的體驗來說,一定是結果生成的越快越好,但可以稍微控制一下顯示到界面上的間隔時間。

一般首次等待時間在2秒內不會造成用戶流失,後續可以考慮生成一段內容後一次性顯示到界面上,避免界面頻繁變化。(想一想垃圾網站上不停跳動的小廣告應該可以感受到類似的體驗~)

二次加工時間則受到前面講過的可輸出的媒體/模態/格式類型、結果質量等因素影響,用戶難免遇到搜索結果無法直接在其他場景(如各種彙報)中使用的情況,此時對內容的二次加工時間非常影響體驗。

例如對思維導圖的編輯是可在線編輯還是需下載後編輯,對生成的圖片能否局部修改等等,二次加工所需時間越長則體驗越差。

廣告體驗則是繞不過去的話題,AI搜索產品必定需要進行商業化以覆蓋成本,前文中曾提到過視覺樣式對廣告體驗的影響,如下圖:

除視覺樣式外,廣告內容能否與用戶屬性匹配同樣重要,當廣告內容恰巧是用戶所需內容,並與用戶的消費能力相符時,甚至可以實現整體正向的廣告體驗。

如果整體生態、合作廣告主規模足夠大,將廣告內容無形融合到答案內容將會是未來廣告形態的重要變化。

現階段基於關鍵詞的廣告最大的體驗問題是非用戶所需,即用戶需要的東西與廣告推薦的東西不匹配,導致了廣告信息影響了用戶找到、閱讀正確的目標信息。

如果用戶搜索的目標是「AI課程」,那麼即使出現賣課的廣告也不會影響用戶體驗,因為這正是用戶所需的。如果再能夠保證課程質量(廣告對應的商品質量)則體驗更佳。而保證廣告對應的商品質量的基礎就是上方提到的各作廣告主規模足夠大,有篩選的基礎。

5)搜索後服務

搜索後服務的體驗由服務範圍、搜索-服務融合度、服務-意圖匹配度、服務路徑長度、信息記憶、廣告體驗等指標決定。

服務範圍指搜索到相關信息後,能否接近一站式的繼續解決需求,例如搜索北京旅行攻略,能繼續預定去北京的機票/酒店/旅行團。搜索iphone15能在結果頁中馬上下單購買。

這方面的體驗與前文中提過的數據互通、AI搜索產品融合等話題相關,顯而易見的是AI搜索後服務能提供的服務範圍越大,則路徑越短、操作越簡、體驗越好。

在搜索後服務的流程中,傳統方式是在各個大廠的平台切換,用戶路徑較長並且需要在不同產品中多次輸入帳號/密碼/地址….等很多信息,操作複雜度很高還有詐騙風險。

AI搜索產品如果能融合其他業務,則可以更接近一站式的完整解決需求,而不是將需求分解到多個公司的多個產品中完成。如旅行場景就可以把搜索攻略與機/酒/團等需求一次性解決。這就是搜索-服務融合度的意義。

而服務-意圖匹配度則還是強調的意圖識別準確率的問題,當某大廠覆蓋的業務範圍極廣,那麼能否把各業務與用戶搜索的意圖精準對應就成了影響商業轉化和體驗的重要因素。

服務路徑長度上面也舉過例子,當用戶的目的是打開一個網站,那麼沒有搜索結果頁面直接打開某網站是既低成本又短路徑的優秀體驗。沒有必要非給用戶一個結果頁面上面有個網站入口,還需要再點擊一次。不過這個具體場景可能會影響廣告曝光量,實際環境中需要再仔細考慮。

廣告體驗同樣也在前文中提到過都不再多說。

總結

本文內容由3個大主題構成:

1. 為什麼AI搜索產品成了共識

2. AI搜索產品的演進方向猜測

3. AI搜索產品的核心體驗及影響因素

其實目前大多數Chatbot和其他AI類產品出現時間都非常短,很多用戶體驗方面的問題也來不及做得很細,大多數公司依然在關注模型層面的技術問題。

但作者一直認為在用戶視角下其實並不關心模型層面的技術問題,更直接與用戶接觸的是體驗,體驗是用戶使用產品後在極短時間內、極主觀決定是否繼續使用這一產品的決定性因素。

參考:

1. super黃老哥的文章《雙10億:AI重塑搜索 | 一文看懂AI搜索現狀和未來》

2. 橘子汽水鋪的文章《AI 搜索,一次講透》

本文來自微信公眾號:AI與用戶體驗,作者:杜昭