AI是否會終結傳統搜索引擎?

我們都明白「Google」一下是什麼意思。你只需在搜索框中輸入幾個關鍵詞,便會得到一系列藍色鏈接,指向最相關的結果。頁面頂部可能會顯示一些簡短的解釋,或者呈現地圖、體育比數、影片內容等。但本質上,這一過程只是從互聯網上提取已有的信息,並以某種結構化的方式展示給你。
然而,這一切正面臨變化,我們正處於一個全新的轉折點。
自上世紀 90 年代以來,搜索引擎傳遞信息的方式正在經歷前所未有的變革。不再需要依賴關鍵詞搜索,也不必在鏈接中逐一點擊篩選。我們正步入對話式搜索的新時代。這意味著,你無需再輸入關鍵詞,而是用自然語言提出真實的問題。你獲得的將不再是鏈接,而是更多直接的答案。這些答案由生成式人工智能實時創作,基於整個互聯網的信息,以更加直觀的方式呈現給你。
Google,這家在過去 25 年中一直主導搜索領域的公司,正努力在這一變革中保持領先。2023 年 5 月,Google開始測試利用其 LLM 對搜索查詢進行智能回應,提供類似於專家或可信賴朋友所給出的答案。這項功能被稱為 AI 概覽。Google首席執行官 Sundar Pichai 在接受 MIT Technology Review 採訪時,將其形容為「我們長期以來對搜索所做的最重大革新之一」。
AI 概覽從根本上改變了Google可以解答的查詢類型。現在,你可以向它提出諸如:「下個月我去日本旅行一週,會住在東京,但想安排一些一日遊活動。附近有哪些節慶活動?鐮倉的衝浪條件如何?有沒有不錯的樂隊在表演?」這樣複雜的問題。Google會直接給出答案,而不僅僅是提供 Reddit 等網站的鏈接,而是整合當前信息的直接解答。
更重要的是,如今你可以嘗試那些過去幾乎無法找到答案的問題,並獲得準確的回應。你無需清晰地表達自己在尋找什麼。只需簡單描述院子裡出現的鳥類、冰箱的異常狀況,或汽車發出的奇怪聲音,Google就能從原本分散在互聯網各處的信息中整合出幾乎像人類解釋般的答案。這種體驗令人驚歎,一旦習慣了這種搜索方式,就很難回到以往的模式。
而且,這種變革並不僅限於Google。OpenAI 的 ChatGPT 已經可以聯網,能夠更精準地獲取最新的答案。微軟在 9 月推出了 Bing 的生成式搜索結果,Meta 也開發了自己的版本。初創公司 Perplexity 同樣在推動類似的技術,秉持著「快速行動,打破常規」的理念。這些企業正在競相成為下一個信息檢索的主導者——「下一個Google」,這場競爭背後牽涉著數萬億美元的利益。
然而,並非所有人都對這種變化感到興奮。出版商對此感到極度恐慌。這一趨勢加劇了人們對「零點擊」未來的擔憂——那是一個搜索引薦流量將消失的時代,而這種流量自Google誕生前便是互聯網的重要支柱。
去年 6 月,當我在手機上收到 Perplexity 應用的推送通知時,我第一次對未來的搜索方式有了直觀的感受。Perplexity 是一家試圖重塑網絡搜索體驗的初創公司。除了提供對查詢問題的深入解答外,它還會利用來自不同來源的信息,通過人工智能整合成完整的文章,報導當天的新聞。
那天,它向我推送了一篇由艾力·施密特撰寫的關於一家新興無人機公司的報導。我立刻認出了這篇文章。就在本週早些時候,《福布斯》曾獨家報導過這則新聞,但內容是收費的。Perplexity 推送的報導中配圖與之的一模一樣,文章的語言和結構也極為相似。實際上,這幾乎是同一篇報導,只不過現在互聯網上的任何人都可以免費閱讀。我給一位參與原始報導的編輯朋友發了短信,詢問《福布斯》是否與這家初創公司達成了內容轉載協議。但答案是否定的。他對此感到震驚、憤怒,當然也很睏惑。而他並不是唯一有這種反應的人。目前,《福布斯》、《紐約時報》和康泰納仕都已向 Perplexity 發出停止侵權的通知。新聞集團更是提起訴訟,要求賠償由此帶來的損失。
人們擔心,這些由 LLM 驅動的新技術將對我們共同認知的基本現實產生深遠影響,這可能預示著傳統權威答案時代的終結。
這正是出版商們最害怕的噩夢場景:人工智能正在吸納他們精心製作的優質內容,重新包裝後推送給用戶,而這種呈現方式幾乎不給讀者任何點擊原文的理由。事實上,Perplexity 在其「關於」頁面上列出的首要優勢之一,正是「跳過鏈接」,直接提供答案。
然而,這個問題遠不止影響出版商的利益,甚至也不僅關乎我個人的關注。
人們同樣擔心,這些由大型語言模型驅動的新技術會對我們共同認知的基本現實帶來怎樣的影響。大語言模型有編造信息的傾向——它們可能生成看似真實卻毫無根據的內容。此外,生成式人工智能可以針對同一個問題,每次都給出全然不同的答案,甚至會根據對不同用戶的理解,提供個性化的回應。這種不確定性可能預示著傳統標準答案時代的終結。
但別誤會,這正是搜索的未來。只要親自嘗試,你就會明白其中的不同。
當然,我們仍然希望通過搜索引擎瀏覽網頁,發現新的、有趣的信息來源。但鏈接正在逐漸退居次要位置。人工智能能夠利用來自全網的實時數據,為幾乎任何問題提供合理、直接的答案,這種方式帶來了更優質的用戶體驗。尤其是相比近年來網絡搜索的發展趨勢,這一變化顯得尤為明顯。如果說搜索引擎尚未完全失效,那麼至少它變得更加混亂,信息導航也愈發困難。
誰還願意使用搜索引擎的傳統語言來查找信息?當可以直接獲得答案時,誰還願意逐個瀏覽鏈接?甚至更進一步地想,當答案觸手可及時,誰還願意主動學習?
最初的搜索工具是 Archie,這是第一個真正意義上的互聯網搜索引擎。它能夠抓取那些曾經隱藏在遠程服務器深處的文件,但它並不會告訴你這些文件的具體內容,只是簡單地列出文件名。它無法預覽圖片,沒有結果排序,甚至幾乎沒有界面。但這是一種突破性的開始,且表現得相當不錯。
隨後, Tim Berners-Lee 創造了萬維網,各種網頁如雨後春筍般湧現。Mosaic 主頁、互聯網電影數據庫、Geocities、Hampster Dance、Web Rings、Salon、eBay、CNN、聯邦政府網站,甚至還有來自土耳其某個人的個人主頁,這些內容豐富了互聯網的早期生態。
隨著網頁內容的激增,我們漸漸發現自己無從下手。面對浩如煙海的信息,我們迫切需要一種更高效的方式來導航,真正找到所需的內容。
於是,1994 年,楊致遠創建了雅虎,一個基於網站分類目錄的導航平台。它迅速成為數百萬人的上網主頁。而且……確實還不錯。坦白說,回頭來看,我們當時可能覺得它比實際效果更好。
然而,互聯網仍在快速發展、擴張,每天都有大量新信息湧入網絡。此時,我們需要的不再是簡單的按類別羅列網站,而是能夠真正全面查看和索引所有內容的工具。到了 90 年代末,各類搜索引擎應運而生,用戶可以在 AltaVista、AlltheWeb、WebCrawler 和 HotBot 等平台中自由選擇。這些搜索引擎的出現無疑是一次巨大的飛躍,至少在最初,它們確實讓信息檢索變得更加高效。
但隨著搜索引擎的興起,人們開始嘗試利用它們帶來的巨大流量。這些流量極具價值,網絡出版商依靠它來銷售廣告,零售商則借此吸引消費者關注他們的產品。為了獲取更多曝光,有時網站會在頁面上堆砌大量關鍵詞或無意義的文字,僅僅是為了讓頁面在搜索結果中排名更靠前。這樣的做法帶來了糟糕的用戶體驗。
直到Google的出現,一切才發生了改變。1998 年,Google正式推出,其革命性影響不可言喻。Google不僅僅是掃瞄網頁內容,它還分析哪些網站鏈接到某個頁面,以此判斷內容的相關性。簡單來說:一個內容在其他網站被引用得越多,Google就越認為它可靠,排名也會隨之上升。這一突破性的算法讓Google在提供相關搜索結果方面遠超其他技術。

Google首席執行官 Sundar Pichai 將 AI 概覽稱為「我們長期以來對搜索所做的最重大的革新之一」(來源:MIT Technology Review)
25 年來,Google一直主導著搜索市場。對大多數人而言,Google幾乎就是搜索的代名詞。(Google的市場主導地位目前也正受到美國和歐盟多項法律調查的關注。)
然而,Google首席搜索科學家 Pandu Nayak 指出,Google早已不再只是提供一串藍色鏈接。
「搜索結果不僅包括傳統的網頁鏈接,還有圖片、影片和新聞的特別內容。我們提供直接答案、詞典釋義、體育賽事結果、知識圖譜相關的信息,以及精選摘要等功能。」他說。同時他還列舉了Google多年來為更高效、直接地回答用戶問題所採取的一系列創新舉措。
確實如此,Google隨著時間的推移不斷演變,越來越像一個集成的問答平台。它不斷增加各種工具,讓用戶可以直接獲取答案——無論是比賽的實時比數、咖啡館的營業時間,還是來自 FDA 網站的內容片段——而不必跳轉到可能包含答案的其他網站。
但一旦你使用過 AI 概覽,就會立刻意識到它與以往的功能截然不同。
以精選摘要為例,Google有時會從網頁中提取一段內容,並將其突出顯示在搜索結果的頂部。這些內容是直接引用自原始來源的。而知識面板也是如此,它們依託於公共數據庫和Google的知識圖譜生成,後者儲存了數萬億條關於世界各類事實的信息。
儘管這些信息可能存在不準確之處,但它們的來源是明確的,也是可追溯和可修正的。這些數據存儲在數據庫中,用戶可以自行查證。然而,如今的情況已經發生了變化:AI 概覽每次生成的內容都是全新的,基於大語言模型的文本預測與網絡索引動態結合而成。
「我認為這是一個激動人心的時刻。我們顯然已經完成了對世界的索引,並在此基礎上通過知識圖譜建立了深刻的理解。我們一直在利用大型語言模型和生成式人工智能來加深對這些內容的把握。」Sundar Pichai 在接受 MIT Technology Review 採訪時表示,「但現在,我們能夠利用它進行內容生成和創作。」
因此,搜索體驗不再像是在查詢一個數據庫,而更像是在向一位非常聰明、博覽群書的「朋友」請教問題。不過需要注意的是,這位「朋友」如果不知道答案,有時也會隨口編造一些內容。
「我們的使命是整合全球信息。」Google搜索主管 Liz Reid 在加利福尼亞州山景城總部對我說道,「但實際上,有很長一段時間,我們所做的只是整理網頁。這與整合全球信息或讓信息真正有用、可供訪問並不是一回事。」
這個「可訪問性」的概念正是Google在 AI 概覽中真正關注的重點。在與Google高管的對話中,這一觀點反復被提及:通過引入語言模型來輔助提供答案,Google能夠更有效地處理更複雜、更開放式的查詢,而且可以通過自然語言來完成。
這種能力對於未來的搜索體驗至關重要,尤其是在搜索方式逐漸超越文本查詢的趨勢下。例如,Google Lens 允許用戶通過拍照或上傳圖片來獲取更多信息,它會利用人工智能生成的答案來解釋你所看到的內容。Google甚至已經展示了對實時影片進行查詢的技術能力,這進一步拓寬了信息獲取的方式。
當沒有確切答案時,人工智能模型依然可能自信地給出看似權威的回答。對於Google而言,這可能是一個嚴峻的問題,畢竟在過去 20 年里,Google一直以可靠性著稱,而對我們其他人來說,這種情況甚至可能帶來真正的風險。
正如 Sundar Pichai 所說:「我們無疑正處於一段旅程的起點。相比過去十年,人們將能夠提出更複雜的問題並獲得答案。」
然而,這種進步伴隨著潛在的危險。最關鍵的一點是:大型語言模型可能會誤導用戶。它們會產生「幻覺」,生成錯誤或虛假的信息。當沒有準確答案時,人工智能模型仍可能輕率而自信地提供看似合理的回應。這不僅對Google構成挑戰,也對所有依賴這些技術的人帶來了不小的風險。
2024 年 5 月,AI 概覽在全美範圍內推出,但效果並不理想。長期以來一直被視為全球「諮詢台」的Google,竟然向用戶建議吃石頭、在披薩上塗膠水等荒謬的答案。這些回應大多源於所謂的「對抗性查詢」——用戶刻意設計的問題,目的是讓Google出錯。然而,無論原因如何,這些結果都顯得不盡如人意。
對此,Google迅速採取了補救措施,例如停止引用來自 Reddit 等網站的用戶生成內容,因為一些離奇的答案正是來源於這些平台。
儘管建議吃石頭的荒唐錯誤引發了廣泛關注,但更具潛在危害的是那些不太明顯的錯誤。例如,在為這篇文章做研究時,我詢問Google MIT Technology Review 是什麼時候創刊的。Google很「自信」地回答:「 MIT Technology Review 將於 2022 年底上線。」這個錯誤對我來說顯而易見,但對於一個對這份出版物毫不瞭解的人來說,這樣的信息可能不會引起懷疑。
我在Google和 OpenAI 的 ChatGPT 搜索中都遇到過類似的例子。這些回答雖然偏離事實,卻不足以立即被識別為錯誤。Google希望,隨著時間的推移,它能夠依靠對優質信息來源的持續優化,逐步改善這些問題。
「當生成 AI 概覽時,我們會從搜索結果中提取確鑿的信息,並儘可能確保這些結果來源於可靠渠道。這些機制的實施,旨在確保即使用戶只是瀏覽 AI 概覽而不深入點擊,我們也希望他們能獲得可靠、值得信賴的答案。」Pandu Nayak 表示。
然而,在之前提到的案例中,Google錯誤地回答 MIT Technology Review 將於 2022 年底上線,這一錯誤信息似乎源於一篇關於該出版物電子郵件通訊的報導——而該通訊確實於 2022 年推出。但大模型從根本上誤解了這條信息。這正是Google依靠人工評估者來檢測其搜索結果準確性的原因之一。儘管評分並不會直接糾正或控制某條 AI 概覽的內容,但它們有助於訓練模型生成更準確的答案。不過,人類評分者也有可能出錯,Google正在積極解決這一問題。
Nayak 解釋道:「觀察實驗結果的評估者可能不會發現模型的幻覺(錯誤信息),因為它聽起來很自然。所以在評估設置上必須下功夫,確保當模型產生幻覺時,有人能夠識別出來並指出問題。
新的搜索
Google已將其 AI 概覽推廣至全球 100 多個國家,覆蓋超過 10 億用戶。然而,它正面臨來自新興企業的激烈競爭,這些公司正在重新思考搜索引擎的運作方式。

當我與 Sundar Pichai 談論這一問題時,他對Google在使用 LLM 生成響應的同時仍能保持準確性表現出樂觀態度。這是因為 AI 概覽不僅依託於Google的旗艦大型語言模型 Gemini,還融合了知識圖譜以及Google認為在網絡上具有高信譽度的信息來源。
Pichai 表示:「這始終是一個概率問題。我們所做的是在可信度、真實性和質量方面達到我所謂的幾個‘九’的標準。我會說是 99.5% 的可靠性。我認為這就是我們始終堅持的標準,AI 概覽也不例外。」他補充道,「問題在於,我們是否能夠再次在大規模上做到這一點?我相信我們可以。」
然而,還有一種潛在風險:用戶會向Google提出各種奇怪甚至敏感的問題。正如有人說的,如果你想瞭解一個人最隱秘的秘密,只需查看他們的搜索歷史。有時,人們會搜索內容非常陰暗,甚至涉及非法信息。對於Google來說,挑戰不僅在於在用戶需要幫助時準確地提供答案,更在於在面對可能帶來危害的查詢時謹慎行事,避免通過 AI 概覽生成潛在有害的信息。
「如果你問‘我該如何製造炸彈?’,搜索結果中可能會有相關內容,因為這是一個開放的網絡,任何人都可以訪問各種信息。」Google搜索主管 Liz Reid 表示,「但我們不需要一個 AI 概覽來告訴你如何製造炸彈,對吧?我們認為這根本不值得提供。」
然而,對於依賴Google搜索流量的下遊用戶而言,真正的風險可能就在他們自身。以出版商為例,幾十年來,他們一直依靠搜索引擎將用戶引導至自己的網站。如果用戶在搜索結果頁面就能獲得所有想要的信息,他們還有什麼理由點擊進入原始來源呢?
市場研究公司 SparkToro 的聯合創始人 Rand Fishkin 對所謂的「零點擊搜索」進行了研究。隨著Google越來越多地直接提供答案,用戶無需點擊鏈接即可滿足需求的搜索比例不斷上升。菲什金認為,AI 概覽將進一步加劇這一趨勢。
他表示:「如果你的業務依賴Google帶來的流量,並且這種流量是業務增長的關鍵動力,那麼你會在短期和長期都陷入困境。」
「基本原則是,人們來這裏是為了尋找信息。他們並不總是期望Google直接給出答案。」Pichai 說,「有時候是這樣,但在絕大多數情況下,搜索只是一個起點。」
與此同時,Google搜索主管 Liz Reid 認為,AI 概覽能夠幫助用戶提出更複雜的問題,進一步深入瞭解他們真正需要的信息。這種能力甚至可能對某些出版商和小型企業有所幫助,尤其是那些專注於利基市場的內容創作者和公司。她解釋道:「你實際上能夠接觸到新的受眾,因為人們現在可以更具體地表達他們的需求,這樣專業領域的從業者就不需要在通用查詢中與大型網站競爭排名。」
與此同時,OpenAI 的產品負責人 Nick Turley 在一次 Zoom 會議上展示了即將推出的 ChatGPT 網絡搜索工具時說道:「我要從一件有風險的事情開始。」他承認自己通常會提前做準備,但這次決定直接幫我現場搜索。「這總是一個高風險的演示,因為人們通常會對互聯網上關於他們的信息很敏感。」
他在搜索框中輸入了我的名字,原型搜索引擎隨即返回了幾句話,類似於演講者的簡曆。它準確識別了我的身份和當前角色,甚至突出顯示了我幾年前撰寫的一篇可能是我最著名的文章。簡而言之,這次的回答是正確的。
幾週後,OpenAI 將搜索功能正式整合進了 ChatGPT,利用來自網絡的信息來豐富語言模型生成的答案。如果模型判斷回答會因最新信息而更完整,它會自動進行網絡搜索,並將檢索到的內容整合到回應中,同時提供相關鏈接,方便用戶深入瞭解。如果模型沒有主動搜索,用戶也可以選擇手動觸發網絡搜索。雖然 Open AI 沒有透露有多少用戶正在使用其網絡搜索功能,但它表示,ChatGPT 每週大約有 2.5 億用戶,所有人都有可能接觸到這一功能。
「網絡上的內容量極其龐大,許多信息都是實時更新的。你當然希望ChatGPT能夠利用這些最新的信息來優化答案,成為你更強大的超級助手。」
——OpenAI 首席產品官 Kevin Weil
Rand Fishkin 表示,這些新型人工智能輔助搜索目前尚未對Google的搜索主導地位構成真正威脅。「它似乎並沒有侵蝕傳統網絡搜索的市場份額。」他說。
儘管 OpenAI 聲稱並不打算在搜索領域與Google直接競爭——坦白說,這聽起來更像是在管理外界的期望——但實際上,它的策略已經有些接近。OpenAI 解釋說,網絡搜索主要是用來補充語言模型的知識庫,因為模型的數據通常有時間限制,可能是幾個月甚至更久以前的信息。因此,雖然 ChatGPT 可能擅長解釋複雜概念,比如西海岸進攻戰術的運作方式,但它長期以來都無法告訴用戶舊金山 49 人隊的最新比數。現在,這個局限已經被打破。
OpenAI 首席產品官 Kevin Weil 表示:「我一直在思考,我們如何讓 ChatGPT 能夠回答你提出的每一個問題?我們如何讓它在你的日常生活中變得更加有用?這正是搜索的意義所在。」他補充道:「網絡上的信息量驚人,很多事情都在實時發生。你當然希望 ChatGPT 能夠利用這些實時信息來改進答案,成為你更強大、更貼心的超級助手。」
如今,ChatGPT 已能夠針對時事新聞、股票價格等幾乎實時的信息生成響應。儘管 ChatGPT的界面一直相對簡潔,但整合的搜索結果卻為用戶帶來了豐富的多媒體內容——包括圖像、圖表,甚至影片。這種信息呈現方式與傳統的對話體驗相比,顯得更加多樣化,也帶來了截然不同的用戶體驗。
OpenAI 首席產品官 Kevin Weil 認為,與Google等競爭對手相比,ChatGPT 在創新和自主性方面擁有更大的空間,甚至比其合作夥伴微軟的 Bing 還要自由。Google和 Bing 都依賴廣告業務來盈利,而 OpenAI 並不依賴廣告。OpenAI 的收入主要來自直接使用其產品的開發者、企業和個人用戶。儘管如此,OpenAI 仍處於高額投入階段。據一些報導,到 2026 年,OpenAI 預計將虧損高達 140 億美元。
不過,OpenAI 有一個優勢:它無需像Google那樣在搜索結果中插入廣告。這讓它能夠更專注於優化用戶體驗和信息質量,而不是平衡廣告收入與用戶需求之間的矛盾。

「有很長一段時間,我們所做的只是整理網頁。這與整合全球信息或讓信息真正有用並可被輕鬆獲取是兩回事,」Google搜索主管 Liz Reid 說道(來源:MIT Technology Review)
與Google類似,ChatGPT 同樣從網絡出版商處收集信息,進行總結並整合到其答案中。但不同的是,OpenAI 還與部分出版商達成了財務協議,允許其獲取內容並將這些信息納入生成結果中。
然而,問題在於,為了實現 OpenAI 所設想的比語言模型更實時、更新更快的搜索體驗,ChatGPT 仍需從各種出版商和未建立合作關係的信息來源獲取數據。對此,OpenAI 的媒體合作負責人 Varun Shetty 向 MIT Technology Review 表示,OpenAI 不會對其合作的出版商給予任何特殊待遇。
OpenAI 解釋稱,模型會根據具體查詢,從網絡中篩選出最值得信賴、最有用的來源。可這也會帶來一些奇怪的結果。例如,當 OpenAI 產品負責人 Nick Turley 演示名字搜索功能時,ChatGPT 提到了我多年前為 Wired 撰寫的一篇關於黑客攻擊的文章,這篇文章至今仍是我最廣泛閱讀的作品之一。但 ChatGPT 並沒有鏈接到 Wired 的原始報導,而是鏈接到了 The Verge 對該文章的簡短改寫版。
當我向他詢問為何模型會選擇特定來源時,他並不能給出明確的解釋,因為這些選擇完全是模型自主做出的。公司可以通過識別他們認為更優質的答案來引導模型改進,但最終的決策仍然由模型本身完成。
「而且在很多情況下,它會出錯,這正是我們正在努力改進的地方,」OpenAI 產品負責人 Nick Turley 說道。「將模型直接融入搜索反饋循環中,這是一種與傳統搜索引擎截然不同的工作機制。」
確實如此!無論是 OpenAI 的 GPT-4o、Google的 Gemini,還是 Anthropic 的 Claude,這些大型語言模型都在解釋複雜問題方面表現得非常出色。但它們為何選擇某個特定來源、如何篩選信息,甚至如何組織和表達答案,這些背後的邏輯依然非常神秘。當然,這些模型能夠解釋很多複雜的概念,但當涉及到解釋它們自己如何得出答案時,它們往往無法給出清晰的解釋。
大約十年前,也就是 2016 年,Google首席執行官Sundar Pichai曾寫道,Google正從「移動優先」轉向「AI 優先」的戰略。他預測:「在未來 10 年,我們將邁入一個以人工智能為中心的世界。計算將無處不在——無論是在家中、工作場所、車里還是旅途中——與所有這些設備和界面的互動將變得更加自然和直觀,更重要的是,更加智能。」
如今,這一願景正逐步成為現實,但人工智能在信息篩選和呈現方式上仍存在許多不確定性和亟待解決的問題。
我們已經接近那個未來——幾乎觸手可及。這是一個既熟悉又陌生的階段,且只會變得更加複雜和奇異。尤其值得注意的是,原本看似截然不同的行為和需求正逐漸融合:查詢搜索引擎、向模型發出提示、查找我們拍攝的照片、決定我們想閱讀、觀看或聆聽的內容,甚至請求查看那些我們從未拍攝但依然渴望看到的照片。所有這些體驗正在悄然交彙。
我們現在從生成式人工智能中得到的搜索結果,更應被視為一個起點,而非終點。也許,真正重要的已經不再是「搜索」本身,而是搜索為人工智能模型開發者提供了一條將實時信息融入輸入和輸出的路徑。這一變化開啟了無限的可能性,預示著人工智能將更加深入地融入我們的日常生活,塑造我們獲取、理解和互動信息的方式。
OpenAI 的首席產品官 Kevin Weil 表示:「能夠理解和訪問互聯網的 ChatGPT 不再只是總結搜索結果。它可能會主動為你完成某些任務。我認為這是一個非常令人興奮的未來。你可以想像,這個模型能夠為你預訂航班、下單點餐,甚至在未來自動完成各種日常任務。一旦模型學會如何有效地使用互聯網,它就會變得不可或缺。」
這正是人們長期以來談論的 Agentic Future:人工智能模型通過實時獲取和處理互聯網數據,正逐步接近全面實現這一願景。
想像一下,幾週後你即將出行。一個實時聯網的 AI 智能體可以根據對你個人偏好和行程安排的理解,自動預訂航班、酒店,甚至提前安排好餐廳預約,整個過程無需你的干預。另一個 AI 智能體可能實時監測你家中的污水系統,檢測潛在的健康風險,並自動為你預約體檢和治療。再比如,你無需費心搜索汽車發出的奇怪噪音,因為你的車載 AI 智能體已經識別出問題並幫你預約了維修服務。
正如 Sundar Pichai 所說:「人工智能並不總是只是搜索並給出答案。有時,它會主動採取行動。有時,你會直接在現實世界中與它互動。這一切都體現了‘普遍援助’的理念。」
與此同時,這些設備提供答案的方式也在快速演變。例如,今天的Google不僅能夠搜索文本、圖片,甚至是影片內容,它還可以生成這些內容。想像一下,如果這種能力與多種格式和設備的搜索功能相結合,將會帶來怎樣的體驗。比如,你可以說:「告訴我眼前樹上的湯氏鶯長什麼樣。」或者發出更複雜的請求:「用我現有的家庭照片和影片,製作一部關於我們明年前往波多黎各渡假的電影預告片,別忘了包含我們要參觀的所有頂級餐廳和地標景點。」
Sundar Pichai 提到:「我們目前主要在輸入端進行這方面的工作。」他指的是Google目前在圖像和影片搜索上的能力。「但你也可以想像,在輸出端同樣會有這樣的發展。」
Google已經通過 NotebookLM 展示了這類未來體驗的雛形。這款工具允許用戶上傳大量文本,並將其轉換成對話形式的播客內容。他設想,這種將一種輸入轉化為多種輸出的能力,未來將徹底改變人們與信息互動的方式。
在今年夏天的開發者大會上,Google展示了一款名為 Project Astra 的工具,這標誌著人工智能與現實世界互動的一次重大突破。這款工具利用手機和智能眼鏡內置的攝像頭和馬克風,能夠實時理解用戶周圍的一切環境——無論是在線還是離線,是聲音還是視覺信息。Astra 不僅可以感知環境,還能以多種方式回憶並回應用戶的需求。
例如,Astra 可以掃瞄一張一級方程式賽車的草圖,不僅準確識別賽車模型,還能詳細解釋其各個部件的功能和用途。
但可以想像,這種技術未來會發展得更加先進。設想一下,如果我想觀看一段關於如何修理單車的影片,但這段影片並不存在。理論上,基於人工智能輔助生成搜索,Astra 可以在互聯網的各個角落提取相關信息,並即時生成一段教程影片,向我演示如何進行修理,就像今天它可以用文字為我解釋問題一樣。
當你將整個人類知識體系——那些曾經因語言和格式而彼此隔離的內容,如地圖、商業註冊信息、產品 SKU、音頻、影片、數字數據庫、舊書、圖片,甚至所有曾被出版、追蹤和記錄的信息——彙集進一個模型中時,新的可能性便開始顯現。這個模型或許無法完全準確地理解所有信息,但它具備整合、重組並以各種方式重新呈現這些內容的能力,力求為用戶提供有用的答案。這種能力,遠遠超越了傳統的索引方式。
這正是我們即將面對的現實,也即將親眼所見的未來。隨著Google將這種技術推向數十億用戶,許多人將首次體驗與對話式人工智能的互動。這將帶來什麼樣的影響?我們將如何改變獲取和使用信息的方式?一切都在快速發展,變化正在加速。堅持住,緊跟變化的步伐。
原文鏈接:
https://www.technologyreview.com/2025/01/06/1108679/ai-generative-search-internet-breakthroughs/
