Google正在走出創新者窘境

Google一直被稱為互聯網的中心,現在,它想做AI智能體網絡的中心。

在剛剛結束的I/O大會上,Google的野心已經難以包藏。

Google選擇在已經有15億用戶的Google搜索的Overview上,而不是在僅有4億用戶的Gemini獨立應用上,為用戶提供完整的AI搜索體驗。把最先進的大模型和最新的功能,直接推到了互聯網的入口處

打開Google搜索,用戶將可以選擇基於Gemini 2.5的AI Mode,也可以選擇預設AI概覽,或者經典的鏈接列表。

AI Mode是Google的一個宣示,它的所有的應用,以後都可能有一個AI Mode,如Gmail就會有一個,會更懂用戶,並且在用戶授權的前提下以其口吻回覆郵件。

Google會把AI網頁智能體的功能,如調用不同的工具和訪問不同網頁完成任務,加入AI Mode中,這一被稱為Project Mariner的功能,將從活動門票、餐廳預訂和本地預約開始,之後直接打通各大電商和本地服務平台。

以後用戶遇到需要解決的問題,甚至還可以從搜索界面求助,一個目前被稱為Project Astra的功能,可以用搜索、聲音、圖像、影片指導用戶解決問題,就像身邊站著一個真正的助手。

更不用說它不僅提供鏈接,還能提供答案,並根據要求,用多種形式展示答案,如圖像和圖表。

Google正在加速構建智能體網絡,其智能體調用協議A2A與MCP(模型上下文協議)之間互相兼容。

本屆I/O大會,與前兩屆笨拙的「大象起舞」相比,Google正在從創新者的窘境中走出,「如果你不把自己的創新當窘境,它就不會是窘境。」GoogleCEO劈柴哥說。

AI搜索

在人們以為Google會深深地陷入創新者窘境時,其強大的基礎設施支持它經過兩年的調整,迅速趕超OpenAI,把競爭帶入了它最擅長的領域,在全棧技術的每個層面做出殺手級的服務與產品。

想當年ChatGPT推出時,人們本能的反應是,它將顛覆搜索。而當Llama開源軟件推出時,Google內部又驚呼,沒有護城河。Google面臨著典型的AI新業務與搜索傳統業務之間的互博狀態。AI的內容生成與對話功能成本遠遠高於搜索,而新的商業模式亦不明確。

Google做出的第一個戰略調整,是合併DeepMind和Google Brain,把所有基礎模型的研發都放到Google DeepMind旗下,由哈薩比斯負責,並且把所有的業務都建立在Gemini的基座之上。

Google最自信的是其基礎設施,之後推出了兩代TPU,持續提升計算效率。目前形成了層次分明的大模型組合:開源小模型Gemma系列,輕量Flash級模型主打性價比和速度,Pro和Ultra級主打前沿性能。

Gemini一開始的定位就是集生成、強化學習(推理)、多模態於一體的大模型。在此基礎之上,它又建立起了哈薩比斯所說的「通用AI肋手」,其中包括面向物理世界完成任務的Gemini Robotics,並且延伸到所有的端側,包括自動駕駛、手機、頭顯、眼鏡。

年輕一代的習慣,已經從「搜索信息」優先變成「獲取答案」優先,加上從蘋果內部傳出,其瀏覽器上使用Google搜索的頻率開始下降,這迫使Google更下決心加快向AI搜索的轉型,經過緊張的內測之後,Google於本屆I/O大會推出AI Mode。

關鍵是「在搜索中獲得完整的AI體驗」。查詢量持續增長,但問題是,AI搜索的經濟成本是否與搜索的成本是一樣的,即AI搜索的邊際成本是否大於邊際收入。

如何對比一次搜索問詢和一次AI問詢(query)的成本?知名科技博客All in主理人David Friedberg(曾與劈柴哥同一年進入Google)在這次I/O大會前採訪劈柴哥時,問到了這個問題:

問:從單位經濟效益看,處理一個AI驅動的搜索查詢,成本肯定比傳統搜索高。這對Google的收入模式會有什麼影響?

劈柴:這是兩年前大家很擔心的問題。但我一直覺得,如果問題是服務成本,那憑藉Google的基礎設施,我們有信心比幾乎任何對手都做得更好。事實上,在過去18個月裡,處理特定查詢的成本已經大幅下降。我認為,更大的瓶頸可能是延遲,而不是單位查詢成本。搜索向來追求即時響應,如何在這個前沿思考,才是更重要的問題。單位查詢成本不會是最終決定性因素,我相信我們能平穩過渡。

問:那AI查詢的廣告收入呢?

劈柴:現在大家都已經在用AI概覽了,我們現在還處在一個基準階段,和沒有AI概覽時相當的水平。從這個基礎出發,我們還能繼續改進。廣告在搜索中效果好,是因為商業信息本身也是用戶有特定意圖時尋找的最相關信息。從第一性原理看,沒理由AI在這方面做不好。所以我們有信心順利完成轉型,有些方面可能需要時間,但所有跡象都表明,假以時日,我們能做好。即使是現在,AI概覽廣告也已達到基準水平。

顯然,Google的基礎設施,即支持AI搜索的輕量前沿模型成本甚至可以勝過DeepSeek R1。但這並不意味著其AI問詢成本已經低於搜索問詢,AI搜索正在帶來新的問詢量,這已經讓Google搜索的總問詢量增長了10%,同時正在帶來新的商業模式。

商業模式

首先是增加購物功能。

AI及智能體,可能從純粹的廣告進入電商領域,並增加許多AI體驗式購物場景。這樣,Google可以在保持傳統搜索廣告收入的基礎之上,增加AI搜索帶來的增量收入,這可能彌補AI搜索帶來的成本增加。

其次,從工具到結果。

從互聯網的商業模式可以清晰地看出演變的階段和趨勢,門戶、搜索、社交、電子商務等通過免費的信息服務,形成網絡效應,建立平台經濟,從廣告和零售獲取收入,這是典型的「雙邊市場」。

進入SaaS階段,軟件互聯網化,雲計算持續交付的軟件服務作為工具,可以按照訂閱的模式,如每年付費,按人頭或者單位集體付費。它提供的是工具,用於開發者、創意者、管理者、設計者、專業人士,可能產生有價值的結果。它的商業模式實際上是從企業各個部門的生產資料費用支出。

在此前基礎之上,AI應用的商業模式是通過智能體直接交付結果。AI智能體具備了協助和獨立完成代碼、內容、計算、創意、設計等越來越多專業級別任務的能力,它能直接或者與人類合作交付結果,一篇文章、一項研究、一份報告、一段影片故事、一個軟件,甚至一個決策建議。它的費用來自企業的人力支出,而且可能是各個部門的人力支出。

如果做到這一步,AI智能體將不再只關心流量,還要關心它能否為用戶交付更有價值的結果

Google為它的服務直接定出了每月250美元的價格,其中包括製作影片故事的Flow,這超出了OpenAI的200美元。如果以後按照人力定價,如一位博士級的研發智能體,當然可以定價到每月2000美元。

Gemini,基座模型與獨立APP

Gemini趕上了OpenAI的大模型,而且之後的超越是大概率的。OpenAI接下來的重心是商業化,奧特曼已經找到了一位負責經營的CEO,似乎還有點想草草宣佈實現了AGI的意思。但DeepMind對AGI的理解顯然比OpenAI更深。哈薩比斯提出過,距離實現AGI還差兩三個「transformer級的範式突破」

DeepMind的研究實力遠在OpenAI之上,它可以花更長的時間,投入更多的資源,在生成推理和多模態一體化的模型上擴展,還可以推出新範式,如最近負責強化學習的副總裁西爾弗與圖靈獎獲得者瑟頓,聯合提出的人工智能的「體驗時代」。

除傳統主流模型不斷降低單位性能成本外,這次I/O大會上,Google還推出了算法新範式實驗研究模型Gemini Diffusion,它可能帶來新的技術路線,更快(官方數據1479tokens/sec)更低成本實現接近Gemini 2.0 Flash-Lite的性能;此外,Teach&Repeat(學習&重覆)機制與Personal Context的引入,可能降低每次重新思考的成本,但也可能增加額外記憶的成本。

全棧技術、軟件硬件、研究應用,這就是Google十年前提出的AI First的戰略,它的創始人退居管理幕後,卻跑到Gemini模型研發的一線,親自寫代碼和反饋產品。它的顛覆性技術包括量子計算,新的千億美元級的業務,還有值得期待的Waymo。

後面的戲可能就是以Google為主在唱了。

如果用ChatGPT與Gemini都當成兩個獨立的應用對比用戶,前者6億,後者4億,似乎OpenAI領先。但對於Google來說,Google最大的AI應用是搜索中的Overview,全球有15億用戶,它還有至少10個10億用戶級別的應用,想想看,這些都加上AI Mode,會發生什麼。

所以,Gemini的用戶能否超過ChatGPT,並不重要。

顛覆網頁智能體網絡與價值分配

如果AI直接提供了結果,而且其多模態的內容表達方式比其源自的網頁還酷,用戶在多數情況下,為什麼還要去打開網頁?沒有理由。

Google搜索主管列斯聯·列特(Liz Reid)認為:

「我認為搜索結果頁面是一種構造。」二十多年來,我們使用Google的方式很大程度上是對網絡本身結構的回應:網頁輸入,網頁輸出。如今,優秀的人工智能模型能夠繞過這種結構,從眾多來源查找和整合信息。Google現在面臨的問題是:「信息是直接呈現給你,還是以一種你認為有用的方式呈現給你?」

Google的AI Mode一旦全面推開,搜索結果頁面可能很快成為歷史。Google如今擁有所需的所有信息,並且有很多新的技術和模式更好地使用這些信息。搜索市場很大,但「行動」市場、「結果」市場、「答案」市場更大。既然Google正在一天天地做到這點,是不是很快我們就不再需要傳統意義上的「Google搜索」了呢?

如果說以往Google搜索還能為網頁帶來流量,並將其轉變為廣告或者訂閱收入,那麼在Google把網頁上的內容吸走,直接生成給用戶之後,可能時代拋棄網頁,都不會打聲招呼。

隨著智能體生態的日益成形,這一趨勢不止Google看到了,微軟也看到了。

微軟在幾天前的Build開發者大會上推出的一項開源協議NLWeb(Natural Language Web),讓任何網站都能輕鬆集成自然語言交互功能,打造類似ChatGPT的對話體驗。

微軟希望通過NLWeb推動「智能體網絡」(Agentic Web)的發展,使網站能夠輕鬆地為用戶提供對話界面,並根據用戶選擇的模型和自身數據,讓用戶能夠以各種語義方式直接與網頁內容交互。

NLWeb的目標是讓網站擺脫對第三方平台的依賴,直接掌控用戶體驗,推動去中心化的AI交互方式。

這裡面又產生了一個問題,如果智能體網絡代替了傳統的網絡架構,那些構建優秀內容的網站將失去它們的廣告和訂閱收入,網頁將衰落,那麼智能體將失去其智能和服務的本源,人類創造的優秀內容會不會萎縮。

如何解決這個問題?以知名科技博主Ben Thonmson為代表的觀察者主張,可能會出現分佈式賬本技術、智能合同、加密貨幣等可編程的支付手段,可以解決網頁內容創作者的價值分配問題。

這些網頁基於類似web 3概念的網站,它們內嵌了智能合同的功能,當有智能體來調用時,自動向其支付費用,如用穩定幣及其他可以接受的加密貨幣。

正如Ben所指出的:

若未來由單一主導性AI與少數受青睞的內容創作者達成商業協議,同時像禿鷲般搜刮網絡上殘存內容來構建其他服務,這樣的世界將遠不如由多元市場、競價機制和激勵相容所驅動的生態來得精彩。

面對即將到來的智能體網絡時代,我們此刻卻未能構建相應的支付體系。

參考:

https://blog.google/technology/ai/io-2025-keynote/#google-beam

https://blog.google/technology/google-deepmind/gemini-universal-ai-assistant/

https://stratechery.com/2025/the-agentic-web-and-original-sin/

https://www.platformer.news/google-io-2025-ai-everything-everywhere/

本文來自微信公眾號:未盡研究 (ID:Weijin_Research),作者:未盡研究