最牛的AI應用開發者,都在做AI瀏覽器

本文來自微信公眾號:極客公園 (ID:geekpark),作者:張勇毅、Nico,編輯:Nico,題圖來自:AI生成

The Browser Company是一家明星且特別的公司。

它創辦於2019年,base在紐約,累計融資1.28億美元,估值超過5.5億美元。

核心產品Arc瀏覽器,以顛覆性的產品體驗吸引了上百萬高粘性用戶,在矽谷極客們眼中,Arc是過去五年最酷的瀏覽器產品,有著遠超Chrome等傳統瀏覽器的產品設計。

但在2024年春天完成了5000萬美元融資之後,他們悄悄作出了一個決定——將團隊重心轉向新產品「全新設計的AI瀏覽器」的研發,原產品Arc僅保持維護,用戶期待的Arc 2.0也許再也不會有了。

半年後,新產品Dia瀏覽器官宣。創始人Josh Miller說,他們對這個demo中的新產品,有數不清的good idea。

現在,Dia終於開啟了邀請碼公測。

一、為AI重新設計瀏覽器

這支產品創新能力很強的團隊,一開始就目標明確:從頭開始,打造一款原生AI瀏覽器

為了做到這一點,開發團隊認為必須「推翻重來」;即使他們傾注數年心血的Arc瀏覽器已經初步形成規模效應。開發團隊從未公佈過Arc瀏覽器的用戶總量,但僅Windows版本上線首月就吸引了20萬用戶,iOS端App Arc Search上線之後用時三個月日活躍用戶數量就突破了10萬。

雖然Arc瀏覽器堪稱「古典瀏覽器時代」的最高潮,但它無力對AI Agent對瀏覽器帶來的這場革命產生關鍵影響;開發團隊也曾試圖在Arc瀏覽器中整合一部分AI功能,但仍然無力改變Arc瀏覽器本身並不是為AI而生這一事實。

Dia官網上的一條信息寫道:Dia並非僅僅是在現有瀏覽器上添加AI功能,而是將AI作為核心構建理念,旨在打造一個全新的、由AI驅動的瀏覽環境。

開發團隊認為,AI不應該只是一個應用或一個按鈕,而應該成為瀏覽器底層的能力。

Dia作為從一開始就「深度整合AI能力進入瀏覽器中」的產品,實際體驗能帶來哪些改變?

二、極簡但優雅的產品體驗

表面上,Dia瀏覽器是一款同時集成了GPT-4o與Gemini Flash 2.0的多模態AI瀏覽器,支持個性化對話、影片分析與多任務處理,並且免費、無使用限制。

但如果你已經或曾經是Arc瀏覽器的用戶,在打開Dia的首頁,你就能通過Dia首頁,意識到兩款瀏覽器產品迥然不同的開發邏輯,即從「複雜極客工具」到「極簡AI入口」的產品邏輯巨大變化。

作為開發團隊對「AI瀏覽器應該是什麼樣」的一個實現方式,Dia在首頁的一個角落加入了「Personalize Dia」功能,你可以通過輸入包括「你崇拜誰?」「你喜歡怎樣的學習方式?」以及「Dia的回答風格」三個角度,來幫助Dia快速理解用戶本身,將AI快速設定為用戶更熟悉的一個形態。

無論是Steve Jobs的創新精神,還是《The Atlantic》、《NYT》、《New Yorker》等媒體的視角,用戶的選擇都將潛移默化地影響Dia的知識結構搭建與思考方式,使其在某種程度上成為用戶所崇拜對象的「投影」。

在AI融入瀏覽器的浪潮中,Dia團隊並非簡單地將AI生硬地塞入既有的框架,而是試圖從用戶與AI的交互入手,構想「AI瀏覽器」的個性化定製方案。

更進一步,Dia提供了多達20檔的「Dia的回答風格」強度調節。這就像早期的操作系統允許用戶調整字體大小和界面主題一樣,Dia讓用戶能夠精細地控制AI的表達方式和情感色彩。預設的中間檔位提供了一個平衡點,而用戶可以根據自己的喜好,微調Dia的「個性」。

簡單設置好Dia的風格後,你能感受到開發團隊在「讓AI能說人話」這件事上,一定下足了功夫。「舒服」是最準確的描述。

對於經常使用瀏覽器打開眾多窗口、處理複雜工作的用戶,Dia瀏覽器的@Tabs中包括網頁內容分析、自動推薦提示詞等功能,確實能有效幫助用戶理清思路、用最簡單的方式梳理複雜內容的結構脈絡。

在此前開發團隊的早期演示中,Dia還能幫助用戶完成更加複雜的任務,例如自動將郵件中的商品添加到亞馬遜購物車中——彼時AI Agent概念還沒有興起。而在現階段版本的體驗中Dia對網頁讀取的顆粒度非常細緻,但同時也更加強調借助AI能力,大幅簡化用戶界面和操作流程,通過設計上的「克製」來獲取更加高效的使用體驗。

Dia預示著未來的AI瀏覽器,將不再是冰冷的工具,而是能夠理解用戶、貼近用戶,甚至在某種程度上成為用戶在數字世界中的延伸。

這與Manus團隊為AI單獨打造瀏覽器的思路異曲同工,都指向一個核心目標:讓AI更好地服務於人類,同時以更自然、更個性化的方式融入我們的數字生活。

三、與Manus不同的產品哲學

對於原生AI應用來講,瀏覽器作為平台讓模型能力可以更深入地理解用戶的瀏覽習慣和上下文,從而提供更個性化和高效的服務。快速地將AI Agent概念中的產品交付給用戶,因此今年的情況,實際已經變成了「優秀的AI應用開發者,會打造自己的瀏覽器」。

即使過去三十年互聯網領域已經發生了數次重大的技術變遷,但瀏覽器仍然是構成當代互聯網最前沿用戶體驗的重要部分。但這也讓瀏覽器市場變得「極端保守」。

或許會有一些極客用戶,會為了屏蔽廣告等功能去嚐鮮一款新瀏覽器工具,但絕大部分用戶並不會為了一點新鮮感,放棄自己原本已經熟悉的體驗——這才是讓Chrome過去十餘年一家獨大的根本原因。

如果說Dia瀏覽器現階段哪一點最讓人印象深刻,或許仍然是「新鮮感」。但它的新鮮感與充滿「極客工具箱」屬性的Arc又有著明顯不同,Dia瀏覽器更像是開發團隊打造的一片「適合AI應用生長的土壤」。

這個思路與此前打造出Manus AI的Monica.im團隊異曲同工:在開發Manus的過程中,Monica.im曾經一度想打造一款AI瀏覽器,但他們很快遇到了一個問題:AI和人類共用一個瀏覽器界面,體驗極差。

最終Monica.im的解決方案是:為AI單獨打造一款瀏覽器,讓人與AI交互,AI操作瀏覽器完成執行命令。作為基於瀏覽器的Agent而存在,它需要用戶在「想用AI」的時候使用。

針對同一個問題,在瀏覽器交互上有著極強創新能力的Dia團隊,給出的答案是:在AI能夠更好地融入瀏覽器之後,重新設計瀏覽器的交互邏輯。

雖然The Browser Company聲稱自己「不做App」,但瀏覽器本質上仍然是一個巨型App。除了Dia這樣的挑戰者,包括Google、Opera等在上一個時代掌握瀏覽器入口的選手,也在主動擁抱AI Agent給瀏覽器帶來的轉型機會。

在當前AI應用發展處於早期,並未提供手機系統級別的生態入場機會的前提下,無論是The Browser Company還是Perplexity的Comet,都選擇了瀏覽器作為佈局LLM深度交互生態的「船票」。

由於瀏覽器這個形態的產品自承接端側用戶信息以及互聯網入口的屬性,因此一些硬件/手機OS廠商,都又在這個領域嘗試突破,落地一部分AI Agent的能力,因此這個賽道會迅速變得「百花齊放」,也會是AI Agent短期內最讓人興奮的突破口之一。

問題實際上變成了:對於創業公司來講,AI瀏覽器是否已經是現有生態下的AI App終點?

四、創業公司和大廠都在做瀏覽器回到一個根源的問題,「瀏覽器」是什麼?

它是互聯網歷史的第一個「入口」。PC互聯網的最初期,以網景、Mosaic為代表的圖形界面瀏覽器改變了用戶訪問互聯網的方式,微軟IE瀏覽器更是因為反壟斷案改變了科技競爭格局。

隨後,Office、Adobe等桌面軟件一度興起,佔據大量市場份額,但Web端依然出現了G-Suite和Canva、Figma、Notion等新銳產品,隨著SaaS模式在全球市場的成功,最終網頁應用和移動App成為了開發者top 2的選擇。

至少在桌面平台上,瀏覽器是聚攏價值的金山。用戶瀏覽信息(新聞、博客、流媒體),執行操作(郵件、創作、影片會議),所有這些,在大模型時代,我們稱之為context(上下文)

這意味著,AI有極大的發揮空間,以及被augmented的機會。

如果你關注過去數月關於Agentic AI的討論,你會發現browser瀏覽器作為產品形態,頻繁地被討論和使用。

Manus內置了瀏覽器,Opera發佈AI助手Aria,Perplexity和OpenAI都在做瀏覽器產品,當然還有The Browser Company的新產品Dia。

一些原本定義並非瀏覽器的產品,也選擇了瀏覽器的形態。比如豆包,它的桌面端基於Chromium開發。另一家大廠也有類似形態的產品——夸克的桌面端。這兩家大廠的產品,功能極其全面,且用戶量遠遠領先創業團隊的新產品,最重要的,它們都是各自集團AI to C的重點發力產品。

豆包希望成為你的預設瀏覽器豆包希望成為你的預設瀏覽器

還有Claude的桌面端應用,基於Electron框架的PWA應用——還是Chromium。(當然Claude大概率是個暫時性的產品,他們應該沒準備一輩子用這個形態。)

部分AI瀏覽器或基於瀏覽器的AI產品部分AI瀏覽器或基於瀏覽器的AI產品

還有很多廠商在琢磨怎麼讓AI能夠更好地「使用瀏覽器」,比如剛剛完成融資的browser-use,以及Amazon剛剛發佈的Nova Act SDK,這些項目更多在框架層,為開發者提供調取瀏覽器的服務。

從AI接入方式的層面上,AI瀏覽器產品大多可以分為三類:

  • 傳統瀏覽器+AI,通常以copilot的形式存在,最早有Mircosoft Edge,以及Chrome上包括Monica.im在內的各種瀏覽器插件。

  • 讓AI built-in瀏覽器的更底層,有更多權限。比如Arc Max能夠整理tab,Opera Aria能夠像Manus一樣執行操作,Dia未來能夠擁有記憶,知道用戶拿瀏覽器做過什麼。豆包和夸克的桌面端產品,看起來「上網」不再是最核心的feature——就像打電話之於智能手機。OpenAI和Perplexity正在研發的產品,大概率也在這個範疇內。

  • 打造一款給AI用的瀏覽器。這是Manus主要的產品哲學,他們讓用戶與AI交互,AI去操作跑在虛擬機上的瀏覽器,是個更加終局的解決方案。

功能性的roadmap是明確且共識的:

最開始,AI處理一個信息單元,讀取單個網頁,閱讀文字,抽取YouTube字幕,或者理解用戶當前所處的網頁環境;

然後,context延展,AI能夠理解更多的信息,比如其他已經打開的Tab,甚至能夠記住用戶過去打開的網頁、執行的操作;

最終,AI必然會代替用戶執行操作,比如挑選商品、發送郵件、寫文檔、做設計,所有用戶在瀏覽器內能做的事,AI都可以執行。

這是一個非常清晰的,能夠顛覆過去瀏覽器體驗的機會。

只是我們還不知道,這個機會屬於拿到5000萬美元融資的The Browser Company,還是傳統巨頭Chrome和Edge,又或者,下一個像Manus一樣的創業新秀會橫空出世,將想像中的用戶體驗變成現實。