OpenAI 與全世界最新銳的團隊,想用AI 完成對瀏覽器的「複興」

本文來自微信公眾號:極客公園 (ID:geekpark),作者:張勇毅,題圖來源:AI生成

網景公司創始人Marc Andreessen曾過說:瀏覽器可以說是有史以來對人們生活影響最大的一個軟件。

無論桌面PC世代還是智能手機世代的用戶,都離不開瀏覽器這個工具——它太過重要,甚至可以說是互聯網迄今為止最重要的發明。在互聯網過去三十年的數次時代變遷中屹立不倒。

但這不意味著瀏覽器在AI時代中不會發生改變:據The Information報導,OpenAI正在打造一款與ChatGPT深度整合的網絡瀏覽器工具,並且已經就ChatGPT在網頁交互上的功能整合,與旅遊、食品、房地產以及零售等主要網站服務商進行了溝通。

除此之外,OpenAI在近幾個月已經挖來了Google Chrome創始團隊成員Ben Goodger:他同時也是Firefox的首席工程師,這意味著OpenAI可能已經為AI瀏覽器項目可組建了相關的團隊。

關於AI瀏覽器這個概念,其實我們已經不陌生:如果你是一個Mac用戶,又恰好是一個效率工具愛好者,那你肯定聽說過Arc瀏覽器這款產品:這是一款基於chromium內核打造的第三方瀏覽器。它將瀏覽器的平台化應用做到了極致,旨在幫助用戶「靈活調度所有網頁內容」,並由此衍生出了自己獨特的標籤頁管理與交互邏輯。

這套如同效率工具一般的邏輯經過瀏覽器的功能整合,迅速收穫眾多擁躉,開發團隊The Browser Company也在2024年以5.5億美元的估值,融資5000萬美元

但在似乎一切都在向好的方向前進時,開發團隊卻自己選擇按下了終止鍵,選擇另起爐灶,原因無他,只是開發團隊認為「能在AI被時代用戶喜愛的瀏覽器應該是別的樣子」。

無獨有偶,從2024年秋開始,諸如Claude 3.5發佈的computer use、Google泄露了下一代瀏覽器工具Project Jarvis這樣基於瀏覽器人機交互流程優化的產品相繼誕生。

似乎在近兩年的生成式AI浪潮後,終於輪到我們最熟悉的瀏覽器被AI來「升級」了。但AI瀏覽器,究竟會以一種怎樣的面貌出現在我們的設備中?

01、Arc走過的彎路

2024年10月底,按照The Browser Company聯合創始人的Josh Miller在公告影片中公佈的信息,儘管Arc在過去一年中用戶數量增長了四倍,但其複雜性和獨特性使其難以成為主流產品

因此,團隊決定不再在現有產品上進行改進,而是著手開發一款全新的瀏覽器,旨在從根本上改變用戶與網絡的互動方式,成為一個更具主動性和智能化的平台。

我用ChatGPT翻譯了一下,Josh Miller說的話意思大概就是「Arc瀏覽器現在挺好的,但我們覺得這不是我們想要的未來,因此我們不會繼續更新它了」。

這種「棄坑聲明」一般的內容即使被包裝的像是「新產品發佈預告」,不出意外還是被網民普遍理解成了:

給Arc瀏覽器出殯」。

即使創始人將這個「下一步」吹的天花亂墜,但不難想像這樣一通騷操作肯定犯了眾怒——尤其是那些伴隨著Arc瀏覽器一路走來的老用戶們。

在Josh Miller發佈的影片評論區,高讚評論幾乎全是關於「抽水」這份宣言,因為它等同於將Arc瀏覽器宣判死刑:即使是當下,Arc也並沒有做到真正意義上的完美,它還有著眾多的問題需要修補。

能讓開發團隊冒著如此風險去開發的新產品,足見這次「轉向」在The Browser Company眼中的重要性:按照Josh在影片中的說法:他們認為AI能力「即將徹底改變瀏覽器」,因此他們要做的新產品也將會是再一次顛覆瀏覽器使用體驗的一款產品。

雖然罵聲一片,但對於打造了Arc瀏覽器這樣明星產品的團隊來講,在光環圍繞的情況下保持清醒激流勇退,尤其是從創業公司的角度,確實稱得上是做「難但正確的事」。

站在此時反思,其實Arc瀏覽器雖然一開始標榜「讓每一個用戶都能高效使用瀏覽器」,但實際上在誕生後兩年多的迭代中,Arc瀏覽器逐漸偏離了這個目標:過多的新元素同時也意味著高昂的工具學習成本,Arc被很多用戶詬病的「上手困難」,很多習慣了Chrome的用戶對於切換到這樣一款新產品的興趣並不強。

或許也是因為看到了Arc瀏覽器現在存在的這種問題,開發團隊在預告他們的下一款瀏覽器產品時,表示「(上手的)前90秒變得毫不費力」將會是全新瀏覽器的重要特徵。

這幾乎已經是在明示在這款全新的瀏覽器中「用AI能力幫你快速上手」將會是主要賣點:Arc瀏覽器至今存在的「評價兩極分化」,也是在一定程度上解釋了用戶並非不需要效率工具,而是在不希望在這個過程中本末倒置,為了學習使用效率工具花費更多的成本。

不只是Arc瀏覽器,實際上在2024年,包括Google Apple這樣的系統大廠都在做相應的功能跟進,「用AI幫你接管繁瑣的初步設置」這個概念已經初具規模:這些功能如同一個帶你參觀房子的嚮導,不僅能替你解答其中的具體問題,更能在背景中,自動根據用戶的個人喜好,將眾多設置選項調整至完美的狀態。

02、「在信息的海洋中滑行」

回顧互聯網歷史,幾乎每一個十年的互聯網操作體驗變革,背後都有瀏覽器產品之王易主的影子。

瀏覽器在很多時候是構成互聯網體驗的重要窗口,因此瀏覽器的操作變革一直走在互聯網工具更新的最前沿:從1994年網景打造的Mosaic瀏覽器佔據當時80%的市場份額,到微軟通過Windows預裝IE瀏覽器迅速成為新時代的霸主,再到新世紀初Firefox、Chrome為代表的操作效率與移動端革命,瀏覽器的一次次革命,都如同預言般奠定了未來數年的互聯網技術發展趨勢。

雖然大模型能力已經成為所有人公認、即將改變互聯網面貌的重要技術革命,但作為工具的瀏覽器似乎在這一輪演變中慢了一拍:以OpenAI為代表的第三方大模型廠商通過直接抓取網頁信息,給出用戶反饋的方式,大有取瀏覽器而代之,成為新世代互聯網最主要交互工具的趨勢。

目前的Arc瀏覽器中,其實已經能看到不少AI功能的身影:比如直接在網頁中提問問題,Arc瀏覽器就能根據網頁中顯示的內容給出最相關的信息整合反饋,以及瀏覽器中對於ChatGPT的整合,網頁/下載文件自動重命名等功能。

Arc 瀏覽器中現有的網頁內容問答功能 | 圖片來源:Arc SearchArc 瀏覽器中現有的網頁內容問答功能 | 圖片來源:Arc Search

尤其是在誕生時間更短的手機版Arc Search上,開發團隊還設計了「捏合總結網頁信息」的功能:只需要在手機屏幕上捏合網頁,Arc Search就能自動調用語言模型能力,幫你彙總網頁中的內容並整理一份摘要。以及AI搜索功能:搜索後不會返回傳統搜索引擎的詞條,而是參考至少六個相關網頁內容,然後以總結的形式精準給你一個關於你的問題的答案。

移動端ArcSearchApp的AI搜索功能|圖片來源:TheBrowercompany移動端ArcSearchApp的AI搜索功能|圖片來源:TheBrowercompany

如果這些都不算開發團隊眼中的「AI瀏覽器」,那真正的AI瀏覽器應該是什麼樣,就成了新的問題:按照The Brower company的介紹,他們已經花了五年的時間在這款產品的開發上,當下Arc的平台化能力將會繼續成為全新瀏覽器產品的特徵之一。

雖然LLM如今明顯有「取代搜索引擎」的趨勢,但這並不代表瀏覽器將會在下一個時代中被淘汰相反瀏覽器作為AI能力平台的屬性將會進一步得到強化:當前Chrome瀏覽器的第三方插件應用商店中,就已經能看到不少調用第三方語言模型能力的插件。

Google目前尚未發佈的Project Jarvis,據稱也是一款利用Gemini 2.0能力,改變用戶與網頁內容的交互的一款插件工具。

Josh在影片中提到,他設想中的、屬於AI時代的瀏覽器應該有的體驗,應該是他在舊金山乘坐Waymo自動駕駛出租車服務時,有過的那種「在物理世界中輕盈滑過」的感覺。

具體到互聯網世界,這顯然就是「瀏覽器應該幫助用戶從網頁中高效提取有用的信息」,甚至幫助用戶完成一些必要的交互:例如填寫相關的帳號、地址等信息。

類似的概念其實不只局限於瀏覽器:Claude 3.5發佈的Computer Use功能,其實已經能實現初步的「電腦接管」,例如你提問「幫我總彙總最近的數碼新聞」,它可以自動完成「打開瀏覽器-輸入關鍵字-總結反饋內容-生成一份日曆視圖的表格」這樣的流程。

但Computer Use目前暴露出的問題,其實也與瀏覽器有關:例如當你想要執行一個「幫我查詢機票最低價格並預定一個旅遊套餐」時,不僅涉及到「搜索-反饋」的動作,其中還涉及到大量「輸入個人信息/銀行帳號」這樣的驗證信息,類似Claude這樣的自然語言機器人,難以順暢地完成其中所有關鍵操作

ConputerUse自動幫你訂票時,涉及到用戶信息填充的部分仍然比較繁瑣|圖片來源:AnthropicConputerUse自動幫你訂票時,涉及到用戶信息填充的部分仍然比較繁瑣|圖片來源:Anthropic

從這一步其實已經能看出,如果類似的功能是瀏覽器本身自帶,這樣的問題就都能迎刃而解——實際上,Google Project Jarvis目前已經泄露的消息中,就已經出現了類似的功能:作為Google官方發佈的產品,Project Jarvis的官方介紹是「您上網衝浪時的有用伴侶」。不僅有可能完全基於端側運行,而且能在確保用戶數據安全的情況下,幫助用戶處理更多涉及到諸如帳號密碼、相冊分類,內容查找等基於瀏覽器實現、包含大量用戶隱私數據的操作。

在掌握了足夠的事實信息以及用戶數據後,如今還不具備多少可行性的「直接幫我買某某產品」,實現的可能性就急劇提升:由於不少人依賴瀏覽器訂閱服務以及訂購各種數字產品,瀏覽器已經事實上成為很多人的信用卡與密碼管理工具。

此外,由於有了瀏覽器本身的支持,讀取各種網頁內容,就再也不用像Claude 3.5那樣,需要依賴多模態識別屏幕截圖,效率極低地完成各種操作:這個難題,包括Apple與微軟這樣的操作系統級廠商都難以解決,而瀏覽器作為訪問網頁內容的「窗口」,本身就掌握著網頁最為豐富的原始信息,不僅能夠提升操作效率,也能大大提升操作準確率。

這些操作,在開發術語中需要借助大量的瀏覽器API接口,才有可能獲得,而Arc瀏覽器此前作為遵循平台化思想開發的一款瀏覽器產品,實際上就已經初步具備了這樣「接管用戶數據」的能力,接下來能做的,顯然是讓瀏覽器「想用戶所想」,並最終進化成為一款「替做用戶儘可能做更多想做的事」的這樣一款工具。

聽起來很美好,但實際上關於「瀏覽器在AI工具的浪潮中何去何從」的討論,如今才剛剛燃起星星之火:不僅有Chrome這樣瀏覽器巨頭的早期探索,也有類似OpenAI、Anthropic這樣試圖完全顛覆瀏覽器操作體驗的廠商,Arc瀏覽器團隊的「急轉向」,也恰恰表明了他們要第一批加入這場競爭的信心。

在AI能力的支持下,瀏覽器能做的,顯然不只是如同ChatGPT一樣,總結並返回搜索結果這樣簡單。

但目前,隨著Arc瀏覽器的停止更新,有一件事已經塵埃落定:至少在今天,我們需要最新銳的團隊投入到對下一代瀏覽器的探索,而不是再來一場「瀏覽器的文藝複興」

但目前,隨著Arc瀏覽器的停止更新,以及OpenAI、The Browser Company這樣的團隊全力投入「AI瀏覽器」的開發之中,關於這個話題的結論已經塵埃落定:

無論巨頭還是創業公司,其瀏覽器產品想要在AI時代中繼續生存下去,對AI瀏覽器的探索必不可少。