Manus爆火的秘密武器Browser Use融資1700萬美元!讓AI「讀懂」網頁

新智元報導  

編輯:犀牛

【新智元導讀】隨著AI智能體的爆發,Browser Use異軍突起,剛剛融資1700萬美元。它能讓AI智能體輕鬆地「讀懂」網站並自動完成複雜任務,引領了一波AI應用熱潮。

AI智能體可能還沒有一個大家都認可的定義,但這並不妨礙一大堆創業公司爭相打造智能體工具,來自動化處理各種任務。

其中一家名為Browser Use的公司尤其吸引開發者與投資人的關注,因為他們的工具能使智能體更容易地「讀懂」網站。

據最新報導,Browser Use剛融了一筆1700萬美元的種子輪資金,由Felicis的Astasia Myers領投,Paul Graham、A Capital和Nexus Venture Partners跟投。此次融資之前還沒被報導過。

網站地址:https://browser-use.com網站地址:https://browser-use.com

Browser Use是Y Combinator 2025冬季班的一員,最近幾個月隨著智能體的爆火而名聲大噪。

尤其是火出圈的Manus也用了Browser Use工具,一下子就把它的知名度推到了新高。

Browser Use的創辦人是Magnus Müller和Gregor Zunic,他們去年通過蘇黎世聯邦理工學院的創業加速器創辦了這個項目。

Müller多年來一直在研究網頁抓取工具,2024年他在讀數據科學碩士時認識了Zunic。Müller說,他們倆一塊兒琢磨出了把網頁抓取和數據科學結合起來的想法,打算讓瀏覽器自己完成任務。

Müller和Zunic花了五週時間做出了個Browser Use的demo,結果一炮而紅。後來,他們幹脆把Browser Use開源了。

簡單說,Browser Use是把網站上的按鈕和元素拆解成一種更容易理解、更像「文本」的格式給智能體用。

這能幫助AI智能體搞清楚網頁有哪些選項,然後自主做出決策。

「好多智能體靠的是視覺系統,通過截圖來瀏覽網站,但這過程中老出問題。」Müller說,「我們把網站轉化成智能體可以理解的東西,這種方法能讓我們以更低的成本反復運行相同的任務。」

隨著越來越多的AI公司想讓他們的智能體跟網站交互得更順暢,Müller覺得Browser Use能成為滿足這些需求的「底層技術」。

他還表示,現在Y Combinator冬季班里有20多家公司都在用Browser Use滿足自己的需求。

有些公司還跑來問他們,怎樣才能使得智能體更容易地瀏覽自己的網站?

Müller說,「像LinkedIn這樣的網站,總是改變網站的功能,智能體在這種情況就經常出錯。」

Felicis的Myers說,他們過去幾年一直在關注AI智能體領域,而Browser Use就是一個很好的投資機會。

她說,Browser Use的創始團隊——以及他們開源為先的策略——徹底打動了自己。

「我們覺得網頁AI智能體是下一個前沿技術,能真正使得人類任務實現端到端的自動化,」Myers對TechCrunch說,「網頁AI智能體就像是一座動態橋樑,連接著靜態預訓練模型與不斷變化的數字世界,而這些靜態模型往往只專注於文本。」

Browser Use:讓智能體簡單地瀏覽網頁

Browser Use可以使AI智能體簡單地瀏覽網頁。

它在GitHub上開源,許多項目都使用了它的功能,目前已經獲得超過47k個Star了。

項目地址:https://github.com/browser-use/browser-use項目地址:https://github.com/browser-use/browser-use

Browser Use通過提取網站的交互元素(如按鈕、表單等),使AI能夠自動化執行瀏覽器操作,例如填寫表單、搜索信息或導航網頁。

這對於開發AI驅動的網絡智能體非常有用。

比如,它可以將商品添加到你的購物車,並完成結賬。

甚至是閱讀你的簡曆,然後幫你找工作!中途如果有需要,還會停下來等待你的指示。

它也可以幫你幹活兒。

比如,讓它在Hugging Face上查找具有cc-by-sa-4.0許可證的模型,然後按點讚數排序,將排名前5的模型保存到文件中。

從MCP到Browser Use的爆火

Browser Use是隨著智能體的快速發展而爆火起來的。

去11月,Anthropic首次提出「模型上下文協議」,即MCP,賦予了Claude模型超級能力,一次構建,讓AI與工作流深度集成。

用通俗的話講,MCP就像是專為AI應用設計的通用接口,類似我們日常使用的USB-C。

正如USB-C簡化了不同設備與計算機的連接方式,MCP簡化了AI模型與數據、工具和服務之間的交互方式。

通過MCP,AI助手不僅能夠「讀懂」代碼,還能「理解」團隊討論、涉及文檔等外部信息,提供更加精準的回答。

今年1月,OpenAI推出了Operator,能夠自主執行網絡任務,如規劃假期、填寫表單或預訂餐廳 (OpenAI Launches Operator)。

Operator使用名為Computer-Using Agent (CUA)的AI智能體,通過視覺界面控制網頁瀏覽器,模擬人類點擊、輸入和滾動的操作。

這一工具展示了AI智能體在網絡任務自動化中的潛力,但也需要用戶在遇到複雜界面或驗證碼時介入。

差不多同一時間,Browser Use也開源了,它被Manus團隊集成到了Manus智能體中。

Manus因其綜合能力和友好的用戶界面(如實時顯示思考過程)而迅速走紅,吸引了大量關注。

這直接推動了Browser Use知名度的提升。

參考資料:

Browser Use, the tool making it easier for AI ‘agents’ to navigate websites, raises $17M