Anthropic 推出升級版 Claude 3.5 Sonnet 模型,可操控用戶電腦

感謝IT之家網民 新心思 的線索投遞!

IT之家 10 月 23 日消息,當地時間 10 月 22 日,Anthropic 推出了升級版的 Claude 3.5 Sonnet 以及新的 Claude 3.5 Haiku 模型,升級版 Claude 3.5 Sonnet 不僅編程能力更強,還帶來全新功能 computer use(計算機使用),支持像人類一樣操作計算機,可以遵循用戶的命令在計算機屏幕上移動光標,點擊相關位置,並通過虛擬鍵盤輸入信息,模擬人們與自己計算機的交互方式。

IT之家注意到,升級版 Claude 3.5 Sonnet 現已可以使用,computer use 測試版也已開放使用。

進化後的 Claude 3.5 Sonnet 在各個方面得到了全面顯著的提升,尤其是業界領先的編碼能力。

Anthropic 首席科學官 Jared Kaplan 表示:「我認為我們將進入一個新時代,模型可以像人一樣使用所有的工具來完成任務。」

升級版 Claude 3.5 Sonnet 的發佈標誌著 Anthropic 在商業 AI 模型領域的一項重要進展。該模型旨在超越傳統的聊天框,成為真正的「AI 代理」。

所謂的「AI 代理」是指能夠像人類一樣使用軟件並執行其他計算機任務的 AI 模型。有些 AI 代理,如 Cognition AI 的 Devin,專門用於編程。而 Anthropic 則將其 AI 代理定位為一個多面手,聲稱它可以瀏覽網頁並使用任何網站或應用程序。用戶可以根據自己的需求來使用 AI 代理,無論是編程等技術任務,還是旅行規劃等簡單任務。

在 Wired 描述的一個演示中,Claude 被要求規劃一次與朋友一起在日出時觀看金門大橋的旅行。AI 打開了一個網頁瀏覽器,在Google上搜索了一個好的觀景點和其他細節,並將行程添加到日曆應用程序中。雖然令人印象深刻,但 Wired 指出,Claude 沒有考慮到其他有用的細節,比如如何到達那裡。

在另一個演示中,Claude 被要求創建一個簡單的網站,它使用微軟的 Visual Studio Code 來完成這項任務,甚至打開了一個本地服務器來測試它剛剛創建的網站。雖然在創建過程中出現了一個小錯誤,但當給予提示後,其糾正了代碼。

然而,儘管這些 AI 模型看起來很有前景,但它們仍然存在可靠性的問題,尤其是在編寫代碼方面,Anthropic 的模型也不例外。據 TechCrunch 報導,即使在簡單的測試中,如預訂航班和修改預訂,Claude 3.5 Sonnet 也只成功完成了不到一半的任務。

除了技術上的不完善,AI 代理還帶來了明顯的安全風險。用戶是否願意讓這些不穩定且有時難以預測的技術訪問個人電腦文件並使用網絡瀏覽器,仍是一個值得深思的問題。

Anthropic 對此表示,通過逐步開放這種有限、相對更安全的 AI 模型,能夠幫助提升 AI 代理的安全性。他們在聲明中寫道:「我們認為,與其等到更強大的模型出現,不如讓現有較為安全的模型接觸電腦,這樣我們可以開始觀察並應對潛在問題,在提升使用水平的同時逐步增強安全措施。」

廣告聲明:文內含有的對外跳轉鏈接(包括不限於超鏈接、二維碼、口令等形式),用於傳遞更多信息,節省甄選時間,結果僅供參考,IT之家所有文章均包含本聲明。