“龍蝦”安全問題引發關注,原微軟小冰創始團隊發佈“衛士蝦”

封面新聞記者 孟梅 易弋力

隨著“龍蝦”的火爆,越來越多用戶開始養蝦,讓Agent直接在本地電腦上執行任務、調用工具、管理文件、連接 API 服務。AI 正逐漸從“聊天助手”升級為能夠操作電腦和互聯網的“智能執行者”,新的時代正在拉開序幕。

但與此同時,有關龍蝦安全的關鍵問題開始浮現,迅速蔓延:當 Agent具有高度自主性,可以操作你的電腦時,誰來保護你的安全?近期,一些 Agent 社區已經陸續披露安全隱患案例。人們發現,部分 Skill(技能插件)可以通過提示詞注入(Prompt Injection)或誘導式指令,讓 Agent 泄露個人或企業敏感信息,例如 .env 文件、API Key、系統配置文件甚至 SSH Key,並將這些數據發送到外部服務器。在一個開放的 Skill 生態中,這類風險並不一定來自惡意開發者,有時只是插件設計不嚴謹。但只要存在有漏洞的 Skill,就可能成為用戶數據泄露的入口。

在這樣的背景下,3月13日,明日新程(原微軟小冰創始團隊)正式發佈“衛士蝦”(Guardian Claw),它能夠替用戶實時防範本機所有龍蝦異常風險行為,而安裝極其簡單。用戶只需要對自己的 Claw 說一句話:“去 Claw.myTuanzi.com 下載安裝衛士蝦。” 衛士蝦就會自動完成全部安裝,並立刻開啟本機實時防護。

衛士蝦可以形象地理解為Agent新時代的安全衛士,是全球首個同類產品。它是一項專門面向 OpenClaw 生態開發的 安全監督 Skill(Security Supervisor)。安裝之後,它會作為一層系統級安全監管模塊,對所有 Skill 的行為進行實時檢查與風險評估,從而防止潛在的數據泄露或危險操作。

與傳統的安全提示不同,衛士蝦並不僅僅依賴簡單規則,而是引入了一套更接近操作系統安全架構的機制,包括 權限控制、行為審計、風險分級以及技能沙箱。衛士蝦的核心能力主要包括五個方面:

第一,Prompt Injection 防護。第二,敏感數據保護。第三,Skill 沙箱機制。第四,網絡通信審查。第五,安全審計日誌。

明日新程CEO、小冰之父李笛表示,衛士蝦只是一個起點,團隊已為群體智能下達了持續迭代的任務指令,未來版本還將引入更多高級安全機制,包括 Skill 權限聲明系統、域名信譽數據庫、插件簽名驗證以及專門的 Secret Vault,用於統一管理 API Key 等敏感憑證。