英偉達推出 NIM AI 護欄服務,防止模型遭用戶「越獄」
IT之家 1 月 18 日消息,英偉達宣佈推出一項名為「NIM」的 AI 護欄服務,該服務現已以英偉達 NeMo 護欄(NeMo Guardrails)套件的形式提供,可以讓開發人員為大語言模型(LLM)添加一系列護欄規則,旨在解決用戶通過提示詞「越獄」大模型,防止 AI 生成不符合預期的內容。

英偉達表示,相應 AI 護欄服務套件基於英偉達的 Aegis 內容安全數據集進行訓練而成,該數據集包含了 3.5 萬個標註的數據樣本,並已在 Hugging Face 上公開,IT之家附地址如下。
英偉達指出,相應 AI 護欄套件具有體積小、效率高的特點,在大部分場合中都能流暢運行,企業可以在開發 AI 模型時直接嵌入相應安全套件,可以改善醫療、汽車、製造業等領域部署的 AI 安全性。
此外,英偉達還提供了公佈了一項名為 Garak 的漏洞掃瞄工具,用於檢測模型的安全性,防止模型可能輸出幻覺內容或泄露企業內部機密信息。
廣告聲明:文內含有的對外跳轉鏈接(包括不限於超鏈接、二維碼、口令等形式),用於傳遞更多信息,節省甄選時間,結果僅供參考,IT之家所有文章均包含本聲明。