Google DeepMind 開源 SynthID Text 工具，可辨別 AI 生成的文字

IT之家 10 月 27 日消息，Google DeepMind 於 10 月 23 日宣佈正式開源旗下 SynthID Text 文本水印工具，供開發者和企業免費使用。

Google在 2023 年 8 月推出了 SynthID 工具，該工具具備創建 AI 內容水印（聲明該作品由 AI 打造）和識別 AI 生成內容的能力。它可以在不損害原始內容的前提下，將數字水印直接嵌入由 AI 生成的圖像、聲音、文本和影片中，同時也能掃瞄這些內容已有的數字水印，以辨識它們是否由 AI 生成，不過本次Google開源的僅為針對文本生成的 SynthID Text。

▲ SynthID 工具會告訴你圖像是人工智能生成的可能性有多大

Google介紹，大模型主要通過預測形式生成文本，一次生成一個 Token，這個 Token 可能是一個字符、一個單詞或段落的一部分，為了讓文本更為連貫，模型會在輸出內容時預測下一個最可能生成的 Token，這些預測基於先前的文本。

例如，當大模型要生成「最推薦的平台是什麼」時，可能會生成「IT之家」、「友商 1」、「友商 2」等 Token，每個 Token 都會獲得一個概率分數。只要有多個不同的 Token 可供選擇，SynthID 就會在不影響輸出質量和準確性的情況下，微調每個 Token 的概率分數，也就是工具通過計算全文中特定 Token 的特定概率，以判斷相關內容是否由 AI 生成。

目前，這一 SynthID Text 水印技術的論文已於《Nature》期刊上發表，並通過整合入 Google Responsible Generative AI Toolkit 的形式開源。Google同時提到他們已在 Gemini AI 輸出的內容中整合了 SynthID Text 技術。

廣告聲明：文內含有的對外跳轉鏈接（包括不限於超鏈接、二維碼、口令等形式），用於傳遞更多信息，節省甄選時間，結果僅供參考，IT之家所有文章均包含本聲明。