Deepfake 檢測準確率達 98%，螞蟻數科入選金融科技創新應用案例

近日，在中關村論壇系列活動第 12 屆數字金融與科技金融大會上，螞蟻數科的 Deepfake 檢測方案入選大會「金融科技技術創新與應用案例」。

螞蟻數科依託旗下天璣實驗室，業界首次構建了大規模、高質量、多模態的 Deepfake 數據集，其合成超過百萬級多媒體內容，充分地模擬了真實世界金融風控環境中的 Deepfake 攻擊樣本，成為評測現有金融領域 Deepfake 檢測模型性能的重要標準。在金融業務場景中，螞蟻數科多組測試數據集上的 Deepfake 檢測準確率達到了 98% 以上，併成功阻止了多起利用 Deepfake 技術進行的欺詐行為，保護了用戶的資產安全。

該數據集解決了以往金融領域 Deepfake 檢測模型無法大規模訓練，無法在真實環境中測評的問題，並且從多模態分析角度促進了傳統檢測模型的發展。目前該數據集已經成為螞蟻數科反深偽產品 ZOLOZ Deeper 對外服務客戶的關鍵能力。

據瞭解，螞蟻數科使用先進的多達 81 種 Deepfake 技術生成高質量的合成圖像，覆蓋了多種偽造技術類型、複雜光照條件、背景環境和麵部表情，以模擬複雜逼真的真實世界攻擊環境。除了靜態圖像外，還收集並生成了大量包含聲音的影片數據，包括 100 多種偽造技術類型，涵蓋不同語種、口音和背景噪音，確保數據集的多樣性和複雜性。

在數據預處理和標註階段，螞蟻數科對收集到的數據進行清洗和預處理，確保數據質量。通過專家團隊對數據進行標註，明確每張圖像或每個影片是否為 Deepfake 生成的內容，同時保證偽造痕跡的最小化，達到高度逼真的效果。此前，螞蟻數科發佈了 AI 數據合成與生產平台，在數據標註層面實現了「AI 主導」，標註模型依賴人工標註量降低了 70% 以上。

此外，螞蟻數科在 2024 外灘大會發起了一場 Deepfake 攻防挑戰賽，將 Deepfake 數據集作為比賽的基礎訓練和測試數據，吸引到了全球 26 個國家和地區，2200 多名選手報名參賽。通過大賽選手貢獻的算法方案，Deepfake 數據集的攻擊質量和檢測難度得到了有效驗證和評估。

隨著人工智能技術的發展，Deepfake 技術也在迅速進步。這種技術利用深度學習算法，可以對影片中的人臉進行逼真的替換。儘管 Deepfake 在娛樂和傳媒等領域有著積極的應用，但在金融領域，特別是身份驗證和交易驗證環節，Deepfake 技術帶來了新的風險。金融機構的身份驗證系統往往依賴於生物識別技術，如人臉識別。一旦這些系統被 Deepfake 技術所欺騙，可能導致嚴重的金融欺詐。

鑒於此，開髮針對 Deepfake 攻擊的檢測系統在金融領域是十分必要的，但是強大的 Deepfake 檢測防禦模型需要高質量符合真實世界環境的人臉 Deepfake 數據集，所以如何構建模擬真實世界的數據集以及如何驗證其有效性是緊迫的問題。