國際最新研究構建超萬張人類圖像數據庫 評估人工智能視覺偏見
國際最新研究構建超萬張人類圖像數據庫 評估人工智能視覺偏見
中新網北京11月6日電 (記者 孫自法)國際知名學術期刊《自然》最新發表一篇人工智能(AI)研究論文,提出並構建了一個超過1萬張人類圖像的數據庫,旨在評估AI模型在以人為本的計算機視覺領域中的偏見。
這一「公平的以人類為中心的圖像基準」(FHIBE)由索尼AI團隊開發,其採用符合倫理手段獲取、基於用戶同意的數據集,可用於評估以人為中心的計算機視覺任務,從而識別、糾正偏見和刻板印象。

本項研究的相關圖像數據(圖片來自論文)。施普林格·自然 供圖
該論文介紹,計算機視覺廣泛應用於自動駕駛車輛到面部識別技術等領域。許多計算機視覺使用的AI模型,其訓練數據存在缺陷,可能未經同意收集,經常來自網絡大規模圖像抓取。人們也已發現,AI模型可能會反映出延續性別歧視、種族歧視或其他刻板印象的偏見。
在本項研究中,索尼AI團隊構建了一個圖像數據集,在同意機制、多樣性和隱私等多方面努力採取最佳實踐:FHIBE包含81個國家或地區中1981個個體的10318張圖像,該數據庫涵蓋人口統計和生理特徵的全面標註,包括年齡、代詞類別、祖先血統、髮色與膚色等;參與者獲得關於項目和潛在風險的詳細信息,幫助他們做出知情同意,過程符合全面數據保護法規。這些特徵使該數據庫成為評估AI偏見的可靠資源。
研究團隊將FHIBE和27個現有以人類為中心的計算機視覺應用數據集進行比較,發現FHIBE數據集在多樣性與AI評估的可靠同意方面標準更高,同時還有效減少了偏見,它包含的參與者自我申報標註信息超過其他數據集,還包括了相當比例通常代表性不足的人群。
論文作者總結表示,FHIBE數據集可用於評估現有的AI模型在計算機視覺任務中的表現,能揭示更多此前無法瞭解的偏見。他們也提醒指出,創建數據集的過程充滿挑戰且成本高昂,但FHIBE可能代表了邁向更可信AI的一步。(完)



















