AI換臉偷聲侵權,那麼大模型訓練呢?
#AI大模型訓練如何劃定使用邊界#【#AI換臉偷聲侵權#,那麼大模型訓練呢?】近期,配音行業掀起了一場大規模抵製AI聲音侵權行動,原因是如今AI仿聲、聲音複製等技術濫用愈演愈烈。無獨有偶,從撞臉明星,到神似素人,AI短劇「偷臉」問題同樣持續引發關注。
從換臉到偷聲,技術在奔跑,法治也在補位。不久前,國家互聯網信息辦公室發佈《數字虛擬人信息服務管理辦法(徵求意見稿)》,向社會公開徵求意見,意味著對數字虛擬人這一新興業態的治理將邁入全面、系統的法治化規範新階段。
AI侵權的治理有難度,是因為現在AI生成的技術門檻很低,技術發展的速度又很快。目前的AI換臉、偷聲,還是直接使用名人或者普通人的肖像、聲音,但隨著技術的不斷成熟,以後的AI生成未必會採用「照搬」的模式。
簡單地說,未來AI完全可以從不同個體的肖像、聲音中獲取素材,但不是原封不動地盜用,而是進行更加細緻、複雜的拚湊、混合。比如,AI和某人的聲音或肖像不是一模一樣,但有百分之六七十相似,又該如何去認定?這裡面顯然會存在標準不太清楚的地方。這樣一來,維權必然會越來越困難。
這就帶來了一個重要的提醒:說AI換臉、偷聲是侵權,大家都不會有異議,可是AI大模型的訓練,又該如何清晰劃定使用邊界呢?因為我們都知道,AI生產的內容,嚴格意義上來說並不是憑空生成的,它需要蒐集大量的數據材料,從而進行訓練和學習。
但在沒有得到事先明確同意的情況下,生成式人工智能模型可以使用我們的肖像、聲音等「材料」來訓練嗎?即使AI開發者可以合法獲取素材來訓練AI,又該不該向素材的所有者支付報酬?更重要的是,我們應該如何建立可參考執行的行業標準來獲取、管理和應用這些數據?
2025年,包括李察·奧斯文、石黑一雄、凱特·莫斯和瓦爾·馬克德米德在內的一群知名作家簽署了一封公開信,呼籲英國政府追究Meta公司的責任,因為該公司一直在使用受版權保護的書籍訓練人工智能。
事實上,和個體的肖像、聲音一樣,如果一本書籍、一部作品被視為模塊化和可互換的,那麼要認定AI到底有沒有侵權就會變得非常困難。比如,生成式人工智能完全可以「繼承」不同作家的寫作邏輯和語言風格,並將其「自動化」,完成大雜燴式的作品。明明侵權了,又好像沒有侵權,這樣的局面又該怎麼辦?
因此,當我們談論AI時代的版權保護時,應該關注的不僅是已經被大模型生成的內容,或許更應該把目光投向它的源頭——那些被用來訓練的材料到底有沒有受到嚴格的保護?它們又該受到怎樣的保護?這些問題,確實值得社會各界展開認真地討論。




















