AI聲音侵權怎麼判?北京互聯網法院法官:可識別性是關鍵丨專訪

「我的聲音被偷了。」今年3月,以729聲工場旗下配音演員發佈聲明函為起始,行業內多位知名從業者及機構集體發聲表明對未授權AI訓練的反對態度。關於AI聲音侵權及維權的討論充斥在社交平台上。

事實上,這並非聲音權利人的第一次維權嘗試。兩年前,全國首例AI生成聲音人格權侵權案——殷某案在北京互聯網法院宣判。該案涉及五方被告,法院對各方主體的責任作出了區分認定,法院最終認定原始錄音製品的採集方和授權方與實施AI化處理的技術方構成侵權。此後,該案被最高人民法院列為利用網絡信息技術侵害人格權典型案例。

相比兩年前,目前AI聲音技術的演化速度已遠超外界想像,新的侵權形式也在不斷湧現。據媒體報導,為動畫角色太乙真人配音的張珈銘,曾投入大量時間與資金用於製止AI盜聲,但由於侵權主體多為未成年人,法律追責受阻等現實難題,截至今年4月仍無一例起訴成功。4月2日,中國廣播電視社會組織聯合會演員委員會,針對「聲紋複製複刻」「擅自抓取演員影像聲頻用於AI模型訓練」等侵權行為進行了嚴正聲明。

當聲音被「偷走」之後,權利人究竟該如何把它「找回來」?帶著這個問題,新京報記者專訪了北京互聯網法院法官江瀟。試圖透過真實的審理視角,還原AI聲音侵權行為背後的司法觀察與審慎思考。

北京互聯網法院。供圖北京互聯網法院。供圖

新京報:從北京互聯網法院受理的案件情況來看,當前涉及AI聲音或聲音權益的糾紛,主要集中在哪幾類?

江瀟:從目前案件情況來看,當前涉及AI聲音或聲音權益的糾紛,主要集中在以下幾類:第一類是未經許可將他人聲音進行AI化處理並製成文本轉語音產品對外銷售牟利,此類案件的典型代表是我院審理的全國首例「AI生成聲音人格權侵權案」,該案被最高人民法院選為利用網絡、信息技術侵害人格權典型案例;第二類是未經權利人許可,使用AI合成的名人聲音用於商業推廣或帶貨;第三類是對配音演員的聲音進行AI複製並在各類平台廣泛傳播使用。此外,還有涉及AI生成聲音在短影片、有聲讀物等領域使用的糾紛。

新京報:與傳統肖像權或人格權案件相比,這類案件呈現出哪些新的特點?在你看來,AI聲音案件是否已經形成某種相對穩定的糾紛類型?

江瀟:與傳統人格權案件相比,AI聲音案件呈現出以下特點:一是侵權鏈條複雜、主體多元,導致權利追溯和責任認定均較傳統案件更為複雜;二是侵權行為具有高度隱蔽性和技術性,權利人往往難以自行發現和鎖定侵權源頭;三是損害後果的擴散速度快、影響範圍廣。總體來看,AI聲音侵權案件尚處於不斷湧現和探索階段,案件的具體形態也在豐富和演變之中。

新京報:《中華人民共和國民法典》規定聲音參照肖像權保護,「具有可識別性」是認定侵權的重要前提。在具體審理案件時:法院通常如何判斷某段聲音是否具有「可識別性」?是更側重技術相似度,還是公眾感知相似度?

江瀟:關於「可識別性」的認定路徑。《中華人民共和國民法典》第一千零二十三條第二款規定,對自然人聲音的保護,參照適用肖像權保護的有關規定。據此,聲音權益保護以具有「可識別性」為法律保護的前提條件。我院審理的「AI聲音權」案中認定自然人聲音的可識別性是指在他人反復多次或長期聆聽的基礎上,通過該聲音特徵能識別出特定自然人。利用人工智能合成的聲音,如果能使一般社會公眾或者相關領域的公眾根據其音色、語調和發音風格,關聯到該自然人,則可以認定為具有可識別性。因此,此類案件在判斷標準上並非單純或主要依賴技術指標,而是以「相關領域普通聽眾能否識別」作為判斷核心。

全國首例AI聲音權案庭審現場,庭審在線上進行。供圖全國首例AI聲音權案庭審現場,庭審在線上進行。供圖

新京報:在一些案件中,AI生成聲音未必完全一致,而可能只是「風格類似」或「高度相似」。法院如何區分「高度相似」與「僅屬風格模仿」?對於配音演員這類聲音可變性較強的職業,其職業特性是否會影響識別性的判斷?

江瀟:關於區分標準,這是一個難點問題。我個人認為,關鍵或許在於聲音特徵的整體重合程度,以及公眾是否會對聲音主體產生一一對應的聯繫。如果在音色、語調、發音風格等多個核心特徵上均呈現高度一致性,且足以使一般公眾或相關領域公眾將該聲音關聯到特定自然人,則可考慮認定為「高度相似」而非「僅屬風格模仿」。

關於配音演員的聲音識別性問題。相似地,我個人認為,判斷的關鍵還是在於,一定範圍內的聽眾能夠將聲音與某特定自然人建立一一對應關係,則可認定具備識別性。

新京報:目前部分AI系統會融合多人的聲音特徵生成新的聲音,而非模仿單一對象。在這種情況下,如果生成聲音無法明確對應某一自然人,法院是否仍可能認定侵權?若涉及多個潛在權利人,是否可能出現責任歸屬困難?您認為這類「融合聲音」案件未來是否會成為審判重點難點?

江瀟:關於融合聲音的侵權認定,是一個前沿性的問題。我想還是要回歸到可識別性的認定標準,如果生成聲音無法明確對應某一特定自然人,則在該自然人獨立提起的人格權侵權訴訟中,恐怕難以認定構成對特定個人的聲音權益侵害。但另一方面,AI系統融合多人聲音的處理方式,可能還涉及個人信息保護、數據安全等其他法律問題,成為可供參考的其他維權路徑。

新京報:在一些案件中,被告可能對錄音製品享有著作權,但並不當然意味著獲得對聲音進行AI化處理的授權。如果合約中寫的是「信息網絡傳播權」或「全權授權」,法院通常會如何解釋?從審判經驗來看,聲音權利人在簽約時最容易忽視或最需要警惕的授權風險有哪些?

江瀟:關於合約的解釋。這是一個在審判實踐中反復出現的問題。我院在「AI聲音權案」中已明確:對錄音製品享有著作權,並不等同於獲得了對聲音進行AI化處理的授權。未經權利人的知情同意,AI化使用或授權他人AI化使用權利人聲音的行為,是欠缺合法權利來源的。因此,除非合約中有明確、具體的「聲音AI化」「語音合成」等授權條款,否則不宜解釋為包含了人格權層面的聲音使用授權。

因此,配音演員在簽約時應警惕協議中是否存在將著作權授權與聲音人格權使用混為一談、授權條款過於籠統寬泛、未約定聲音素材的流轉限制等問題。

新京報:AI聲音侵權通常涉及多個主體,如模型開發方、平台運營方和實際使用者。法院通常如何區分不同主體的責任邊界?如果平台僅提供工具而未直接生成內容,法院通常會重點考察哪些因素?

江瀟:在案件審理中通常根據不同主體的行為性質、主觀狀態和對侵權結果的參與程度,分別認定其法律責任。以「AI聲音權案」為例,該案涉及五方被告,法院對各方主體的責任作出了區分認定:原始錄音製品的採集方和授權方與實施AI化處理的技術方,因未經原告許可AI化使用原告聲音,構成侵權,承擔賠償責任和賠禮道歉責任;下遊採購使用方與雲服務平台方承擔賠禮道歉責任;中間採購方則因主觀上不存在過錯,不承擔損害賠償責任。

新京報記者 吳龍珍

編輯 吳龍珍

校對 柳寶慶