版權問題如何解決？OpenAI被控非法使用圖書數據訓練AI系統

06月30日 07:46 新浪網 news-int-auto-hilite

新浪科技訊北京時間6月30日早間消息，據報導，兩名作者在美國舊金山聯邦法院起訴OpenAI，他們認為OpenAI濫用其作品，用作品訓練ChatGPT。

來自美國馬薩諸塞州的作家Paul Tremblay和Mona Awad說，ChatGPT未經許可從大量圖書中複製提取數據，侵犯了作者的版權。

訓練先進的AI系統需要用到大量數據材料，這種使用方式在法律上面臨諸多挑戰。比如，源代碼所有者將矛頭指向OpenAI和微軟旗下GitHub，視覺藝術家起訴Stability AI、Midjourney和DeviantArt等AI工具。被告則認為，系統合理使用了有著作權的作品。

當用戶向ChatGPT給出提示語時，AI會快速回應，雖然這種回應充滿爭議。ChatGPT僅僅開放兩個月，1月時活躍用戶便達到了1億。

ChatGPT及其它生成式AI系統會用海量數據創造內容，很多數據來自互聯網。作家Paul Tremblay和Mona Awad認為書本是關鍵數據材料，因為它們是高質量長文寫作的典範。

訴狀估計，OpenAI的訓練數據包含了至少30萬本圖書，當中有許多是沒有獲得許可、非法獲取的有版權圖書。

兩名原告稱ChatGPT可以對他們寫的書作出非常精準的總結，也就是說他們的書被吸納進數據庫。