24 小時抓取百萬次,Anthropic AI 公司被指過度抓取網站數據

IT之家 7 月 31 日消息,金融時報(FT)發佈博文,指出 AI 公司 Anthropic 雖然聲稱「要負責任地開發 AI」,但通過 ClaudeBot 機器人過度抓取網站數據,用於訓練 Claude 大語言模型。

儘管使用網絡爬蟲抓取數據是人工智能行業普遍做法,但 Anthropic 因其激進程度而受到批評。

自由職業者網站 Freelancer 也表示,ClaudeBot 在四小時內訪問了 350 萬次,被迫對其進行屏蔽。批評者指出,Anthropic 無視網站的 robots.txt 協議,強行獲取數據,與其宣稱的「負責任的 AI」理念相悖。

維修團隊 iFixit 首席執行官 Kyle Wiens 於 7 月 24 日發佈推文,IT之家翻譯如下:

@AnthropicAI,我知道你渴望獲取數據,且 Claude 模型也非常聰明,但真的有必要 24 小時內訪問我們的服務器 100 萬次嗎?

這些流量沒有向我們付費,且佔用了我們開發資源,這真的不太厚道。

我們的服務條款中已經明確禁止通過這種方式使用我們的內容,但你悄悄 @AnthropicAI 是怎麼做的。

如果 @AnthropicAI 想要就我們內容的商業使用許可進行交流,我們願意溝通。

廣告聲明:文內含有的對外跳轉鏈接(包括不限於超鏈接、二維碼、口令等形式),用於傳遞更多信息,節省甄選時間,結果僅供參考,IT之家所有文章均包含本聲明。