24 小時抓取百萬次，Anthropic AI 公司被指過度抓取網站數據

07月31日 08:44 新浪網 news-china-auto-hilite

IT之家 7 月 31 日消息，金融時報（FT）發佈博文，指出 AI 公司 Anthropic 雖然聲稱「要負責任地開發 AI」，但通過 ClaudeBot 機器人過度抓取網站數據，用於訓練 Claude 大語言模型。

儘管使用網絡爬蟲抓取數據是人工智能行業普遍做法，但 Anthropic 因其激進程度而受到批評。

自由職業者網站 Freelancer 也表示，ClaudeBot 在四小時內訪問了 350 萬次，被迫對其進行屏蔽。批評者指出，Anthropic 無視網站的 robots.txt 協議，強行獲取數據，與其宣稱的「負責任的 AI」理念相悖。

維修團隊 iFixit 首席執行官 Kyle Wiens 於 7 月 24 日發佈推文，IT之家翻譯如下：

@AnthropicAI，我知道你渴望獲取數據，且 Claude 模型也非常聰明，但真的有必要 24 小時內訪問我們的服務器 100 萬次嗎？

這些流量沒有向我們付費，且佔用了我們開發資源，這真的不太厚道。

我們的服務條款中已經明確禁止通過這種方式使用我們的內容，但你悄悄 @AnthropicAI 是怎麼做的。

如果 @AnthropicAI 想要就我們內容的商業使用許可進行交流，我們願意溝通。

廣告聲明：文內含有的對外跳轉鏈接（包括不限於超鏈接、二維碼、口令等形式），用於傳遞更多信息，節省甄選時間，結果僅供參考，IT之家所有文章均包含本聲明。