Claude團隊:用400萬條對話分析AI對經濟的長期影響
一水 發自 凹非寺
量子位 | 公眾號 QbitAI
基於400萬條Claude真實對話數據,Anthropic重磅發佈全新報告!
在今天,哪些職業用AI最多?他們都用AI幹什麼?
這些有關AI在各經濟領域應用情況的問題,報告用實實在在的統計數據全回答了。

這一次,他們不僅推出The Anthropic Economic Index(用來理解AI對經濟影響的指數),還公開了第一篇論文,里麵包含大量觀察結論:
-
目前AI使用場景最多的是軟件和寫作;
-
AI應用也呈現出「二八定律」,約4%的職業在75%的任務中高度使用AI;
-
是否使用AI與經濟水平高度相關,中高收入最為普遍,最高和最低都要低得多;
-
當前AI更多承擔輔助功能,不過自動執行任務已經漸趨成熟(43%);
……
與此同時,Anthropic宣佈開源上述用於分析的數據集,以方便其他研究人員進一步得出發現。
報告一經發佈,迅速引起熱議。

看完上述消息,網民們終於舒了一口氣!
AI對經濟的影響,總算不用全靠猜測了。

AI還只是某種選擇而非必需品
還是先來看第一篇公開論文的具體內容。
概括而言,通過對Claude平台400萬+匿名對話數據的分析,Anthropic構建起了衡量AI在經濟活動中使用模式的框架,以此揭示AI在不同任務、職業中的應用情況,並最終探討了其對經濟的影響。

展開來說,如下圖框架所示,研究團隊使用Clio工具(Anthropic開發的自動化分析工具)對大量對話進行分析,目標是將對話映射到職業類別上。
由於美國勞工部O*NET數據庫包含近20,000個獨特的任務陳述,導致直接分類難度較大,因此研究人員構建了一個分層的任務樹結構。
也就是說,先由Claude篩選出職業相關對話,接著借助樹狀搜索,讓Claude依據對話內容從任務層次結構頂層向下遍曆選擇,最終完成對話與具體O*NET任務的映射。

而根據上述映射和分析,研究發現了AI在不同職業類別中的使用差異。
首先,由於軟件開發、數據分析等工作高度適配AI技術,因此計算機和數學相關職業的AI使用率最高,佔所有查詢的37.2%,整體TOP 6如下:

與之相反,偏傳統的農林牧漁行業與AI最遠。

進一步分析不同職業的AI使用深度,可以看出,約36%的職業在四分之一任務中會使用AI,而僅有約4%的職業會在四分之三任務中使用。
換句話說,少部分人大量使用AI,大多數人採取「適量」姿態,整體上AI還只是一種選擇而非必需品。

其次,收入情況也和AI使用率息息相關。
數據顯示,AI在中高收入的工作中(如程序員)使用最為普遍;低收入(如服務員)和非常高收入(如麻醉師)的工作中AI使用率則又要低得多,呈現中間多、兩邊少的形態。

接下來,研究觀察了人們更喜歡與AI協作,還是讓AI自動化執行任務。
結果發現人機協作仍佔據主位,約佔57%;不過以智能體為代表的自動化執行也不容小覷,目前已經佔比43%。
這也意味著,「2025屬於Agents(智能體)」這句話的重要性還在上升。

BTW,Anthropic這次還透露了Claude 3.5 Sonnet和Claude 3 Opus模型之間的任務使用模式的比較分析。
顯而易見,最新模型Sonnet 3.5被更多用於編碼和技術任務,而Opus更多用於創意寫作和教育內容開發。

以上為論文主要發現。另外值得一提的是,官方還特意強調了分析所存在的局限性。
無法確定所有這些任務都是在工作中完成;
人們可能從不同途徑使用Claude,(當前僅統計官方平台)協同使用這一項可能被低估;
由於Claude不支持圖片生成,可能遺漏部分重要使用場景。

不過接下來,Anthropic將繼續推進這一研究。對此,他們同步公開了上述分析所使用的數據集,並邀請經濟學家、政策專家和研究人員開展合作。
而且還順勢搞了波招聘,為公司社會影響團隊招研究科學家和研究工程師。

全網催更Claude新模型
除了討論報告本身,保留節目是,網民們紛紛借此開啟了催更模式。
Sonnet 4怎麼還不來??

更有網民犀利辣評,Anthropic將發佈除新模型之外的一切。(doge)

回顧Anthropic更新Claude模型的頻率,不難發現新模型可能要等到今年上半年。
(表格由AI整理,內容經過驗證)

更具體的說法,來自創始人Dario Amodei在今年一月底的一次訪談,他透露Anthropic正在開發一些新的大模型,有望在未來3-6個月內發佈。
嗯,保守估算一下,也就是今年5~8月份了。
另外他當時還劇透了,新模型會採取不同於其他公司的策略,讓推理能力與模型的其他能力更加協調統一。
正在開發的還有一個「虛擬協作者」(Virtual Collaborator)。
這是一個可以在計算機上執行各種任務(如寫代碼、測試、交流、撰寫文檔等)的AI系統,用戶可以與它進行長時間的任務導向交互。
至於圖像和影片生成則不是Anthropic的研發重點,未來如果確有必要的話,也會選擇「拿來主義」,與專業的圖像生成公司合作。
那就狠狠期待一波了~
參考鏈接:
[1]https://x.com/AnthropicAI/status/1888954156422992108
[2]https://news.ycombinator.com/item?id=43000529