新・摩亞定律誕生:AI 智能體能力每 4 個月翻一番,「智能爆炸」在即

AI 編程智能體的能力正在飛速增長,最新研究揭示了這一「新摩亞定律」,如果 AI 智能體的任務時長繼續以每 4 個月翻倍的速度增長,到 2027 年它們可能完成長達 167 小時的月級任務!

編程智能體能完成的任務量,正以爆炸式的速度增長!

而且,這一趨勢還在加速。

2024 到 2025 年,它們的任務處理能力每 4 個月翻一倍;而在 2019 到 2025 年,這個翻倍週期則是 7 個月。

22 號,AI 研究網站 AI Digest 發表了上述觀點,揭示了一個 AI 智能體的新摩亞定律。

博客地址:https://theaidigest.org/time-horizons

從圖表中可以清晰地看到這一趨勢,任務時長的增長軌跡幾乎是一條陡峭的指數曲線。

2019 年,GPT-2 只能處理不到 1 秒的簡單任務;2022 年 ChatGPT 發佈時,AI 已經可以完成 30 秒的編程任務。

現在,智能體可以自主完成人類需要一小時才能完成的編程任務。

頂尖的 AI 系統可以完成的任務長度正在呈指數級增長 —— 每 7 個月翻一番。

這個趨勢是 METR 的研究人員發現的。

他們選取了 2019 到 2025 年間最強的 AI 模型,測試了它們在大約 200 個任務上的表現。主要是編程任務,也有一些邏輯推理任務。

然後,他們把 AI 的成功率和每個任務的長度做了對比 —— 任務長度指的是專業人士完成這些任務需要的時間,從不到 30 秒到超過 8 小時不等。

測試過所有模型後,出現了兩個明顯的規律:

  • 任務長度和 AI 成功率高度相關(相關係數 R²=0.83)。

  • AI 成功率達到 50% 的任務長度 —— 即「時間跨度」—— 正在呈指數增長。

  • 接下來是什麼?

    這個指數增長的趨勢看起來很穩健,沒有停下來的意思。

    如果按照這個趨勢推算下去,AI 智能體將能夠完成:

    •  2026 年:2 小時的任務;

    •  2027 年:1 個工作日(8 小時)的任務;

    •  2028 年:1 個工作周(40 小時)的任務;

    •  2029 年:1 個工作月(167 小時)的任務。

    最近,這一趨勢還在加速。

    2024-2025 年間,時間跨度是每 4 個月任務長度翻一番,而 2019-2025 年間則是每 7 個月翻一番。

    如果按照 2024-2025 年加速的趨勢(每 4 個月翻倍)推算,AI 智能體可能在 2027 年就能完成月級任務(167 小時)。

    然而,僅觀察一年的數據給出預測可能會不太穩定,實際的進步速度也可能會放緩。

    不過,考慮到這個趨勢已經開始加速,它很可能處於一個比指數增長還要快的增長軌道上。

    這也很符合直覺:隨著增長軌道直線上升,1 周和 2 周任務之間所需技能的差距,可能比 1 年和 2 年任務之間的差距更大。

    此外,隨著 AI 能力的提升,它們在開發更強大 AI 方面的作用會越來越大,可能導致超指數級增長。

    智能爆炸

    AI 智能體的能力提升會反過來加速更強大 AI 的研發,形成飛輪效應:更強大的 AI 智能體能夠更快地開發出更先進的 AI 系統,從而進一步提升能力。

    這種正反饋循環可能導致超指數增長,甚至觸發「軟件智能爆炸」(software intelligence explosion),即 AI 能力在短時間內急劇提升,遠遠超過人類的水平。

    此外,算法進步也在推動這一趨勢。

    METR 的研究表明,近年來 AI 在算法效率上的提升,顯著降低了計算資源需求。

    通過更高效的預訓練和後訓練方法,即使硬件資源不增加,AI 智能體的能力也能快速提升。

    AI 智能體任務時長的指數增長,可能成為人類歷史上最具變革性的趨勢之一。

    它能在短時間內完成複雜任務,將徹底改變軟件開發、科學研究、醫療診斷等多個領域。

    例如,一個能夠自主完成月級任務的 AI 智能體,可以完全自動化軟件工程項目,甚至獨立進行科學研究,從而大幅提高生產效率。

    這一趨勢也帶來了潛在的社會挑戰。隨著 AI 智能體能力的快速提升,人類社會可能難以適應這種變化。

    許多傳統職業可能面臨自動化,人類可能需要轉向更具創造性和策略性的角色。

    參考資料:

    • https://theaidigest.org/time-horizons

    • https://x.com/AiDigest_/status/1914710297157493173

    本文來自微信公眾號:新智元(ID:AI_era)

廣告聲明:文內含有的對外跳轉鏈接(包括不限於超鏈接、二維碼、口令等形式),用於傳遞更多信息,節省甄選時間,結果僅供參考,IT之家所有文章均包含本聲明。