銀牌組最高分,Google DeepMind 捅破 AI 數學推理上限:6 道國際奧數題解出 4 道

IT 之家 7 月 26 日消息,Google DeepMind 團隊昨日(7 月 25 日)發佈博文,表示其研發的 AlphaProof 和 AlphaGeometry 2 模型可以解決數學中的高級推理問題,在解答國際數學奧林匹克競賽難題方面達到銀牌標準。

AI 模型簡介

  • AlphaProof:基於強化學習的全新數學形式推理系統。

  • AlphaGeometry 2:幾何解題系統的改進版。

DeepMind 團隊結合兩個 AI 模型,協作解決了今年國際數學奧林匹克(IMO)6 道題目中的 4 道,首次在競賽中取得與銀牌得主同等的成績。

評分團隊

DeepMind 團隊兩位專家,根據 IMO 的評分規則進行評分,這兩位專家分別為:

  • 蒂莫西・高爾斯教授(Prof Sir Timothy Gowers):著名數學家、IMO 金牌得主和費爾茲獎得主。

  • 約瑟夫-美亞斯博士(Dr Joseph Myers):兩屆 IMO 金牌得主、IMO 2024 年問題遴選委員會主席

AI 模型推理

AI 會將 IMO 的 6 道題目翻譯成為模型可以理解的數學語言。

AlphaProof 通過確定答案並證明其正確性,解決了兩個代數問題和一個數論問題,而其中解決的 1 個問題是比賽中最難的,在今年的 IMO 中只有 5 位選手解決了這一問題。

AlphaGeometry 2 證明了幾何問題,沒有解決 2 個組合問題。

AI 模型結果

按照 IMO 規則,6 道題目每道題可獲得 7 分,總分最高為 42 分。

DeepMind 系統最終獲得了 28 分,每個問題都得到了滿分,相當於銀牌組的最高分。

2024 年的金獎門檻從 29 分開始,在正式比賽中,609 名參賽者中有 58 人獲得了金獎。

IT 之家附上參考地址