超越國際數學奧林匹克金牌得主:Google DeepMind AI 系統展現超強幾何解題能力
IT之家 2 月 8 日消息,Google旗下人工智能研究實驗室 DeepMind 開發的人工智能系統 AlphaGeometry2 在解決國際數學奧林匹克競賽(IMO)幾何問題方面取得了突破性進展,其表現甚至超過了平均金牌得主。

AlphaGeometry2 是 DeepMind 在今年 1 月發佈的 AlphaGeometry 系統的改進版本。根據 DeepMind 研究人員最新發表的論文,該 AI 系統能夠解決過去 25 年國際數學奧林匹克競賽中 84% 的幾何問題。國際數學奧林匹克競賽是一項面向高中生的數學競賽,而 DeepMind 認為,發現解決複雜幾何問題(特別是歐幾里得幾何問題)的新方法可能是實現更強大人工智能的關鍵。

證明數學定理或邏輯解釋定理(例如勾股定理)為何成立,需要推理能力以及從多種可能的步驟中選擇解決方案的能力。如果 DeepMind 的觀點正確,這些解決問題的技能將成為未來通用人工智能模型的重要組成部分。
IT之家注意到,去年夏天,DeepMind 展示了一個將 AlphaGeometry2 與 AlphaProof(一種用於形式化數學推理的 AI 模型)相結合的系統,成功解決了 2024 年國際數學奧林匹克競賽中的 6 個問題中的 4 個。除了幾何問題,類似的方法還可以擴展到數學和科學的其他領域,例如輔助複雜的工程計算。
AlphaGeometry2 包含幾個核心要素,其中包括Google Gemini 系列 AI 模型中的語言模型和一個「符號引擎」。Gemini 模型協助符號引擎,後者利用數學規則推導問題的解決方案,並為給定的幾何定理提供可行的證明。
由於將證明轉化為 AI 可理解的格式存在複雜性,可用的幾何訓練數據匱乏。因此,DeepMind 為 AlphaGeometry2 的語言模型創建了自己的合成數據,生成了超過 3 億個不同複雜度的定理和證明。
研究團隊從過去 25 年(2000 年至 2024 年)的國際數學奧林匹克競賽中挑選了 45 個幾何問題,包括線性方程和需要在平面上移動幾何對象的方程,並將其「翻譯」成一個更大的 50 個問題的集合(由於技術原因,某些問題需要拆分為兩個)。根據論文,AlphaGeometry2 解決了其中的 42 個問題,超過了平均金牌得主 40.9 的得分。
不過,該系統也存在局限性。一個技術問題導致 AlphaGeometry2 無法解決涉及可變數量點、非線性方程和不等式的問題。此外,儘管 AlphaGeometry2 不是第一個達到幾何問題金牌水平表現的 AI 系統,但它是在如此規模的問題集上實現這一目標的首個系統。
在另一組更具挑戰性的國際數學奧林匹克競賽問題上,AlphaGeometry2 的表現也不盡如人意。DeepMind 團隊額外挑選了 29 個由數學專家為競賽提名但尚未出現在比賽中的問題,AlphaGeometry2 只能解決其中的 20 個。
廣告聲明:文內含有的對外跳轉鏈接(包括不限於超鏈接、二維碼、口令等形式),用於傳遞更多信息,節省甄選時間,結果僅供參考,IT之家所有文章均包含本聲明。