OpenAI 被曝 IMO 金牌「造假」，陶哲軒怒揭內幕！

07月22日 10:55 新浪網 tech-auto-hilite

原來，事情並非那麼簡單。

一位IMO內部人士透露，實際上OpenAI並沒有和組委會合作，拿下AI金牌不一定真實有效。

最關鍵的是，他們違背了IMO規定的「公佈時間」規則。

為了避免AI公司們搶奪人類學生的風頭，IMO評審團要求：在閉幕式結束一週後再公佈結果。

然而，OpenAI卻在閉幕Party還未結束前，就發佈了結果。

對此，GoogleDeepMind負責人Thang Luong表態，「是的，IMO組委會有一份不對外公開的官方評分標準」。

若未依據該標準進行評估，任何獎牌聲明均無效。

扣除1分後應為銀牌，而非金牌。

這麼說來，OpenAI聲稱拿下IMO金牌，只是自嗨？！

OpenAI真面目被戳穿

搶奪學生風頭

就在昨天，費爾茲獎得主陶哲軒在一口氣連發三條評論，暗指的就是OpenAI。

他表示，「自己不會評論任何未預先公開測試方法的AI競賽成績報告。在缺乏受控測試環境的情況下，AI的數學能力難以準確評估」。

另外，IMO組委會一位成員Joseph Myers透露，OpenAI並非是IMO合作測試模型的AI公司之一。

而且，陽光海岸的91位協調員（Coordinator）也無人參與結果評估。

P6題協調員表示，「IMO評審團和協調員一致認為，OpenAI此舉顯得失禮且不妥當」。

根據IMO規定，借助AI模型參賽的公司，需要在7月28日之後公佈結果。

一家專注於數學AI初創公司Harmonic官方發文，從側面印證了這一規定存在的準確性。

最新回應引熱議

OpenAI研究科學家，德撲之父Noam Brown下場回應，給出了兩點證明：

首先，團隊是在閉幕式「之後」公開結果。閉幕式有直播記錄，這一點很容易核實。

其次，他確認了OpenAI並未與IMO進行協調，只是在發帖前與一位組織者告知了此事。出於對參賽學生的尊重，要求OpenAI等到閉幕式結束後再發佈——「我們也照做了」。

對此，有人還精細計算了閉幕式和公開結果的時間差。

IMO閉幕式的時間在7月19日（當地時間）下午4點舉行閉幕式，直播時間1小時43分鐘，結束時間不晚於5點43分。

再來看負責人Alexander Wei的發文時間，7月19日下午3:50（東八區），也就是當地時間的5點50分。

從時間來看，確實是OpenAI在IMO閉幕式結束7分鐘後，才發佈了公告。

即便如此，網民們仍舊看不慣OpenAI炒作風暴，而且根本沒有給獲獎學生留有餘地。

而且，可以確定的是，OpenAI公佈的結果，並沒有得到IMO官方認證。

未來幾天，GoogleDeepMind會正式發佈AI奪下IMO 2025細節。

馬庫斯憤怒抨擊，太符合品牌調性了。

UCLA數學教授

LLM短期內不會取代人類

針對LLM拿下IMO金牌事件，來自UCLA應用數學教授Ernest Ryu發表了自己的看法。

1. OpenAI IMO P1-P5的解答目測是正確的。

2. 第6題是一個明顯新穎且難度更高的問題。可以說第1-5題仍在「標準」IMO解題技巧範圍內，但第6題需要創造性思維。

他表示，根據自己使用LLM進行數學研究的經驗，Gemini的表現優於ChatGPT。

但OpenAI搶先在週六宣佈了結果，而GoogleDeepMind「慢科研」學術作風，讓他們輸掉了這場公關戰。

不過，Ernest Ryu認為，在短期內，大模型不會取代數學家。

因為數學研究是，解決那些目前「沒有人」知道如何解決的問題（訓練數據分佈之外），即類似IMO P6題。這需要極大的創造力，OpenAI的模型在IMO解題中恰恰缺乏這種能力。

然而，對於那些人類已有能力解決的問題（訓練數據分佈之內），LLM只會變得愈加強大。

在數學研究中，人們會將現有技術與新創意相結合，LLM將顯著加速前一部分工作的實現。

Ernest Ryu還預測，在接下來十年里，越來越多的數學家將借助LLM來搜索證明框架中的已知部分，從而提升研究效率。

老一輩數學家或許會對此唏噓不已，但年輕一代只會繼續產出優秀成果。

參考資料：

https://x.com/ns123abc/status/1947016206768046452 https://x.com/lmthang/status/1946960256439058844 https://x.com/Mihonarium/status/1947027989608190065