o3智商高達157?每13333人中才有一個這麼高,網民:編碼分數無意義

機器之心報導

機器之心編輯部

從韋氏智商測試來看,如果 o3 的 IQ 真這麼高,則稱得上非常優秀。

OpenAI o3 的智商(IQ)竟然已經這麼高了嗎

今天,Reddit 上一則熱帖宣稱「OpenAI o3 的 IQ 估計為 157」,並放出了一張數據圖。

這意味著什麼呢?人類中的 0.0075% 才能達到這個智商水平。更具體地說,每 13,333 個人中才出來一個這麼高智商的。

對比之下,GPT-4o 的 IQ 為 115、o1 preview 為 123、o1 為 135、o1 pro 為 139、o3 mini 為 141。

同樣更具體地講,GPT-4o 每 6 人中有一個、o1 preview 是每 16 人、o1 是每 93 人、o1 pro 是每 200 人、o3 mini 是每 333 人。

這些 IQ 是如何計算出來的呢?疑似原作者表示,他根據 Codeforces 編碼評級來粗略地估計 IQ,並假設報名時競爭程序員排名前 15%,最後得出 GPT-4o、o1 preview、o1、o1 pro、o3 mini 和 o3 的 IQ 以及在人類中的排名。

圖源:X@i_dg23圖源:X@i_dg23

此前還有人整理了 GPT-4o 與 o1 preview、o1、o3 在 2024 年 AIME 數學競賽題目測試(AIME 2024)中的結果,從 13.4 到如今的 96.7,七個月的時間,數學能力實現了飛躍式提升。

圖源:X@zbgoodwin圖源:X@zbgoodwin

僅從以上數據來看,AI 大模型的進步速度著實令人震驚。不過,畢竟開局一張圖,o3 的 IQ 真的如表格中那麼高嗎?

有人找到了「Tracking AI」中 o1 在挪威文沙智商測試(Mensa Norway)IQ 測試中的結果(為 133,與上面表格中估計的 135 相差不大),一定程度上驗證了 o3 估計智商的可靠性。

圖源:X@facundo_fagalde圖源:X@facundo_fagalde
圖源:https://www.trackingai.org/home圖源:https://www.trackingai.org/home

因此,未來等 o3 正式發佈以後,它的挪威文沙智商測試結果將更加值得期待。

圖源:X@AILeaksAndNews圖源:X@AILeaksAndNews

o3 IQ 如此之高,瞬間引爆了大傢伙的評論熱情。

網民熱評

有網民直呼:「這張圖是我見過最愚蠢的東西之一,這些數據根本不能代表智商。他們用編碼表現的 z 分數代表智商。但編碼不是智商測試,尤其是對於參加編碼測試的 LLM 來說,它們對所有在互聯網上分享的代碼具有完美的數字記憶。o3 甚至無法解答我 6 歲和 8 歲的孩子可以解答的問題。」

也就是說,如果 LLM 針對編碼測試進行訓練,那麼用編碼表現分數代表智商是毫無意義的。

但另一位網民表示:「並非如此,這是一種基於相關性的『轉換』,但首先相關性有點弱,其次它轉化為機器智能的效果尚不明確,即人工智能模型可能擅長編碼,但在其他領域卻不行。」

網民指出:「IQ 本身就是用來評估人類的指標。它評估與智力相關的特定技能,並理所當然地認為人類應該擁有許多其他特徵。而這張圖通過考慮人工智能可以擅長的單一指標來假設廣義智能,他們甚至沒有使用智商測試來得出這個結論,而是根據與智商相關的指標來推斷。」

總的來說,人們對於所謂的「o3 智商高達 157」並不認可。或許,這又是一場炒作吧。

參考鏈接:https://www.reddit.com/r/singularity/comments/1hkxmi6/o3s_estimated_iq_is_157/