Gemini 2.5瘋狂反撲OpenAI,智商130碾壓人類,一鍵3D打印蛋糕、秒解魔方
AI圈最熱的風頭莫過於GPT-4o的原生圖像,但別急著下定論。Gemini 2.5 Pro正在悄悄反擊,在Chatbot競技場奪冠、IQ測試拿下第一後,它還能解魔方、建模型、創遊戲,甚至一鍵生成3D打印文件!AI的下一個戰場,正在從文字轉向視覺與空間,誰能笑到最後?
要說這幾天AI圈最火的模型,那肯定非GPT-4o莫屬。
為了應對DeepSeek V3的一次「小升級」以及GoogleGemini 2.5 Pro的推出,奧特曼帶隊上線了GPT-4o的原生圖像生成功能。
隨之而來的是一股吉卜力風席捲全網,火速出圈兒。
只留下Google在這股風中淩亂。。。
Google的這個旗艦模型真的這麼不堪一擊嗎?
好像不是那麼回事。
剛剛發佈幾天,Gemini 2.5 Pro已經衝上了Chatbot競技場榜首的位置,超越了最新更新的ChatGPT-4o-latest以及Grok-3。

更離譜的是,在一項智商測試中,Gemini 2.5 Pro的IQ竟然高達130,離線得分也有118分。
均在所有模型中排名第一。
要知道人類平均智商為100。
雖然不太全面,但至少在有些方面,AI的確已經比大多數人聰明了!

這麼厲害的模型都能幹點什麼,我們先來看看網民的腦洞。
從3D建模蛋糕到秒解魔方
DeepMind的研究員Fei Xia在網上展示了如何用Gemini 2.5 Pro讓一張圖片活起來。
「Gemini 2.5 Pro 是一個強大的編碼模型。我能夠使用它將一張圖片轉換成3D打印對象,並使其活起來!」他表示。

他首先用Gemini 2.0 Flash Image將妻子畫的三層蛋糕轉換成3D渲染圖。
Gemini 2.0 Flash做得很好,添加了很多細節。

接著,他就讓新發佈的Gemini 2.5 Pro模型編寫OpenSCAD代碼來複製這個3D模型。
這個過程中還需要同時注意可打印性。

最後,點擊打印按鈕,就得到了一個可愛的玩具!
Fei表示他非常喜歡所有的細節。







X上的大V Shruti Mishra貼出了一些實測Gemini 2.5 Pro的震撼用例。
比如,使用Three.js創建一個3D汽車模擬器。

接下來是個老節目,旋轉多邊形和彈跳小球的動畫。
實測中兩個模型使用了相同的提示詞。
不得不說,Gemini 2.5 Pro與GPT o1 Pro表現得都很棒,o1 Pro的小球還有一些動效。
Gemini 2.5 Pro生成的小球可能更接近真實情況一些。

甚至創建出一個Minecraft遊戲。
生成一個3D魔方,然後解開它。
你還可以調整魔方的階數。

輕鬆製作一個高爾頓板模擬器,更直觀地理解概率、統計、正態分佈、大數法則、二項分佈等抽像數學概念。

還有經典的3D飛行遊戲。
不過這遊戲場景看起來還不夠豐富。

Advanced用戶可以使用Canvas
剛剛,Google官方宣佈,Gemini Advanced用戶可以在Gemini 2.5 Pro中使用Canvas進行創作了。

他們還給出了一個3D恐龍世界示例,表示僅用幾分鐘和幾個提示就完成了。

Google表示他們正在努力讓Gemini 2.5 Pro盡快對更多人開放試用。
在GPT-4o的聲勢和吉卜力畫風席捲全網之際,Google的Gemini 2.5 Pro悄然崛起,用一連串硬核的技術實力和實戰應用回應了所有質疑。
從3D建模到秒解魔方,從高爾頓板到Minecraft遊戲,無論你是開發者、創作者,還是科技愛好者,現在是時候重新認識Gemini了。
別只盯著熱度,真正的力量,往往藏在冷靜的數據和落地的能力中。
參考資料:
https://x.com/heyshrutimishra/status/1905953060209451450
https://x.com/GeminiApp/status/1906137074102948308
本文來自微信公眾號「新智元」,作者:新智元,編輯:犀牛,36氪經授權發佈。