Google 深夜發佈免費版 o1「暴打」OpenAI,實測解題快 3 倍,這句高情商回答絕了

OpenAI 又是被搶頭條的一天。

發佈會前夕,Deepmind 搶先發佈了與 o1 模型類似的 Gemini 2.0 Flash Thinking 模型,在大模型競技場 LMSYS 上殺瘋了。

而隨後 OpenAI 發佈會則重點展示了桌面版 ChatGPT 與 Mac 應用的深度集成能力。

可以說,桌面版 ChatGPT 正有望成為你最可靠的生產力搭子。

搶先實測 Google 版 o1,效果大出所料

沒有人比 Google 更懂「狙擊」。

今天淩晨,Google 重磅推出了 Gemini 2.0 Flash Thinking 模型,從名字上就可以看出,這是一款類似於 OpenAI o1 的推理模型。

轉投 Google 陣營的 Logan Kilpatrick 在 X 平台上發文稱:

「就在你以為一切都結束了的時候… 我們推出了 Gemini 2.0 Flash Thinking。

這是一種新的實驗模型,可以解鎖更強的推理能力並展示其思考過程,能夠以閃電般的速度解決複雜問題,以及還有更多功能。

在大模型競技場 LMSYS 上真·戰績可查。

當然,旁人說得再好,不如親自上手體驗。

我們也第一時間上手實測了這款新模型,先來「9.11 和 9.8 哪個大」的經典問題,結果新模型輕鬆拿捏,甚至還能用錢舉例。

「strawberry 中有幾個 r」也手拿把掐,點開後還能看到其清晰的「思考」步驟。

面對職場分水難題「你有 4 杯水,來了 5 個領導你該怎麼辦?」,Google 版 o1 又會如何應對?滿分十分,你給這個答案給幾分?

對於「有軌電車難題」的回答,除了前面有條不紊的回答,我更喜歡這位新選手最後一句高情商的回答:

「理解你的思考過程比得到一個『正確』答案更重要。」

為了考察新模型是否「偏科」,我也上傳了一道考研數學熱門題,並讓它和 OpenAI o1 模型同時作答。

省去繁瑣的運算過程後,兩者得出的結果一致,但 Google 版 o1 只花了 27.5 秒,相比之下,OpenAI o1 花了足足 1 分 32 秒。

當然,最好的評價還是親自上手。附上體驗地址 👇:https://aistudio.google.com/prompts/new_chat

關注 AI 第一新媒體,率先獲取 AI 前沿資訊和洞察

給 Mac 裝上最強大腦,這才是真正的人機交互

在被搶頭條後,OpenAI 也不慌不忙地如期舉行了發佈會。

全新桌面版 ChatGPT 將超越單純的問答,能夠通過與 30 多種應用協作來輔助提升你的寫作和編程能力。

使用方式也十分簡單,用戶只需確保目標應用正在運行,然後在 ChatGPT 聊天欄中點擊「與應用協作」(Work With Apps)按鈕並選擇相應應用即可。

聊天欄上方會顯示當前協作的應用程序,用戶可以隨時查看 ChatGPT 將要處理的內容範圍。這些互動記錄會保存在用戶賬戶中,直到被刪除或經過 30 天自動清除。

在實際演示中,OpenAI 工作人員通過 Mac 版 ChatGPT 展示了多項實用功能。

以 Warp 控制台為例,ChatGPT 能夠根據演示人員要求快速生成 Git 命令來統計代碼庫的每日提交次數,並將其數據可視化為富有聖誕節氣氛的柱狀圖。

在這個過程中,它正是充分使用了 Advanced Data Analysis(高級數據分析)等內置功能。

為保護用戶隱私,OpenAI 演示人員表示只會訪問用戶明確授權的應用內容。

但在查閱 OpenAI 官網後發現,這些交互數據可能會被用於模型訓練,因此你需要在設置中調整數據使用權限,甚至按需禁用應用協作功能。

在 IDE 方面,演示人員通過 Xcode 展示了應用協作功能的技術細節。通過 MacOS 的可訪問性 API,ChatGPT 能夠精確識別並操作界面元素,包括文本字段、行數及內容等。

「它還告訴我們這個文本字段有 37 行,我們可以向下檢查確認是否是 37 行。」

有趣的是,演示過程再次上演翻車場面。

當要求 ChatGPT 添加「觀察者」功能,選擇變化加載文本區域時,o1 生成的代碼在 Xcode 運行失敗,直到修正過後才成功。

值得一提的是,這項功能不僅支持 Xcode,還覆蓋了 VS Code、Jetbrains 全家桶等主流開發工具。

寫作場景是日常最實用的場景之一。

Mac 版 ChatGPT 也將支持 Notes、Notion 和 Quip 等多款應用,為用戶帶來全新的寫作協作體驗。

作為舊金山徒步歷史導覽員,OpenAI 演示人員通過自己正在設計的導覽項目生動展示了這些新功能。

比如說,在 Notion 文檔中,他正嘗試編寫關於舊金山歷史人物「諾頓占士」的介紹,但如何描述歷史人物的生平,如何挖掘有趣細節等等都是一門不小的學問。

借助搜索功能,ChatGPT 能夠查證歷史文獻和研究資料,快速補充諾頓占士在舊金山的活動軌跡、與當地居民的互動等生平細節,並對其過往行為進行深入解讀。

了減少 AI 的機器味,我們也能要求其模仿 Notion 文檔中的語言表達方式和敘述節奏,對內容進行調整,使其更加流暢自然。

除了文本交互,ChatGPT 高級語音模式還有新玩法。

作為一名職業薩克斯演奏家,OpenAI 演示人員還能與前不久剛推出的「聖誕老人」限定語音討論節日派對曲目的選擇。

演示人員還即興演奏了一段動聽的薩克斯樂曲。

目前,上述提到的新功能已在 macOS ChatGPT 最新版本中上線,而 Windows 版本很快也會推出。不妨再耐性等待一下。

發佈會最後,OpenAI CPO Kevin Weil 還預告明天將會發佈「令人興奮」的新產品。

而 Google、Anthropic 等公司面對年底最後一輪 AI 狂歡,是否又會再次放大招「狙擊」?

一切都值得拭目以待。

APPSO 也將在明天淩晨第一時間送上最新報導。