Google 深夜發佈免費版 o1「暴打」OpenAI,實測解題快 3 倍,這句高情商回答絕了
OpenAI 又是被搶頭條的一天。
發佈會前夕,Deepmind 搶先發佈了與 o1 模型類似的 Gemini 2.0 Flash Thinking 模型,在大模型競技場 LMSYS 上殺瘋了。
而隨後 OpenAI 發佈會則重點展示了桌面版 ChatGPT 與 Mac 應用的深度集成能力。
可以說,桌面版 ChatGPT 正有望成為你最可靠的生產力搭子。
搶先實測 Google 版 o1,效果大出所料
沒有人比 Google 更懂「狙擊」。
今天淩晨,Google 重磅推出了 Gemini 2.0 Flash Thinking 模型,從名字上就可以看出,這是一款類似於 OpenAI o1 的推理模型。
轉投 Google 陣營的 Logan Kilpatrick 在 X 平台上發文稱:
「就在你以為一切都結束了的時候… 我們推出了 Gemini 2.0 Flash Thinking。
這是一種新的實驗模型,可以解鎖更強的推理能力並展示其思考過程,能夠以閃電般的速度解決複雜問題,以及還有更多功能。」
在大模型競技場 LMSYS 上真·戰績可查。
當然,旁人說得再好,不如親自上手體驗。
我們也第一時間上手實測了這款新模型,先來「9.11 和 9.8 哪個大」的經典問題,結果新模型輕鬆拿捏,甚至還能用錢舉例。
「strawberry 中有幾個 r」也手拿把掐,點開後還能看到其清晰的「思考」步驟。
面對職場分水難題「你有 4 杯水,來了 5 個領導你該怎麼辦?」,Google 版 o1 又會如何應對?滿分十分,你給這個答案給幾分?
對於「有軌電車難題」的回答,除了前面有條不紊的回答,我更喜歡這位新選手最後一句高情商的回答:
「理解你的思考過程比得到一個『正確』答案更重要。」
為了考察新模型是否「偏科」,我也上傳了一道考研數學熱門題,並讓它和 OpenAI o1 模型同時作答。
省去繁瑣的運算過程後,兩者得出的結果一致,但 Google 版 o1 只花了 27.5 秒,相比之下,OpenAI o1 花了足足 1 分 32 秒。
當然,最好的評價還是親自上手。附上體驗地址 👇:https://aistudio.google.com/prompts/new_chat
關注 AI 第一新媒體,率先獲取 AI 前沿資訊和洞察
給 Mac 裝上最強大腦,這才是真正的人機交互
在被搶頭條後,OpenAI 也不慌不忙地如期舉行了發佈會。
全新桌面版 ChatGPT 將超越單純的問答,能夠通過與 30 多種應用協作來輔助提升你的寫作和編程能力。
使用方式也十分簡單,用戶只需確保目標應用正在運行,然後在 ChatGPT 聊天欄中點擊「與應用協作」(Work With Apps)按鈕並選擇相應應用即可。
聊天欄上方會顯示當前協作的應用程序,用戶可以隨時查看 ChatGPT 將要處理的內容範圍。這些互動記錄會保存在用戶賬戶中,直到被刪除或經過 30 天自動清除。
在實際演示中,OpenAI 工作人員通過 Mac 版 ChatGPT 展示了多項實用功能。
以 Warp 控制台為例,ChatGPT 能夠根據演示人員要求快速生成 Git 命令來統計代碼庫的每日提交次數,並將其數據可視化為富有聖誕節氣氛的柱狀圖。
在這個過程中,它正是充分使用了 Advanced Data Analysis(高級數據分析)等內置功能。
為保護用戶隱私,OpenAI 演示人員表示只會訪問用戶明確授權的應用內容。
但在查閱 OpenAI 官網後發現,這些交互數據可能會被用於模型訓練,因此你需要在設置中調整數據使用權限,甚至按需禁用應用協作功能。
在 IDE 方面,演示人員通過 Xcode 展示了應用協作功能的技術細節。通過 MacOS 的可訪問性 API,ChatGPT 能夠精確識別並操作界面元素,包括文本字段、行數及內容等。
「它還告訴我們這個文本字段有 37 行,我們可以向下檢查確認是否是 37 行。」
有趣的是,演示過程再次上演翻車場面。
當要求 ChatGPT 添加「觀察者」功能,選擇變化加載文本區域時,o1 生成的代碼在 Xcode 運行失敗,直到修正過後才成功。
值得一提的是,這項功能不僅支持 Xcode,還覆蓋了 VS Code、Jetbrains 全家桶等主流開發工具。
寫作場景是日常最實用的場景之一。
Mac 版 ChatGPT 也將支持 Notes、Notion 和 Quip 等多款應用,為用戶帶來全新的寫作協作體驗。
作為舊金山徒步歷史導覽員,OpenAI 演示人員通過自己正在設計的導覽項目生動展示了這些新功能。
比如說,在 Notion 文檔中,他正嘗試編寫關於舊金山歷史人物「諾頓占士」的介紹,但如何描述歷史人物的生平,如何挖掘有趣細節等等都是一門不小的學問。
借助搜索功能,ChatGPT 能夠查證歷史文獻和研究資料,快速補充諾頓占士在舊金山的活動軌跡、與當地居民的互動等生平細節,並對其過往行為進行深入解讀。
為了減少 AI 的機器味,我們也能要求其模仿 Notion 文檔中的語言表達方式和敘述節奏,對內容進行調整,使其更加流暢自然。
除了文本交互,ChatGPT 高級語音模式還有新玩法。
作為一名職業薩克斯演奏家,OpenAI 演示人員還能與前不久剛推出的「聖誕老人」限定語音討論節日派對曲目的選擇。
演示人員還即興演奏了一段動聽的薩克斯樂曲。
目前,上述提到的新功能已在 macOS ChatGPT 最新版本中上線,而 Windows 版本很快也會推出。不妨再耐性等待一下。
發佈會最後,OpenAI CPO Kevin Weil 還預告明天將會發佈「令人興奮」的新產品。
而 Google、Anthropic 等公司面對年底最後一輪 AI 狂歡,是否又會再次放大招「狙擊」?
一切都值得拭目以待。
APPSO 也將在明天淩晨第一時間送上最新報導。