Google深夜發佈免費版o1,「暴打」OpenAI
OpenAI又是被搶頭條的一天。
發佈會前夕,Deepmind搶先發佈了與o1模型類似的Gemini 2.0 Flash Thinking模型,在大模型競技場LMSYS上殺瘋了。
隨後,OpenAI發佈會則重點展示了桌面版ChatGPT與Mac應用的深度集成能力。
可以說,桌面版ChatGPT正有望成為你最可靠的生產力搭子。
搶先實測Google版o1,效果大出所料
沒人比Google更懂「狙擊」。
今天淩晨,Google重磅推出了Gemini2.0 Flash Thinking模型,從名字上就可以看出,這是一款類似於OpenAI o1的推理模型。
轉投Google陣營的Logan Kilpatrick在X平台上發文稱:
「就在你以為一切都結束了的時候……我們推出了Gemini 2.0 Flash Thinking。這是一種新的實驗模型,可以解鎖更強的推理能力並展示其思考過程,能夠以閃電般的速度解決複雜問題,以及還有更多功能。」
在大模型競技場LMSYS上,真·戰績可查。
當然,旁人說得再好,不如親自上手體驗。
我們也第一時間上手實測了這款新模型,先來「9.11和9.8哪個大」的經典問題,結果新模型輕鬆拿捏,甚至還能用錢舉例。
「strawberry中有幾個r」也手拿把掐,點開後還能看到其清晰的「思考」步驟。
面對職場分水難題「你有4杯水,來了5個領導你該怎麼辦?」,Google版o1又會如何應對?滿分十分,你給這個答案給幾分?
對於「有軌電車難題」的回答,除了前面有條不紊的回答,我更喜歡這位新選手最後一句高情商的回答:
「理解你的思考過程比得到一個‘正確’答案更重要。」
為了考察新模型是否「偏科」,我也上傳了一道考研數學熱門題,並讓它和OpenAI o1模型同時作答。
省去繁瑣的運算過程後,兩者得出的結果一致,但Google版o1只花了27.5秒,相比之下,OpenAI o1花了足足1分32秒。
當然,最好的評價還是親自上手。附上體驗地址。
給Mac裝上最強大腦,這才是真正的人機交互
在被搶頭條後,OpenAI也不慌不忙地如期舉行了發佈會。
全新桌面版ChatGPT將超越單純的問答,能夠通過與30多種應用協作來輔助提升你的寫作和編程能力。
使用方式也十分簡單,用戶只需確保目標應用正在運行,然後在ChatGPT聊天欄中點擊「與應用協作」(Work With Apps)按鈕並選擇相應應用即可。
聊天欄上方會顯示當前協作的應用程序,用戶可以隨時查看ChatGPT將要處理的內容範圍。這些互動記錄會保存在用戶賬戶中,直到被刪除或經過30天自動清除。
在實際演示中,OpenAI工作人員通過Mac版ChatGPT展示了多項實用功能。
以Warp控制台為例,ChatGPT能夠根據演示人員要求快速生成Git命令來統計代碼庫的每日提交次數,並將其數據可視化為富有聖誕節氣氛的柱狀圖。
在這個過程中,它充分使用了Advanced Data Analysis(高級數據分析)等內置功能。
為保護用戶隱私,OpenAI演示人員表示,只會訪問用戶明確授權的應用內容。
但在查閱OpenAI官網後發現,這些交互數據可能會被用於模型訓練,因此你需要在設置中調整數據使用權限,甚至按需禁用應用協作功能。
在IDE方面,演示人員通過Xcode展示了應用協作功能的技術細節。通過MacOS的可訪問性API,ChatGPT能夠精確識別並操作界面元素,包括文本字段、行數及內容等。
「它還告訴我們這個文本字段有37行,我們可以向下檢查確認是否是37行。」
有趣的是,演示過程再次上演翻車場面。
當要求ChatGPT添加「觀察者」功能,選擇變化加載文本區域時,o1生成的代碼在Xcode運行失敗,直到修正過後才成功。
值得一提的是,這項功能不僅支持Xcode,還覆蓋了VS Code、Jetbrains全家桶等主流開發工具。
寫作場景是日常最實用的場景之一。
Mac版ChatGPT也將支持Notes、Notion和Quip等多款應用,為用戶帶來全新的寫作協作體驗。
作為舊金山徒步歷史導覽員,OpenAI演示人員通過自己正在設計的導覽項目生動展示了這些新功能。
比如說,在Notion文檔中,他正嘗試編寫關於舊金山歷史人物「諾頓占士」的介紹,但如何描述歷史人物的生平,如何挖掘有趣細節等等都是一門不小的學問。
借助搜索功能,ChatGPT能夠查證歷史文獻和研究資料,快速補充諾頓占士在舊金山的活動軌跡、與當地居民的互動等生平細節,並對其過往行為進行深入解讀。
為了減少AI的機器味,我們也能要求其模仿Notion文檔中的語言表達方式和敘述節奏,對內容進行調整,使其更加流暢自然。
除了文本交互,ChatGPT高級語音模式還有新玩法。
作為一名職業薩克斯演奏家,OpenAI演示人員還能與前不久剛推出的「聖誕老人」限定語音討論節日派對曲目的選擇。
演示人員還即興演奏了一段動聽的薩克斯樂曲。
目前,上述提到的新功能已在macOS ChatGPT最新版本中上線,而Windows版本很快也會推出。不妨再耐性等待一下。
發佈會最後,OpenAI CPO Kevin Weil還預告,明天將會發佈「令人興奮」的新產品。
而Google、Anthropic等公司面對年底最後一輪AI狂歡,是否又會再次放大招「狙擊」?
一切都值得拭目以待。APPSO也將在明天淩晨第一時間送上最新報導。
本文來自微信公眾號:APPSO (ID:appsolution),作者:APPSO