Google劈柴立軍令狀：必斬OpenAI，奪回第一！

12月29日 12:35 新浪網 tech-auto-hilite

新智元報導

編輯：編輯部

【新智元導讀】GoogleCEO劈柴在年度戰略會議上放出狠話，2025年將是AI領域生死存亡之年。一場足以改變AI未來走向的巔峰對決，即將在2025年全面打響。

2025年還未開始，矽谷的戰鼓已經擂響。

在這場AI巨頭之間的角力中，GoogleCEO劈柴放出了一記重磅炸彈。

在Google山景城總部舉行的年度戰略會議上，身著節日毛衣的劈柴語氣凝重地對員工們說道——

2025年將是關鍵的一年！

我們必須認識到當下時刻的緊迫性，公司需要以更快的速度前進。這是一個顛覆性時刻，賭注從未如此之高。

這番話背後，是Google與微軟OpenAI之間愈演愈烈的較量。

自ChatGPT橫空出世以來，這家搜索引擎巨頭一直在努力追趕。過去兩年，Google的努力幾乎總被愛搶風頭的OpenAI蓋了過去。

直到12月，Gemini 2.0 Flash、Veo 2、「Google版o1」Gemini 2.0 Flash Thinking等輪番轟炸，一展超越領先模型的潛力。僅用了90天的時間，Google終於逆風反勝。

這意味著，這場AI競賽終於迎來了轉折點。

會議現場，劈柴展示了一張大模型的對比圖，Gemini 1.5傲然領先於OpenAI等其他競爭對手的模型。

當被問及ChatGPT正成為AI的代名詞時，劈柴坦言道，「在歷史場長河中，你不必總是第一個，但必須出類拔萃，必須在同類產品中保持第一梯隊。這就是2025年的意義所在」。

Google開發者關係負責人Logan Kilpatrick多次暗示，明年Google真的要發力了。

——預計1月份的目標，完整版Gemini 2.0正式上線。

甚至，在GoogleDeepMind CEO Hassabis年度總結下面，他稱這些都只是開胃菜，好戲將在2025年開始。

有網民預測道，明年Google將會把很多強大模型免費推向所有人，而且還會發佈直擊o3的競爭模型。

為了在這場AI革命中佔據製高點，Google正全力以赴。

Gemini，下一個5億級用戶爆款應用

對Google而言，可能更糟糕的是競爭對手OpenAI在搜索業務的挑戰。

雖然Google仍主導搜索市場，但GenAI為人們提供了各種訪問在線信息的新方式。

而OpenAI正在被更多人看作是AI的代名詞，如同國外把Google看作搜索的代名詞一樣。

Google背負著巨大的壓力，正通過重金投資Gemini，來鞏固期在AI領域的領先優勢。

Gemini應用程序允許用戶訪問許多工具，包括Google的聊天機器人。

劈柴表示，「建立大型新業務」是重中之重。

Google目前擁有15個用戶超過五億的應用，而高管們普遍認為Gemini應用將是下一個。

劈柴認為Gemini應用具有「強勁形勢」，但也不得不承認「在2025年還有一些工作要做，以縮小差距並建立領導地位」。

劈柴後來補充道：「明年最大的重點是在消費者方面擴展Gemini。」

此外， Google在美國還被法律纏身，包括其在壟斷搜索的法律裁定，以及非法主導在線廣告技術的指控。

英國監管機構則暫時認定Google的廣告技術行為影響了該國的競爭力。

對此，劈柴表示：「這是我們的規模和成功所帶來的。這是科技正在大規模影響社會的大趨勢的一部分。因此，此時此刻，我們要比以往任何時刻都要確保自己不會分心。」

Google，「後來者」居上？

OpenRouterAI的數據顯示，Google旗下的Gemini在開發者中的市場份額從9月份的約5%，直接飆升至>50%市場份額，遙遙領先，連帶股價也上漲了14%。

而此時，距離OpenAI發佈ChatGPT的2022年11月30日，已經整整過去了2年。

早在2017年，Sam Altman在一次郵件交流中就明確表示，GoogleDeepMind是在AGI競爭中最強大的對手，但令他沒想到的是，曾經公認的「AI巨頭」Google卻是個「花架子」。

ChatGPT發佈以來，幾乎成了「AI的代名詞」，不僅迅速征服了市場，還連帶著微軟起飛，在Edge瀏覽器中嵌入Copilot AI搜索助手，直接斷崖式領先。

被寄予厚望的Google，反倒是昏招頻出，先是Bard難產，又經歷AI Overview總結能力大翻車，建議孕婦吸煙、自殺跳橋等等。

在AI順風車下，股價不漲反降，Google一時間淪為笑柄，被OpenAI打的毫無還手之力，更準確的說，連同台競技的資格都沒有。

讓人費解的是，Google和DeepMind擁有世界上最好的硬件、最多的訓練數據、最頂尖的人才，也發過很多具有劃時代意義的論文，如AlphaFold、GenCast等，但為什麼就連Anthropic這樣的創業公司都打不過？

網民分析的細節原因不勝枚舉，一句話來說，就是「船大難掉頭」。

從安全性上考慮，Google作為世界級獨一檔的科技巨頭，不論發佈什麼產品，其用戶群體都不會小，會涉及到各個種族、不同的意識形態，一點小問題就會被無限放大，而文本生成又是非常主觀的，很容易受到訓練材料的偏見影響，所以Google需要更長的時間進行合規檢查。

23年初，Google受輿論裹挾，急急忙忙發佈Bard，在發佈會上關於問題「關於占士·韋比太空望遠鏡，我可以告訴我9歲的孩子它有哪些新發現？」，Bard給出錯誤答案。

這直接導致公司股價暴跌8%，市值縮水1000多億美元，讓投資群體和用戶大失所望。

但其實OpenAI的產品也經常胡說八道、張冠李戴，不過因為是創業公司，所以大眾的容忍度會高很多，產品標註為beta測試，還可以不斷迭代修改。

作為大公司的Google，也受到更多法律上的限制，比如用戶數據的版權問題。

Google曾因在AI訓練過程中違反歐盟版權法被罰款2.5億歐元，也是全球首個因AI訓練數據被罰款的案例，坐擁金山，卻無法使用，無異於自斷雙臂。

Google的產品線龐大，想要在所有產品中都加入AI驅動，需要非常細緻的產品管理能力，而去年末發佈的Gemini 1.0，因其過度「多樣化」的策略，再次導致股價下跌。

不過，「成功者說什麼都是對的」，Google重新以王者之姿橫掃AI，未來還計劃繼續引領「智能體」發展，攜手瀏覽器和手機端，全自動實現用戶任務。

Google年度AI大事件

Google並非沒有看到AI市場的巨大潛力，但2024年才算是開始「發力」的一年。

很多有名氣的產品基本都是在今年發佈的，比如各種版本的Gemini，NotebookLM，Pixel手機上的AI功能等等。

傳送門：https://blog.google/technology/ai/google-ai-news-recap-2024/

Google宣稱在2024年有「60條重大AI發佈」，不妨看看其中幾條主要的基礎能力。

Gemini模型

去年12月，Google推出首個原生多模態模型Gemini 1.0，打響了Google的AI反擊戰。

它可以同時處理文本、影片、圖像、音頻和代碼等數據，結合了包括數學、物理、歷史、法律、醫學和倫理在內的 57 個學科，也是第一個在MMLU（大規模多任務語言理解）基準上超越人類專家的模型。

今年2月，Google將Gemini 升級到1.5，把上下文窗口從32k提升到100萬個token，超越了同時期所有大模型。

在推理性能上也有大幅提升，Bard也正式更名為Gemini

7月，免費版Gemini 1.5 Flash發佈，支持40多種語言，覆蓋230多個國家和地區，質量和延遲都有大幅提升，尤其是在推理和圖像理解方面。

12月推出的Gemini 2.0 Flash集成了多模態和原生工具使用能力，標誌著大模型正式邁入「智能體」時代。

基於Gemini 2.0， Google構建了原型項目Mariner，從瀏覽器出發探索全新的人機交互方式：訓練Gemini來理解並推理瀏覽器屏幕上的信息，包括像素和文本、代碼、圖像和表單等元素，然後通過實驗性的Chrome擴展程序自主完成複雜任務。

在產品方面，Google於今年5月基於Gemini推出Ask Photos功能，用戶可以通過輸入關鍵詞，如地點、人物和日期，或是類似「主題生日派對」等自然語言概念對照片庫進行檢索。

NotebookLM

去年7月，Google推出了一款AI驅動的科研和寫作助手NotebookLM。

一年後，其底層模型切換為Gemini 1.5 Pro，用戶可以上傳研究筆記、訪談記錄或公司文件，然後提出相關問題以理解和探索複雜材料，支持幻燈片、pdf等多種格式。

9月，NotebookLM發佈重磅Audio Overview功能，模型可以針對用戶材料生成兩位AI主持人互相討論的音頻，可以幫助用戶對材料進行「總結」和「深入討論」。

不過該功能目前仍然處於實驗階段，比如只會英語，無法打斷等問題。

AlphaFold 3

今年5月，Google的AlphaFold 3論文在Nature上發表，在預測蛋白質與其他分子類型相互作用上性能提升了至少50%，在某些重要的相互作用類別，其準確率甚至能翻倍。

論文鏈接：https://www.nature.com/articles/s41586-024-07487-w

論文鏈接：https://www.nature.com/articles/s41586-024-07487-w

2020年發佈的AlphaFold 2實現了蛋白質結構預測的根本性突破，在包括瘧疾疫苗、癌症治療和酶設計等領域輔助數百萬科研人員進行新發現，引用超過2萬次。

AlphaFold 3則跳出蛋白質，進入廣泛的生物分子領域，有可能解鎖更多變革性科學成果，比如開發生物可再生材料和更具彈性的作物，加速藥物設計和基因組學研究。

11月，研究人員發佈了AlphaFold 3模型代碼和權重，以供學術使用。

Pixel移動端

1月份，Google宣佈為新款Galaxy S24系列的錄音、筆記等軟件基於Gemini Pro提供摘要能力；基於文生圖模型Imagen 2，為Galaxy S24圖庫提供生成式照片編輯功能。

八月，Google發佈自家手機Pixel 9，使用全新的定製芯片Tensor G4提供AI計算能力，整合了大量AI能力，包括生成定製天氣報告、整理截圖信息、本地文生圖等多種功能。

其中最重要的Gemini Live，能夠以更直觀、自然的方式幫助用戶計劃旅行攻略、解決家庭維修問題、構思禮物等等。

期待明年Google即將帶來的禮物。

參考資料：

https://x.com/tsarnick/status/1872927162757726475

https://www.cnbc.com/2024/12/27/google-ceo-pichai-tells-employees-the-stakes-are-high-for-2025.html

Google CEO says AI model Gemini will the company’s ‘biggest focus’ in 2025

https://www.cnbc.com/2024/12/27/how-googles-sundar-pichai-navigated-a-pressure-filled-year.html