Google劈柴立軍令狀:必斬OpenAI,奪回第一!

新智元報導  

編輯:編輯部

【新智元導讀】GoogleCEO劈柴在年度戰略會議上放出狠話,2025年將是AI領域生死存亡之年。一場足以改變AI未來走向的巔峰對決,即將在2025年全面打響。

2025年還未開始,矽谷的戰鼓已經擂響。

在這場AI巨頭之間的角力中,GoogleCEO劈柴放出了一記重磅炸彈。

在Google山景城總部舉行的年度戰略會議上,身著節日毛衣的劈柴語氣凝重地對員工們說道——

2025年將是關鍵的一年!

我們必須認識到當下時刻的緊迫性,公司需要以更快的速度前進。這是一個顛覆性時刻,賭注從未如此之高。

這番話背後,是Google與微軟OpenAI之間愈演愈烈的較量。

自ChatGPT橫空出世以來,這家搜索引擎巨頭一直在努力追趕。過去兩年,Google的努力幾乎總被愛搶風頭的OpenAI蓋了過去。

直到12月,Gemini 2.0 Flash、Veo 2、「Google版o1」Gemini 2.0 Flash Thinking等輪番轟炸,一展超越領先模型的潛力。僅用了90天的時間,Google終於逆風反勝。

這意味著,這場AI競賽終於迎來了轉折點。

會議現場,劈柴展示了一張大模型的對比圖,Gemini 1.5傲然領先於OpenAI等其他競爭對手的模型。

當被問及ChatGPT正成為AI的代名詞時,劈柴坦言道,「在歷史場長河中,你不必總是第一個,但必須出類拔萃,必須在同類產品中保持第一梯隊。這就是2025年的意義所在」。

Google開發者關係負責人Logan Kilpatrick多次暗示,明年Google真的要發力了。

——預計1月份的目標,完整版Gemini 2.0正式上線。

甚至,在GoogleDeepMind CEO Hassabis年度總結下面,他稱這些都只是開胃菜,好戲將在2025年開始。

有網民預測道,明年Google將會把很多強大模型免費推向所有人,而且還會發佈直擊o3的競爭模型。

為了在這場AI革命中佔據製高點,Google正全力以赴。

Gemini,下一個5億級用戶爆款應用

對Google而言, 可能更糟糕的是競爭對手OpenAI在搜索業務的挑戰。

雖然Google仍主導搜索市場,但GenAI為人們提供了各種訪問在線信息的新方式。

而OpenAI正在被更多人看作是AI的代名詞,如同國外把Google看作搜索的代名詞一樣。

Google背負著巨大的壓力,正通過重金投資Gemini,來鞏固期在AI領域的領先優勢。

Gemini應用程序允許用戶訪問許多工具,包括Google的聊天機器人。

劈柴表示,「建立大型新業務」是重中之重。

Google目前擁有15個用戶超過五億的應用, 而高管們普遍認為Gemini應用將是下一個。

劈柴認為Gemini應用具有「強勁形勢」,但也不得不承認「在2025年還有一些工作要做,以縮小差距並建立領導地位」。

劈柴後來補充道:「明年最大的重點是在消費者方面擴展Gemini。」

此外, Google在美國還被法律纏身,包括其在壟斷搜索的法律裁定,以及非法主導在線廣告技術的指控。

英國監管機構則暫時認定Google的廣告技術行為影響了該國的競爭力。

對此,劈柴表示:「這是我們的規模和成功所帶來的。這是科技正在大規模影響社會的大趨勢的一部分。因此,此時此刻,我們要比以往任何時刻都要確保自己不會分心。」

Google,「後來者」居上?

OpenRouterAI的數據顯示,Google旗下的Gemini在開發者中的市場份額從9月份的約5%,直接飆升至>50%市場份額,遙遙領先,連帶股價也上漲了14%。

而此時,距離OpenAI發佈ChatGPT的2022年11月30日,已經整整過去了2年。

早在2017年,Sam Altman在一次郵件交流中就明確表示,GoogleDeepMind是在AGI競爭中最強大的對手,但令他沒想到的是,曾經公認的「AI巨頭」Google卻是個「花架子」。

ChatGPT發佈以來,幾乎成了「AI的代名詞」,不僅迅速征服了市場,還連帶著微軟起飛,在Edge瀏覽器中嵌入Copilot AI搜索助手,直接斷崖式領先。

被寄予厚望的Google,反倒是昏招頻出,先是Bard難產,又經歷AI Overview總結能力大翻車,建議孕婦吸煙、自殺跳橋等等。

在AI順風車下,股價不漲反降,Google一時間淪為笑柄,被OpenAI打的毫無還手之力,更準確的說,連同台競技的資格都沒有。

讓人費解的是,Google和DeepMind擁有世界上最好的硬件、最多的訓練數據、最頂尖的人才,也發過很多具有劃時代意義的論文,如AlphaFold、GenCast等,但為什麼就連Anthropic這樣的創業公司都打不過?

網民分析的細節原因不勝枚舉,一句話來說,就是「船大難掉頭」。

從安全性上考慮,Google作為世界級獨一檔的科技巨頭,不論發佈什麼產品,其用戶群體都不會小,會涉及到各個種族、不同的意識形態,一點小問題就會被無限放大,而文本生成又是非常主觀的,很容易受到訓練材料的偏見影響,所以Google需要更長的時間進行合規檢查。

23年初,Google受輿論裹挾,急急忙忙發佈Bard,在發佈會上關於問題「關於占士·韋比太空望遠鏡,我可以告訴我9歲的孩子它有哪些新發現?」,Bard給出錯誤答案。

這直接導致公司股價暴跌8%,市值縮水1000多億美元,讓投資群體和用戶大失所望。

但其實OpenAI的產品也經常胡說八道、張冠李戴,不過因為是創業公司,所以大眾的容忍度會高很多,產品標註為beta測試,還可以不斷迭代修改。

作為大公司的Google,也受到更多法律上的限制,比如用戶數據的版權問題。

Google曾因在AI訓練過程中違反歐盟版權法被罰款2.5億歐元,也是全球首個因AI訓練數據被罰款的案例,坐擁金山,卻無法使用,無異於自斷雙臂。

Google的產品線龐大,想要在所有產品中都加入AI驅動,需要非常細緻的產品管理能力,而去年末發佈的Gemini 1.0,因其過度「多樣化」的策略,再次導致股價下跌。

不過,「成功者說什麼都是對的」,Google重新以王者之姿橫掃AI,未來還計劃繼續引領「智能體」發展,攜手瀏覽器和手機端,全自動實現用戶任務。

Google年度AI大事件

Google並非沒有看到AI市場的巨大潛力, 但2024年才算是開始「發力」的一年。

很多有名氣的產品基本都是在今年發佈的,比如各種版本的Gemini,NotebookLM,Pixel手機上的AI功能等等。

傳送門:https://blog.google/technology/ai/google-ai-news-recap-2024/

Google宣稱在2024年有「60條重大AI發佈」, 不妨看看其中幾條主要的基礎能力。

Gemini模型

去年12月,Google推出首個原生多模態模型Gemini 1.0,打響了Google的AI反擊戰。

它可以同時處理文本、影片、圖像、音頻和代碼等數據,結合了包括數學、物理、歷史、法律、醫學和倫理在內的 57 個學科,也是第一個在MMLU(大規模多任務語言理解)基準上超越人類專家的模型。

今年2月,Google將Gemini 升級到1.5,把上下文窗口從32k提升到100萬個token,超越了同時期所有大模型。

在推理性能上也有大幅提升,Bard也正式更名為Gemini

7月,免費版Gemini 1.5 Flash發佈,支持40多種語言,覆蓋230多個國家和地區,質量和延遲都有大幅提升,尤其是在推理和圖像理解方面。

12月推出的Gemini 2.0 Flash集成了多模態和原生工具使用能力,標誌著大模型正式邁入「智能體」時代。

基於Gemini 2.0, Google構建了原型項目Mariner,從瀏覽器出發探索全新的人機交互方式:訓練Gemini來理解並推理瀏覽器屏幕上的信息,包括像素和文本、代碼、圖像和表單等元素,然後通過實驗性的Chrome擴展程序自主完成複雜任務。

在產品方面,Google於今年5月基於Gemini推出Ask Photos功能,用戶可以通過輸入關鍵詞,如地點、人物和日期,或是類似「主題生日派對」等自然語言概念對照片庫進行檢索。

NotebookLM

去年7月,Google推出了一款AI驅動的科研和寫作助手NotebookLM。

一年後,其底層模型切換為Gemini 1.5 Pro,用戶可以上傳研究筆記、訪談記錄或公司文件,然後提出相關問題以理解和探索複雜材料,支持幻燈片、pdf等多種格式。

9月,NotebookLM發佈重磅Audio Overview功能,模型可以針對用戶材料生成兩位AI主持人互相討論的音頻,可以幫助用戶對材料進行「總結」和「深入討論」。

不過該功能目前仍然處於實驗階段,比如只會英語,無法打斷等問題。

AlphaFold 3

今年5月,Google的AlphaFold 3論文在Nature上發表,在預測蛋白質與其他分子類型相互作用上性能提升了至少50%,在某些重要的相互作用類別,其準確率甚至能翻倍。

論文鏈接:https://www.nature.com/articles/s41586-024-07487-w論文鏈接:https://www.nature.com/articles/s41586-024-07487-w

2020年發佈的AlphaFold 2實現了蛋白質結構預測的根本性突破,在包括瘧疾疫苗、癌症治療和酶設計等領域輔助數百萬科研人員進行新發現,引用超過2萬次。

AlphaFold 3則跳出蛋白質,進入廣泛的生物分子領域,有可能解鎖更多變革性科學成果,比如開發生物可再生材料和更具彈性的作物,加速藥物設計和基因組學研究。

11月,研究人員發佈了AlphaFold 3模型代碼和權重,以供學術使用。

Pixel移動端

1月份,Google宣佈為新款Galaxy S24系列的錄音、筆記等軟件基於Gemini Pro提供摘要能力;基於文生圖模型Imagen 2,為Galaxy S24圖庫提供生成式照片編輯功能。

八月,Google發佈自家手機Pixel 9,使用全新的定製芯片Tensor G4提供AI計算能力,整合了大量AI能力,包括生成定製天氣報告、整理截圖信息、本地文生圖等多種功能。

其中最重要的Gemini Live,能夠以更直觀、自然的方式幫助用戶計劃旅行攻略、解決家庭維修問題、構思禮物等等。

期待明年Google即將帶來的禮物。

參考資料:

https://x.com/tsarnick/status/1872927162757726475

https://www.cnbc.com/2024/12/27/google-ceo-pichai-tells-employees-the-stakes-are-high-for-2025.html

Google CEO says AI model Gemini will the company’s ‘biggest focus’ in 2025

https://www.cnbc.com/2024/12/27/how-googles-sundar-pichai-navigated-a-pressure-filled-year.html