Google劈柴立軍令狀:必斬OpenAI,奪回第一!
新智元報導
編輯:編輯部
【新智元導讀】GoogleCEO劈柴在年度戰略會議上放出狠話,2025年將是AI領域生死存亡之年。一場足以改變AI未來走向的巔峰對決,即將在2025年全面打響。
2025年還未開始,矽谷的戰鼓已經擂響。
在這場AI巨頭之間的角力中,GoogleCEO劈柴放出了一記重磅炸彈。
在Google山景城總部舉行的年度戰略會議上,身著節日毛衣的劈柴語氣凝重地對員工們說道——
2025年將是關鍵的一年!
我們必須認識到當下時刻的緊迫性,公司需要以更快的速度前進。這是一個顛覆性時刻,賭注從未如此之高。
這番話背後,是Google與微軟OpenAI之間愈演愈烈的較量。
自ChatGPT橫空出世以來,這家搜索引擎巨頭一直在努力追趕。過去兩年,Google的努力幾乎總被愛搶風頭的OpenAI蓋了過去。
直到12月,Gemini 2.0 Flash、Veo 2、「Google版o1」Gemini 2.0 Flash Thinking等輪番轟炸,一展超越領先模型的潛力。僅用了90天的時間,Google終於逆風反勝。
這意味著,這場AI競賽終於迎來了轉折點。
會議現場,劈柴展示了一張大模型的對比圖,Gemini 1.5傲然領先於OpenAI等其他競爭對手的模型。
當被問及ChatGPT正成為AI的代名詞時,劈柴坦言道,「在歷史場長河中,你不必總是第一個,但必須出類拔萃,必須在同類產品中保持第一梯隊。這就是2025年的意義所在」。
Google開發者關係負責人Logan Kilpatrick多次暗示,明年Google真的要發力了。
——預計1月份的目標,完整版Gemini 2.0正式上線。
甚至,在GoogleDeepMind CEO Hassabis年度總結下面,他稱這些都只是開胃菜,好戲將在2025年開始。
有網民預測道,明年Google將會把很多強大模型免費推向所有人,而且還會發佈直擊o3的競爭模型。
為了在這場AI革命中佔據製高點,Google正全力以赴。
Gemini,下一個5億級用戶爆款應用
對Google而言, 可能更糟糕的是競爭對手OpenAI在搜索業務的挑戰。
雖然Google仍主導搜索市場,但GenAI為人們提供了各種訪問在線信息的新方式。
而OpenAI正在被更多人看作是AI的代名詞,如同國外把Google看作搜索的代名詞一樣。
Google背負著巨大的壓力,正通過重金投資Gemini,來鞏固期在AI領域的領先優勢。
Gemini應用程序允許用戶訪問許多工具,包括Google的聊天機器人。
劈柴表示,「建立大型新業務」是重中之重。
Google目前擁有15個用戶超過五億的應用, 而高管們普遍認為Gemini應用將是下一個。
劈柴認為Gemini應用具有「強勁形勢」,但也不得不承認「在2025年還有一些工作要做,以縮小差距並建立領導地位」。
劈柴後來補充道:「明年最大的重點是在消費者方面擴展Gemini。」
此外, Google在美國還被法律纏身,包括其在壟斷搜索的法律裁定,以及非法主導在線廣告技術的指控。
英國監管機構則暫時認定Google的廣告技術行為影響了該國的競爭力。
對此,劈柴表示:「這是我們的規模和成功所帶來的。這是科技正在大規模影響社會的大趨勢的一部分。因此,此時此刻,我們要比以往任何時刻都要確保自己不會分心。」
Google,「後來者」居上?
OpenRouterAI的數據顯示,Google旗下的Gemini在開發者中的市場份額從9月份的約5%,直接飆升至>50%市場份額,遙遙領先,連帶股價也上漲了14%。
而此時,距離OpenAI發佈ChatGPT的2022年11月30日,已經整整過去了2年。
早在2017年,Sam Altman在一次郵件交流中就明確表示,GoogleDeepMind是在AGI競爭中最強大的對手,但令他沒想到的是,曾經公認的「AI巨頭」Google卻是個「花架子」。
ChatGPT發佈以來,幾乎成了「AI的代名詞」,不僅迅速征服了市場,還連帶著微軟起飛,在Edge瀏覽器中嵌入Copilot AI搜索助手,直接斷崖式領先。
被寄予厚望的Google,反倒是昏招頻出,先是Bard難產,又經歷AI Overview總結能力大翻車,建議孕婦吸煙、自殺跳橋等等。
在AI順風車下,股價不漲反降,Google一時間淪為笑柄,被OpenAI打的毫無還手之力,更準確的說,連同台競技的資格都沒有。
讓人費解的是,Google和DeepMind擁有世界上最好的硬件、最多的訓練數據、最頂尖的人才,也發過很多具有劃時代意義的論文,如AlphaFold、GenCast等,但為什麼就連Anthropic這樣的創業公司都打不過?
網民分析的細節原因不勝枚舉,一句話來說,就是「船大難掉頭」。
從安全性上考慮,Google作為世界級獨一檔的科技巨頭,不論發佈什麼產品,其用戶群體都不會小,會涉及到各個種族、不同的意識形態,一點小問題就會被無限放大,而文本生成又是非常主觀的,很容易受到訓練材料的偏見影響,所以Google需要更長的時間進行合規檢查。
23年初,Google受輿論裹挾,急急忙忙發佈Bard,在發佈會上關於問題「關於占士·韋比太空望遠鏡,我可以告訴我9歲的孩子它有哪些新發現?」,Bard給出錯誤答案。
這直接導致公司股價暴跌8%,市值縮水1000多億美元,讓投資群體和用戶大失所望。
但其實OpenAI的產品也經常胡說八道、張冠李戴,不過因為是創業公司,所以大眾的容忍度會高很多,產品標註為beta測試,還可以不斷迭代修改。
作為大公司的Google,也受到更多法律上的限制,比如用戶數據的版權問題。
Google曾因在AI訓練過程中違反歐盟版權法被罰款2.5億歐元,也是全球首個因AI訓練數據被罰款的案例,坐擁金山,卻無法使用,無異於自斷雙臂。
Google的產品線龐大,想要在所有產品中都加入AI驅動,需要非常細緻的產品管理能力,而去年末發佈的Gemini 1.0,因其過度「多樣化」的策略,再次導致股價下跌。
不過,「成功者說什麼都是對的」,Google重新以王者之姿橫掃AI,未來還計劃繼續引領「智能體」發展,攜手瀏覽器和手機端,全自動實現用戶任務。
Google年度AI大事件
Google並非沒有看到AI市場的巨大潛力, 但2024年才算是開始「發力」的一年。
很多有名氣的產品基本都是在今年發佈的,比如各種版本的Gemini,NotebookLM,Pixel手機上的AI功能等等。
傳送門:https://blog.google/technology/ai/google-ai-news-recap-2024/
Google宣稱在2024年有「60條重大AI發佈」, 不妨看看其中幾條主要的基礎能力。
Gemini模型
去年12月,Google推出首個原生多模態模型Gemini 1.0,打響了Google的AI反擊戰。
它可以同時處理文本、影片、圖像、音頻和代碼等數據,結合了包括數學、物理、歷史、法律、醫學和倫理在內的 57 個學科,也是第一個在MMLU(大規模多任務語言理解)基準上超越人類專家的模型。
今年2月,Google將Gemini 升級到1.5,把上下文窗口從32k提升到100萬個token,超越了同時期所有大模型。
在推理性能上也有大幅提升,Bard也正式更名為Gemini
7月,免費版Gemini 1.5 Flash發佈,支持40多種語言,覆蓋230多個國家和地區,質量和延遲都有大幅提升,尤其是在推理和圖像理解方面。
12月推出的Gemini 2.0 Flash集成了多模態和原生工具使用能力,標誌著大模型正式邁入「智能體」時代。
基於Gemini 2.0, Google構建了原型項目Mariner,從瀏覽器出發探索全新的人機交互方式:訓練Gemini來理解並推理瀏覽器屏幕上的信息,包括像素和文本、代碼、圖像和表單等元素,然後通過實驗性的Chrome擴展程序自主完成複雜任務。
在產品方面,Google於今年5月基於Gemini推出Ask Photos功能,用戶可以通過輸入關鍵詞,如地點、人物和日期,或是類似「主題生日派對」等自然語言概念對照片庫進行檢索。
NotebookLM
去年7月,Google推出了一款AI驅動的科研和寫作助手NotebookLM。
一年後,其底層模型切換為Gemini 1.5 Pro,用戶可以上傳研究筆記、訪談記錄或公司文件,然後提出相關問題以理解和探索複雜材料,支持幻燈片、pdf等多種格式。
9月,NotebookLM發佈重磅Audio Overview功能,模型可以針對用戶材料生成兩位AI主持人互相討論的音頻,可以幫助用戶對材料進行「總結」和「深入討論」。
不過該功能目前仍然處於實驗階段,比如只會英語,無法打斷等問題。
AlphaFold 3
今年5月,Google的AlphaFold 3論文在Nature上發表,在預測蛋白質與其他分子類型相互作用上性能提升了至少50%,在某些重要的相互作用類別,其準確率甚至能翻倍。
2020年發佈的AlphaFold 2實現了蛋白質結構預測的根本性突破,在包括瘧疾疫苗、癌症治療和酶設計等領域輔助數百萬科研人員進行新發現,引用超過2萬次。
AlphaFold 3則跳出蛋白質,進入廣泛的生物分子領域,有可能解鎖更多變革性科學成果,比如開發生物可再生材料和更具彈性的作物,加速藥物設計和基因組學研究。
11月,研究人員發佈了AlphaFold 3模型代碼和權重,以供學術使用。
Pixel移動端
1月份,Google宣佈為新款Galaxy S24系列的錄音、筆記等軟件基於Gemini Pro提供摘要能力;基於文生圖模型Imagen 2,為Galaxy S24圖庫提供生成式照片編輯功能。
八月,Google發佈自家手機Pixel 9,使用全新的定製芯片Tensor G4提供AI計算能力,整合了大量AI能力,包括生成定製天氣報告、整理截圖信息、本地文生圖等多種功能。
其中最重要的Gemini Live,能夠以更直觀、自然的方式幫助用戶計劃旅行攻略、解決家庭維修問題、構思禮物等等。
期待明年Google即將帶來的禮物。
參考資料:
https://x.com/tsarnick/status/1872927162757726475
https://www.cnbc.com/2024/12/27/google-ceo-pichai-tells-employees-the-stakes-are-high-for-2025.html
Google CEO says AI model Gemini will the company’s ‘biggest focus’ in 2025
https://www.cnbc.com/2024/12/27/how-googles-sundar-pichai-navigated-a-pressure-filled-year.html