無聲處的驚雷:OpenAI和微軟的競爭悄然開始

在OpenAI 開源了個Swarm演示Multi-Agent後,微軟則開源了magentic-one。雖然演示的功能不太一樣,前者關於業務邏輯處理,後者關注文件訪問這些基本操作,但這也是個Multi-Agent的例子。橫向比較,微軟的比OpenAI的略好,可以解決實際問題,真能用。但關鍵卻不在這裏,而是當你把兩個項目放在一起做比較的時候,你就會發現一種無聲的競爭已經開始。

我們有理由相信,隨著Multi-Agent的智能原生程序變的越來越關鍵,這種競爭也會變得越來越激烈。

很多做戰略分析的同學未必願意讀代碼,願意讀代碼的同學未必願意花心思發現這種競爭的導火索,所以我在這裏挑個事,還是把這事再說說。

OpenAI Swarm做了一期AI碰撞局,記錄參見:人類優先還是智能優先?(暨AI碰撞局第十三期小記),等我空了針對magentic-one很有必要再做一期,也用非技術的語言再說說這個項目,並且做個二者機制的對比。

AI的兵家必爭之地

什麼是AI產業的兵家必爭之地?

備受關注的大模型其實基本不是,除非只有一家一騎絕塵,別人的模型水平是1,你是10。

如果大模型是競爭最關鍵的地兒,那其實OpenAI Swarm基於GPT-4o,微軟magentic-one也是基於GPT-4o,大家沒什麼衝突。你做好模型,我用好模型,你好我好,根本沒什麼衝突的事。

關鍵就在於如果你預期的是超級應用,我預期的也是超級應用,那就隨著超級應用的價值變大,那超級應用全鏈條的關鍵控制點上就會有你死我活的競爭。

OpenAI和微軟之間暗搓搓衝突的根源倒不是在於某個應用,而在於誰對AI的基礎設施有控制力。

那什麼是未來各種超級應用的關鍵控制點?找出這個控制點就找到了AI的兵家必爭之地。

OpenAI和微軟的潛在衝突和下面這個被我隨手畫的簡圖有關:

其中智能原生應用相關的詳細說明參見:真假◎智能原生(AI Native)應用極其挑戰

因為我們在說微軟,所以我們拿LLM based OS和過去的Windows做類比。

比如我們常用的Windows裡面也封裝有很多算法,但不管我們在Windows上寫多少程序,也不會直接使用裡面封裝的算法,而是要通過Windows對外提供的接口。這些算法對你是透明的。誰知道Windows裡面封裝了多少了算法呢?

為什麼這樣呢,因為Windows裡面不止有算法這些功能,還有賬戶管理、消息機制等把功能鏈接起來的部分。

上面兩張圖中,核心差異就是這個:

左側的圖仍然有系統的概念存在,而在右側的圖里,系統的概念消失了,模型不單履行邏輯判斷的能力,也還取代了系統。

為什麼這會導致劇烈衝突和競爭呢?

多大池子養多大魚

智能原生應用因為數據擁有權不同,所以註定有多個,但LLM based OS和LLM不是的。

這種基礎設施是個超級大的大池子,但理論上在一個聯通的市場空間里最後可能就剩下少數幾個,並且Top1的佔據50%以上的市場份額

誰在AI時代幹成這事,誰就是新時代的巨頭。

OpenAI需要這個,而微軟顯然不會放過這個。

可左側的構圖裡面有微軟的位置,右側的沒有。

如果世界最終選擇了右側的圖,那模型即系統,微軟公司在AI這塊地兒的基礎設施上就沒有位置!

一切剛剛開始

上面其實是一些猜想,這個猜想有個大前提:智能原生(AI Native)的應用會席捲各個應用場景。這還需要點時間,所以上面說的深層矛盾也就在開源項目上漏出一點端倪。

但數字的事最違反人類常規感知的點就是速度,假如說人類進化的速度是1,制度文化進化的速度是100,那數字的進化速度至少是100萬甚至更高。

一兩年前大家不知道智能原生到底是什麼,但現在上述兩個開源項目,每個都是智能原生的。

所以這種潛在衝突也可能在某個瞬間一下爆發出來,關鍵節點應該是智能原生應用的收入規模。

後續的走勢

當前這類競爭會在無聲狀態開始,短期誰佔優由用戶的選擇決定,但模型如果不繼續迭代幾次,應用的範圍就還是會比較窄。微軟這次開源項目附帶的說明很直接道出了當前的狀態。

1、2、3、4、5、6如果用一句話來簡單概括就是你要把它放沙盒裡面,然後人類看著點免得造成不可預計的損失。

具體來說就是下面這個任務在跑的時候沒準就執行了別的什麼,比如把系統搞宕機這種事是可能發生的。

https://github.com/microsoft/autogen/tree/main/python/packages/autogen-magentic-one

在這樣一種前提下,這種新的智能原生模式不是不能用,而是範圍會被限制的比較窄,你也不敢讓它負責出錯後代價特別大的事,比如直接做診療。

好消息是這種精度問題確定可解決,眼下不知道的是在通用的大模型上到底什麼時候解決。

如果有足夠的錢其實可以在比較垂直的領域走特斯拉 FSD12走過的路,如果沒有那就必須等待通用大模型的升級,這二者其實等價。

理論上如果通用大模型足夠強大,那專門訓練一個E-To-E的模型和直接把數據扔給通用的模型其實並沒有區別。

通用模型哪有什麼智能邊界!

終點上應用的邊界其實是數據的邊界。

不管怎麼樣,這裏需要個拐點。否則我們上面說的就只有影子,而不會漏出真身。

這個拐點在技術上是通用大模型的進步,在商業上是出現一個Top的智能原生應用公司。互聯網為什麼變得如火如荼?本質是因為當年的BAT啊,BAT的那個收入量級確實足以啟動一個時代。

這個臨界點,我看美國人要到了。Tesla的FSD12就不說了,Glean的ARR一年翻4倍,5500萬美金也不算少了。生意常在,而時代性機遇只有一次。

小結

更有趣的事情並不是老美怎麼樣,而是米國和我國的AI顯然會分成兩套很難聯通的生態系,那國內的情況如何?走到最後米國和我國的生態系最終又會如何競爭、共存?互聯網用了20幾年來把這類問題交出答卷。從現在開始算,AI可能也需要這麼多時間。所以潛在的小時代可能要過去了。

本文來自微信公眾號「琢磨事」,作者:老李話一三,36氪經授權發佈。