無聲處的驚雷：OpenAI和微軟的競爭悄然開始

11月18日 07:35 新浪網 tech-auto-hilite

在OpenAI 開源了個Swarm演示Multi-Agent後，微軟則開源了magentic-one。雖然演示的功能不太一樣，前者關於業務邏輯處理，後者關注文件訪問這些基本操作，但這也是個Multi-Agent的例子。橫向比較，微軟的比OpenAI的略好，可以解決實際問題，真能用。但關鍵卻不在這裏，而是當你把兩個項目放在一起做比較的時候，你就會發現一種無聲的競爭已經開始。

我們有理由相信，隨著Multi-Agent的智能原生程序變的越來越關鍵，這種競爭也會變得越來越激烈。

很多做戰略分析的同學未必願意讀代碼，願意讀代碼的同學未必願意花心思發現這種競爭的導火索，所以我在這裏挑個事，還是把這事再說說。

OpenAI Swarm做了一期AI碰撞局，記錄參見：人類優先還是智能優先？（暨AI碰撞局第十三期小記），等我空了針對magentic-one很有必要再做一期，也用非技術的語言再說說這個項目，並且做個二者機制的對比。

AI的兵家必爭之地

什麼是AI產業的兵家必爭之地?

備受關注的大模型其實基本不是，除非只有一家一騎絕塵，別人的模型水平是1，你是10。

如果大模型是競爭最關鍵的地兒，那其實OpenAI Swarm基於GPT-4o，微軟magentic-one也是基於GPT-4o，大家沒什麼衝突。你做好模型，我用好模型，你好我好，根本沒什麼衝突的事。

關鍵就在於如果你預期的是超級應用，我預期的也是超級應用，那就隨著超級應用的價值變大，那超級應用全鏈條的關鍵控制點上就會有你死我活的競爭。

OpenAI和微軟之間暗搓搓衝突的根源倒不是在於某個應用，而在於誰對AI的基礎設施有控制力。

那什麼是未來各種超級應用的關鍵控制點？找出這個控制點就找到了AI的兵家必爭之地。

OpenAI和微軟的潛在衝突和下面這個被我隨手畫的簡圖有關：

其中智能原生應用相關的詳細說明參見：真假◎智能原生（AI Native）應用極其挑戰

因為我們在說微軟，所以我們拿LLM based OS和過去的Windows做類比。

比如我們常用的Windows裡面也封裝有很多算法，但不管我們在Windows上寫多少程序，也不會直接使用裡面封裝的算法，而是要通過Windows對外提供的接口。這些算法對你是透明的。誰知道Windows裡面封裝了多少了算法呢？

為什麼這樣呢，因為Windows裡面不止有算法這些功能，還有賬戶管理、消息機制等把功能鏈接起來的部分。

上面兩張圖中，核心差異就是這個：

左側的圖仍然有系統的概念存在，而在右側的圖里，系統的概念消失了，模型不單履行邏輯判斷的能力，也還取代了系統。

為什麼這會導致劇烈衝突和競爭呢？

多大池子養多大魚

智能原生應用因為數據擁有權不同，所以註定有多個，但LLM based OS和LLM不是的。

這種基礎設施是個超級大的大池子，但理論上在一個聯通的市場空間里最後可能就剩下少數幾個，並且Top1的佔據50%以上的市場份額。

誰在AI時代幹成這事，誰就是新時代的巨頭。

OpenAI需要這個，而微軟顯然不會放過這個。

可左側的構圖裡面有微軟的位置，右側的沒有。

如果世界最終選擇了右側的圖，那模型即系統，微軟公司在AI這塊地兒的基礎設施上就沒有位置！

一切剛剛開始

上面其實是一些猜想，這個猜想有個大前提：智能原生（AI Native）的應用會席捲各個應用場景。這還需要點時間，所以上面說的深層矛盾也就在開源項目上漏出一點端倪。

但數字的事最違反人類常規感知的點就是速度，假如說人類進化的速度是1，制度文化進化的速度是100，那數字的進化速度至少是100萬甚至更高。

一兩年前大家不知道智能原生到底是什麼，但現在上述兩個開源項目，每個都是智能原生的。

所以這種潛在衝突也可能在某個瞬間一下爆發出來，關鍵節點應該是智能原生應用的收入規模。

後續的走勢

當前這類競爭會在無聲狀態開始，短期誰佔優由用戶的選擇決定，但模型如果不繼續迭代幾次，應用的範圍就還是會比較窄。微軟這次開源項目附帶的說明很直接道出了當前的狀態。

1、2、3、4、5、6如果用一句話來簡單概括就是你要把它放沙盒裡面，然後人類看著點免得造成不可預計的損失。

具體來說就是下面這個任務在跑的時候沒準就執行了別的什麼，比如把系統搞宕機這種事是可能發生的。

https://github.com/microsoft/autogen/tree/main/python/packages/autogen-magentic-one

在這樣一種前提下，這種新的智能原生模式不是不能用，而是範圍會被限制的比較窄，你也不敢讓它負責出錯後代價特別大的事，比如直接做診療。

好消息是這種精度問題確定可解決，眼下不知道的是在通用的大模型上到底什麼時候解決。

如果有足夠的錢其實可以在比較垂直的領域走特斯拉 FSD12走過的路，如果沒有那就必須等待通用大模型的升級，這二者其實等價。

理論上如果通用大模型足夠強大，那專門訓練一個E-To-E的模型和直接把數據扔給通用的模型其實並沒有區別。

通用模型哪有什麼智能邊界！

終點上應用的邊界其實是數據的邊界。

不管怎麼樣，這裏需要個拐點。否則我們上面說的就只有影子，而不會漏出真身。

這個拐點在技術上是通用大模型的進步，在商業上是出現一個Top的智能原生應用公司。互聯網為什麼變得如火如荼？本質是因為當年的BAT啊，BAT的那個收入量級確實足以啟動一個時代。

這個臨界點，我看美國人要到了。Tesla的FSD12就不說了，Glean的ARR一年翻4倍，5500萬美金也不算少了。生意常在，而時代性機遇只有一次。

小結

更有趣的事情並不是老美怎麼樣，而是米國和我國的AI顯然會分成兩套很難聯通的生態系，那國內的情況如何？走到最後米國和我國的生態系最終又會如何競爭、共存？互聯網用了20幾年來把這類問題交出答卷。從現在開始算，AI可能也需要這麼多時間。所以潛在的小時代可能要過去了。

本文來自微信公眾號「琢磨事」，作者：老李話一三，36氪經授權發佈。