微軟 AI CEO 穆斯塔法:小模型絕對是未來趨勢,AI 會小到能裝在冰箱貼上
「AI 的「幻覺」不是 Bug,而是創造力的體現。」
譯 | Eric Harrington
上週,我們整理了微軟創始人比爾·蓋茨在一場播客中的最新訪談,他大談特談 AI 與未來科技的發展,判斷「軟件市場的格局會被 AI 重塑,未來需要的應用數量會遠少於現在」。
近日,DeepMind 聯合創始人、微軟 AI CEO 穆斯塔法·舒里文尼(Mustafa Suleyman) 在 Masters of Scale Summit 峰會上也聊了聊自己對 AI 的最新見解,和他對話的則是 LinkedIn 創始人、美國企業家、風險投資家與作家列特·荷夫曼(Reid Hoffman)。兩人是老相識,曾在兩年前和另一位 AI 大咖 DeepMind 資深科學家 Karén Simonyan 共同創始了 AI 應用公司 Inflection,並在去年發佈了 AI 助手產品 Pi。
兩人共同討論了人工智能的風險與回報,對話中金句不斷,觀點頻出:
-
重新定義幻覺:「所以說,「幻覺」這個詞其實用得不太恰當。這不是缺陷,在我看來,這恰恰是 AI 的優勢所在。」
-
需要警惕的關鍵能力:「目前,這些模型幾乎沒有真正的自我改進能力,也就是說,沒有一個不需要人類直接監督的自我進化閉環。」
-
突破預測:「我非常有信心,到 2025 年,永久記憶這個問題就能解決。想想看,我們在網絡上其實已經有了某種形式的記憶系統。」
-
談及模型發展趨勢:「模型正在同時向著更大和更小兩個方向發展,這種趨勢幾乎肯定會持續下去……我認為接下來會發生的是,我們會把知識壓縮到更小更經濟的模型中,小到可以裝在冰箱磁貼上。」
-
歷史性的機遇窗口:「到 2050 年,機會的列車就要開走了。到那時一切都會變得很不一樣。這是我們真正有機會集體塑造和影響未來的時刻。」
以下是這次對話的主要內容,經 CSDN 精編處理。
列特·荷夫曼:讓我們從一些小問題開始。你和其他人經常把 AI 比作一個「新物種」。我很好奇,你覺得用這個角度來理解 AI 合適嗎?這種類比在哪些方面有啟發性?又在哪些方面可能會讓人產生誤解?最重要的是,這種思維方式能如何幫助我們思考 AI 的發展方向?
穆斯塔法·舒里文尼:每當我們遇到一個完全創新的事物時,它總是與我們之前經歷過的一切都不一樣。每一波技術革新都給人這種感覺。想想看,當人類第一次用上電力時,或者第一次通過越洋電話與大西洋彼岸的人交談時,那種體驗一定讓人覺得不可思議,彷彿置身魔法世界。這些突破為人們開啟了一個全新的認知維度,徹底改變了我們對「可能性」的理解。所以,每當這種情況發生時,我們都會本能地尋找一些已知的參照物,試圖通過類比來理解這個新事物。
雖然這個新事物最終可能與我們用來類比的參照物大不相同,但在它真正到來之前,這是我們能找到的最好的思考方式。我之所以提出「新興的數字物種」(new digital species)這個比喻,是因為在深入觀察這些 AI 系統的能力後,發現這確實是再恰當不過的描述。儘管這種比喻可能會引發一些我們不希望看到的聯想,但我認為它很好地幫我們框定了一個核心問題:如何約束這種新興的數字物種。想想看,這些模型未來將能夠看到你所看到的,聽到你所聽到的,實時理解和處理文本信息,甚至代表你採取行動。這些能力現在正在逐步實現。
我認為「物種」(species)是目前對 AI 最恰當的比喻,是我們能找到的最接近的參照系。這個比喻不僅幫助我們理解 AI 的潛力,也為我們思考應該避免 AI 發展成什麼樣子提供了一個很好的框架。
列特·荷夫曼:你認為在引導這種「新物種」發展的過程中,我們最應該做的是什麼?最應該避免的又是什麼?——順便提一下,我強烈推薦大家讀讀穆斯塔法的新書《浪潮將至》*,書中對這個話題有更深入的探討。我們現在討論的只是 60 秒精華版。
* 歡迎閱讀我們整理的《浪潮將至:技術、權力與未來的衝擊》書摘:我們是否該給技術按下暫停鍵?
穆斯塔法·舒里文尼:這些 AI 模型最令人著迷的地方在於,它們給出的答案並不僅僅是你輸入內容的簡單重組。這正是軟件發展的終極目標。我們希望它能告訴我們一些我們原本不知道的東西。所以說,「幻覺」這個詞其實用得不太恰當,這不是缺陷,在我看來,這恰恰是它的優勢所在。
列特·荷夫曼:這應該叫創造力。
穆斯塔法·舒里文尼:對,就是創造力。我們希望在給定某個輸入的情況下,能得到各種各樣新穎的回應。這種靈活性和不確定性正是我們想要的。現在這些模型能夠自主學習對事物的理解,而不是靠我們手工設計特徵,這正是過去 15 年機器學習努力的方向,看到這一目標實現真是太棒了。但關鍵問題是,我們需要搞清楚這種學習的邊界在哪裡。目前,這些模型幾乎沒有真正的自我改進能力,也就是說,沒有一個不需要人類直接監督的自我進化閉環。不過我們預計這種情況在 2025 年就會出現。研究團隊會開始進行這方面的實驗。這是我們需要特別謹慎對待的一個方向。
另一個值得關注的問題是 AI 的自主性。顯然,如果這些模型能夠在任意數字環境中自由活動,比如自主啟動虛擬機、操作網頁、調用 API 接口,完全不受人類監督和控制地做這些事情,風險就會大大增加。這兩種能力是我們比較擔心的。
說到積極的一面,我認為這些 AI 系統將展現出驚人的創造力,而且能幫助我們展現最好的一面。你要知道,如果設計得當,它們不需要像人類那樣容易刻薄、帶有偏見或讓人感到羞愧。我們知道人類有時候會很討厭,對吧?但 AI 沒有理由變得刻薄。當然,可能會有人專門把 AI 助手設計成具有這些特質,但這不是必然的結果,這完全是設計者的選擇。
從系統層面來說,我們應該盡一切努力在整個生態系統中,通過規範和價值觀來限制這類行為。雖然可能還是會有人這麼做,但我相信 AI 有巨大的潛力幫助我們成為更好的自己。舉個例子,我三週前讀到一篇研究報告,講述了一群深信陰謀論的人——我說的是那種相信「地平說」級別的陰謀論的人——
列特·荷夫曼:這種人現在突然變多了。
穆斯塔法·蘇萊曼:——我想我們都同意「地平說」確實很荒謬。總之,研究發現,這些陰謀論者在與聊天機器人持續交流大約六週後,他們相信「地平說」的傾向明顯降低了。這是為什麼呢?因為聊天機器人表現出了難得的耐性,從不帶有評判性,不會貶低對方,而且始終如一,永遠願意傾聽和回應,最重要的是,它會基於可靠的科學文獻和證據來展開討論。這些跡象讓我對 AI 的積極影響充滿信心,它的潛力確實令人振奮。
列特·荷夫曼:實際上,讓我跳到一個我本打算稍後問你的問題,我覺得現在是個很好的時機。當你、Karén Simonyan 和我一起創立 Inflection 時,我們的一個核心理念是「情商與智商同等重要」。能否跟讀者也分享一下,這個理念對 Pi 意味著什麼?這種思維方式為什麼重要?它的影響不僅僅局限於 Pi,對吧?
穆斯塔法·蘇萊曼:沒錯,這個問題很關鍵。談及智商,我們通常指的是回答的準確性、速度、全面性、相關性,以及實時獲取信息的能力。在這些方面,我們確實在穩步進步。但我注意到,AI 研究界的人們往往忽視了一個重要維度:信息傳遞的方式。這種忽視源於一種典型的技術人思維:「只要我把事實擺出來,人們自然就會明白這是對的。」
列特·荷夫曼:對,典型的工程師思維。
穆斯塔法·蘇萊曼:就是這樣。事實證明,語氣、風格、情商水平、互動方式、是否能用用戶熟悉的語言表達,這些看似表面的東西,對大多數普通用戶來說可能比單純複述域奇百科的內容更重要。
所以我認為這將成為一個關鍵能力。現在每個人都開始意識到,未來的 AI Agents(AI 智能體)不僅僅是完成任務那麼簡單。人們清楚地看到,個性化表達同樣重要。我對如何塑造 AI 的個性特別感興趣,因為我認為這正是用戶最看重的,或者說我能看到用戶最看重的特質。
列特·荷夫曼:說到 AI Agents 的未來,能給我們描繪一下你的願景嗎?從協作助手的角度來看,你覺得在未來兩到五年內,AI Agents 會在我們的生活中扮演什麼角色?從宏觀的「數字物種」層面到具體應用層面,你認為有哪些關鍵點?我們又該如何與它們友好互動?
穆斯塔法·蘇萊曼:要實現真正的 AI Agents,第一步是讓你的協作助手能夠「看見」你眼中的一切。想像一下,當你的 AI 伴侶能夠真實地感知你在屏幕上、瀏覽器中、桌面上、手機上看到的所有內容時,它就能持續地感知你的視覺輸入,實現與你的深度共情。這樣,你就可以用很自然的方式與它交流,比如說「還記得我剛才看到的那個東西嗎?」或者「剛剛跳過的那些內容在哪裡來著?」
這種理解層次是我們以前從未擁有過的。它讓 AI 能夠真正替你行動——在瀏覽器中導航、調用各種 API、預訂服務、購物和規劃等。目前,我們已經看到了很多相關的精彩演示。但坦白說,要讓這些功能在實際生產環境中穩定運行,我們還有一段路要走。從之前的技術浪潮我們就能看出這一點,就像在 GPT-3 之前,各大公司內部就有了一些語言模型。那大概是在 2020 年、2021 年間,但那時的模型還很不穩定。
我覺得這可能就是我們如今在「逆境商數」(Adversity Quotient,簡稱AQ)方面所處的階段。目前能讓這些功能在 50% 到 60% 的情況下正常工作已經很了不起了,但我們的目標是要達到 99% 的準確率。這讓我想到了語音識別和聽寫功能的發展歷程——那是一個持續了 15 到 20 年的過程。只是在最近兩三年,它才突破了臨界點,達到了大約 99.5% 的準確率,而且還實現了個性化。正因如此,你開始看到越來越多的人優先使用語音交互,這既是因為輸入方便,也因為生成能力提升了。所以,我認為 AI Agents 要達到類似的水平還需要幾年的時間。
列特·荷夫曼:你覺得語音輸入會在什麼時候迎來拐點?實際上,正如我們經常討論的,生成式 AI 的革命讓對話式交互成為可能,讓語音輸入變得更加自然,因為你可以直接說話,而它能真正理解你的意思。這種突破會如何進一步推動 AI Agents 的發展呢?
穆斯塔法·蘇萊曼:從本質上說,界面的形式決定了輸入的方式。回想一下,因為搜索引擎只是一個簡單的搜索框,我們不得不學著說「搜索語言」,對吧?我們通常會把想法壓縮成三四五個關鍵詞,甚至連完整的句子都不是。
列特·荷夫曼:實際上,搜索引擎用戶平均每次搜索時使用的詞數是 1.6 個詞。
穆斯塔法·蘇萊曼:對,平均 1.6 個詞。有趣的是,語音交互釋放了我們與計算機互動時的另一面——你可以用完整的句子交談,可以即時糾正自己,可以前後補充,還可以加入我們日常對話中的各種細節。而且模型會用完整的段落回應你。突然間,你開始談論和詢問一些你以前從未想過要數字化的內容。我認為這很好地展示了未來行動層面可能發生的變化。因為當你有了這樣一個隨時待命的 AI 伴侶,它能完成任何你能在電腦上做的數字任務,你就會讓它做很多你現在不會自己動手做的事情。這是一個重大轉變,因為完成任務的門檻即將大幅降低。這不僅是因為邊際成本接近於零,更因為操作的阻力真的減少了。因此,你會想到很多以前因為太麻煩而不願意去做的事情。
列特·荷夫曼:你覺得這種交互方式會如何提升我們的創造力?與這些 AI Agents 互動會給我們帶來什麼樣的創意啟發?
穆斯塔法·蘇萊曼:想想看,我們每天會冒出多少隨機的想法、靈感或疑問。如果你真正靜下心來觀察你的潛意識,會發現有很多「如果……」、「要是……」的瞬間,這些想法往往還沒形成明確的語言就消失了。為什麼?因為我們身邊並不總是有人可以傾聽這些突如其來的想法。除了你自己。而且,老實說,每次都掏出手機打字記錄實在太麻煩了。即使是我這種經常使用搜索的人,一天可能也就搜索五到八次。這需要不少努力。
如果獲取這些想法的門檻降低了,那麼你能夠在 AI 伴侶幫助下實現的創意想法自然會大大增加。更重要的是,它還有記憶力——這是另一個即將在行動能力之前實現的重大突破。我非常有信心,到 2025 年,永久記憶這個問題就能解決。想想看,我們在網絡上其實已經有了某種形式的記憶系統。我們現在已經能相當準確地從網絡上檢索信息。比如 Copilot 就能提供很好的引用,它能知道 15 分鐘前發生的新聞等等。
所以我們只是在把這個過程壓縮,應用到個人知識圖譜上。然後你就可以添加自己的文檔、郵件和日曆等內容。記憶能力將徹底改變這些交互體驗。想想看,當你進行一次深入的對話或圍繞某個創意展開有趣的探索,然後過了三四次對話再回來,卻發現要重新開始,這是多麼令人沮喪。因為它完全忘記了我們之前討論過的內容。這個突破將帶來巨大的改變,因為它不僅降低了你表達創意的門檻,而且這些想法不會被遺忘。你可以模糊地引用之前的內容:「三周前我說的那個想法是什麼來著?」「對了,那個想法和我們之前討論的主題有什麼聯繫?」
列特·荷夫曼:更像是一場持續的對話。
穆斯塔法·蘇萊曼:沒錯。這就像有了第二個大腦,是你思維的延伸。這也是為什麼培養 AI 的情商會如此重要。
列特·荷夫曼:完全同意。讓我們來談談更具體的技術層面,特別是關於模型的發展。因為有很多企業家都在思考這個領域在未來幾年會如何演變,以及需要關注哪些關鍵點。
穆斯塔法·蘇萊曼:好消息是,模型正在同時向著更大和更小兩個方向發展,這種趨勢幾乎肯定會持續下去。在過去一年里,一種被稱為「蒸餾」的新方法開始流行起來。簡單說,就是用大型的、非常智能的、推理成本高的模型來教導小模型,這些小模型可以通過 AI 反饋進行強化學習,這種監督方式已經證明相當有效。但規模仍然是遊戲的重要組成部分。我們還有很大的發展空間,數據也會越來越豐富,所以我認為至少在未來兩到三年內,大規模模型帶來的性能優勢不會減弱。我們還在不斷增加新的模態,當然包括影片和圖像等。
但我們真正感興趣的難點是在複雜的數字界面上追蹤用戶行為軌跡。比如從瀏覽器跳轉到桌面,然後切換到手機,在不同的生態系統之間穿梭,無論是在封閉的環境還是開放的網絡中。我們正在努力理解這些行為軌跡,收集大量相關數據,使用監督式微調等技術。我相信這會帶來很多令人驚喜的突破。
列特·荷夫曼:顯然還有另一個廣受關注的話題就是數據。關於可以使用什麼樣的數據、數據質量如何,網上已經有很多討論了。但我認為人們思考得不夠多的是新數據將從何而來。比如說,合成數據就很有意思——我們發現如果能獲得某些特定類型的數據,就能訓練出更好的大小模型。那麼,我們如何獲取這些數據?如何確保它們能夠被有效整合?企業家們應該如何思考這個問題?
穆斯塔法·蘇萊曼:讓我們先想清楚什麼是提示詞(prompt),它不僅僅是你問的問題。我覺得這個概唸經常被混淆。當你問聊天機器人一個問題時,那就只是個問題,而不是提示詞。當你編寫一份包含多個示例的三頁風格指南,用以指導模型行為時,實際上是基於這份指南來調整模型的輸出。從這個角度來說,提示詞本質上就是你的數據——它們是一系列高質量的指令,能夠引導預訓練模型按照特定的方式行動。
令人驚訝的是,模型只需要幾頁指令就能表現出與另一個用完全不同方式提示的模型截然不同的行為。這本身就很神奇。但往更深一層想,如果你希望模型能夠以精確和細緻的方式表現,真正符合你的企業品牌價值觀或產品特色,你需要展示成千上萬個優秀行為的例子,通過微調將它們融入模型,這是預訓練過程的延續,目標是某些你確定準確的高質量數據。好消息是,對於很多細分領域或特定垂直市場來說,收集幾萬個例子並不難。這就是一個機會,我認為在對預訓練模型進行高質量微調方面,創業公司有很大的發展空間。這樣你就能獲得更穩定的、真正符合你期望的行為模式。
列特·荷夫曼:創業者應該如何思考小型模型的應用和部署?顯然,他們會使用微軟、OpenAI 和Google等公司的前沿大模型,因為那些都是投入數十億美元的項目。但對於小型模型,創業者應該如何發掘機會?如何用它們做出有趣和獨特的事情?
穆斯塔法·蘇萊曼:小型化絕對是未來的方向,因為想想看,當你向一個真正的前沿大模型提問時,它會激活數十億個與當前問題無關的神經網絡連接。說起來很瘋狂,它能在生成每個詞時高效地搜索或引用數億個節點。
但實際上它並不需要這樣做。如果你有一個具體的應用場景,我認為接下來會發生的是,我們會把知識壓縮到更小更經濟的模型中,小到可以裝在冰箱磁貼上。
列特·荷夫曼:「冰箱磁貼」這個比喻我還是第一次聽你用。
穆斯塔法·蘇萊曼:對吧?這是我能想到的最小的數字設備了。
列特·荷夫曼:我甚至不確定它算是數字設備。
穆斯塔法·蘇萊曼:噢對,說得對。不過想像一下,冰箱磁貼能在早上跟你打招呼,和你聊天,多麼有趣。或者換個形態——它可能在耳機里,在可穿戴設備上,在耳環上,或者在帶傳感器的花盆里……所以,我認為環境感知革命即將到來。這個承諾已經存在很久了。但這就是壓縮技術的發展方向。它會發展到極致,你能擁有真正實用的 AI——當然,冰箱上的 AI 不需要懂量子計算,但它知道怎麼在早上歡迎你、告訴你天氣、提醒你冰箱里有什麼、提醒你日程安排,這就足夠了。我估計這樣的 AI 可能只需要幾千萬個參數就夠了。人們還沒有真正開始探索這個方向,但這完全在任何兩人團隊的能力範圍之內。
列特·荷夫曼:是的,這正是重點,也是一個創業的關鍵點。讓我轉到我們最後一個問題的延伸版本:在接下來的日子裡,大家應該思考什麼問題?我先拋磚引玉,給你一點思考的時間。
對我來說,核心問題是:作為技術從業者,我們需要融入哪些元素來設計一個更具人性的未來?通常當人們談到「更具人性」時,他們會想到傳統意義上的人性——人類在過去幾千年里是什麼樣子。這當然很重要,但向前看同樣重要。因為隨著技術的發展,我們的人性也在發展。我們通過這些技術發展人性,通過杯子、舞台、播客設備發展人性。
所有這些都在重塑著我們作為人類的本質。所以這不僅僅是要記住我們有情感和激情——是的,當然有。我們有同理心——但關鍵是,這些人性特質如何在我們的技術中得到新的表達?這就是我想提出的一個值得深思的問題。
穆斯塔法·蘇萊曼:我想說的是:問問自己,你準備好全力以赴了嗎?因為這確實是一個歷史性的轉折點。看看過去五十年的重大技術變革,每一次都徹底重塑了事物的結構。我認為現在正是創辦公司、擴展業務的最佳時機。即使你不是企業家,無論你是活動家還是組織者,這都是轉換職業的好時機——哪怕你是學者,這都是一個真正需要全神貫注的時刻。因為到 2050 年,機會的列車就要開走了。到那時一切都會變得很不一樣。這是我們真正有機會集體塑造和影響未來的時刻。沒有什麼是預先註定的。確實在我們的能力範圍內,可以為人類的最大利益來塑造這個未來。我們很幸運能活在這個時代。這種感覺令人難以置信地振奮人心,同時也意味著每個人身上都有著重大的責任。
參考鏈接:https://www.youtube.com/watch?v=IZBT57oLKas