DeepSeek橫空出世,為什麼偉大不能被計劃?

DeepSeek的橫空出世,震動全世界,也讓我們去重新去思考創新的模式和路徑。DeepSeek憑什麼逆襲,挑戰Open AI的霸主地位?

DeepSeek採用了獨特的創新策略:在產品上沒有拘泥於行業慣常操作,堅持AGI底層創新,想法設法突圍。對員工看能力,而不是看經驗;沒有KPI考核,沒有任務;讓每個人有自由發揮的空間和試錯的機會,儘可能少的干預和管理。

比起科技大廠層層設計的嚴密組織架構和目標運營,為什麼這樣的模式反而能夠激發創新?

《為什麼偉大不能被計劃》的作者堅尼斯·史丹利寫到:

「正是在這片位於已知和未知之間的‘蠻荒’邊界地帶,我們應該讓人類最偉大的頭腦進行探索,而不是在最大共識的舒適區‘沉迷享樂’。」

「非目標搜索的更重要啟示是,它是一位實力強大的尋寶者。在漫無目標的新奇性搜索中,你不一定能找到心中想要的寶藏,反而可能發現許多意料之外的寶藏,這將使整個過程充滿驚喜。」

以下是OpenAI前研究員,人工智能科學家堅尼斯·史丹利2023年7月在混沌的授課內容。

‍一、目標悖論

很榮幸能跟大家分享、交流。我的研究領域是開放性(open-endedness)機器學習。我們都知道,大多數機器學習算法,往往預設了一個優化目標,達成目標很重要。開放式算法與此不同,這一算法沒有終點。它讓機器具有無限的潛力和持續的創造力,可以在沒有明確目標或終止條件的情況下不斷演化和產生新的結果。

那什麼才算開放性?什麼進程是永遠不會停止的?舉兩個現實世界中我們能體會的例子,它們非常具有啟發性。

第一個例子是進化。從地球上的第一個單細胞開始,它不斷分化並創造,經歷數億年甚至十多億年,創造出了人類等等生物,進化的腳步永遠不會停止。

第二個例子是文明。人類出現後,你會看到思想和文明的迸發,這個過程是宏大的,不可思議的。從火種和車輪一直演變到現在的計算機、空間站,文明不斷演化,一直持續到今天。它不會停留在某個具體的目標上,只會持續向前發展。從某些方面來看,文明其實是人類最重要的創造發明。不斷再造周圍世界的能力,是人類智力的重要組成部分。

我們都是開放性進化的產物,而人類作為產物本身又創造了文明。

在這樣的背景下,我想同大家分享一個故事。我們研究人工智能的時候,發現了一個人類根本性缺陷。即「單一的目標導向思維會阻礙創造力和創新」,這對社會而言是一個極其嚴重的問題。

不僅是機器算法,你會發現人類所做的一切,幾乎都是以目標為導向的。但目標在我們處理重大事項時,有時反倒是無用的,無法幫我們實現創新。

舉個例子,10多年前我在大學任教時,建立了一個網站Picbreeder。它可以幫助人們「繁衍」圖片——用一張圖片作為母圖片,可以「生出」與之類似的許多子圖片。這個技術和現代的圖像生成技術是不同的。

如果你準備在Picbreeder繁衍圖片,可以先自選一張圖片,這張選中的圖片就是下一代圖片的父母。你可以轉身去忙別的事情,Picbreeder不需要任何指令就會繼續繁衍,到最後,出現的圖片可能是一隻蝴蝶,一個頭骨,甚至是木星。這個過程令人震撼。

我需要向各位解釋一個非常重要的機制,它被稱為分支(branching)。如果用戶確實繁衍出一些有趣的東西,並且通過網站保存這一圖像,相當於把圖像公開發佈。那麼其他人就可以把這張圖片為起點進行分支演化,也就是用這張圖去繁衍,獲得新圖片。這意味著,在前人的基礎上繼續發現更多新事物。

這就出現了生物學家口中的不斷髮展的系統發育。就像一棵生命樹,這些生命之樹末端的葉子就代表著新的發現,而這些都是以一種看似偶然的方式被發現的。

大家可以看下面這張幻燈片上的圖片,為什麼會繁衍出現這些圖片?我得出了一個驚人的發現。

有些人認為,想最終得到一隻熱帶鳥的圖片,只要選擇看起來最像熱帶鳥的斑點,通過繁衍就可以得到想要的結果。但有趣的是,事情不是這樣運作的。

如果你想用Picbreeder生成一張熱帶鳥的圖片,肯定會失敗,這就是以目標為導向的思維方式。能讓我們繁衍出鳥類圖片的東西,往往看起來並不像鳥。我們的世界是複雜的,臆斷只會導致失敗。一些人按照自己的想法去繁衍圖片,最終的結果令他們感到沮喪。

那麼,如果將它們作為目標來搜索無法成功的話,怎樣做才能成功呢?我認為這就是事情變得更加深刻的起點。

再以Picbreeder為例回答這個問題。我用一張外星人臉的圖片,繁衍出一輛汽車的圖片。

首先有一個非常重要的前提,我最初的想法並不是繁衍出一輛車。當時,我只是看到了一張像E.T.一樣的外星人臉,覺得繁衍這張圖片一定很有趣,可以得到更多的外星人面孔。

神奇的事情發生了,通過分支出來的圖片,外星人的眼睛開始向下移動,這時我意識到外星人的眼睛正逐漸變成輪子,可能會演化出一輛汽車。

在演化的過程中有兩個條件必須成立。首先,必須有人去完成我永遠不會做的事(比如繁衍出一張外星人圖片,供我選擇);其次,我不能帶著目標去做事。只有這樣,我才能獲得我想要的發現。

讓人震驚的是,這種繁衍方式,不是巧合。Picbreeder數據庫記錄了每一張圖片的繁衍過程,記錄了每一張熱門圖片背後的「踏腳石」,我們能夠確切地知道每張圖片是怎麼來的。Picbreeder網站上的大多數熱門圖片,都有著完全相同的繁衍路徑。

這其中蘊含著一個非常奇怪的寓意,你只有不帶目的地尋找才能實現目的。這與我們的直覺相違背,也與我們對現實生活的認知相悖。

如果這條理論成立,人們就不能通過對目標的尋找來發現任何東西。

實際上,這條理論並不僅僅存在於Picbreeder之中,整個現實世界都是這樣運作的,所有的複雜空間都有這個性質,這是一個非常重要的發現。

如果我沒有通過外星人的臉發現那輛車,我就永遠不可能意識到這一點,也不可能創造出後來的算法,也永遠不會寫《為什麼偉大不能被計劃》這本書。

當然,這也是一個可以用來理解「開放性」的例子,因為你永遠不會知道,你走出的每一步會帶來什麼結果。

現在有更多的證據來證明這條理論。例如,這張圖片中的蝴蝶和頭骨是由隨機斑點演化而來,各進行了74次、和90次迭代。但在另一個實驗中,我們把生成這些圖片當作目標,讓15個孩子通過自主選擇來生成這些圖像,最後經歷了3萬次演化才得到了目標圖像。這個結果是多麼的瘋狂。

我個人認為,這表明人類在人工智能或機器學習領域的許多基準文化可能已落入歧途。算法的強大力量,並不在於當你真正建立一個目標時,它們做事情的能力;而在於,當你沒有設定目標的時候,它們做事情的能力。

如果你的目標是生成一張蝴蝶、頭骨照片,這個目標會導致你忽略了這些踏腳石,事實上你更應該關注這些踏腳石,我稱之為目標悖論。目標悖論的含義是,即擁有一個目標,會妨礙你實現目標。

這裏需要澄清一點,目標悖論並不是要你沒有目標,而是說當你沒有目標的時候,更有可能實現創新。目標只會在簡單的、非欺騙性空間里生效,解答容易的問題,有一個適度的目標並沒有錯。當你放棄目標的時候,你可能會做成偉大的事情,但是你不會提前知道這件事情是什麼。

這就是我們面臨的選擇。

這個世界上,不可能有人在完成一件驚人的事情的同時又有一個目標。我們希望世界能以這種方式運作,但事實並非如此。這不僅是Picbreeder的運作結構,也是現實世界的運作結構。

人類總是在適度的目標中成功完成任務,相信並由此推斷這一思維模式對一切都有成效,這是根本錯誤的。覺得每件事情都會圍繞目標運作,這是人類文化中產生的一種誤解。

二‍、「新奇式搜索算法」和「發散尋寶」

在發現這一理論的時候,我還在研究計算機科學或者人工智能,對這個發現的興趣完全是在算法範圍內的。我和同事祖爾·雷曼在思考,也許我們可以發明一種新的算法,讓它以非常反直覺的方式工作,不設立任何目標,我們稱之為「新奇式搜索算法」

舉個例子。我們想訓練一個兩足行走機器人走路,想法是機器人走得越遠越能獲得獎勵。傳統機器學習觀念認為,必須一小段一小段地走,機器才能學會走路。我們的訓練理念是讓機器人做一些與此前不同的事情,想法越新奇越好,這種探索未必是正確的,但只要機器人採用了一種新方法,就能獲得獎勵。

最後實驗證明,新訓練理念的最好結果要遠遠優於傳統版本,這種違反人類直覺的結果令人震驚。學會走路的機器人,不一定看起來像在學走路。

新奇式搜索算法催生出了一個新的領域,高質量多樣性算法。通過把有趣與高質量目標結合,找到多樣性選項中的最佳結果。

在一個非目標導向的世界里,人類的本能之一就是想要追隨有趣的事物,因為有趣可以驅動進一步探索。

簡單來理解,要想實現最高目標,必須先願意放棄目標。只有當我們沒有真正想著這些目標時,或者當別人沒有遵循你所謂的正確的道路以及符合你的利益時,才可能實現目標。

如果人們只做自己認為正確的事,就會忽略掉那些真正能幫你解決問題的「踏腳石」,忽略這些能夠奠定偉大基礎的東西。就好比,發現一張外星人的面孔,為繁衍出汽車圖片奠定了基礎。

從目標悖論的角度來看,合作可以導致趨同和共識,但是也將消除通向偉大事物的「踏腳石」。協作的含義是什麼?當一群人一起進入一個房間,大家想要達成某種共識,想要找到某種正確的道路,這就導致了多樣性的缺失,也帶來了妥協。

有時在組織里不達成共識也是很重要的,人們必須跟隨直覺,才能到達某種地點。我稱之為發散尋寶。尋寶的人只是隨便看,並不知道會找到什麼。發散是因為每個人都有不同的方向。

這樣的搜索過程沒有目標,只是憑直覺在荒野中漫步,去發現有趣的事物。有人會認為我在讚美隨機性,並非如此,這一過程還是遵循一定原則的。舉個例子,人們在Picbreeder上選擇圖片不是出於隨機,而是出於一定的喜好,而你的喜好一定不是隨機的,而是由你的生活經歷決定的。

非目標導向的演化過程是非常有趣的,比如Picbreeder和新奇式搜索,進化和文明可以看作是一個發散尋寶的過程,它們也沒有最終目標,這才是現實世界的運作方式。

在發散尋寶的過程中,收集「踏腳石」仍然是關鍵。

舉個例子,Picbreeder的強大之處在於它運行的時間越長就會出現越多有趣的圖像,這意味著我們可以找到更多有趣的事物。這就是踏腳石,這些圖片不僅可以用來解決具體問題,還能不斷髮散、不斷繁衍,最終繁衍出一個具有很高價值的寶藏。

三‍、人工智能時代應該如何創新?

為什麼只有不設定目標才更有可能取得驚人的發現?這就是我們今天一直討論的話題。我想通過《為什麼偉大不能被計劃》這本書,引起整個社會對這一問題的關注和討論。

為什麼人們要用目標來定義每一次偉大的努力?目標給我們規定了每一步,指引我們每一次行動,這種想法無處不在。我個人認為它是有毒的,抑制了創造力。如果人類所做的每一步都是根據生活中的某個目標來進行的、評估的,從出生到退休,那這段時光太令人窒息了。

IT技術的進步符合這種目標導向思維,人類製定性能指標,評估其表現,認為一切事物都必須向前發展。但如果我們只獎勵目標上的東西,就永遠不會發現有趣的技術。因為傳統思維帶有一種懲射失敗的意味。

另一種選擇是獎勵有趣的東西,這種方式會讓一些人不安,但對另一些人而言卻是解放性的。人類擁有的最好技能,就是發現有趣事物的主觀本能。世界上所有的創新,都是因為人類有對有趣事物產生興趣的本能,它不是隨機的,而是基於人生經驗的。

直覺會告訴我們什麼是有趣的事物。我們應該傾聽並討論有趣的事情,即使討論的一部分是主觀性的。需要再次強調的是,目標導向思維,在某種程度上是成立的,比如那種最有抱負的目標,比如你想變得富有。

20世紀40年代產生的ENIAC是第一台計算機,這台計算機是怎麼產生的?實際上促使其產生的是真空管。在第一台計算機出現之前,人們已經研究真空管150多年了。有趣的是,如果人們直接對計算機感興趣而不去研究真空管,人類就不會有真空管和計算機。研究真空管的人並未將發明計算機當作目標,這再次體現了目標悖論。

再舉一個商業案例,二十世紀七八十年代出現了電唱機,盒式磁帶、音箱和各種盒式磁帶播放器,之後是隨身聽、CD隨身聽和iPod。iPod是蘋果公司發佈的一種革命性的音樂播放器,但蘋果的目標不是作出最好的音樂播放器,iPod成了一塊通往iPhone的踏腳石,最終那個引領性的產品是一部手機。

避免掉入目標悖論,超越狹隘的目標局限,這一能力對創新來說至關重要。

有人會好奇,在人工智能時代應該如何創新?從我目前的經驗來看,考慮到目標悖論、目標神話以及新奇性搜索算法,我會給大家六點建議。

第一,看到這條路的前景,也要超越眼前的道路。超越的眼光十分重要,我們要超越眼前的路,而不僅僅只關注是否能走得更遠。

第二,期待驚喜的出現。世界是具有欺騙性的,驚喜在等待著你,會發生的可能不會發生,而不會發生可能就會發生。

第三,準備好接受欺騙。即使看起來是在做正確的事情,結果也會是錯誤的,或者看起來是錯的結果卻是對的。所以,信念非常重要。可能所有人都會覺得你錯了,但事實卻會證明你所專注的事情恰恰是十分正確的。

第四,相信有趣的事物,質疑所謂的標準。人們喜歡設定標準,因為它們可以提供安全保障,這是一種評估形式。但人類社會並沒有給予有趣適當的重視,我們應該相信有趣的事情,換句話說,你需要相信自己的主觀判斷,憑藉你自己的人生經驗。

第五,不要隨波逐流,而要追隨有趣。每當有任何抓眼球的事物出現時,人人都會隨波逐流,但恰恰是那些不起眼的事物才值得我們率先關注,因為它們可能會創造巨大的價值。

第六,不起眼的事物可能帶領人們去到全新的領域,即使當下我們未能察覺。這就是生活中人們必須接受的不確定性。

最後,還需要特別注意的一點。追求有趣的事物,並不能保證你一定會做出驚人的成就,你只是有取得成功的可能。所以,你必須學會接受一定程度的風險。如果你不想在生活中冒險,就做一些安全簡單的事情,這雖然不會給你帶來偉大的成績,但也能夠讓你取得相對不錯的結果,這隻是個人的選擇而已,無論是否以這種方式成為真正的先驅,這兩種選擇都是完全可接受的。