ChatGPT快兩歲了,AI的下一步往何方?

從AlphaGo到AlphaFold3,人工智能技術經歷了充滿挑戰與機遇的發展歷程,對社會、科研和商業都產生了深遠的影響。在本文中,中歐國際工商學院管理學副教授楊蔚分析了大模型技術如ChatGPT面臨的挑戰,包括技術、應用場景和商業化模式的不確定性,並討論了如何通過技術創新、多維度突破和基礎科研的合作來克服這些挑戰,最終實現人工智能技術的廣泛應用和產業變革。

2024年9月13號,OpenAI發佈了最新的大模型OpenAI o1的預覽版本。意外的是,這個看似強大、能夠思考,號稱能解決大模型在數理邏輯方面的缺陷和幻覺問題的重大更新,卻未能延續ChatGPT 4和Sora的矚目和喝彩,公眾的關注中多了一份謹慎和審視。「為什麼不是GPT 5?」性能是否真的達到了宣傳中的效果?OpenAI的著名法則,大(算)力出奇蹟的「Scaling Law」是不是已經走到了極限?

相比ChatGPT推出伊始的勢如破竹,一次次的OpenAI「新品」發佈中不斷髮酵的卻是逐步積累的質疑和猜想。在最初的驚豔和狂熱後,公眾對於大模型技術和應用的潛力和未來有了更多的不同聲音

與其他技術創新相比,人工智能技術似乎呈現出更為明顯的週期性,在公眾和資本熱度過後往往陷入爭議甚至沉寂。然而,歷史證明,社會輿論和投資者預期的大起大落並不能真正反映人工智能技術真正的發展軌跡和價值。人工智能技術和應用的突破,往往是在沉寂和質疑中醞釀和爆發的。

「前塵往事」AlphaGo:深度學習中的「社會驗證」時刻與影響

時間回到2010年。當時的人工智能技術發展可以說處於黎明前最後的黑暗,彼時還是助理教授的李飛飛剛剛發佈了ImageNet——世界首個大型的非結構化圖片數據庫。直到兩年後,當今人工智能的主流技術——卷積神經網絡,才在基於這個數據庫的視覺識別比賽中超越其他技術路徑異軍突起,而人工智能對於高度模糊、變動性與不確定性極大的語言文本的分析處理能力更是無從談起——基於卷積神經網絡的注意力機制改進,也就是我們現在大語言模型的基礎,更是直到2017年才初具雛形。

在這樣的技術混沌期,一個名不見經傳的人工智能初創企業悄然在英國倫敦誕生了。回顧當時這個企業網站上簡略模糊的信息,我們很難想像它會在日後成長為影響力巨大的獨角獸,並在人工智能發展中引起軒然大波——該企業由一個沒有任何人工智能經驗的神經外科博士和他的同事創辦,沒有產品,沒有技術專利,也沒有收入。網站上僅有的信息,是在探索和遊戲、機器學習、電子商務算法相關的人工智能。

令人意外的是,這家初創企業DeepMind引起了大西洋彼岸的馬斯克的注意,在特斯拉業務初見起色的2011年,他甚至以天使投資人的身份,參與DeepMind的發展。有趣的是,馬斯克後來說,他對於DeepMind的投資是出於對電影《終結者》的恐懼,這與5年後他成立OpenAI的初衷幾乎如出一轍。

值得注意的是,馬斯克早期的經營重點更多的還是放在了特斯拉上,對於外部初創企業的投資其實並不頻繁。但這兩家有著馬斯克身影的初創型組織,雖然沒有像馬斯克希望的那樣,真正解決人工智能倫理和風險問題,卻兩度成為推動這一技術從低谷走向高峰的最重要力量。

DeepMind的真正轉機,出現在馬斯克投資之後,Google的收購要約。Google在2014年以6.6億美元的超高溢價打敗了同為矽谷巨頭的競爭對手臉書,收購了DeepMind及其團隊。至此,這個一直尋覓技術路徑和應用場景的初創企業,似乎找到了一個別具一格的探索方向——研究用人工智能下圍棋

對於計算機對弈算法的研究其實並不鮮見,最早甚至可以追溯到人工智能誕生的伊始。IBM的深藍更是在1997年就在國際象棋的競技中打敗了人類選手。但圍棋的難度是空前巨大的,圍棋棋盤中兩子對弈所衍生出來的棋路的可能性,甚至超過了整個宇宙中原子的數量總和。圍棋戰略對抗中高度的複雜性,意味著優秀的圍棋選手依靠的不僅是高強度的訓練,更是在經驗積累中不斷強化的天賦和直覺。傳統的計算機程序依靠窮舉或暴力演算搜尋,顯然無法複製頂尖棋手對弈決策中罕見的天賦型能力,超越更是無從談起。在DeepMind之前的數十年,計算機的圍棋水平僅能勉強對戰業餘選手。

是以當DeepMind宣佈要用其開發的人工智能圍棋程序AlphaGo挑戰世界頂尖的九段圍棋高手——已經拿下18個冠軍頭銜的李世石時,無論是計算機科學家還是圍棋界,普遍認為人類的勝利在這樣的挑戰中幾乎毫無懸念。李世石本人在賽前曾預測:「5盤棋不應該是3/2,也許是4/1或5/0,但我一定會贏。」

這場發生在2016年3月的比賽,結果卻出乎所有人的意料,DeepMind的AlphaGo以4:1的成績戰勝了李世石,震驚世界。當代人工智能技術通過圍棋這一古老且家喻戶曉、具有「社會驗證」屬性的策略競技方式,空前直白地展現出其驚人的潛力。AlphaGo勝利所帶來的軒然大波,與7年後ChatGPT的火爆,幾乎如出一轍,也深刻地塑造了其後人工智能技術的發展。

AlphaGo的影響首先出現在最為相關的開發者社區當中。我和美國杜蘭大學的張雨辰教授在2022年發表於Strategic Management Journal的研究中,通過分析開發者問答社區Stack Overflow和世界上最大的開源代碼平台GitHub的開發者行為數據,發現AlphaGo使得開發者在人工智能創新中,能夠更好地運用平移、類比等思維認知模式提出更為複雜的問題。而複雜問題的求解,是新興技術突破後進一步創新的關鍵。AlphaGo通過圍棋挑戰所得到的社會範圍的關注、認可和性能驗證,不僅進一步確定了其選擇的深度學習的技術潛力,更激勵和影響了人工智能領域的投資活動和人才儲備。正是這些微觀基礎層面的悄然變革奠定了日後整體人工智能技術發展的基礎。

技術成功之後:創新探索中的付出、堅持與蛻變

AlphaGo出人意料的成功,背後離不開母公司Google的支持。Google早在2004年上市時就擁有矽谷最大的服務器集群之一,更是在2015年就推出了自己的專有算力芯片TPU,其計算能力甚至超過了當時的主流運算芯片英偉達。強大的算力是深度學習人工智能算法發展不可或缺的配套資產。更值得注意的是,DeepMind在被收購以後,不再需要直接應對大部分營收壓力,作為Google的子公司,其在人工智能上的科研成果更多的是面向Google內部轉化,被應用到其搜索、影片推薦和數據中心能源系統管理等業務,這使得DeepMind在很大程度上可以不計成本專注於研發,不斷推進技術本身的性能潛力。

新興技術的突破,往往是初創企業與技術巨頭通力合作的結果,而這樣的互動也會進一步塑造技術的發展。初創企業通常被視作顛覆性技術的來源,具有極大的創造力和探索精神,但在商業化過程中會面臨缺乏市場經驗、客戶資源和配套資產的挑戰。巨頭和成熟企業往往具備很強的商業化能力以及相關資源,但因為路徑依賴和長期發展積累的組織惰性,往往在研發過程中只能基於現有的成功產品進行漸進式創新搜尋。

因此,初創企業和巨頭通過併購、戰略投資等合作,不僅能推動初創企業的技術創新,也成為技術巨頭獲取新技術的重要「窗口」和「通道」。我在與美國得克薩斯大學奧史甸分校McCombs商學院的Francisco Polidoro教授的合作研究中,發現生物製藥領域的重大創新同樣離不開大型藥廠戰略投資的參與,而這樣的戰略投資和併購也會影響新興技術其後的發展——為了更好地利用巨頭的配套資產,初創企業的技術路徑會向巨頭逐漸靠攏。在人工智能領域,AlphaGo對於Google人工智能算法和服務器的利用,同樣展現出這樣的特點,並直接影響了技術性能的發展,進而決定了AlphaGo在與李世石對決中的勝利。

然而,AlphaGo所引發的熱潮並未能一直持續。圍棋的複雜性、競技性和對抗性與典型可變現的商業化應用場景具有很大的區別,熱度之後,深度學習的商業前景開始受到質疑。而DeepMind選擇蛋白質解析這一生物學中看似極為專業聚焦的領域作為商業化的第一個嘗試,似乎也驗證了公眾對於深度學習的商業化潛力的質疑。雖然在AlphaGo基礎上的AlphaFold展示出同樣驚人的性能潛力,通過預測蛋白質內極大數量的氨基酸形態解析蛋白質結構,在之後的2年中完成了超過15萬個人類蛋白質解析,超過生物學家過去50年通過傳統方法所完成工作量的3倍,社會卻因為這一基礎科學領域的專業度對商業化前景產生了質疑,寄予深度學習的關注和期望在這個期間逐漸降溫,風險投資的增長也逐步趨緩。

但實際上,深度學習技術真正蛻變成具有更為廣闊的應用潛力的通用性技術,卻是在這樣的社會驗證引發的關注高潮過後公眾熱情退卻的冷靜期悄然實現的。2020年,AlphaFold 2推出,在其後的兩年內完成了超過100萬個物種的2.14億個蛋白質結構的預測解析,幾乎涵蓋了世界上全部的「蛋白質宇宙」。這一成果很大程度上解決了傳統蛋白質解析因高人力資源和儀器資金投入所面臨的效率問題,為下遊相關的生物製藥和醫療應用領域研發打開了新的大門。蛋白質解析領域的領軍人物施一公曾經評價道:「AlphaFold蛋白質解析是本世紀最重要的科學突破之一。」

2024年5月,AlphaFold 3推出,在原有的卷積神經網絡和增強學習技術上,運用了大模型中廣泛運用的注意力機制加擴散算法。在不斷的迭代發展中,AlphaFold 3已經可以預測蛋白質與其他幾乎所有的生物分子結構,這意味著,這一技術可以更為廣泛地應用在生物學、高科技甚至一部分傳統生產製造領域。從分子結構層面對於材料、配方和生產流程的進一步理解,能夠極大地拓寬這些領域的技術以及應用機會,而對於這項技術的應用所帶來的知識變革,也將會對這些行業的競爭藍圖產生深刻甚至顛覆性的影響。

未來之路:人工智能的期待與挑戰

縱觀從AlphaGo到AlphaFold 3的發展過程,我們看到的是技術在9年間從爆發到應用的迷茫,再到特定領域聚焦的探索,最後在不斷向外擴展的應用邊界中呈現出更為確定的通用潛力。其歷程無疑驗證了比爾蓋茨的名言:「我們總是高估未來兩年內發生的變化,低估未來十年內發生的變化。」

面對ChatGPT和更為新興的大模型技術,也許我們在不遠的未來,也會看到AlphaGo所經歷過的「風口」的沉寂——畢竟,雖然性能驚人,但大模型的真正應用還要攻克技術、應用場景、商業模式等眾多挑戰。

首先,創新的商業化應用是高性能技術的成功組合,而不是單一技術的延展。目前大模型基於表徵關聯產生的「幻覺」問題,也許需要輔助技術的加持而不是在單一技術內尋求性能突破。如何通過技術的疊加和組合,讓大模型能夠更為有效地在預訓練的基礎上「學習」和「理解「世界,也許成為未來技術突破和從技術上獲得競爭優勢的關鍵之一。

其次,大模型本身的性能提升和商業化也有賴於人工智能技術之外多維度的創新突破。技術的成功商業化還離不開與技術相匹配的配套資產的發展。尤其是大模型的「Scaling Law」,指數級極大參數疊加才能帶來語義理解性能的倍數提升,這使得當前人工智能的訓練和推理從本質上就無法避免極大的算力消耗。如何能夠提高大模型的效率,降低能耗,從算法上用更「小」的參數實現相同的性能,從數據上提高數據質量,避免訓練數據質量低下導致的毒性提高模型效率,都是大模型進一步發展所亟待解決的問題。而地緣政治敏感的當下,如何突破算力芯片作為大模型本身最關鍵配套資產所面臨的進口限制,成為中國企業面臨的最為矚目的問題。

最後,大模型的不確定性,還來自人工智能基礎科研層面面臨的挑戰。縱觀美國信息技術以及其他高新技術的發展史,由政府資助、高校主導的基礎科研一直髮揮著至關重要的基礎知識生產、篩選和初步轉化的職責。包括互聯網等當代至關重要的技術發明,最初都誕生於高校科研,而大模型的超高算力需求以及相應的資本投入,已經超出了目前美國高校的經費承受能力,使得人工智能領域的基礎科研向企業轉移——李飛飛和前Google首席科學家辛頓在2023年10月的一次對話訪談中如是說。

在很大程度上,任何以單一應用為導向的基礎研究都具有很高的風險——在新興技術發展的早期,儘可能大的技術多樣性才能夠保證最優的創新組合在充分的技術競爭中得以留存,最終成為主導。而企業以商業應用和利潤為導向的的本質,有可能會導致基礎科研過早偏於保守和單一,錯過了更為激進但有效的遠程技術機會。中國的人工智能技術,同樣面臨這樣的風險。如何從高校科研上,通過企業合作和政府支持的雙重模式,尋求多樣的技術可能性,或許能在一定程度上縮短AlphaGo由企業主導的技術探索期,成為未來人工智能技術更為快速破局的關鍵。

在應用層面,AlphaGo的發展歷程對我們理解人工智能的未來也具有啟示意義——新技術應用層面的成功商業化,起始於與技術特點和路徑最為適配的相關領域,隨著應用的逐漸成熟,才會在這些領域的臨近區域尋求延展機會,最後在更為廣闊的層面延展泛化。

人工智能發展中,公眾熱情和投資所呈現的週期性,也源於技術早期的真實適用範圍與外界預期的錯配,而過早投資在應用領域,在新興技術性能無法適配的情況下強行尋求應用甚至人為製造風口,並不能真正加速技術的成熟,反而會導致稀缺資源的浪費和錯配。

在喧囂過去之後,對於挑戰的直面和努力,對於風險下的契機識別和把握,對於制度的不斷完善和資源配置的悉心規劃,也許是當下實現從ChatGPT到「通用人工智能」蛻變的基礎和關鍵,讓這一備受關注的技術在更長遠的未來真正賦能各個應用領域的產業升級和變革。

教授簡介

楊蔚教授是中歐國際工商學院管理學副教授。在加入中歐前,她曾任美國佐治美臣大學管理學助理教授。楊教授畢業於美國德克薩斯大學奧史甸分校,並獲得管理學博士和碩士學位,她在香港大學和北京大學分別獲得金融學碩士和管理學碩士學位。

楊博士的研究領域聚焦於高科技環境下的企業戰略和創業。她尤其專注於企業的技術創新和知識創造戰略是如何受到行業和社會環境的影響,特別是企業與競爭對手、外部合作者、用戶、投資者和媒體的互動。

【參考文獻】

Callaway, E. (2022). The entire protein universe’: AI predicts shape of nearly every known protein. Nature, 608(7921), 15-16.

Polidoro Jr, F., & Yang, W. (2021). Corporate investment relationships and the search for innovations: An examination of startups’ search shift toward incumbents. Organization Science, 32(4), 909-939.

Zhang, Y., & Yang, W. (2022). Breakthrough invention and problem complexity: Evidence from aq uasi‐experiment. Strategic Management Journal, 43(12), 2510-2544.

本文來自微信公眾號「中歐國際工商學院」(ID:CEIBS6688),作者:楊蔚,36氪經授權發佈。