吳恩達最新演講:企業都在技術棧底層較勁,應用層才是價值窪地

「絕大多數企業 AI 轉型太慢了,十天就能完成的項目拖了六個月。」

作者 | Eric Harrington

AI 創業潮,從理論突破到實際應用往往是最具挑戰的一躍。近日,人工智能領域的標誌性人物吳恩達(Andrew Ng)用行動詮釋了如何跨越這道鴻溝:他發佈的開源項目aisuite在 GitHub 上迅速積累了近 8600 顆星標。這個工具以簡潔優雅的設計打通了各大 AI 模型平台,展現了他一貫主張的理念——真正有價值的 AI 創新在於化繁為簡,讓技術能夠輕鬆落地。

https://github.com/andrewyng/aisuitehttps://github.com/andrewyng/aisuite

這種務實的創新思維,在他最近於杜拜的一場演講中得到了系統性的闡述。「人工智能就像電力一樣,是一種通用技術,但其價值必須通過具體應用才能實現。」吳恩達指出,當前 AI 領域的討論過分聚焦於底層技術棧,而最關鍵的應用層創新卻未受到應有的重視。從開源工具的推出到這場演講的真知灼見,都指向一個核心命題:如何讓 AI 技術真正服務於現實需求。

雖然這次演講的主題是教阿聯酋的土豪們怎麼用 AI,但吳恩達其實也全面地、系統性地分享了他對企業 AI 轉型的思考,提出了幾個格外引人關注的觀點:

  • 區分技術(底層 AI 模型)和真正的應用,我們應該治理的是應用,不是技術!

  • 智能體 AI(Agentic AI)如何突破傳統 AI 應用的局限

  • 企業如何將 AI 項目開發週期從 6 個月壓縮到 10 天

  • 「任務導向」幫助企業找準 AI 落地切入點

  • 傳統行業如何借助 AI 實現價值倍增

以下是演講全文:

讓全村用上「電」

很高興來到杜拜。這是我第一次來到這個國家,我一直在尋找與各方交流的機會。希望這次訪問將成為未來更多交流的開端。今天我想與大家分享一些人工智能領域令人振奮的機遇。

我想特別分享為什麼我對阿聯酋的機遇如此興奮。你們可能聽我在其他場合說過,人工智能就像電力一樣。這意味著人工智能也是一種通用技術(general purpose technology),可以應用於許多不同的領域。比方說,讓你講一講電力有什麼用途,這個問題幾乎難以回答,因為它太過普及。因此,我們面前的重要工作就是要識別並構建新的機遇,利用現在人工智能技術所能實現的可能性來開發新的應用。

人們經常問我,人工智能最大的機遇在哪裡?讓我和大家分享我理解的人工智能技術棧:在最底層是半導體層,上面是雲計算層,再上面是基礎模型訓練層。每當出現新的技術浪潮時,媒體和各方的關注往往都集中在技術棧的這些層面上。這沒什麼問題。

但事實上,對於所有這些工作來說,幾乎根據定義,還有另一個層面,即應用層(application layer),它必須變得更有價值。因為我們需要構建的應用能夠產生更多收入,這樣才能負擔得起技術棧下層的成本。

說到人工智能領域正在發生的諸多變革,如果讓我選擇一個最重要的技術趨勢,那就是智能體 AI(agentic AI)的崛起。如果你要記住一件關於人工智能技術的事,我建議你關注智能體 AI。

讓我解釋一下這個概念。我們很多人可能都在使用基於雲的大語言模型,比如 ChatGPT、Gemini 或 Claude,我們會輸入提示詞,讓它給出回應。在這種情況下,人工智能會從第一個詞開始寫答案,一直寫到最後一個詞,中間完全不能回頭修改。儘管被迫以這種線性方式寫作很睏難,但人工智能的表現已經相當出色。

但事實證明,如果允許更具迭代性的工作流程,人類和人工智能都能做得更好。在智能體工作流程中,我們可能會先讓它寫一個特定主題的大綱,然後詢問是否需要做網絡研究。如果需要,我們就下載一些網頁內容並將其放入人工智能的輸入上下文中。然後詢問哪些部分需要修改或進一步研究,接著讓它寫出初稿,閱讀自己的初稿進行評判,修改草稿,如此循環往複。

這種工作流程看起來更像是這樣:先思考,然後修改,再思考,如此反復。事實證明,通過多次循環這個過程,它能產生比非智能體工作流程好得多的輸出結果。我的團隊收集了來自不同研究組在使用人工智能編寫代碼方面的數據。在一個編程基準測試中,當要求從第一個字符到最後一個字符輸出代碼時,GPT-3.5 的正確率為 48%,也就是說 40% 的時間能寫出可工作的程序。GPT-4 是一個更好的模型,正確率達到 67%。但有趣的是,從 GPT-3.5 到 GPT-4 的提升,遠小於 GPT-3.5 使用智能體工作流程帶來的提升。而 GPT-4 配合智能體工作流程的效果會更好。

我們在各個領域都看到了這種變化。在 Coursera,我們使用智能體工作流程幫助開發者定製他們的課程或為學習者提供建議。在我領導的 AI Fund,我們看到智能體工作流程在醫療診斷輔助、複雜合規文書填寫或理解複雜法律文件方面發揮著重要作用。我的多個團隊開發的許多應用,如果沒有智能體工作流程,根本就不可能實現。

這是一個新興的人工智能技術棧,在基礎模型和應用之間有一個新的編排層(orchestration layer)。在計算機科學中,編排意味著我們協調多個用戶,在這種情況下是基礎模型。

編排層控制底層的功能已經存在了幾年,但現在編排層正在變得越來越具有主動性。這並不改變我一開始說的結論,即大部分價值必須在應用層。但我看到的是,智能體編排層使得在其上構建應用變得更加容易。

我的團隊 DeepLearning.AI 和 Coursera 與幾乎所有領先的生成式人工智能公司合作進行開發者培訓。如果你列出排名前 10 的生成式人工智能公司,我們實際上在與其中的 10 家全部合作。我認為這讓我們處於一個特殊的位置,能夠從所有前沿生成式人工智能公司獲取知識,並與全世界分享。這也幫助我們洞察人工智能的未來發展趨勢。

十天幹完六個月構建的系統

讓我分享一些你們可能感興趣的重要趨勢。一個有趣的趨勢是生成式人工智能(generative AI)正在使原型開發變得非常高效。這正在改變企業、大學以及初創公司創新的方式。

在生成式人工智能之前,如果使用預測性人工智能、深度學習或監督學習,這是我和許多其他團隊用來構建許多有價值的人工智能系統的工作流程:我們收集數據,訓練人工智能模型,然後可能將模型部署在雲服務上。這需要我們花 6 到 12 個月才能完成。這沒什麼問題,我們用這種方式構建了一些非常有價值的人工智能系統。

但事實證明,有許多人工智能系統過去需要我和優秀的人工智能團隊花 6 到 12 個月才能構建的,現在有數十萬個團隊可以在大約 10 天內完成。我們可以在幾天內寫幾個提示詞,然後在一週內部署到生產環境中。

值得注意的是,構建一個軟件有很多步驟,不僅僅是人工智能部分。你需要產品設計、用戶研究、數據集成、防護措施、合規性等。只有其中的一個部分加快了速度,這就是為什麼許多企業觀察到有很多人工智能原型還沒有投入生產的原因。這是因為其他部分仍然需要和以前一樣長的時間才能完成。

但當人工智能部分可以構建得如此之快時,我看到許多企業系統地構建多個原型,作為發明新事物的方式。因此,企業創新流程正在發生變化,因為你現在可以非常低成本地構建 20 個原型,看看什麼有效。在我居住的矽谷,「快速行動,打破常規」(move fast and break things)這個口號因為確實打破了東西而名聲不佳。

我想分享一個我們團隊工作過的創業案例,並介紹我們的流程,因為我希望這對阿聯酋的企業在利用人工智能新機遇方面也會有所幫助。

幾年前,三井集團(Mitsui Corporation)來找我。作為一家全球貿易公司,三井集團在日本運營著大型遠洋船隊。他們提出我們應該研究使用人工智能來提高船舶燃料效率。在篩選想法時,我的團隊通常會花大約一個月的時間驗證是否存在市場需求,以及技術上是否可行。如果可行,我們就會招募一位 CEO 來幫助我們建立這個企業。

我們招募了連續創業者 Dylan Kyle,他之前已經有過一次成功退出的經歷。我們通常會與 CEO 一起花三個月時間構建技術原型。如果這個階段成功了,我們就會開出支票投資這家公司。這讓他們可以招聘團隊、獲得真正的客戶,並繼續發展和擴大規模。

這個案例的結果是,Bering AI現在已經在600多艘遠洋船舶上運行,通過使用全球風況和洋流數據為船舶提供建議,指導它們如何航行以安全、準時地到達目的地,每艘船每年節省約50萬美元的燃料成本,同時減少約10%的燃料消耗和二氧化碳排放。

我想強調這個例子的原因在於,作為一個人工智能從業者,我永遠不會想到這個想法,因為我對全球海運業知之甚少。但是通過三井集團對這個行業的深入瞭解,以及我的團隊對人工智能的認識,我們共同識別並建立了這個應用。我認為這僅僅是成千上萬甚至數十萬個尚待識別和構建的人工智能機會中的一個。

我的團隊 AI Fund 經常與企業合作夥伴一起識別、構建和執行人工智能機會。讓我簡要分享一個似乎很有效的工作方法。我們認為重要的是要為企業高管提供一些關於人工智能技術的基礎培訓。去年 Coursera 上增長最快的課程是「面向所有人的生成式人工智能」(Generative AI for Everyone)。這門課程提供了對人工智能的非技術性的商業層面理解,包括它能做什麼,不能做什麼等內容。

我們發現,只要有一點點人工智能技術方面的高管培訓,往往就能帶來非常富有成效的人工智能項目頭腦風暴。每個與我們合作的企業最終都會產生很多關於人工智能的想法。團隊會有各種想法,但我想與大家分享一個特別有成效的方法,叫做「基於任務的工作分析」(Task-Based Analysis of Jobs)。這個方法是由我的朋友,史丹福大學教授 Eric Brynjolfsson 和他的一些同事首創的。

這個方法源於這樣一個觀察:儘管我們擔心人工智能會自動化就業崗位——這確實是政府、社會和學術界需要討論的重要話題——但從商業角度來看,更有用的是將人工智能視為自動化任務的工具。因為工作崗位是由許多不同的任務構成的。當我們看看我們的員工在做什麼,並將其分解成任務時,就能幫助我們識別出哪些任務人工智能可以自動化或增強。

區分技術和應用

在我與世界各地的政府和董事會討論人工智能治理時,經常被問到:我們如何治理人工智能?我想傳達的關鍵信息是,我認為必須區分技術和應用,我們應該治理應用,而不是技術本身。

在技術領域,我們必須區分技術本身(比如電動機就是一種技術)和應用(比如將電動機用在攪拌機、車輛、透析機或者製導炸彈中)。其中一些應用是我們想要更多的,有些可能是我們想要更少的。事實證明,技術指的是可以用多種方式解決問題的工具,而應用則是技術的具體實現,旨在滿足特定的客戶需求。

人工智能技術也是如此。一個人工智能模型可以用於醫療設備、社交媒體信息流、聊天機器人等等,其中有些應用是積極的,有些可能不太積極。事實證明,風險更多地取決於應用,而不是技術本身。因此,對像電動機或人工智能這樣的通用技術進行管理只會扼殺創新,而不會增強安全性。

因為如果你去找一個電動機制造商,讓他們保證沒有人會把他們的電動機用在武器或有害的應用中,這對電動機制造商來說是不可能的。這種技術根本不存在。但是,如果我們去找攪拌機制造商,或者電動車製造商,或者醫療設備製造商,我們可以弄清楚我們在醫療設備中想要什麼和不想要什麼,並確保它是安全的。

在過去的一年半里,我對美國和歐盟的一些大公司的遊說活動感到驚訝。這些公司投入了大量資金創建大型人工智能模型,不希望與免費的、開源的模型競爭。我對他們為通過扼製性法規而進行的遊說力度感到吃驚,這些法規試圖關閉開源或開放方式的人工智能模型(指團隊在互聯網上免費發佈供任何人使用的人工智能模型)。

幸運的是,我們已經擊退了最嚴厲的法規(SB-1047 法案),但仍然在不斷有人試圖通過這些法規。如果他們成功了,包括阿聯酋在內的許多國家將失去訪問權或發現更難獲取前沿人工智能的機會。因此,我認為除了少數幾家反對開源和開放方式模型的科技公司外,幾乎所有人的利益都在於確保這些法規不會通過。

讓我總結一下。作為一種通用技術,人工智能創造了許多構建應用的機會,並且正在擴大人工智能可以完成的任務範圍。隨著人工智能帶來的所有變革,我們需要新的技能來為企業和個人做好準備,迎接人工智能將與我們並肩工作的未來工作方式,因為工作角色正在發生變化。

最後,正如你們今天早上看到的,阿聯酋在阿拉伯世界人工智能就緒指數排名第一,全球排名第八。我認為阿聯酋在人工智能時代有很好的發展定位。因此, Coursera 和我的其他團隊,包括 DeepLearning.AI、AI Fund,我們都很感激有這個機會參與其中,也希望未來能與在座的各位有更多合作。

參考鏈接:https://www.youtube.com/watch?v=SN-BISKo2lE