獨家對話阿里雲劉偉光:什麼是真正的AI雲
過去一年,雲計算行業「內卷式」競爭的趨勢漸消,但如何在生成式AI浪潮中蹚出一條雲計算新路,沒有什麼標準答案能參考,無論是海外的還是國內的雲服務商,都在一邊實踐一邊驗證。
阿里雲也不例外。阿里雲智能集團資深副總裁、公共雲事業部總裁劉偉光表示:「如果我不自己在一線去感受客戶的需求,我沒有辦法或者沒有信心去設計出面向未來幾年的戰略方向。」
他的解決方法很簡單,也很有效。過去一年,他的日程表記錄下了至少162家客戶的走訪日程——這還不是全部。來自一線的AI應用需求千差萬別,最終如何沉澱為公共雲平台的能力,這是劉偉光和阿里雲公共雲團隊面臨的挑戰。
在革命性技術發展的早期,需求是廣泛發散再到不斷收斂的過程,現階段的AI需求已經能夠凝練出一些共性。
基礎大模型的先行者還在持續地訓練大模型,垂直化應用公司開始深度使用大模型,一些傳統公司探索用大模型進行業務的創新和提效。一個更值得關注的趨勢是,越來越多企業不僅是使用簡單調用大模型,而是在原有應用中大量嵌入AI Agent,甚至在原有應用之外開發AI原生應用。
這些企業的需求集體推動了AI雲的進化。如果說自2006年,雲計算開創了一個時代,讓更多中小企業上雲、節省成本和降低門檻,初步成為企業的數字化生產力工具。
那麼,AI和雲的結合,將雲計算產業送入一個至關重要的節點,未來所有基礎設施的能力都會被AI所衝擊。被衝擊的過程就是雲計算能力的完全迭代升級甚至重構的過程,AI雲時代已經到來。
如同傳統IT時代的IOE(IBM的小型機、Oracle數據庫、EMC存儲設備),作為上一個計算紀元的代表產物,它們締造了通用算力的基礎設施底座;AI雲則是典型的智能算力的基礎設施底座,大語言模型從誕生的第一天起,就生長在雲上、成長在雲上。
這一階段的雲服務的重要標誌是——不論主動還是被動,企業擁抱雲不是單純的IaaS(Infrastructure as a Service,基礎設施即服務)資源需求,而是IaaS、PaaS(Platform as a Service, 平台即服務)、大語言模型、AI應用等全棧能力,這個垂直技術棧的最佳承載毫無疑問便是雲計算。
而對於雲計算的最終使用者——企業而言,如何基於大模型形成智能時代的生產關係、發揮AI真正的價值成為一道必答題。
劉偉光在走訪162家客戶後,感知到越來越多的傳統企業級市場客戶、外資企業及跨國公司(MNC)不僅將資源遷移到雲端,更是將業務系統全面雲化,涵蓋網絡、存儲、大數據、數據庫等IaaS+PaaS一體化的全棧服務。
他給出了旗幟鮮明的觀點:「只有具備IaaS+PaaS一體化能力的雲,才能被稱為真正的雲。這是我今天對‘雲’的定義。同樣地,在AI時代不創造社會價值的大模型,很難稱之為大模型。」
關於上述問題,在鈦媒體《AI雲年度10問》欄目中,鈦媒體集團聯合創始人、聯席CEO、ITValue發起理事劉湘明與阿里雲智能集團資深副總裁、公共雲事業部總裁劉偉光,以及阿里雲智能集團副總裁、公共雲首席解決方案架構師韓鴻源,展開了一次對AI雲的深度剖析。
以下為對話實錄,經鈦媒體編輯整理。
只有具備IaaS+PaaS一體化能力的雲,才是真正的雲
劉湘明:阿里雲公共雲事業部是去年11月底成立的,這一年以來作為公共雲事業部總裁,你有什麼感受?
劉偉光:我的第一感受是「希望」。無論是內部產品研發的進展、AI能力的提升,還是大語言模型的日益精進,以及各行各業客戶在探索雲和AI結合方面的實踐,都讓我對未來充滿信心——不僅是未來一年,甚至是接下來的5到10年。
今天,許多客戶不僅將雲計算視為資源,更將其當成數字化轉型的關鍵工具;同時,他們也不僅僅把AI看作創新手段,而是當作推動產業升級、面向未來的戰略性武器。因此,我看到了非常大的希望。
劉湘明:AI可能是下一次「蒸汽機出現」的時刻,你提的「希望」我也特別認同。最近IDC發佈《中國公有雲服務市場(2024上半年)跟蹤》,顯示IaaS+PaaS市場同比增長12.2%,對比之前的增速,可以說中國公有雲市場開始回暖了。其中 PaaS同比增長達21.9%,表現更突出一些,這裡面阿里雲依然保持市場領先和穩定的提升。背後的原因有哪些?
劉偉光:從內因來講,阿里雲一直在踐行推動IaaS+PaaS一體化,而不僅僅把雲當成資源來進行售賣。我們希望客戶能大規模採用我們PaaS層的產品,尤其像數據庫、大數據、容器化、Serverless、開發運維工具等產品。PaaS層的能力和數據能力對企業業務有非常直接的支撐作用,甚至可以直接推動業務。當PaaS的產品與客戶業務百分百結合在一起,才能真正激發生產力。
許多傳統企業級客戶、外資企業及跨國企業(MNC),已經把IaaS+PaaS全棧搬上雲去。因為他們認為全棧上雲節省了採購、時間、創新成本,還縮短了創新的時間。
從外因角度看,這一年我拜訪了非常多客戶,發現他們對雲的認知跟過去有了很大不同。很多客戶認識到雲不僅僅是服務器資源,更提供豐富的數字化能力。比如,開源軟件發展速度遠超商業化軟件,在雲上選擇各種具備不同技術能力且開源的組件,是最好的選擇。
如果客戶自行開發軟件、產品,所花費的人力成本、研發成本、服務器成本、創新成本、試錯成本都非常高。相比之下,雲計算提供的開箱即用的PaaS化能力,可以直接助力客戶業務創新迭代。
越來越多的客戶意識到,IaaS+PaaS一體化才是充分利用雲、用雲來實現業務的迭代創新、幫助業務實現直接的增長的最好選擇。
阿里雲服務了小紅書、喜馬拉雅、得物這種大型互聯網企業,他們通過阿里雲的大數據產品,不僅激發了數據價值,更實現了對搜索、推薦、廣告等業務價值的直接提升。
2024年,小紅書宣佈成功遷移500PB數據湖至阿里雲
最近,我跟很多同事講,沒有PaaS的雲,很難稱之為雲,只有具備IaaS+PaaS一體化能力的雲,才是真正的雲。
劉湘明:可能十年前,大家經常問的問題是「為什麼要上雲」,處於搖擺狀態。但當AI出現之後,大家發現需要的能力在本地再也無法獲得了,一定要在雲上獲得。
劉偉光:非常對。我這一年遇到的企業幾乎沒有不談AI的。這裡面有一個重要的契機——企業大模型應用必須要跟數據結合,這就繞不過PaaS層的大數據、數據庫產品。沒有過去這麼多年雲計算規模化地從底層算力到網絡、存儲、大數據的積累,就不會有今天的大模型,它不可能在空中樓閣上建立起來。這也推動了很多客戶重新審視雲計算中IaaS、PaaS、SaaS的意義。
劉湘明:從資源池到技術棧,企業的用雲深度在不斷加強,從自研、自建向直接選擇PaaS層產品,從簡單的資源租賃到全棧上雲,有哪些原因或者業務價值推動這種轉變?
劉偉光:從外部市場看,雲上的技術優勢非常明顯,所有的先進技術都優先誕生在雲上。企業會優先選擇先進的技術棧,而先進的技術棧只有雲上有。
從雲計算從業者角度看,我們要滿足不同類型的客戶需求,就必須把能力做「厚」——不僅是滿足資源層面需求,還要做好容器化往上的所有PaaS層。
這裡面還有一個與時俱進的點:雲計算把所有客戶聚集在雲上,跟IOE時代把客戶、技術散落在無數點上,是兩種不同的技術主張。過去沒有規模化的時候,只能看單點需求;在雲上,當規模化的客戶每天調用大模型時,大模型對網絡、存儲、彈性計算等都有著非常大的推動作用。因此,今天雲必須要為AI改變、適配、升級原有的技術能力,才能滿足今天AI使用者的需求。
沒有商業價值和社會價值的大模型,很難稱之為大模型
劉湘明:你出差很多,可能是國內見客戶最多的人之一,對客戶的痛點、需求應該也有很明顯的體感。有沒有統計過這一年大概見了多少客戶?他們有什麼痛點和需求?
劉偉光:從公共雲事業部成立到今天為止,我大概拜訪過162個客戶,走遍大江南北,看千行百業。如果不去一線感受不同行業和地域的客戶需求,就沒有辦法判斷在下一個財年我們如何設計更好的戰略,支撐好市場。
大家對AI的需求千差萬別,有做基礎大模型的先行者還在持續訓練大模型,有做垂直化應用的公司在深度使用大模型,還有一些傳統行業的公司用大模型進行業務創新和提效……他們不僅是簡單調用,還會在原有應用中大量嵌入AI Agent(智能體),還有很多客戶在原有的應用之外去開發AI原生的應用,不僅在手機端,還有PC端的企業應用。
我認為,未來整個市場對於大語言模型的使用,無論是從模型調用還是開發自己的模型,一定不僅僅局限在手機APP上。未來會有更多應用來自於企業應用。這些企業的應用如果站在大語言模型的肩膀上,其實真正釋放的是商業價值,是社會價值。
阿里雲服務了很多To B企業、創造商業價值。比如在中華財險,他們通過阿里雲通義千問,輸入目標客戶各類情況的提示詞,就可以自動生成一份定製化團險保單。如果不完整可以再次對話,大模型會繼續設計。整個項目耗時只有人工的1‰或者1‱。最後如果成交就會創造商業價值。
在快遞領域,中國快遞行業發展迅速,效率高、人員多、數據多且迭代快、場景多,大模型應用就非常有效果。申通快遞和阿里雲經過多次碰撞、驗證場景之後,一起實現了大模型應用在網點經營分析、客服摘要、客服質檢、地址校驗等多個物流場景的落地,實現客服違規率下降50%,信息處理率提升60%。
一家國內領先的工兵型招聘企業利用Qwen-Plus整理本地公眾號、微信群中的零散用工信息,降低了80%運營人力成本;使用模型檢測潛在的用工歧視、跨國用工等風險信息,大幅提昇平台合規能力。此外,人崗匹配、搜索推薦、客服質檢等場景灰度上線中。
此外,中國的跨境電商非常發達,一家垂類的電商企業,面對大量細分品類和近百萬SKU的日常上架及運營工作,通過通義大模型,進行商品關鍵詞生成、標題提煉、商品描述,並輔助進行商品上架前的違規檢測,可以高質量完成海量商品上線,提升商品上架效率。
還有,基於通義打造的智能招投標信息服務平台,利用大模型的自然語言理解和推理能力,通過Prompt工程識別項目名稱和公告名稱中的關鍵信息,進行關聯概率計算,向最終用戶提供與項目關聯的所有公告信息的搜索查詢服務。
儘管我們看到很多實實在在的效率提升成果,但從市場整體來看還是滄海一粟。未來中國在大語言模型發展和場景應用上會迎來快速普及,我對未來充滿信心。因為越是人多,數據多、流程複雜、場景複雜的業務,大模型起到的效果就越明顯。
我們明年有個目標,希望阿里雲提供的推理資源能服務中國90%的AI agent、90%的AI原生應用。如果說沒有PaaS的雲今天不能稱為雲,那麼大模型不能創造社會價值和商業價值也是沒有意義的,所以我們朝著創造價值的方向來做。
劉湘明:AI在To B的價值要實現,意味著AI應用和服務一定要無縫嵌入現有數據流和工作流,真正進入生產環境才能發揮價值,有哪些挑戰?
劉偉光:第一個難點是大家都知道AI重要,但是不知道如何下手,不知道大模型應該跟企業的哪一個場景、哪一類數據結合才能最快出效果。
第二個難點是人才。在實現AI最後一公里建設的時候,在開源模型和推理資源基礎上構建專屬模型、AI應用、AI Agent等等工作是需要客戶自己來做,別人無法代勞。它是好幾件事情的組合:第一是AI應用開發的範式;第二是這個範式之下所有要用到的AI工具鏈;第三是選擇基礎大模型;第四是合理選擇底層的推理資源。這四件事組合在一起才是開發一個AI agent或者AI應用的充分且必要條件。
挑戰存在於方方面面,但同時我也看到很多客戶有獨立的AI規劃、AI預算,AI人才、AI辦公室……這是非常好的現象。因為只有真正把AI做成一個企業的一把手工程、企業級戰略項目,才有可能把AI真正跟企業完整融合在一起。
AI雲,一個充滿想像力的新時代
劉湘明:現在人們對於AI基礎設施創新的關注度,遠不及對大模型和生成式AI服務的關注,你怎麼看?
劉偉光:關注大語言模型或者AI對基礎設施的演變的,是非常小的一個客戶群體,比如這個領域專業的工作者、觀察者,或者是基礎大模型的研發者。
更多人會關注AI應用,這很正常。就像人們戴個AI眼鏡,關注的是它能實現什麼功能,能翻譯嗎?能對話嗎?而不會關注背後是用什麼技術來實現的。但支撐這些AI應用創新的核心競爭力的基礎設施技術是非常重要的,就像我們打開水龍頭,不會關心它從哪個水廠流出來,但那個水廠的設備應該是最先進的。所以,當AI能力越來越強,提示詞工程產生的效果越來越好、反應越來越快、對話越來越流暢的時候,實際上是因為背後的基礎設施能力非常強,這兩者是相輔相成的。
劉湘明:我們正站在一個拐點上,展望2025年,AI與雲計算的結合將開啟一個充滿想像力的新時代,你預判未來的增長機會將發生在哪裡?企業需要做好哪些準備?
劉偉光:我的想像力是無窮的,這來自於我的客戶,我拜訪了這麼多客戶,看到他們對AI未來發展感到興奮。
AI和雲的結合是雲二次騰飛的關鍵。從雲計算提出來到今天將近20年時間,是讓全世界各種企業認識到雲是先進技術的聚集地,雲是讓更多中小企業上雲,能節省成本。同時能夠把雲不僅是資源,還是數字化生產力工具。
未來的所有基礎設施的能力都會被AI衝擊,這個過程就是能力的完全迭代、升級甚至重構,這是一個AI雲的時代。我相信未來各行各業都會不斷擁抱AI,基於大語言模型去構建的AI應用、AI agent會層出不窮,甚至可能會有專門的AI agent store,這會產生一個全新的世界。越來越多的客戶正加速擁抱雲的進程,而且這次擁抱雲不是簡簡單單是對IaaS的擁抱,而是包含IaaS、PaaS、AI資源、大語言模型、AI應用、AI agent……是真正更加廣義的全棧。
對於企業來講,要進行更細分的資源規劃,從AI的頂層設計,到IT層面的AI人才、AI資源,包括AI開發工具,都要進行全方位考量。今天所有企業都要為AI重新準備一套數字化工具或者AI工具鏈,這是企業應該做好的事情。
我非常相信中國在擁抱AI這件事情上,不會比其他國家慢。中國的創新能力將在AI應用時代爆發,這也是我所說的「希望」所在。
大語言模型應在適合的場景發揮效果,而非泛化到解決一切問題
劉湘明:在2024年與企業的交流中,你看到高頻的問題或者關注點有哪些變化?這些高頻詞彙反映了企業在AI與雲計算結合的新時代下,需求產生了什麼變化?
韓鴻源:大語言模型的效果,還是要停留在其本身適合發揮的場景里討論,而不是泛化到一個解決一切問題的大模型。今天我們在做的所有事情,還是希望大語言模型能夠在業務裡面發揮其支撐作用。
比如AI輔助寫代碼,這是所有大語言模型應用領域裡面,經過了最充分的驗證、最能體現出直接效果的場景。通過調研大互聯網公司,我們看到絕大部分領先企業,已經有20%甚至30%的代碼使用了AI輔助生成。通義靈碼已經得到了比較廣泛的應用。
有些大型企業客戶會採購上萬個座席的通義靈碼使用權,小一些的企業可能採購幾千個座席,這種情況現在已經非常常見。當客戶使用了這個工具之後,他會持續使用下去,會提出更多的需求,迭代之後也會逐步發揮更大的作用。
另外我們看到,除了大語言模型本身的變化外,它還推動了底層基礎設施的演進。許多客戶開始更多地利用GPU資源進行業務創新,例如在搜索和推薦系統中引入GPU以提升性能。
企業落地生成式AI的普遍難點和解決方案
劉湘明:生成式AI在企業落地的環境準備、模型就緒、應用工程三個階段中,企業普遍遇到了哪些難點?阿里雲提供了哪些解決思路和方法?
韓鴻源:我從上往下說,先從應用工程開始,在選擇合適的AI應用場景時,我們看到兩個典型的做法。
一是構建全新的應用和業務系統時,希望引入AI或以AI為主構建。這種情況我們充分地分析能力,尋找適合的應用場景,並經過驗證逐步迭代,最終使系統趨於完善。這種做法包袱比較小,見效快,但對現有業務的影響有限,依賴於新場景的需求。
另外一個是在既有應用里引入AI以提升效率。這是我們比較看好的方向。企業內部已有大量數字化系統支撐業務運轉,這些系統在構建時AI尚未成熟,因此存在許多可以優化的點。例如,許多業務流程依賴文字處理,涉及大量重覆性工作。如果引入機器語言理解技術,將大幅提升效率。
從全球化範圍看,Salesforce等領先公司已經展示了這種潛力,將其Agentforce平台視為未來的增長點。
然而,這種潛力的釋放的前置條件是:流程會被使用足夠多的次數,否則改造成本有可能支持不了業務回報。
回到環境準備和模型就緒階段,選擇合適的模型及其運行方式至關重要。尤其在國內嚴格的合規要求下,通義提供了一個可靠的選擇,它不僅在國內廣泛使用,在海外也是最受歡迎的開源模型之一。
下一步是決定如何支持模型運行。最簡單的方式是調用現成的模型服務。模型服務已成為雲計算不可或缺的能力。用戶可以選擇直接使用模型的服務能力,或者根據特殊需求定製模型。
當模型規模化使用時,優化其運行環境變得非常關鍵。它直接涉及成本和生命週期管理,能否以低成本讓客戶持續有效地使用模型,發揮其最大價值,是一個重要挑戰。
雲為整個模型使用全生命週期提供了一個非常好的條件。不管是從用戶的選擇角度還是靈活性上,都提供了非常多可能性。
企業的AI應用部署範式
劉湘明:你覺得對於不同能力的企業,未來在模型的應用部署方式上面,他們的選擇會有什麼不同?
韓鴻源:如果想以最快的方式開展應用開發,模型服務可能是一個入手最簡單的方式,而且這些模型本身經過的驗證也比較多。
如果企業還是想要保留一部分知識產權,就會選擇另外一條路:使用一些模型做調整,或者在不做調整的情況下,自己把推理設施建起來,最後調用這些模型服務,實現相對偏私有域的應用的使用方式,也是完全合理的需求。
通義千問會繼續保持開源開放,客戶完全可以選擇自己搭建推理平台,把模型的調用變成自己內部的事情,不讓別人介入到自己的模型調用過程中。
語言交互的推理有波峰波穀的效應,雲提供了一個比較好的選擇,大家在雲上使用雲的全球基礎設施,也可以保持自己運行的相對獨立性的情況下,保有自己的一些保密和隱私。
面向推理和多模態數據處理趨勢
劉湘明:推理也是今年特別熱的詞。推理市場的繁榮將對於企業使用公共雲有哪些影響?又對公共雲提出了哪些新的要求?深度用雲的企業有哪些關注點?
韓鴻源:我覺得其實訓練是更吸引眼球的,但一個模型的訓練過程不直接產生任何實際價值,模型真正要發揮作用是在推理階段。訓練投入會繼續增長,但模型要重覆使用才能釋放價值,所以,未來推理投入佔比可能會遠遠高於訓練。
今天雲上所有模型API服務本身就是一個推理,是包裝一層API之後被用戶去用,通義大模型本身會使用很大的推理資源來響應客戶的需求。另一種,是客戶不想用現成的API方式使用模型,選擇自己去做推理。
通義系列模型在對外服務過程中積累了豐富的推理技術優化經驗,使用戶能夠直接享受這些技術帶來的紅利。比如,阿里雲會提供通義模型服務、會提供百煉上調整模型的方式和使用模型的方式,包括工具鏈,同時也會提供PAI平台去做更底層的能力承載,用戶可以基於這些做相對更自由一些探索。最終,我們是希望能夠去滿足用戶的全方位的需求。
劉湘明 :「多模態數據」也是今年的一大熱詞。您如何看待多模態數據處理的需求和發展趨勢?在這個大趨勢下,阿里雲在多模態數據的統一存儲、檢索和管理方面有哪些優勢?
韓鴻源:一方面模型提取非結構化數據的結構化信息能力在提升,視覺語言模型具備了自動化的信息提取的能力,可以更好地理解這些多模態數據,讓以前無法有效使用的數據充分發揮作用。
另一方面,Agent和這些數據探索能力的結合蘊藏著巨大的潛力。以前,人們收集到的結構化和半結構化的數據需靠人去理解、探索,很多時候無法充分挖掘出數據的潛力。今天AI提供了自動化處理能力,結合大數據讓AI探索數據會成為一個非常有潛力的發展方向。
對雲計算而言,除了提供基礎的資源供應,上層軟件能力會變得越來越重要。
例如,將多模態數據管理能力被集中整合到特定產品中,實現對多種類型數據的統一管理。在RAG(檢索增強)過程中,這些數據可以在模態之間無縫切換和使用,大大簡化了客戶的操作複雜度和數據管理難度,從而更順暢地運行其業務流程。(本文正選於鈦媒體APP,作者 | 張帥,編輯 | 蓋虹達)