「算力版滴滴」發佈 AI 雲新品,PPIO CEO預測三年模型推理成本將下降1000倍|鈦媒體AGI

(圖片來源:unsplash)(圖片來源:unsplash)

AI大模型等技術和應用爆髮式發展,正加速推動中國構建更龐大的算力基礎設施。

鈦媒體App 9月5日消息,國家統計局最新數據顯示,截至5月底,規劃具有高性能計算機集群的智算中心達10餘個,智能算力佔算力總規模比重超過30%。目前,中國算力機架總規模超過195萬架,整體上架率達63%左右。東西岸樞紐節點間網絡時延已基本滿足20毫秒(ms)要求。

國家數據局黨組書記、局長劉烈宏在2024中國國際大數據產業博覽會上透露,截至今年6月底,中國八大國家樞紐節點直接投資超過435億元,拉動投資超過2000億元。

很顯然,中國正加大 AI 算力投資力度。

在這其中,如果把 AI 大模型的推理放到邊端,通過分佈式推理,可有效降低算力成本。AMD CEO蘇姿豐(Lisa Su)曾預估,未來價值4000億美元規模的AI加速計算市場中,其中超過一半的份額,即至少2000億美元將被專門用於AI推理計算場景的應用。

「我們正處於一個各大企業大規模深化應用、上雲複製的階段。」中國信息通信研究院雲計算與大數據研政企數字化轉型部主任徐恩慶在9月4日舉行的「Power to Pioneers·2024分佈式雲計算論壇暨PPIO AI產品發佈會」上表示,2023年中國數字經濟規模佔GDP的比重達42.8%,整個數字經濟規模處於蓬勃發展狀態。其中,互聯網廠商、數智廠商、網絡運營商所代表的經濟規模只佔20%,傳統的政企單位以及大量企業深入使用新一代的數字化技術所創造新的經濟規模價值佔80%。

在徐恩慶看來,伴隨著 AI 和大算力基礎設施的建設過程中,分佈式算力體系已經成為支持新一代IT技術發展的關鍵。這些新一代超大規模分佈式算力基礎設施通過分佈式計算,確保了 AI 算法的高效運行,同時也需要一個更強大的操作平台來融合異構算力和智算基礎設施。

會上,PPIO派歐雲聯合創始人、CEO姚欣發佈專為AI推理場景設計的Serverless產品,公司通過算法、系統和硬件協同創新,提供模型部署、運行優化、彈性伸縮及API服務,幫助客戶在自定義模型時獲得高效的彈性效率和極致的運行成本。Serverless產品的推出使得開發者無需再管理和運維算力服務器,而是能夠將精力集中於核心業務的應用邏輯開發與創新,從而幫助企業實現降本增效。

姚欣預測,未來三年,AI 大模型推理成本或將下降1000倍以上。而遵循Scaling Law(尺度定律)的基本原理,計算能力將決定大模型創新和應用的上限。那麼在計算資源成本高昂而需求爆增的市場格局下,分佈式算力將成為引領下一輪科技革命的重要推動力,正在逐步改變全球計算資源的供給和利用方式。

PPIO派歐雲董事長姚欣PPIO派歐雲董事長姚欣

PPIO派歐雲成立於2018年,由PPTV創始人姚欣(Bill)和首席架構師王聞宇聯合創立,主要在網絡和邊緣側基礎設施上建構計算雲服務,科技「按需付費」形成商業落地。姚欣形容,PPIO派歐雲是「算力版的滴滴」,主要整合企業側閑置碎片化的算力,承載多種服務,包括音影片和AI推理等。

場景商業化層面,PPIO派歐雲主要業務範疇在雲和邊兩側,重心是邊緣雲業務和算力雲業務。其中,派歐算力雲產品可廣泛應用於產業園、寫字樓、住宅、文娛和高校等園區進行算力入園的管理服務,並實現不同地區、時間和業務的彈性算力調度和大模型推理加速,為園區內的AI應用提供智算服務,滿足智能數據處理、大模型部署、AIGC生成、AI算法加速、渲染加速等一系列應用需求,合作客戶包括

姚欣強調,PPIO派歐雲主要是與端側協調配合,不與端側設備廠商競爭。

融資層面,截至目前,PPIO派歐雲已經完成三輪融資,總額超過3億元人民幣,投資方包括張江科投、藍馳創投、沸點資本等知名機構,以及百川智能創始人王小川、迅雷創始人程浩、元氣森林創始人唐彬森等科技行業內人士。

值得一提的是,論壇上,PPIO派歐雲聯合創始人兼CTO王聞宇還推出全新Model API服務產品,支持生成式AI應用開發所需的全模態API,商業模式是「按需付費」。價格方面,GLM-4的 Model API 費用達到每1億(100M)Token價格達0.5元,從而以低價格來顯著提升AI應用的開發效率,並有效降低企業開發和運營成本。

會後交流時,姚欣向鈦媒體App坦言,算力需求和使用不平衡是一個長期存在的問題。從未來算力構成來看,95%是推理算力,5%是訓練算力,但這95%也不會出現一家獨大局面。

「未來兩、三年內,我們有望看到大模型逐漸走向集中化和標準化,在這其中,異構推理算力硬件環境將會呈現‘百花齊放’狀態,針對不同的場景,不同的領域,有不同的解決方案,不同的卡去解決它。對於未來三年 AI 推理成本下降100倍、1000倍的過程預測,我們是非常樂觀的。」姚欣認為,開源技術是推動中國 AI 發展的關鍵要素。

「我過去經常講一句話,被AI幹掉的不是你,而是最先掌握AI的人,我們必須一次面對技術創新,無論多麼高深必須先掌握,掌握它的人才有資格談能不能在未來時代發展;第二,對於新技術往往短期過於高估,長期過於悲觀,對我們來說,即使十年時間放在技術路線來講還是其中一小段過程,真正技術發現落地需要長期堅持過程。

雖然現在外面經濟環境、資本環境不是那麼好,但是對真正做事的人來講是一個好環境,因為今天做的每一分積累都是好回報。所以,今天的創業者、創始人也需要抱團取暖,需要形成我們的社區,需要互相協作,一起來迎接支持新的 AI 時代到來,用自己心中的夢想堅定走自己的道路。」姚欣在演講結尾表示。

以下是姚欣與鈦媒體App等進行的部分對話交流整理:

問:如何看待未來算力有可能過剩這一觀點?AI算力如何實現供需平衡?

姚欣:在算力中心建設方面,我們見證了一種與之前數據中心建設相似的趨勢,即適度超前建設後迅速普及。然而,真正的應用需求和技術革新是連續且不斷迭代的過程,甚至有的時候是一個「躍變」的過程,你很有可能在這個過程中「死在黎明前」。

在大模型訓練領域,預計訓練將越來越集中,規模不斷擴大,因為規模越大,效果越好,這是所謂的scaling law效應。但能夠進行這種大規模訓練的廠商數量將減少,行業競爭將集中在幾個大玩家手中,這是產業成熟和技術進步的標誌。

隨著技術的成熟,大規模應用將隨之而來。就像過去每個人都需要自己開發手機和操作系統,現在只需要選擇幾個主流的即可。大模型的發展也將走向集中化,新應用將隨之普及。AI推理算力市場正經歷著從文字互聯網到影片互聯網的轉變,流量消耗呈百倍、萬倍增長。預計到2024、2025年,行業將觸底反彈,大規模應用將帶來更多推理算力需求。儘管未來95%的算力可能都是推理算力,但市場不會只有一家獨大,可能會有3家、5家甚至更多廠商共存。

在智能設備上執行推理任務時,我們關注的焦點可能會因應用環境的不同而有所差異。例如,為了優化智能設備的功耗,推理算法的設計需要特別注重能效比,以在保證準確性的同時降低能耗。在音影片實時對話系統中,網絡分佈和延遲成為核心考量,推理模型的選擇和部署需要能夠應對網絡波動,確保數據的低延遲和高質量傳輸。如果目標是運行大規模模型以獲得更高的性價比和擴展性,那麼模型的複雜度和計算能力就變得至關重要,這可能需要高性能硬件和優化的推理引擎。智能設備的多樣性也對推理任務提出了更高的要求,需要根據不同設備的實際情況靈活調整算法和模型參數,以實現最佳性能和效率。

未來,推理卡市場將出現從低端到高端的多樣化細分,以滿足不同任務的需求。然而,從IT行業的長期趨勢來看,單位算力的成本將持續下降,從未出現過上升的情況。這表明,隨著技術的進步,算力的普及和成本效益將不斷加速。

問:如何看待AI泡沫和過熱現象?

姚欣:我們目前處於行業發展的早期階段,這一時期往往伴隨著過熱現象,例如去年模型數量的激增,我們認為這是不必要的,因此我們並沒有跟風。我們去年的策略是專注於未來,而不是追逐短期的泡沫。在早期,行業可能會出現泡沫,這是每個時代、每個行業不可避免的過程。但隨著時間的推移,市場逐漸回歸理性,轉向實際應用,這是符合當前環境的,也是我們投融資的價值觀。我們不追求簡單的技術概念,而是相信技術必須服務於行業和產業。作為基礎設施和基礎算力的提供商,我們需要耐性,穩步前行。

我們不歡迎那些追求短期泡沫、融資驅動的現象,我們更看重的是那些能夠通過自身盈利模式吸引客戶、而非依賴融資的客戶。我們追求的是長期價值,歡迎那些有耐性、看重獨特商業模式和技術積累的資本。我們不認為,公司的估值越高、融資越多就意味著成功。相反,我們認為應該回歸價值創造,遵循技術的長期成熟規律。這種實事求是的投資人是我們所歡迎的。

在藍馳的投資經歷深刻影響了我今天的商業價值觀。我們在初創時期就確立了商業價值觀,即要做有價值創造且需求落地的事情。我們不願意僅僅為了榜單排名或展示我們的學術實力和師資能力。我們更重視的是自身的實力和能力,希望我們的團隊能夠吸引一系列閃亮的客戶,通過實際的業務成果來證明我們的價值。

坦白講,這波生成式AI才大規模發展了2年,所以我們得耐性地等,一個一個耐性地去積累,這就是我們的一個選擇。

問:現在公司算力雲產品的商業化程度如何?

姚欣:我們團隊已經建立了穩定的營收和客戶基礎,我更關注於尋找能夠長期合作並形成正向循環的客戶。自2020年起,我們就開始研發雲遊戲、數字人和分佈式邊緣計算產品,不斷積累技術。去年,我們開始為大模型提供服務,但主要聚焦於內部和合作夥伴。我們重視中小開發者的需求,他們需要AI技術來提升營銷和市場分析能力。同時,我們感謝開源社區的支持,通過與開源模型的整合和優化,我們的產品已經成熟,能夠為不同規模的客戶提供定製化的服務。

另外,我們非常要感謝開源,我們的確從開源上得到了幫助,比如開源模型。接下來,我們會與百川、智譜等開源模型進行深度整合,做性能優化。

實際上,兩年前就開始在做準備技術,去年已給一些大客戶在內部試用,那今年,我們覺得是已經做得比較成熟,同時可針對大、中、小型客戶提供不同層次的產品能力。

問:對於 AI 算力研發高昂挑戰,PPIO派歐雲如何應對?

姚欣:那就是你的商業模式要掙錢,有營收。其實你如果看我們這種業務發展和增長,包括我們其實應該我們上一輪融資的時候,音影片的流量需求是一度猛增的,所以我們自身的整個營收和規模已經到了一種體量。甚至可以這樣講,經過這麼多年的打磨了,我們邊緣業務已經走到盈利狀態,邊緣業務是盈利的。

同時,我們的 AI 算力業務是投入的,是今天我們願意去培育和等待市場,特別中小創業者慢慢成長和發展起來。我們再等待新的一波的這些明星公司,我們在耐性地陪待和等待他們的發展。從企業的角度來講的話,我們不是靠融資做大的公司,做ToB一定是要掙錢的。

問:其他國內AI Infra公司與你們的區別是什麼?

姚欣:很多企業是可能都有各自的專注,我能看到的是基於分佈式專注做推理,且具備全站優化能力的,是我們一家。AI 推理加速引擎框架只是我們其中的一部分,同時,我們有非常強的這個工程化研發,加上學術界的背景,在系統結構、體系結構、高性能計算、並行計算、分佈式計算等領域都有深厚背景。

而且,我們又有PPTV的技術積累,至少我們也承載過 4.5 用戶,每天的用戶訪問量也達到一個海量數字,也服務過一系列頭部的互聯網企業,每天有數億用戶在我們的網絡上間接單使用我們的服務。

所以我們無論是在互聯工程側,還是在系統結構這種學術領域側,我們都是最強。再加上分佈式的特性,我們並不是去自己建數據中心,也不是為這個大的這個數據中心打工,我們在整合分佈式和碎片化的算力,所以這三者之間做交集。我覺得,我們有挺強的差異化和獨特性。這也是為甚麼我們敢喊出「三年持續極致性價比」這一口號。因為是端到端領域,我們不是只做 AI 推理這一件事。

(本文正選於鈦媒體App,作者|林誌佳,編輯|胡潤峰)