PPTV創始人姚欣AI再創業,「分佈式推理」終於有人做了

基爾西 發自 凹非寺

量子位 | 公眾號 QbitAI

這個月,PPTV創始人姚欣再次站到了聚光燈下,組織了一場分佈式雲計算論壇,向外界揭開了他的新篇章。

姚欣的第二次創業,瞄準了雲服務,要打造AI時代的基礎設施。

但姿勢獨特:公司沒有自建IDC和購買GPU,而是通過獨特的方式成為了全國最多節點的雲服務商

成立六年來,PPIO派歐雲已獲三輪共4億元的融資,包括百川智能創始人王小川、迅雷創始人程浩、前微軟Azure中國總裁申元慶在內的19位CEO都參與了天使投資。

姚欣,曾是互聯網影片時代的拓荒者,2004年,他在華中科技大學讀研時輟學創業,發明了P2P-Streaming協議,創辦了覆蓋全球4.5億用戶的影片平台PPTV,比YouTube還早1年

PPTV在PC時代創立,移動互聯網早期就迅速崛起,2012年位列中國影片網站用戶規模第2名。然而,2014年,姚欣將PPTV出售,似乎淡出了公眾視野。

姚欣重回到公共視野的當下,我們不禁想問,在市場接近飽和的環境下,為何姚欣堅持要選擇雲服務賽道?又因何受到投資者如此青睞?

一方面,時勢造英雄,2020年Gartner開始推崇的分佈式雲概念,給了姚欣這個「分佈式信徒」難得的發展機遇

另一方面,英雄造時勢,姚欣也賽前分析性地選擇跳過訓練算力業務,全部聚焦發展分佈式推理算力,下注AI應用普及對於推理算力的巨大需求。

當分佈式計算遇見AI Infra

要理解姚欣的再創業,可以先從這樣的具體案例中感知——

國內某Top3小說推廣APP,開始為創作者提供AIGC生圖功能,吸引了更多的作者和讀者。

AI技術帶來的流量增長自然是一件好事,但與此同時帶來的運維壓力也陡然上升。

而且隨著這樣的新功能被更多人所熟知,後台服務器性能也遇到了瓶頸,高峰時期生成速度明顯變慢的情況開始逐步顯現。

在過去,解決的方式簡單粗暴——擴容,但一味地選擇這種方式,實際並非長久之計,不僅代價高昂,而且在面對不確定性增長時顯得力不從心。

而PPIO的分佈式架構,就是針對這種場景和痛點而生。

這不僅是一種技術選擇,更是一種為未來打下基礎的架構方案。

它打破了傳統集中式架構的瓶頸,不僅為企業大幅降低了運維壓力,還將系統的處理效率提升到了一個全新的高度。

△PPIO CTO王聞宇介紹派歐算力雲產品PPIO CTO王聞宇介紹派歐算力雲產品

利用PPIO提供的AI推理平台,免去了自行部署後台服務的繁冗過程,通過API即可調用服務,不再需要自行運維,成本直接減少了40%

速度方面,得益於PPIO龐大的分佈式算力網絡,網絡擁堵現象大幅降低。

據瞭解,採用PPIO服務後,該小說APP的平均生圖時間從10秒縮短到了2秒,生產效率提升了50%

姚欣還介紹,如果海外AI應用使用其推理服務,能夠獲得比矽谷還要高的綜合性價比。

這得益於PPIO遍佈全球的分佈式雲服務網絡,無論用戶身處何地,總能找到近距離的算力節點,獲得20毫秒級的低延遲體驗。

姚欣選擇分佈式推理並非偶然,而是基於他多年對整個行業的深入理解。

根據TIRIAS research的研究,隨著AI的快速發展,未來算力需求的構成將發生重大變化,95%的算力需求來自推理,訓練算力僅佔5%。推理將逐漸成為AI計算的核心

姚欣看準了AI時代算力結構轉型的機遇,將重心放在推理側。

推理計算的核心在於實時處理用戶請求,低延遲和高效率是它的生命線。

而分佈式技術,恰恰是實現這一需求的不二之選——

通過將推理計算分佈到全球多個節點,PPIO能夠最大限度地減少到用戶的時延;

同時根據不同區域的需求波動智能調度算力資源,確保全局計算效率始終保持最佳狀態。

分佈式推理不僅是一次技術創新,更是一種新的商業模式,讓中小企業和開發者不再為算力門檻所困,讓他們也能走進AI世界。

相比之下,傳統的大型數據中心雖然具備強大的處理能力,但其成本高昂,不僅包括硬件設備的購置和系統維護,還包括高度集中帶來的大量散熱能耗的需求。

分佈式雲通過調度分佈在全國各地的中小型數據中心或邊緣計算節點,充分利用當地高性價比能源和算力資源,降低總體運營成本。

當然,姚欣還提出了「三年內降本1000倍」的期望,要想成功實現,除了龐大的分佈式算力網絡,還要有更多創新技術的支撐。

為此,姚欣給出了他的答案——Serverless彈性調度和推理加速優化

其中,Serverless架構被用來解決跨區域服務過程中節點數量龐大、用戶請求複雜的問題。

該架構通過智能整合分佈式算力,自動實現彈性伸縮與按需付費。

用戶可將自有鏡像或模型託管到該平台,不用再擔心海量用戶的併發響應問題,亦無需親自管理和維護大量算力服務器。

△派歐算力雲Serverless產品自動彈性觸發時延和單實例冷啟動速度派歐算力雲Serverless產品自動彈性觸發時延和單實例冷啟動速度

除此之外,PPIO還通過算法、系統和硬件的協同創新,推出了針對大語言模型特點的推理加速引擎。

借助全鏈路FP8量化、KV Cache稀疏壓縮算法,以及投機采樣等技術,顯著提升了推理的加速性能,打破了顯存、算力和帶寬的限制,釋放了大模型推理的更大潛能。

此次的分佈式雲計算論壇,標誌著姚欣的第二次創業取得了階段性的成功。

這背後除了有姚欣自己對行業的獨到見解,還有分佈式雲自身與雲服務發展形勢的契合。

分佈式雲的天時地利

在國內的雲服務領域,有很多我們耳熟能詳的選手,華為、百度、騰訊、阿里等眾多互聯網大廠,都擁有自己的雲服務產品。

但這些雲服務無一例外都採用了集中式的方式,更加襯托出了姚欣做的分佈式雲系統的別具一格。

不過,姚欣強調,分佈式與集中式並非對立的選擇,而是相互補充的合作模式

技術上看,PPIO採用了集中式雲服務也在用的基於K8S技術的雲原生架構,能夠與集中式雲進行標準的互聯互通

商業模式上看,用戶也不會過度關注自己的產品究竟運行在哪種雲,他們更在意的,是最終的運行效果。

歸根結底,究竟應該採用哪種運算方式,取決於具體的應用場景。

在競爭與合作共存的格局當中,分佈式雲的獨特優勢在於,它能夠解決集中式雲難以應付的需求

隨著AI新應用的大量落地,產生了大量的實時數據計算和海量IO吞吐,AI帶來的新算力需求以超越摩亞定律的方式不斷膨脹。

正是這些大量實時計算需求的湧現,讓傳統的集中式算力中心顯得捉襟見肘,但這真的是因為算力總量不夠用嗎?

答案是否定的。

據統計,我國有47%,也就是將近一半的算力都處於閑置狀態,未被充分利用。

造成這一現象的核心原因,是算力需求與供給的不匹配。數據中心和超算中心的建設過於超前,但數據產生地與算力節點往往相距甚遠,造成了算力不足的表象。

所以,算力唯有「去中心化」,下沉分佈到網絡側邊緣,才能解決時延和海量數據IO吞吐問題。

PPIO做的就是這樣的工作,其本身不生產算力,而是作為空閑算力的「搬運工」和「指揮員」,解決算力時空分佈不均、利用效率低下的窘境。

當然,姚欣的願景不僅限於當前的雲服務,他提出了算力發展的三條曲線,目前已經基本建成的,是其中的前兩條——邊緣雲(紅色)和算力雲(綠色)

去年,PPIO更是根據這兩條「曲線」,將公司的業務線拆分成了兩個事業部。

而「第三條曲線」,則是實現各個組織機構間,算力資源的實時調度和自由交易

姚欣認為,從技術角度看,業界已經有能力實現這種模式,但在產業共識和商業模式上,還需要參與者的共同努力。

但就像從雲計算誕生之初,人們都不相信公有雲,到後來公共雲服務逐漸成為主流一樣,這種「算力共享」也將經歷一個形成共識的過程。

而之所以選擇這條與眾不同的創業之路,源自姚欣豐富的創業經歷與技術信仰。

創業者姚欣:立誌把分佈式技術寫進教科書

公眾眼中的姚欣有很多標籤:大學創業、網絡電視、互聯網、投資人等。

然而,常常被忽略的是,他在技術方面同樣擁有著深厚的積澱

事實上,姚欣自從高中時起就是一名學霸。

他曾連續兩年獲得全國奧林匹克計算機競賽一等獎,1999年被保送進入華中理工大學(現在的華中科大)

也正是在大學生涯之中,姚欣接觸到了分佈式計算這個概念——他的老師金海教授(華中科技大學教授,中國計算機學會副理事長),正是將這一概念帶入中國的第一人。

金海教授早在2002年就開始負責中國教育網的網格計算(分佈式計算的一種)建設,2007年也是第一批從事虛擬化和雲計算研究的科研專家。

一直到現在參與設計國家提出的「東數西算」和算力網絡,是中國分佈式計算領域的領軍人物。

當時,金海教授就跟姚欣講了算力大眾化的願景:

當有一天網格(當時的叫法)足夠分佈的時候,我們每個人用算力就像用電用自來水一樣,隨時隨地接上插頭、打開水龍頭就可以使用到。

金老師所描繪的技術普惠理念深深影響了姚欣,並植入了他的創業初心。

除了金海教授讓姚欣接觸到了分佈式計算,姚欣的創業的另一大源動力是他對身邊事物的觀察。

姚欣讀大學時正值2002年世界盃,在校園中觀看足球比賽就成了一個火熱的需求。

其間,姚欣發現了一個不尋常的現象——

像H湯臣P、FTP這樣的傳輸協議,用的人越多速度也就越慢,但如果用BitTorrent這種P2P的傳輸方式,用的人越多,速度反而越快。

網格計算需要連接很大的計算節點,但可以整合每個人電腦的上行帶寬,構建一個分佈式的存儲和傳輸的網絡,提供基於P2P技術的網絡電視服務。

這一想法促使姚欣創建了PPLive(PPTV的前身),起初PPLive只是一個簡陋到沒有界面的學生作品,但是很快就獲得了過億的下載量。

PPTV的成功,毫無疑問依賴於技術優勢。相比(當時的)優酷、土豆等競爭對手,PPTV的影片處理成本僅為其1%。

後來,賣掉了取得成功的PPTV後,姚欣開始重新思考自己的未來目標。

他不再滿足於「一人的成功」,而是想將其轉變為「眾人的成功」,希望通過聚集更多人的力量來實現改變生活的技術創新。

從影片行業中暫時淡出的姚欣,也始終未曾遠離分佈式計算的技術願景——

在PPTV的成功背後,正是他對資源整合和計算效率提升的深刻理解,而這些理念也是他對分佈式計算長久關注的理論基礎。

這也直接推動了他後續的技術創業選擇,並在分佈式推理領域的發展中得到了實踐。

在姚欣看來,創業者最重要的,不是隨大流,不是去模仿,而是要有足夠的差異化和獨特競爭力

所以即使在今天看來,PPIO選擇的分佈式賽道,依然如同PPTV一樣,顯得十分「另類」而新穎;

自己不建大型數據中心,而是整合利用大量的閑置數據中心,這種商業模式也是獨樹一幟。

從P2P-Streaming到分佈式推理,姚欣的創業路徑看似從互聯網內容平台轉向了技術基礎設施,但實際上,這兩者本質上是一脈相承的

姚欣始終在探索如何通過網絡的集體力量提升效率、降低成本,並以分佈式技術為基礎,解決計算中的瓶頸問題。

如今,他將同樣的理念應用於AI推理領域,專注於解決算力供需不平衡的問題。

走到今天,姚欣的誌向已經不只是把企業做大做強,而是希望能夠開創出具有時代意義、能夠被寫進計算機教科書的技術

正是出於這一理想,PPIO聘請了金海教授擔任公司技術委員會主席。

金海教授將為公司技術團隊提供深入全面的指導,將分佈式雲技術邊界進一步拓展,推動更多應用的落地,讓更多創業者輕裝上陣

One More Thing

在剛剛結束的2024分佈式雲計算論壇上,PPIO除了推出了AI算力雲產品外,還聯合PingCAP、Zilliz、AscentStream和CSDN,共同啟動了「Pioneers AI初創加速計劃」

面向AI初創企業和開發者,提供包括分佈式算力、分佈式關係型數據庫、分佈式向量數據庫、分佈式消息隊列、開發者社區等全面的資源和技術服務,助力初創團隊在分佈式雲上實現快速成長,加速其創新成果的落地。

正如姚欣在分佈式雲計算論壇上說的那樣,他的終極目標不僅是推動分佈式雲成為廣泛應用的技術標準,更是通過持續創新,幫助更多企業和開發者在AI時代中獲得成功

我們站在AI時代的門檻前,正在見證一批又一批滿懷夢想的拓荒者紛紛湧現。

正如當年那個24 歲的姚欣一樣,他們需要的,不僅僅是資金和技術,更需要來自同路人、來自先行者的經驗和鼓勵,就像當年的金海教授一樣。

現在,輪到了我們承擔起這樣的使命,用分佈式的力量,做新一代應用的基礎設施,支撐起新時代的拓荒者砥礪前行!

「Pioneers AI初創加速計劃」入口:https://www.ppio.cn/campaign/ai-pioneers