獨家對話燧原科技創始人張亞林:逆全球化下,國產AI算力如何解決商業落地問題?|鈦媒體AGI

燧原科技創始人&COO張亞林燧原科技創始人&COO張亞林

成立6年多,累計融資額近70億元人民幣,估值已達160億元(胡潤數據)……這是騰訊投資的一家AI算力企業——燧原科技交出的最新成績單。

美國哈佛商學院教授、「顛覆性創新之父」基斯甸臣(Clayton M. Christensen)在研究貝索斯、馬斯克等多位頂級創業者後,在《創新者的基因》一書中得出結論:全球經濟發展中,創新是生命之源,是企業首要的戰略考慮。但同時,一個創新領導者,不僅應該是思考者,更應該是一個會把思考及時付諸行動的人。

在中國 AI 算力賽道當中,燧原科技創始人兼COO(首席運營官)張亞林正是這樣一位領導者。

創立燧原科技之前,張亞林曾在AMD工作了11年,他帶領AMD上海研發中心成功開發並量產多顆旗艦處理器,擁有豐富的工程和產品化實戰經驗。

在張亞林的帶領下,作為通用人工智能(AGI)算力基礎設施服務商,燧原科技已完成 AI 算力產品的開發、量產和規模化落地,涵蓋板卡、智算一體機、液冷算力集群以及配套的軟件系統。同時,燧原也是騰訊自2018年起持續投資的國產AI算力供應商。

張亞林認為,大模型時代下,算力對於中國驅動 AI 技術的發展至關重要。生成式 AI 技術恰恰依賴於底層硬件和軟件架構,來執行複雜的算法和處理數據,從而實現智能交互功能,而這一切都離不開算力底座的支持。

近日在上海舉行的WAIC 2024(世界人工智能大會)前夕,張亞林與鈦媒體App進行了獨家交流。

張亞林對鈦媒體App表示,本土算力中心的商業化落地,需要AIDC(智算中心)+AIGC(生成式人工智能)結合形成「雙輪驅動」。智算中心「誰來建設、誰來運營、誰來使用」是三個很重要的問題,其關鍵點在於誰來用。只有用戶願意來使用算力,才有人願意來運營,投資建設方才能收回成本,形成可持續發展的閉環。

如今,燧原科技正不斷構建完整的算力中心生態圈。今年5月末,由燧原科技產品提供支撐的宜昌點軍智算中心實現運營。從建立到運營僅用1年時間,燧原就完成了300P國產算力建設和交付,並實現上線全消納,上架率超過80%。而且,燧原科技還在四川成都、甘肅慶陽等地展開智算中心建設及合作,實現國產智算設施的落地和商業化。

張亞林指出,智算中心是一個至少3-5年長週期的落地運營過程,需要投建方、運營方、使用方一起合作共贏。同時,面對短期的市場環境,燧原科技自身需要開源、節流,打造生態護城河,持續構建和打磨生態。

「這個過程沒有太多捷徑可以走。」張亞林表示。

展望未來,張亞林強調,中國在 AI 領域垂直應用具有更多的優勢,從而會推動國產 AI 算力部署,促進國產算力產品的升級迭代。同時,通過雲、邊、端協同發展,聚焦大模型精細化、行業落地以及雲邊端一體化,實現 AI 行業發展。

「中國一定會在 AI 算力層面‘百花齊放’,」張亞林對鈦媒體App表示。

以下是張亞林與鈦媒體的獨家對話速記,經鈦媒體AGI編輯整理:

鈦媒體:近期全國各地都在建 AI 算力集群,那麼,燧原的運營思路是怎樣的?

張亞林:在智算新時代,其實很重要的就是,一個智算(算力)中心如何商業價值變現。

而燧原的策略是用「AIGC+AIDC」雙輪驅動,以解決三個關鍵問題:誰來建設、誰來運營、誰來使用,從而實現真正的商業價值。

具體來說,智算中心是一個龐然大物,這裡面涉及到整個智算中心市場要順利運行,讓它能夠實現商業價值的落地。

第一個就是投建方。如果沒有人投資基礎設施的建設,就沒有基本面。

第二個是真正商業價值變現的運營(實操)方。因為智算中心是一個以3~5年來做運營週期的系統方案。

實際上,如果算商業價值來說,如何讓運營方去通過實現租賃變現賺到錢,其實背後有一套體系。就運營方來說,一次性基礎設施投入包括基建、硬件設備採買、軟件服務和雲服務、大模型預裝,這是智算中心的資本支出(Capital expenditures)。然後還有運營成本支出(Operating expenses),如果以5年計算,每一年運營成本包括運維費用、機器維修費、水電管理費、運維人員管理費、人員成本等等,其實這些都構建成了每一年的運營開銷,乘以五年,成為整個智算中心的投入成本。另外,算力租賃的使用率通常為70%-80%,加上每台服務器的大概金額,可以算出來5年的算力租賃帶來的最終回報。

而這中間就會產生一個價差,如果這個價差是正的話,運營方就能賺到錢,如果是負的話運營方就虧本。當然,這裏還有政策補貼,比如「算力券」、固定投資補貼等。所以,運營方的投入核心就是在兩方面:一是投入的成本、硬件設備和預裝軟件服務成本是否有足夠的性價比;二是算力中心基礎設施是否有足夠的性價比。同時在產出層面,運營方的AI加速卡和設備在運行大模型及其應用時是否有一個合理的價格,從而實現盈利,所以這又涉及到卡的性能是否能達到一定的租賃價格——這其實是一個性價比的問題。

綜合因素考慮下,如果運營方最終要實現商業價值閉環,就誰來運營,就需要去評估整個商業價值閉環。

第三點是「誰來應用」,也就是應用方,這是非常重要的一個問題。

首先,應用方是由誰來牽引,算力提供方、基礎設施提供方、投建方還是運營方;第二,這些客戶願不願意購買你的算力,租賃你的算力,所以這又回到剛剛涉及的,就是你的卡好不好用、易不易用,本身產品有沒有性價比,包括政府的政策和補貼,加一起是否有足夠吸引力,這些其實是比較關鍵的。

舉例來說,如果今天因為你的產品具有性價比,客戶願意租賃服務器,然後能夠用滿,比如(未來)在3年到5年,你的服務器上架率或者使用率能夠達到80%以上,甚至超過90%的話,整個算力的利潤空間就會上升,背後其實是一個商業帳。反之,如果產品面不行、性價比不行、或者政策補貼力度不夠,最終用戶群體不夠多,就會產生算力使用率不飽和、空置率等現象,導致算力利潤偏低。

所以,智算中心就是「誰來投建、誰來運營、誰來使用」這樣一個商業邏輯的概念。

新的形勢下,國內的算力建設趨於「後輪驅動」,也就是有多少客戶使用,來催生是否有企業願意運營,是否有人願意投建。所以,新的智算中心商業變現業態,首先是本身產品有足夠的性價比,租賃價格有足夠的吸引力,生態有足夠的泛化性,才能讓更多用戶有租賃的意願,或者是租賃的訂單。這樣你拿到訂單之後,才能讓運營商願意入場,進而反向推動投建方的信心,從而實現智算中心的商業化。

因此,整個智算中心如果是實現商業閉環的話,最後就回到了一個核心點:誰來用、多少人願意用、大家願意出多少錢來用……這些終極問題。

目前在國內,首先絕大部分算力消納需求大的用戶還是在互聯網;其次可能是垂直行業與央國企,最後是初創大模型公司等。所以,對於中國的算力提供商來說,最重要的就是能不能夠真正找到跟你產品有更大範圍結合的用戶,願意為你的產品買單的用戶群體有多少,它會驅動企業未來能夠實現數據中心的商業閉環的力度有多大。

鈦媒體:AI 和半導體產業存在一定的週期性,長期來看,一旦這輪 AI 熱潮降下來,智算中心就很難有滿載率。那麼,燧原如何解決這一挑戰?

張亞林:這其實是智算中心的「商業測算」概念。舉個例子。假設智算中心是5年的一個運營週期,中間可能會經歷波峰和波穀,我不能只看現在的情況,所以這是一個整體測算的問題。

整體測算裡面分兩類:第一類是有的客戶願意承租3~5年,根據自身的業務發展,也考慮了一定的風險,長期租賃的價格相對會中和一些;第二類是短期客戶,根據業務的彈性需求進行租賃,價格相對高,也會承擔算力供應的風險。

所以從宏觀角度來講,智算中心在一個測算過程中,是一個平均使用率的概念。因此,需要有一個比較謹慎的方式進行測算,肯定不能用100%的峰值去測算平均使用率。

通常保守估計,用70%-80%左右去衡量平均使用率,這樣的話至少在5年之內可以平均波峰波穀情況,當然具體還是要看運營成本、空置率和平均使用時長等,從而保證智算中心在5年的運營週期中是可以盈利的。

但其實,中國的智算中心都還在前一、兩年的商業模式探索過程中,只是一個初始階段。隨著時間的推移,設備會折舊、算法會演進、波峰波穀會出現,很多的事情會發生變化,

然而另一個問題是,儘管我們可能沒有辦法完全預測未來這幾年的一個變化,但至少,我們現階段在第一步智算中心的建設裡面,遵照「誰來使用,誰來運營,誰來投建」這種合理的商業模式,合理的邏輯線,這是必須的。

鈦媒體:AI 和算力半導體領域都具有很長的週期性,也就是「長期主義」,但國內資本卻需要募投管退的短期需求,那麼,燧原如何在新的變局環境下解決長期和短線問題?

張亞林:這是非常好的問題。

這樣一個長期主義過程中,企業規模化、商業化爬坡時比較慢的,它需要更多產品迭代、生態擴充、客戶群的擴大,還有 AI 本身的技術趨勢不斷變革。

所以,我認為需要做到三個點解決變局問題:開源,節流,以及持續構建生態護城河。

一是開源。

通過產品不斷迭代,持續擴大收入,持續提高毛利,持續構建能落地、規模化的商業模式。收入一定要高速成長,毛利要穩健,商業模式要清晰。只有這樣,才能吸引更多長期主義資本的投資。中國也鼓勵長期資本的存在,能夠給商業面的持續增長信心的話,我覺得長期資本是願意陪伴你的。如果能穩健增長,你的商業模式不斷清晰,客戶群不斷擴大,你的自我造血能力不斷增強,長期主義的資本也會不停的加持你。

第二個是節流。

節流並不是一個反義詞。一個公司本身的組織效能、運營效能,反映了公司持續高效運作的一個根本。公司在發展過程中,一開始大家都比較有熱情、動力和活力,但隨著時間拉長,各種問題出現,很多公司就出現了各種疲態,甚至出現離職潮,這就是在擴大和成長過程中出現了組織問題。有些公司在規模化過程中也遇到了供應鏈問題,無法規模化供貨,也無法提升毛利,這都跟內部管理機制有關。所以企業一定要持續提升你的運營效率、組織效率,持續打造一個有戰鬥力、有活力的團隊,讓你的開發能力、開發效能提高,從而更好降低你的產品成本,提升你的毛利。

節流和開源是相輔相成的。企業需要在開源和節流層面做更多工作,讓資本、合作夥伴相信你能穩健運營公司。

三是持續構建生態護城河。

實際上,高科技企業都遵循了一個原則,就是如果前期(幾年甚至10年)的發展需要迭代的話,它其實是一個緩步前行的過程。所以發展的曲線的斜面斜率是比較平緩的,但是到了某個時間點之後,你會產生一個「拐點效應」,就是產品的爆發點,或公司實現規模化的爆發點,背後其實是取決於你的產品,取決於生態的基本面。而「生態」其實是一個廣義的生態,包含你的產品技術實力、泛化性、客戶群,生態夥伴的能力和加持力。所以,在一個企業的發展曲線過程中,通過積累和打磨,你的產品是否會出現一個拐點式的增長,實現高速式的發展,這其實是非常關鍵的。

因此,你必須要持續投入精力在生態構建上,持續的打磨產品,以及建立各種合縱連橫的商業模式,打造出生態的護城河,從而能夠突出重圍、穿越週期。

鈦媒體:AI 大模型算力背後最核心的是生態,相對於國外方案,燧原科技在國產算力生態當中面臨哪些挑戰?

張亞林:我們現在看到的生態有兩類:一類是技術生態,另一類是產業生態。

整條產業鏈其實是極其複雜的,它是 「一盤棋」。而對於技術生態來說,其實就是衝破原有生態的壁壘,找到國內的軟硬件技術夥伴進行泛化,不斷擴大。

實際上,從硬件算力,到技術軟件棧,再到整體部署開發,在 AI 領域,這一套東西其實就遇到很多挑戰。

第一個挑戰是完備性問題。整套技術底座能夠真正被開發者使用,因此,這裡面很多軟硬件模塊需要開發、擴大,這是一個龐大的生態系統。面對千萬計的開發者群體,你要加入的技術模塊就很多,包括編譯器、加速庫、框架、分佈式計算等一些專業詞彙的模塊,而每一個模塊都需要大量的人力和外部的生態夥伴一起來打磨,從而最終形成一個成熟、高性能、高效的底座。

第二個挑戰是易用性問題。大模型算力工具最終是提供給開發者,他們好不好用、易不易用、能不能成為生產力工具才是最重要的。當然,易用性也不是一蹴而就的,但隨著用戶量越來越高,反饋越來越多,產品迭代越來越多,越來越符合用戶的使用習慣,才能變得易用。

第三個挑戰是泛化性問題。在大模型之前,我們經歷了計算機視覺(CV)、自然語言理解(NLP)、推薦和廣告搜索等時期,AI 的泛化和基本面都是不斷變動的。這是一個很長線的過程,這是它的難度所在。

而對於一家本土AI 算力提供商來說,如何通過以點帶線、以線帶面打磨你的生態,一步步「泛化」到互聯網、金融、醫療、智慧交通等領域。這其實是一個生態打磨的過程,我認為這個過程沒有太多捷徑可走

回到技術生態層面,你如何堅持到生態拐點很重要。

同時,在數據中心產業生態層面,需要各種公有雲和私有雲,大模型廠商,以及集成部署運維運營商等生態夥伴齊心協力,才能夠把智算中心持續發展下來。因此,找到一個可複製的生態打法至關重要,需要不斷把生態「蛋糕」做大,形成商業模式的「閉環」。

鈦媒體:在你看來,如何定義通用人工智能(AGI)的未來?

張亞林:我認為,每個人心中都有AGI,有些人可能認為它和人一樣,有些人認為它是比人更高質量的一個智慧體。但是不管怎麼說,就是我們如何去漸進式接近 AGI 這個定義。

在我看來,AGI解決的一個終極問題是人的助手,或者是說如何更好的幫助人、解放生產力,以更好的方式進一步提升工作的質量和效率。

整體來說,AI 還是一個增效的作用,因為到目前為止,我們還沒有看到 AI 從增效到主導智能。

如果再往GPT-5、GPT-6發展的話,我們看到大型智能體的通用智能性越來越強,也就是跟人的智慧越來越接近。如果說GPT-4是高中生水平的話,GPT-5可能到研究生或者博士生水平。

AGI還是在一個正常的思考水平或者日常生活水平,需要基於一個人正常思維上進行判斷,而不是在更高的洞察力、靈感甚至抽像思維層面去判斷。所以,如果按正常人類思維判斷的話,AGI這種主動型 AI 思維模式逐步增強,最終還是跟人成為相伴的一個助手。

鈦媒體:當前形勢下,行業如何發力國產 AI 算力生態?

張亞林:整體來看,在Scaling Law法則下,我們確實在系統集約化上相對落後。第一,GPT-5的發佈開始停滯了,是否能像摩亞定律一樣不斷髮展,其實是一個問號;第二,完全通過Scaling Law進行 AI 訓練,模型才是最有效方式,需要我們從更多元的方式進行發展。

未來幾年會比較有意思,因為全球都會面臨能源製約、大模型系統複雜度越來越高、精準化模型和專家化模型發展等諸多問題的限制,所以在 AI 算力訓練部署上會發生一些變化。而中國垂直行業分工是最細的,應用的智能化程度遠超國外,因此以端側場景和人的接受度來推演,一定會倒逼 AI 推理部署往邊緣和端側發展,由此國內 AI 算力通過雲、邊、端一體化方式快速發展,未必完全受限於雲端算力。

所以,未來中國如何更好的部署端側、雲端 AI 算力,如何發揮中國在通信網絡分佈式調度措施,如何讓算力更加符合場景,如何聚焦大模型的精細化、行業落地以及雲邊端一體化,賦能基礎網絡,這些才是比較關鍵的。

在我看來,中國未來一定會在 AI 算力層面「百花齊放」。

(本文正選鈦媒體App,作者|林誌佳,編輯|胡潤峰)