中國算力行業的突圍之道|甲子引力
如何提供算力「最優解」?
12月10-11日,由「甲子光年」主辦的「萬千流變 一如既往」2024甲子引力年終盛典在北京中關村國家自主創新示範區展示交易中心召開。
在12月11日下午舉行的《算力江湖:如何提供算力「最優解」》圓桌論壇中,來自算力和芯片行業一線的嘉賓們分享了他們對2024年算力行業的看法。在賽智伯樂投資合夥人蔡哲文的主持下,各位嘉賓為中國算力行業的突圍之道提供了深刻的見解。
賽智伯樂投資合夥人蔡哲文
首先各位嘉賓分享了對2024年國內算力和芯片行業的直觀感受。北電數智CMO、戰略與市場負責人楊震認為,算力中心建設在今年迎來重要轉折點,從過去的大規模快速擴張階段,逐步向持續建設與高效運營階段過渡。在芯片領域,國產算力第一梯隊已初步成型,在特定模型訓練及推理場景應用中,已能夠實現從基礎可用到優質好用的關鍵轉變。
北電數智CMO、戰略與市場負責人楊震
行雲集成電路創始人季宇從芯片行業視角出發,指出2024年度行業發展的顯著特徵是從訓練向推理的重心轉移。隨著大模型應用的逐步落地,國內模型在性能上已基本追平GPT水平,芯片行業競爭焦點也隨之向推理領域傾斜。
清程極智CEO湯雄超表示,國產算力的發展速度超出預期,隨著國產算力生態的日益完善,越來越多清程極智的客戶開始嘗試採用國產算力資源,並取得了令人滿意的效果,部分國產芯片客戶已啟動上市籌備流程,充分彰顯了國產算力巨大的成長潛力。
清程極智CEO湯雄超
九章雲極DataCanvas聯合創始人暨CTO尚明棟提到,智算中心建設呈現出迅猛發展的態勢,但同時也引發了關於算力泡沫的爭議。從算力消納的實際情況來看,眾多企業對於低價格、高彈性算力的需求尚未得到充分滿足,市場供需關係存在結構性失衡,這迫切需要專業算力運營商的大力支持與協同發展。
在算力調度提升資源利用率與降低成本方面,楊震分享了北電數智的創新實踐,例如在異構算力協同方面,構建統一通信庫、全面補齊算子庫並實現自動調優,同時開展算法加速工作。
湯雄超介紹了清程極智的系統軟件解決方案,例如在系統軟件層面,從底層編譯優化、上層調度管理、內存管理到網絡優化等多個通用維度入手,同時充分挖掘國產算力適配的潛在優勢空間。針對不同規模客戶,清程極智也設計了靈活的成果交付模式。
據尚明棟介紹,九章雲極DataCanvas借助Alaya NeW平台實現了算力彈性調度,成功將算力的佔用與使用進行解耦,避免了傳統模式下算力在佔用期間無法被其他用戶複用而造成的資源浪費現象。同時九章雲極DataCanvas推出了「算力包」產品,改變以往裸金屬按時間收費的傳統方式,基於計算量進行計費,極大地提高了用戶的算力使用率。
九章雲極DataCanvas聯合創始人暨CTO尚明棟
針對從可用到好用的過程,季宇強調行雲並非簡單追求芯片價格的降低,而是借鑒PC產業興起的成功經驗,以英特爾8086處理器為例,致力於在顯存維度實現極致優化,即便在一定程度上犧牲算力性能,也要確保芯片價格能夠降至消費級水平,從而讓用戶在端側和雲端都能以較低成本獲得高質量的模型體驗。
展望2025年算力和芯片市場,楊震期望更多智算中心能夠在持續建設的基礎上實現有效運營,不僅能夠滿足模型訓練需求,還能靈活應對推理任務需求,形成具有中國特色的國產算力市場格局。
季宇表示,希望在未來一兩年內,能夠複刻當年X86架構推動PC和互聯網興起的輝煌歷程,在算力行業成功實現從傳統架構向新型高效架構的轉型,開啟算力行業發展的新紀元。
行雲集成電路創始人季宇
湯雄超堅定地認為,國產智能算力行業將繼續沿著集群化和國產化的兩大發展趨勢穩步前行,隨著技術創新與生態建設的不斷推進,國產算力生態也會越來越繁榮。
尚明棟樂觀地預測,隨著算力生態的持續優化完善以及國產GPU廠商技術的快速迭代,模型微調和推理階段的增長速度將實現指數級提升,為人工智能在各行業的廣泛應用提供強大的算力支撐。
以下為圓桌論壇的全部內容,經過編輯整理:
蔡哲文:各位嘉賓,大家好。首先要感謝「甲子光年」為我們準備了這樣一個議題。這個議題非常貼切——所謂的江湖,充滿了刀光劍影。今年最後一個月,行業仍在連續曝出許多新聞,比如Google發佈了最新的量子芯片,英偉達因為涉嫌反壟斷被立案調查,算力議題在今年最後一個月還是這麼熱鬧。
從我們的角度來看,算力可能會逐漸融入我們每個人的生活,就像我們今天使用自來水、電力和互聯網通信一樣,未來算力也可能成為我們生活的一部分。在當前階段,甚至有一個論斷叫算力等於國力。談到AI,很多時候也是和算力掛鉤的。今年我看到的數據顯示,全國新建的智算中心超過250個,總投入達到萬億級別。算力中心的數量、國產算力芯片以及整個算力芯片的市場量級也在不斷提升。
但是在這樣的大背景下,中國的算力行業其實也存在一些挑戰,包括算力的供給與需求存在錯位,部分地區智算中心的實際運營與規模構想存在很大的差異。
今天我們邀請到了四位算力和芯片行業優秀的從業者,來給我們分享對整個算力行業的見解,共同謀求整個行業的解決方案,讓算力從可用變得好用,實現算力產業的高質量發展。
首先我們請各位嘉賓進行簡單的自我介紹,同時講一講我們所在公司今年的重要進展。有請楊總。
楊震:大家好,我是北電數智的楊震,負責戰略和市場。北電數智是一家非常年輕的人工智能國企。在這一年我們首先做出了混元異構的算力調度軟件,並且也做出了芯片和模型層、芯片和框架層的適配平台,目前能夠讓9種芯片和23個基座大模型進行普適的交叉適配。我們馬上還要推出訓推平台,也推出了可信數據空間的產品,與11月國家公佈的《可信數據空間發展行動計劃(2024—2028年)》相契合。
以上是軟件層面。硬件層上,我們今年年底馬上建成北京市在五環之內唯一的E級智算中心,叫作北京數字經濟算力中心。第三件事就是我們從今年1月23日開始,我們也建了一個江湖,叫作AI江湖。不同於剛才哲文總提到的算力江湖,我們所建的江湖包括一系列的閉門會、開門會,把我們同行的夥伴們聚在一起進行思想碰撞。我們相信在全新的時代,人工智能充滿不確定性,每一位從業者其實都是江湖中的英雄,因為大家都充滿了勇氣。謝謝。
季宇:大家好,我是行雲的創始人季宇。行雲是一家非常年輕的公司,也是今年剛開始起步的國產芯片新公司。在這樣一個時間點做芯片,也是為瞭解決很多嘉賓都講過的算力降本問題。在大模型時代,為了讓AI變得普惠,讓大模型應用成本不斷下降,我們想從芯片出發,做一款在顯存維度非常極致的GPU芯片來滿足這樣的需求。也希望通過我們的芯片能夠把AI的成本變得非常低,成為人人都用得起的芯片。
湯雄超:大家好,我是清程極智的CEO湯雄超。清程極智是去年這個時候成立的AI Infra企業。我們所聚焦的是通過核心的基礎軟件賦能國產算力,為整個人工智能行業帶來高性能、低成本的算力系統。具體來說,我們主要會提供面向大模型訓練和推理場景的軟件解決方案,過去一年里,我們在技術產品和商業化上都取得了比較好的進展。
在技術上,我們對大規模並行訓練系統「八卦爐」做了進一步打磨和升級,目前已經適配了好幾款國產算力芯片,可以在大規模的國產算力集群上實現模型訓練。在推理側,我們今年拓展了適配的國產芯片種類,進一步提升了絕對性能和性價比,在很多場景下已經可以跟國外的主流方案相比較。商業化方面,我們已經和許多國產芯片公司以及國產大模型公司達成合作,希望在未來繼續攜手行業夥伴共同建設國產的算力生態。謝謝。
尚明棟:大家好,我是九章雲極DataCanvas的尚明棟。我們公司是一家人工智能基礎設施提供商,圍繞智算中心進行建設和運營,今年我們有五個智算中心投入運營。我們依託今年發佈的Alaya NeW平台,在我們的智算中心裡既提供彈性的算力,同時又有完整的,從訓練到推理的大模型工具鏈支持上層應用。我們致力於提供低門檻、低價格的普惠算力。謝謝大家。
蔡哲文:今天我們的四位嘉賓包含了算力的各個維度。其實這兩年,特別是今年,如果說要評選一個熱門詞,我覺得算力即便不是第一,至少也是第一梯隊。到了年末,各位能不能夠用一兩句話來針對2024年國內的算力和芯片行業,聊一聊你們最直觀的感受,還是從楊總開始。
楊震:我們正在建北京數字經濟算力中心,包括剛才也提到今年國內出現非常多算力中心,所以我認為今年是一個分水嶺,從前幾年的「大幹快上」,到現在應該進入所謂持續建設、有效運營的階段。這是我的第一個觀察。
第二,芯片行業整體向好,因為有壓力就有動力。我們看到國產算力的第一梯隊已經形成,而且隨著推理需求的展開以及自身的性能,包括我們做軟件層、加速層這些方面的努力,在一定參數量以內的模型訓練以及各種的推理場景上,國產的能力已經跟上來了,實現了從可用到好用的轉變。
季宇:從芯片行業來看,今年最大的特點是從訓練轉向推理,隨著大模型的很多應用開始嘗試落地,包括預訓練上面,其實國內的模型也基本追上了GPT的水平,越來越多的應用探索開始展開。所以大家也從過去競爭訓練芯片的維度,慢慢轉向推理維度。訓練跟推理有很多差異,這些差異其實也給國產算力芯片提供了很多新的可能性和機會。我們也希望在這樣的情況下,在滿足未來更加宏大、增長更加劇烈的推理需求上,能夠把握住國產芯片新的可能性。
湯雄超:從清程極智的角度來看,今年很明顯的感受是國產算力的發展超出了我們的預期。一方面,是隨著國產算力生態的不斷完善,非常多客戶,無論是要做大模型的訓練,還是大模型的推理,都開始願意嘗試國產算力,最終也取得很不錯的效果。清程極智也有很多客戶是國產芯片公司,最近也瞭解到有不少客戶已經啟動上市流程,這也讓我們非常堅定地認為,國產算力未來有非常好的成長空間。
尚明棟:涉及智算中心,我們今年能看到,智算中心的建設處於高歌猛進的狀態,這也是為什麼大家會感覺到算力有可能會有泡沫。但是我們又聽到了相反的聲音,就是從算力消納上,依然有非常多的企業對於低價格、高彈性的算力處在需求不滿足的狀態,我們看到了供需市場上結構化的失衡。這需要中間有算力生態和算力運營商的支持。後續我們可以展開討論。
蔡哲文:我自己是做投資的,做投資有一個天然的秉性,就是要樂觀看多。所以我顯然非常看好算力。我大概簡單總結一下,楊總提到了「大幹快上」,季總提到從訓練轉向推理,湯總提到了國產算力的佈局,開始用國產去替代國外,而尚總提到了我們接下來要討論的問題,就是如何在看多的過程中擠泡沫。外界確實也有潑冷水的,比如高盛的分析師提出全世界一兩年內在算力投入不止有幾萬億美元,美股打造出了「算力七姐妹」,每家的市值都突破了萬億美金。但這麼多資金給算力投下去,目前來看,對於GDP的拉動,整個就業市場和創新市場也好,都沒有很多商業化的回饋,所以這裡面存在很大泡沫。在座的四位一線從業者如何看待AI的泡沫化?
楊震:其實我們看2023年,整個人工智能行業,包括算力層、模型層和應用層的話,90%的收入來自算力,7%是來自模型,3%來自應用,這是全球的數據,但投資就基本反過來。大部分投資走向模型,其次是走嚮應用,少量流向算力。我認為是人工智能時代相對於信息IT時代,它更厚重,層次更多,所以需要逐步轉化。
第二,算力究竟是泡沫還是需求不足?我同意明棟總說的結構性矛盾。之前智算中心的「大幹快上」,其實就是建設,堆服務器和芯片,目的是應對模型訓練。通常模型訓練的廠商知道怎麼用芯片和智算中心,所以沒問題。但當下模型訓練放緩,其實就出現一個核心問題。超大規模智算中心是為了模型訓練而建,但是模型訓練三個月後,很多智算中心就要關機斷電。大家會問為什麼它不轉向推理?因為智算中心強調極致算效,極致能效,算效之於訓練和之於推理是不一樣的。
細看推理部分,我們還可以切分成海量推理,包括互聯網用戶;還有高頻推理,比如說交通等領域;此外還有低頻推理。不同的領域對智算中心提出完全不一樣的運營要求,包括調度策略,如何使用多模態模型、模型融合策略等等,都是不同的要求。
而且大模型訓練階段更看重如何快速解決問題,但在推理時代,首先要解決首字延遲的問題,同時還要解決解碼延遲問題,這些都解決掉了,就可以繼續解決提升吞吐量的問題。
而且海量推理時,我要琢磨冷啟動等,它對整個智算中心的服務,包括生態能力上,都提出完全不一樣的需求。原來只為了模型訓練而建的智算中心,無法面向中腰部的互聯網客戶,甚至個人開發者和團體提供非常敏捷、普惠的算力服務,這也是為什麼我剛才提到說我們看到分水嶺,從今年開始非常多智算中心進入所謂持續建設,有效運營的階段,做智算中心一定要懂芯片、懂模型,而且要懂數據。
現在模型訓練暫緩,最主要的原因可能也是因為開源數據集的枯竭,同時我們也看到大量的專項數據其實握在政府手裡,大量產業數據、行業數據握在企業手裡。這些數據如何有效釋放出來,也需要相應的技術和工具。這也是我們佈局可信數據空間的原因。這三層搞明白了,然後對外提供普適的模型服務、工具鏈和套件,包括一些垂類模型,場景以及數據的打開,才能夠通過這些燃料把整個人工智能生態培養起來,之後智算中心就會得到自然的消納。
回到一開始說的,其實主要還是結構性矛盾。有人有擁有算力的困惑,也有人有用不到算力的難處,需要把各層能力建起來才能解決掉。
季宇:我從芯片行業講一個不一樣的視角。其實今天我們看到很多的應用,也看到了模型成本在軟件,包括調度層面不斷下降。但是從芯片的角度來講,今天的AI基礎設施其實跟上個世紀80年代的大型機非常像,智算中心裡面用的很多服務器也好,芯片也好,都是非常昂貴的,雖然大家努力使它的利用率變高,讓它的效率,包括個調度優化變得越來越高,但它的底座其實很像大型機。現在下遊的應用需求非常旺盛,就像上世紀80年代一樣,計算機本身可以對人類社會帶來巨大的影響,同樣今天的AI也可以。而最終讓整個互聯網產業還有PC興起的,最重要的還是它的底座,也就是X86。
從芯片的角度,今天更重要的並不是去做越來越強的大型機,整個計算機的形態一定要像類似於從大型機到X86這樣的轉變,才能促成AI產業和互聯網產業的繁榮。
這是我們這家公司希望去推動的事情,在大型機的基礎之上落地AI產業跟互聯網產業,它永遠存在巨大的結構性矛盾。剛剛哲文總講的巨大的泡沫其實也一樣,如果家家戶戶都能用上PC,那算力的投入會非常大,大家對於算力的需求也會膨脹。但這樣的需求反過來也有可能殺死這個行業,所以我們一定要推動從大型機往PC的轉變,往X86的轉變,才能更好地促成這件事。
所以我們也希望去攜手在座的各位嘉賓,包括生態的上下遊,一起來往這樣的目標推動,才能更好地把泡沫擠掉,走向落地。從芯片的角度,很多芯片都在往怎麼做更好的大型機角度去思考,但我覺得,如果我考慮怎麼做好一個服務於今天的PC,還有互聯網的X86,其實更有意義。
湯雄超:我非常讚成楊總和季總的觀點,現在算力的供給和需求是結構性的矛盾。從清程極智的角度來看,有效的算力供給是不足的。可能大家會看到很多新建的智算中心使用率不是特別高,但它並不是無人問津的,而是大家缺算力,後來去智算中心看了,發現不太能用得起來,所以最後沒用。本質上是因為算力在硬件上已經建好,但還缺乏軟件生態上的連接,讓客戶覺得沒有辦法達到開箱即用的狀態,那他們可能會去選擇其他解決方案。隨著算力軟件生態的成熟,包括我們前面提到的整個AI算力需求的增長,最終整個市場會回歸更加健康的狀態。
尚明棟:大家說的AI算力的泡沫化,可能視角來自不同的地方。一個視角是經濟,大家投資算力的建設,希望獲得對應的回報,這些回報最終可能體現在投資方的回報以及落地場景的回報。現在我們都知道建智算中心,如果算力供給沒有問題,建智算中心的週期可以非常短,差不多三個月,幾個億的投入,1000P,2000P的算力其實就可以建設起來。但是真正從消納的角度來說,它需要一個生態,這個生態既有地方生態,也有行業生態,而生態的建立需要一些時間。現在來看,投入和產出上出現了階段性的失衡,這是我們當前處於AI生態建設的階段所導致的,我們需要更長時間完成完整的生態建設。
第二,很多企業覺得一提到算力建設就有非常大的數字,200多個智算中心,折合成算力也是幾十萬P的算力,但是從實際需求上來說,又覺得門檻過高。大廠的能力比較強,他們會自建,同時他們的技術能力也比較強。他們有了這些智算中心的裸金屬,可以自己在裡面搭框架,建設infra,對他們來說技術門檻是比較低的。但是對於一般的技術型企業,如果從頭開始去用算力,找到對應的場景,並驗證對他們行業的價值,門檻會非常高。所以中間也需要基礎設施這一層,讓算力更好地唾手可得,或者說成為成本比較低的基礎設施。現在看這還需要一段時間,也需要我們整個行業生態的共同進步。
蔡哲文:感謝四位嘉賓的精彩發言,乾貨非常多。我總結一下,尚總提到目前的核心問題在於生態尚未完全建立,即使存在泡沫,一旦生態成熟,這些問題將不再是障礙。湯總的觀點是,算力資源雖然豐富,但如果軟件層面不支持,這些算力也無法發揮作用。因此,我們需要軟件來像開鑿運河一樣,讓算力流動起來。
季總的觀點,我用一個形象的比喻來說明,他認為我們已經進入了智能手機時代,但目前的硬件設施卻還停留在大哥大的水平,與時代發展不匹配,需要進一步改進。楊總則指出了一個現實問題,即算力分配的不均衡,有的人算力過剩,而有的人卻極度缺乏,這表明算力調度存在很大的問題。
接下來,我想針對三位在算力調度領域的創業者提出一個問題。在提高算力資源利用率和降低成本的過程中,是否有一些創新的產品、運營模式或技術可以與大家分享?我們還是從楊總開始。
楊震:我覺得大家的很多技術路線也類似,因為目標都是要提高算力的利用率。我們今年更多是在異構算力的協同作戰上做了一些工作,為了讓不同的國產算力集群能夠協同作戰,也可以和進口算力協同作戰,其實有很多細緻的工作要做,比如為了和模型進行普適的交叉適配,要建立統一的通信庫,算子庫的全面補齊,自動調優。為了實現整體性能提升,我們也做了算法加速的相關工作,包括像稀疏數據集的優化等等。目前在我們的異構調度軟件納管下,國產芯片通過算法加速,可以將首字延遲優化10倍,解碼延遲優化10倍,在推理的表現上,吞吐量可以提升30倍。基本一般芯片性能上能提升2到3倍,那吞吐量能夠提升8~9倍。這是我們做的第一件事情。
第二,我們把所有的芯片集群打散,只要是在同一個計算中心裡面不同集群它依然可以看作一個整體,成為一塊巨大的虛擬的GPU。一塊巨大的虛擬GPU就相當於解決裸金屬租賃的算力冗餘和使用方的不平衡,是非常精細化的運營方式。初步估算,智算中心使用我們的軟件,生產效率可以提升50%。我們也在繼續攻關潮汐調度的策略,進一步實現100%的效率提升。和裸金屬租賃相比,用我們的軟件可以做到100張卡等同於原來150張或者200張卡。
同時我們還無形中解決另一個問題。國產芯片有自己的擅長之處,但可能不能做到全領域的任務支撐。但形成多級混池和混元異構後,就可以對外無差別提供算力服務。兩週前我們推出了國產算力POC平台,也是場景驗證平台。我們邀請場景持有方,無論金融、醫療、政務等各種行業場景都可以在這個POC平台上來體驗國產算力的高質量服務。
另外剛才提到可信數據空間,因為國家已經頒布了未來三年的計劃,我們認為數據是大模型的燃料,可信數據空間從側面也可以有效支撐更多模型訓練,這個是我們做的事情,謝謝。
湯雄超:清程極智做的是系統軟件,包括底層的編譯優化,到上層的調度,或者說內存管理、網絡的優化等,這些是比較通用的。另外如果從進一步降低算力成本的角度來看,對國產算力的適配還有非常大的空間,因為國產芯片性價比上很有優勢。
怎麼樣把提升算力的利用率,降低算力成本的成果交付到用戶手裡?剛才提到的優化技術都是公開的,學術界論文講過很多次了,但難點是如何讓客戶真正用上。對於我們來說,大型客戶我們可以直接做軟件的授權交付,讓他們在自己的集群上安裝部署。對於中小型客戶,安裝部署系統軟件比較有門檻,那麼可以使用清程的推理雲平台(MaaS)部署模型,這樣客戶在無形之中就已經獲得了高利用率、低成本的算力,甚至用上了原本自己很難用起來的國產算力。
尚明棟:此前數位嘉賓均有提及,當下有相當規模的群體認為算力仍具備較大提升空間,就算力而言,一方面其價格偏高。價格較高的部分原因在於,如之前所探討的,綜合算力的使用率較低。一次性投入成本高昂,而實際使用率,據目前運營數據顯示,多數情況下,從完整週期的平均使用率來看,甚至低於 20%。這意味著近 80% 的算力被浪費。如何助力企業避免算力浪費,是算力運營者與消納者當下主要的努力方向。
我們九章雲極DataCanvas依託Alaya NeW平台,首先運用Serverless技術,完成算力的彈性調度,實現算力的佔用與使用解耦。以往算力雖然使用率低,但佔用率高,因算力被佔用期間無法再供其他用戶複用。如今借助Alaya NeW,進行算力資源的高效調度與管控,可以解決上述問題。
此外,在模式創新方面,以往多數前期算力使用者採用裸金屬方式。裸金屬方式會鎖定資源,按時間計費,通常有長租協議,如 6 個月、12 個月或 18 個月。如今我們可以將算力流量化,轉變為「算力包」形式。類似於運營商的流量包,依據算量收費。畢竟模型訓練精調、推理等本質上皆為計算集合,所以基於計算量來收費,就可以幫助我們的用戶快速提升使用率。多謝。
蔡哲文:季總,現在不能將您冷落了。他們三位,在我看來,應該算是您的潛在客戶或潛在合作夥伴,所以先請他們發言,讓您稍作等待。現在專門為您準備一個問題。請您從行雲的角度,講講公司芯片技術是如何從可用發展至好用?
季宇:我簡要介紹一下。其實正如我之前所說,重點並非打造一顆與智算中心常用芯片規格參數相近但價格稍低的芯片,因為那樣可能依舊是大型機的形態,極為昂貴。每台機器價值不菲,運行較大模型時會顯得極為奢侈。回顧大型機歷史,其價格基本在幾十萬美金至幾百萬美金以上,消費群體極為狹窄,僅有少數大型企業能夠承擔。當然,這些大型企業可以提升利用率,使其更具普惠性。實際上,我們更多思考的是PC產業的興起歷程。例如英特爾8086處理器,當時價格已降至幾百美金,首款PC售價約1500美金。而此前IBM出售的最便宜計算機系統約在1萬美金以上,這顯然無法成為PC的基礎,因為它一定會集中化、特定化,僅能服務於支付得起該價格的用戶。並不是說此類產品對雲毫無用處,互聯網亦是如此。
往昔互聯網服務器價格並非如今這般昂貴,當時採用組裝機模式,用戶可定製計算節點、存儲節點等各類節點,價格可降至10萬塊錢上下,而非如今頂配算力服務器動輒上百萬,甚至如今高級機櫃起步價便可能上千萬。並非說上千萬的機櫃不如幾百個甚至上千個廉價芯片,而是其可降低行業門檻,一旦門檻降低,便會引發諸多連鎖反應。
如果PC產品能讓所有人消費得起,推理算力就可以直接置於終端。對於應用創業者而言,如同過去軟件行業,可一次開發、零編輯成本部署。同理,構建互聯網應用時,如果服務器價格降至極低水平,互聯網應用邊際成本便可大幅降低,轉向流量經濟模式。例如,使用AI點一杯咖啡,無論token成本多低,人們總會覺得需為此付費。但若成本降至閾值以下,便可能免費,甚至日常瑣事皆可借助AI完成,此時推理成本就可以從咖啡消費中獲取。
所以我們並非簡單地將現有芯片價格降低,如同PC未完全複製IBM大型機的所有功能,英特爾也沒有什麼黑科技,可以將上百萬美元的產品用幾百美元製造出來,其中存在諸多取捨。
所以我們更多期望聚焦於大模型極為關鍵的顯存維度,將其做到極致,讓人們能以消費級價位擁有高質量模型體驗,無論是在端側還是雲端,皆可創造無限可能,這便是我們整體的目標。換言之,其中存在取捨,我們不會打造一顆算力超強的芯片。
在芯片行業,既要又要難以實現,但若在某一維度做強並降低價格,即便犧牲部分算力,亦能解決計算問題。例如,Google曾採用大量X86構建互聯網基礎設施,但如果是採用購買幾台強大小型機或大型機的方式提供服務,整體服務能力會較差。而採用大量廉價X86組裝機搭建,雖然單個機器可靠性極低,但可通過軟件層面解決可靠性問題,即部分機器掉線亦不影響整體業務,進而構建業務的魯棒性。
回顧過去的PC與互聯網,再看如今,對於算力而言,當下更關鍵的並非算力集成度高低,而是算力價格。我們知曉,高端數據中心處理器的算力性價比甚至不如消費級遊戲卡。但當面臨高端應用需求時,遊戲卡又難以勝任。因此我們要找到平衡點,打造如遊戲卡般廉價但顯存維度極強的芯片。這需要與台上三位嘉賓協同合作完成。正如當年 Google在集群層面通過軟件保障可靠性,使廉價但性價比高的硬件得以發揮作用,推動互聯網行業發展。我們亦期望提供這樣的硬件與芯片選項,與產業界各方攜手合作,將此事做成。
蔡哲文:我們最後一個問題。現在是24年的12月,請每位嘉賓用一句話來說明自己對2025年整個算力和芯片市場的期待和展望?
楊震:25年就像剛才說的,我們希望更多智算中心能夠進入持續建設、有效運營的階段。不僅只用於訓練,也可以應對推理。算力層面,希望國產算力行業能夠短板互補,長板更長,形成有中國特色的國產算力市場。
季宇:希望未來一兩年時間內,能把我們剛剛期望的在過去X86使得整個PC還有互聯網興起的起點,在未來一兩年逐漸成為現實。
湯雄超:清程極智創立的時候,我們對算力行業有兩個判斷,第一是集群化,需要越來越大規模的算力。第二是國產化。用一句話來總結我們對明年的展望,我們維持這兩個判斷不變,同時我們相信國產算力生態會越來越好。謝謝。
尚明棟:隨著我們算力生態的完善,以及國產GPU技術的快速迭代,我相信模型微調和推理階段很快會迎來新的摩亞定律,它的增長速度將不再是一倍,而是以指數級的增長。謝謝。
蔡哲文:最近我在讀第三遍基斯·米拿的《芯片戰爭》,讓我非常有感觸的是,矽谷的創新其實是雙驅動,市場驅動加技術驅動,而且所有的創新都不是在計劃之內。我覺得這個時代最大的創新就是人工智能,也非常有幸和四位非常優秀的從業者同台,你們是中國算力和創新的未來。謝謝。