Llama3.1根本賣不動!業內人士:開源模型成本反而更高

允中 發自 凹非寺

量子位 | 公眾號 QbitAI

Meta的開源大模型Llama 3在市場上遇冷,進一步加劇了大模型開源與閉源之爭的關注熱度。

據外媒The Information報導,Meta的開源大模型Llama 3一直難以在全球最大雲廠商——亞馬遜的AWS上獲得關注,AWS的企業客戶更傾向於使用Anthropic的閉源大模型Claude

據微軟內部人士透露,Llama也並非微軟的銷售首選,他們更傾向於將Llama推介給具備數據專業知識的公司,如內部有工程師和數據科學家的公司。

Meta現面臨挑戰,或將激發Meta自建AI產品的銷售團隊,直面企業需求。而這一系列問題也突顯了開源大模型在商業化過程中的困難。從市場選擇來看,開源模型的實際效果和商業回報或許均未能滿足企業客戶預期。

面對「開源還是閉源」的問題,國內的各大模型廠商根據自身的技術路線和商業戰略,形成了截然不同的立場。那麼,企業應如何選擇大模型,以及在兩者之間如何找到最佳平衡點?

在此背景下,百度智能雲AI與大模型平台總經理忻舟接受了媒體採訪,詳細解析了開源與閉源之爭的底層邏輯、商業策略,以及對未來市場的預判。

忻舟認為,大模型的開源和軟件開源有本質區別——開源模型因其並未開放訓練源代碼、預訓練和精調數據等影響模型效果的關鍵信息,所以無法像開源軟件一樣,靠社區開發者一起參與來提升效果和性能,而基座模型的訓練只能掌握在廠商自己手裡。

談及「開源模型和閉源模型誰更貴」時,忻舟表示,開源模型免費,給人一種低成本的印象,但大模型的應用並不僅僅是單一的技術,而是涵蓋「技術+服務」的完整解決方案,企業要算「總賬」。在業務實際落地時,開源模型若想達到與閉源模型相同的效果,需要後續投入大量的人力、資金和時間,綜合成本反而更高

開源模型和閉源模型分別適用於什麼場景?忻舟認為,開源模型更適合用於學術研究,但不適合對外提供服務的大型商業項目,在一些百萬甚至千萬投入的嚴肅項目中,閉源模型仍然是主角

「開源模型並不便宜」

以下為訪談精編全文:

1、大模型市場中,各家模型廠商都扮演著什麼角色?商業模式是怎樣的?

忻舟:在這場大模型盛宴中,每個廠商的定位和商業模式是不一樣的,大致可以分為三類:

第一類角色,對於雲廠商來說,商業模式其實還是賣算力資源。通過規模化來降低成本、提升資源彈性能力,從而實現盈利,這是雲廠商持久不變的模式。不管是開源模型還是閉源模型,只要託管在雲廠商這裏,雲廠商就可以賺到錢。

第二類角色,既是雲廠商又是模型廠商,他們希望通過模型的調用帶動業務上雲。目前只靠模型API調用的利潤還很低,他們目前期望在市場上佔據有利份額,在大模型的牌桌上,不斷尋找新的拓展機會。

第三類角色,對於創業的模型廠商來說,在各大雲廠商宣佈模型降價以後,他們的調用量下跌很厲害。大模型領域很快就會變成幾大雲廠商之戰,大模型創企要麼專注到特定行業、要麼做toB的私有化項目、要麼轉型做toC產品。

2、為什麼說「開源模型並不便宜,而且技術會越來越落後」?

忻舟:先說技術落後的問題。

第一、大模型的開源並不能帶來模型效果的提升

對比開源軟件,比如像手機操作系統安卓、數據庫軟件MySQL,這些開源軟件是所有的源代碼都開放出來,全社會的開發者都可以參與代碼的開發。這不僅可以降低軟件的研發成本,還能加快軟件迭代速度,提升軟件安全性,這是開源對於軟件的價值。

而開源模型要複雜很多,它可以開源的包括模型訓練源代碼、參數權重、訓練數據等。但目前模型廠商通常僅僅開源參數權重,而訓練源代碼、訓練數據等均未開源,這就導致開發者無法去改進它,也就無法對開源模型的效果做貢獻

比如對於Llama來說,它每一次模型效果的進步,其實都是 Meta自己訓練的結果,而不是開發者參與的結果。Llama2和Llama3在網絡結構上沒太大區別,它優化的是什麼?一方面優化了訓練階段的流程,比如說多階段訓練;另外就是加了很多數據,Llama2和Llama3的數據相差一個數量級,更多的數據和訓練時間為模型帶來更好的效果。

但這些好的效果都是Meta自己搞的,沒辦法把開發者的力量都用起來的,更不會像開源軟件一樣有社區反哺的過程。

第二、開源模型會越來越落後是因為沒有良性的商業模式保證模型持續迭代

模型訓練、數據標註是非常貴的,除非像Meta這樣有強大的公司資源用來支撐開源模型持續發展,如果是一個開源模型的創業公司,他就沒法形成商業閉環。同時,開發者又不能對你的模型效果做貢獻,所以創業公司來做這個一定是越來越落後。再從結果上來看,最好的模型其實還是Open AI,現在評測榜排在最前面的模型都是閉源模型。

再說開源模型為什麼並不便宜。大模型的應用是涵蓋「技術+服務」的完整解決方案,企業應用大模型需要「算總賬」。總賬怎麼算?

第一層,要算硬件資源成本。因為閉源的商業模型會配套相應的工具鏈,包括訓練工具鏈、推理工具鏈,這些工具鏈的性能要比開源的好,對於客戶來說,訓練就能省大概10~20%的硬件成本,推理的時候省得更多,業務規模越大,省得越多。

第二層,看模型帶來的業務收益。同等參數規模的模型,閉源效果更好,一些客戶對於90%還是95%的準確率敏感度沒那麼高。但是有一些業務,比如說商業廣告,在CPM、CTR差一個點,對廣告平台來說一天就可能有上千萬的出入,這種時候對模型的效果要求越高的企業,就更願意去買一個效果更好的閉源模型。

第三層,還有機會成本、人力成本。用閉源商業模型收斂得更快,就比競爭對手更快推出新的產品。在閉源的商業模型中,廠商把模型和硬件都適配好了,調到了最優狀態,客戶直接複製成熟經驗就可以。但如果你用開源,還要自己去適配調,投入的算力成本、工程師的成本更高。

所以我們說企業應用模型要「算總賬」,這個總賬算出來就會差很多。

3、為什麼在硬件成本上,開源比閉源貴那麼多?

忻舟:大多數企業客戶都會採買兩種或者兩種以上的硬件,因為他要考慮供應鏈的安全性和靈活性,開源模型如果要在每個硬件上去做適配的話,它的成本會非常高。

這就體現出閉源商業模型的優勢了,因為它可以通過規模化售賣,來分攤軟硬件適配帶來的成本。而且,多芯適配是一個非常有技術含量的事情,百度的百舸異構計算平台專門為多芯異構做了很多優化,對各種硬件都適配。百舸本身就可以屏蔽掉硬件層各種各樣的差異,有很多的加速庫、推理庫、訓練庫,百舸也為文心大模型提供了端到端的優化。

這對於客戶的好處是,不管用什麼硬件都可以快速跑起來,省下來的時間和人力成本是非常高的。

4、開源模型和閉源模型分別適用於哪些場景?

忻舟:總體的思路是:你想在個別業務場景中做嘗試、做驗證,可以先用閉源模型跑起來,開箱即用,快速驗證;在一些動輒百萬元、千萬元級別的嚴肅商業項目中,對規模化、精度要求高的業務中,閉源的商業模型還是企業的最佳選擇。只有在一些對效果和性能要求不高,但要求必須私有化部署,且對價格又特別敏感的業務場景下,考慮使用開源模型。

開源對於學術和研究的推動是有價值的,比如推理的工程性能優化、預訓練和精調數據對結果的影響等,如果他能夠開源更多的東西,比如說訓練代碼、訓練數據、指令微調的數據等也開放出來,它對於學術研究和技術發展的價值會更大。哪怕只開放了模型權重,也為研究者提供了一個很好的基座模型。

5、有些廠商希望開源閉源兩條路同時走通,即開源模型吸引用戶做大生態,閉源模型專門負責商業化,這個邏輯走得通嗎?

忻舟:如果沒有實踐過的話,看上去貌似是可行的。但實際情況是:

在公有雲上,各廠商公佈的調用量中,閉源模型調用量遠高於開源模型,說明開源模型其實在公有雲上並沒有起到吸引用戶做大生態的作用。而且在公有雲上做微調,開源或閉源模型都可以實現,所以在公有雲上客戶會直接選擇最好的模型。

在私有化部署上,這個邏輯在一定程度上是講得通的。很多企業最開始起步是拿開源模型測試,之後覺得效果不錯要買了,會選擇開源模型對應廠商的閉源模型,因為同源的模型對於prompt的適應性更好,這種情況這個邏輯是成立的。但這種價值正在逐漸的縮小。因為各廠商的模型通用能力都在快速提升,切換成本越來越低,逐步就抹平了這種模型的傳承性。

還有一些廠商推出開源模型是為了推廣硬件,比如英偉達推出開源模型,它的商業邏輯非常簡單,用模型要買卡。

6、百度為什麼一直沒推出開源模型?

忻舟:從各家廠商的調動量上其實已經明確看到,公有雲上調用量大的都是商業閉源模型,開源模型對公有雲並沒有太多影響。

而在私有化市場中,隨著客戶對大模型認知不斷提升,開源閉源逐漸不再成為關鍵因素。我在和很多大型企業客戶交流後發現,業務負責人要不要用一款模型有很多因素,按優先級排序通常是:效果、性能、安全、價格。模型開源閉源並不是決定性因素。

7、您提到企業在選擇模型時最看重的是效果、性能、安全、價格,百度雲推出的「千帆大模型一體機」是否正在嘗試一種新的軟硬一體的商業模式?

忻舟:目前,企業使用大模型還處在探索階段,非常需要低成本、開箱即用的產品來快速驗證大模型的使用場景和效果。「千帆大模型一體機」很適合當下的階段,因為在國內有很多私有化部署的需求,我們的一體機是開放的,各種各樣的硬件都可以做適配,集成了市面上所有主流芯片和模型。百度智能雲的千帆大模型一體機提供兩個能力:

第一,提供軟硬件適配的一體化平台,這個平台內置了文心大模型和業界主流的開源大模型、場景應用樣板間。對於熱門的開源模型也都做過適配和優化,用戶可以直接在一體機上面跑,無需自己去調模型了。同時,千帆大模型一體機可以提供從基礎管控、AI框架、模型訓練、預測推理、場景應用於一身的大模型軟硬一體解決方案,為客戶提供全流程的軟硬件服務。

第二,千帆大模型一體機因為做了端到端的性能優化,能夠把所有硬件性能都榨出來,所以性價比相當高。客戶可以以一個較低的成本快速使用。

在整體價格上,千帆一體機的價格遠低於分別採購服務器和大模型及平台,對於客戶來說能夠開箱即用

8、現在很多人覺得,光用基礎大模型不行,大家還是要做行業模型才能真正實現大模型的產業落地。那目前企業自己訓練一個行業模型要多少成本?

忻舟:成本很高。首先取決於要訓練模型的參數規模,這個成本是線性增加的。其次,取決於數據量有多大。最後,是你的數據標註成本。

你如果要從頭開始訓一個70b的模型,用雲的彈性資源可能需要3000萬。如果要訓參數量更大一點的模型,成本上億都有可能的。這還是有經驗的人去訓,如果沒經驗,中間走了一些彎路,成本就更高了。

9、這麼高的成本,企業如何判斷是否需要做行業模型?

忻舟:我們不建議客戶不管三七二十一的從一開始就做行業基座模型,收益怎麼樣另說,成本一定非常高。我們會幫助客戶先做需求分析。

比如說,畫一個坐標系,橫坐標是任務的敏感性,縱坐標是對行業數據的需求性。所謂任務的敏感性,是指場景是否與行業和業務強相關,比如醫療領域,都是相當專業的問題。縱坐標是對行業數據的需求性,行業越封閉、在公開網絡上的數據越少,就越需要做預訓練。比如醫療領域,需要把一些脫敏後的病曆信息預訓練到模型裡面。

通過分析,在這個坐標軸中,左下角既沒有行業特性,又不需要行業數據,就可以直接用通用模型,但右上角對這個行業的業務屬性有敏感性,又需要很多的行業數據,這個時候就需要做行業模型。

我們通常是建議企業分三步走。

第一步,價值驗證。初步建設大模型軟硬件基礎設施,構建初步的行業大模型。結合相對成熟的生成式AI的應用,快速見到效果。比如通過千帆大模型平台輕量版加上智能客服、企業知識管理、數字人等成熟的應用。

第二步,深入對接企業的各種應用。進一步完善大模型基礎設施,升級為千帆大模型旗艦版,除了大模型相關的訓練調優外,也包含了應用構建的平台。百度及生態夥伴深度參與到企業內部大模型相關培訓和運營中,構建技術氛圍、培訓相關人才,與企業一起攻堅深入業務的難題,給企業帶來更多價值。

第三步,全面創新和自主可控。企業已經掌握了大模型和應用開發的相關技術,也有了相應的人才梯隊,能夠更好的自主可控發展並開始全面創新。百度會作為長期技術支持和顧問,協助發展,並不斷為企業帶來新的技術和方案。

10、您對未來一年的大模型市場如何判斷?

忻舟:對於未來一年的發展趨勢我有三個判斷:

第一,多模態會成為市場新的熱點。

第二,基於大模型的應用會有一個大爆發,非常重要的方向就是Agent(智能體)。大模型如果只做「輸入、輸出「的規定動作,那會大大限制它的價值發揮,他應該更像人,可以使用工具、互相協同、規劃思考、反思迭代。它要跟各種各樣的組件、插件結合,才能滿足特定業務場景的需求,所以Agent會成為接下來各家模型廠商起量的關鍵。

第三,做企業應用的機會會變多,像知識庫、客服、數字人、輔助代碼編寫等場景。比如用大模型做代碼編寫,百度有一個產品叫「文心快碼」,在百度內部已經大規模應用了,採納率能達到46%,新增代碼中生成的比例達到了30%,可以幫助企業大幅提升開發效率。同時,大量做AI應用開發的企業將湧現出來,這些企業能夠將應用的部署和複製成本降到足夠低,只要運營效率夠高,就能脫穎而出。