崑崙萬維方漢:大模型的技術紅利在消退,商業模式創新者將成贏家 | MEET 2025

編輯部 整理自 凹非寺

量子位 | 公眾號 QbitAI

接下來,到底什麼樣的玩家才能吃上AI大模型的紅利

誠如大家所看到的那樣,即便是OpenAI這樣的「頂流」剛發佈了Sora,也未能對其他影片生成模型造成碾壓性的衝擊。

但遙想最初ChatGPT發佈之際,不僅在全球範圍內掀起一股技術新浪潮,更是吃了足足一年半以上的技術紅利。

因此,站在現在這個時間節點,剛才的問題是值得深入思考一番。

而就在前不久的MEET 2025智能未來大會中,崑崙萬維董事長兼CEO方漢便針對這個問題給出了他的答案:

AI大模型SOTA(State of the Art)的技術紅利變得越來越短暫,也將逐漸消退。

AI大模型產品需要關注「新」與「好」,商業模式能夠創新者將成為真正的贏家。

在現場,方漢基於崑崙萬維自身發展和入局大模型多年的經驗,以《智能邊界:AI大模型如何推動應用創新》為主題分享了他的所見所聞、所思所想。

MEET 2025智能未來大會是由量子位主辦的行業峰會,20餘位產業代表與會討論。線下參會觀眾1000+,線上直播觀眾320萬+,獲得了主流媒體的廣泛關注與報導。

核心觀點梳理

  • 用戶不關心內容是否由AI製作,他們只關心內容是否新穎和優質。

  • 技術紅利逐漸縮短,AI產品需要關注「新」與「好」,以用戶為導向實現商業價值。

  • AI公司需要從單純的工具提供者轉變為平台型企業,通過產品和商業模式創新來實現這一轉變。

  • 中國企業在算法優化和商業模式創新上投入更多精力。

  • AIGC技術能顯著降低創作成本,使弱勢文化國家也能創作高質量內容。

(為更好呈現方漢的觀點,量子位在不改變原意的基礎上做了如下梳理)

崑崙萬維的AI大模型發展之道

各位尊敬的來賓,大家好,我是崑崙萬維的方漢,今天我來跟大家分享一下,我們公司在AI大模型這一波浪潮中間,從技術到產品,我們的動作和我們對產品的思考。

首先簡單介紹下我們公司。

崑崙萬維公司2008年成立,主要在中國做網絡遊戲的研發,2015年上市之後開始轉型做出海互聯網平台。

從2015年到2020年,主要是把國外老的互聯網廠牌通過中國人強大的運營能力做大做強,其中包括全世界第三大瀏覽器Opera,還有海外的K歌軟件StarMaker等,都取得了很好的成績。

從2020年開始,我們開始做AI方向的大模型研發。2022年12月,我們發佈了國內開源的第一個13B的中文預訓練大模型。

目前我們有三大業務板塊,AGI與AIGC業務信息分發與元宇宙業務投資業務

我們在全球大概有4億月活躍用戶,海外收入佔比89.7%。在全世界100多個國家和地區都有業務,在20多個國家有我們的辦公室。

下面介紹一下我們在AI領域的佈局。

我們從硬件算力層到模型層到應用層都有投入,其實我們最關注的還是模型層與應用層。

在模型層,我們有語言大模型、多模態大模型、3D大模型、影片大模型、音樂大模型。

目前技術指標最好的是音樂大模型,這是國內目前唯一一家能夠跟國外音樂大模型Suno相媲美的音樂生成大模型。

應用層,我們在AI助手、AI遊戲、AI短劇、AI音樂方面都有投入。

2022年12月我們在開源了13B的中文預訓練大模型之後,2023年4月發佈了一個千億的天工1.0大模型。

2024年4月,我們發佈了天工3.0,其中音樂大模型取得了行業SOTA。

2024年11月20日,我們發佈了天工4.0 4o版和端到端的實時語音對話助手Skyo;11月27日,我們發佈了天工4.0的推理版本o1

我們的天工4.0 4o版本,端到端實時語音對話系統,主要是把語音對話模型的時延從原來外掛式的400毫秒降到100毫秒,這個對於C端應用是至關重要的。

天工4.0 o1版本是國內第一款具有中文邏輯推理能力的o1模型,其中一個系列也馬上要開源

這是我們的業務矩陣,在國內主要做AI搜索業務,在海外有AI遊戲、AI音樂、AI短劇和AI社交等業務。

我們國內的AI助手的產品也升級了,包括高級搜索、天工彩頁和天工寶典。

天工高級AI搜索功能是目前最懂金融、學術的AI搜索。

這是AI短劇平台SkyReels,它是全球首個集成影片大模型與3D大模型的平台。

值得注意的是,Sora已經正式對外發佈了,但是你們可以看到,Sora本身還是一個生成式模型。

國內的生成式模型有一個問題,用它來做實際作品的時候,要有一個很經典的動作,術語叫「抽卡」,就是同一個場景要用同一個prompt可能要生成10個甚至上百個影片,從中間抽出一個可用的影片。

也就是說,可控性是一個非常亟待解決的問題。我們走的路線是用3D大模型進行生成,再通過影片大模型進行轉繪,這樣可以做到一次成片,這個對於影片創作者來說把可控性大大提高了,不僅能夠極大降低用戶的使用成本,甚至還能極大地降低製作時間。

這是AI音樂。

AI音樂的大模型使用的數據量將近2000萬首訓練數據,眾所周知,人類有史以來總共才有4000萬首音樂,我們大概用了一半的數據量。

目前我們在海外有面向C端的流媒體音樂平台Melodio和麵向B端的創作平台Mureka

此外,還有AI社交產品Linky,DAU已經超過50萬。

SOTA技術紅利將消退

下面是我們在做探索過程中的一些商業思考。

目前很明顯AI大模型已經到了半場甚至下半場,企業選擇何種商業模式來進行自己的產品研發和推廣?這是一個很重要的問題。

首先,我覺得由於風險投資的差異,導致中美AI的創業環境的不同。

因為我們在海外做的業務非常多,現在全世界的AI創新企業只有中國和美國是最多的,但是中國的AI創業企業能夠拿到的融資與美國同行相比,少非常多。

可以看到,海外AI創業公司還有一大部分在做基礎架構,它們的B端應用,在醫療健康、法律、金融等方向比較多,中國企業反而可能2C、2B都比較多。

此外,Scaling Law到底有沒有放緩?爭論點非常多。但我覺得能夠看到一個很明顯的事實。

為何OpenAI推出4o?本質是因為訓練的Scaling Law已經放緩了,但是通過慢思考推理的Scaling Law又繼續湧現,所以你只要繼續加大推理時間,模型能力就會上升,這是從產品角度倒推的一個事實。

SOTA的紅利變得越來越短暫。

GPT3.5出來之後震驚全球,它的紅利至少持續一年半以上,但是像Sora正式發佈後,我看到很多評測對其提出了批評意見,比如,圖生圖做得比較差、人臉都生成不出來、文生圖的可控性不好。

也就是說,Sora在正式發佈之後,並沒有表現出對同類的其他一些影片生成模型的碾壓式的技術優勢,這樣導致了Sora的技術紅利能不能像ChatGPT3.5那樣持續很長時間?或者像Dalle3那樣壓根沒有吃到紅利?

在文生圖時代,做得最好的是OpenAI的Dalle3,但是由於種種原因,最後市場上吃到紅利的其實是Midjourney和Stable Difussion。

我認為,Sora有可能吃不到SOTA的紅利。

中國的AI企業,除了拿不到更多投資,還存在一個問題,在算力上受到極大限制。我們能拿到硬件的算力是比較有限的。這樣會倒逼兩點。

首先,中國企業在算法迭代上有極大的動機和投入,例如,Sora第一版本訓練用了將近5000—8000張卡,到中國第一個可用的影片生成模型算力是花了不到1000張卡,最新的一個開源生成模型可能只花了256張卡。

中國團隊在算法的優化和迭代上所花的精力應該是美國同行的很多倍,因為沒有辦法,沒有卡,這就是所謂的以軟補硬。

同時,中國企業還有一個巨大問題,生存壓力特別大。一部分AI企業得不到更多資金,另一部分AI企業即便能拿到資金,投資人對企業盈利的時間點和商業模式都有極高要求,所以中國企業都在思考,用AI如何快速地盈利?

大家可以看到,現在在全球市場上瘋狂買量的AI企業一定是中國企業,因為所有的中國企業都在拚命地打磨自己的產品的盈利模式,而不是像美國同行一樣有充足的資金去做更深層的工作。

AIGC技術能顯著降低創作成本

下面跟大家分享一下,文化平權和多語言帶來的藍海。

還是以Sora發佈為例,大家可以看到,Sora有一篇PR稿件標題叫《尼日利亞的Minna》,這是一個KOL,他用Sora創造了一個質量很好的影片。

正巧我也在尼日利亞待過很長時間,據我瞭解,在尼日利亞拍攝一部電影的平均成本大概是10萬美金,不到100萬人民幣,這樣導致尼日利亞當地根本沒有能力創造出與美國電影,不要說美國電影,甚至連印度電影都比不上的一個高質量的內容。

所以像尼日利亞這樣的亞非拉國家,他們能看的電影只有美國大片,為什麼?因為美國大片平均的製作成本在1億美金以上。

那麼,中國的大片什麼時候能與美國大片正面PK?何時趕上美國?中國的電影,票房上10億之後、單部拍攝成本上億之後,中國的電影才可以正面與美國電影PK。

到《流浪地球》這個級別,它的視聽效果與美國相比已經沒有差別了。這一切本質上都是用資金換來的。全球其他國家如果沒有這個資金,就只能看強勢文化的電影。

但是有了AIGC之後,包括內容生成,我相信以後單部大片的投資,從1億美金的製作成本很快可以降到幾百萬人民幣,甚至幾十萬、幾千元人民幣,這都是非常有可能的。

這樣的結果導致所有國家、所有弱勢文化地區都可以用AI技術來製作本國的內容。

與TikTok一樣,全世界人民都是用手機創作屬於自己的內容文化。我們認為AIGC技術的進步會極大降低所有人創作內容的門檻和所有人創作內容的成本。

這樣全球創作者的規模,包括電影創作者、音樂創作者、電視創作者、短劇創作者都會急劇擴大,這對中國平台型企業而言一定是非常大的優勢,這個過程中也會湧現下一代內容平台。

大家知道,去年AI公司里薪酬最高的是算法工程師,這個與我們最早進入互聯網時代的時候一模一樣,1995年一個程序員會寫HTML,每個月可以掙一輛奧迪出來。

但是今天一個程序員只會HTML,每個月連一個車輪子都掙不出來,這就是技術的迅速弱化。

中國互聯網最後真正賺到錢或者成長為巨頭的企業,大部分都是靠商業模式創新取得了成功。

對於用戶,他們根本不關心你的內容是AI做的還是人做的,只關心兩個點,內容要麼新,要麼好。

例如,眾所周知《黑神話》,這個遊戲的質量非常高,花了幾億元人民幣的成本、工業化的生產,創造出全世界一流的內容,這就是「好」。

對於其他沒有這麼多資金投入的企業來說,你的內容用戶怎麼會買單?那就要「新」。

再舉一個例子,同樣是遊戲領域,像重慶有一家公司,5個人,100多萬投入,最後做了一個戴森球計劃,賣了8億,就是在內容的形式上進行了創新。

我認為,對於AI產品來說,你只要關注你產品的形態是「新」還是「好」,這樣用戶才會買單。

對於大多數AI創業企業來說,產品形式上的創新才是擊中用戶的根本點,而不是說是不是AI、AI用了百分之多少。

對於所有AI創業企業來說,當下都處在比技術、比指標的階段。我覺得絕大多數AI產品都是偏工具類的軟件。在打造工具類產品時,一定要思考整個產品的宗旨是什麼。

例如,在手機剛剛出現的時候,有很多企業做了很多影片工具、美顏工具,其中有一家做工具類產品的公司,最後成長為中國的一個短影片的巨頭,他的產品叫「GIF快手」,就是把影片可以轉成動畫Gif,好在論壇上、聊天上去傳播。

對於今天的所有AI公司來說,我們現在做的都是工具,但我們一定要想,我們的工具怎麼樣通過產品模式和商業模式的創新,成為真正的平台型企業,而不是一輩子做一個工具。

基本上對於所有AI公司都一樣,要麼去捲通用人工智能,要麼通過AIGC為消費者創作更好的內容,讓消費者可以通過AI降低創作內容的門檻和創作內容的成本,更好地塑造和表達自我。

我也希望在座所有企業家和從業者能夠在AI時代大潮中抓住自己的時代紅利。

謝謝大家!