中國大模型創業風潮:應用創新是下一個突破口

從去年的ChatGPT,到今年的Sora,國內對於大模型的討論居高不下。

過去一年以來,資本市場也在試圖挖掘出“中國版的OpenAI”。在巨頭注資下,月之暗面、智譜AI、百川智能等國內AI創業公司正迅速成長為大模型領域的獨角獸。

無一例外,這些企業都聚焦在大模型本身,這也是去年初大多數企業的創業方向。百模大戰、千模大戰的喧囂之後,行業也面臨著泡沫和洗牌。有投資人向21世紀經濟報導記者表示,通用大模型的創業窗口已經關閉。

面對這樣的行業格局,創業者們紛紛將目光從大模型本身轉向了更為落地的商業化應用。2月25日,僅成立3個月且只有3名員工的“AI+遊戲”應用公司“奇酷網絡”正式對外宣佈:以3000萬元人民幣的估值,成功獲得500萬元人民幣的融資。

AI時代的應用競賽已經開始,在大模型的基礎設施和技術逐漸成熟的過程中,應用創新顯然將成為下一個重要的突破口。業內有觀點認為,2024年或是AI大模型應用的浪潮年。

“去年處於一種‘疊加複雜態’,投資人和創業者都摸不清方向,同時欠缺基礎保障,”OpenCSG創始人陳冉向記者表示,“今年來看,創業者對於自己可以做什麼都更加明確。”

雖然大模型技術的發展並未到達天花板,但其帶來的機遇和變革都被業界普遍認同。對於國內的大模型創業者來說,2024年確實是一個路徑更加清晰的起點。

圖片來源:IC photo圖片來源:IC photo

風口吹出獨角獸

就在前幾天,一場AI界的巨額融資引發多方討論。國內AI創業公司月之暗面,於近期完成新一輪超10億美元融資,投資方包括紅杉中國、小紅書、美團、阿里,老股東跟投。

據悉,此次融資被視為自ChatGPT爆火以來,國內AI大模型公司獲得的最大單輪金額融資。在本輪融資後,月之暗面的估值已達到約25億美元,成為國內大模型領域的頭部企業之一。

很難想像這家獲得巨額融資的公司成立還未滿一年。這不僅體現了月之暗面自身的實力和潛力,也反映了國內大模型初創企業整體的發展態勢和資本市場的動向。風口給了創業者機會,據統計,截至2023年11月20日,2023年有14家人工智能公司在一級市場獲得了1億美元以上的融資,其中,基礎大模型的初創企業被更多地看見和關注。

例如,成立於4年前的智譜AI於去年宣佈融資額達到25億元人民幣,估值超過百億,投資方包括社保基金、阿里、騰訊、高瓴等知名機構。該公司是國內最早研發大模型的企業之一,在當時存在BERT、GPT和T5等主流預訓練框架之外,提出了GLM(General Language Model)算法框架。

“想要追趕,你不能簡單踩著別人的腳印往前走。”智譜CEO張鵬向21世紀經濟報導記者表示,從呈現效果上GLM-4正在追趕GPT-4,但具體的實現路徑有細微差別,他認為,這是後發者的優勢所在。

由前搜狗公司CEO王小川創立的百川智能也在去年獲得A1輪3億美元投資,由阿里、騰訊、小米、深創投等機構參投。過去一年,百川以平均每28天的速度迭代大模型,在成立後半年時間內就發佈了7款基礎大模型,其研發速度遠超行業平均水平。

同樣成立於去年的零一萬物是由創新工場董事長兼CEO李開複創辦的人工智能公司。該公司於2023年11月6日完成了新一輪融資,由阿里雲領投。融資後,零一萬物的估值已超過10億美元,成為AI 2.0領域的獨角獸公司。

類似的企業還有MiniMax、深言科技等,投資人砸下真金白銀,讓多家大模型初創企業在極短時間內躋身獨角獸之列。這些初創企業的實力也並不差,在《SuperCLUE中文大模型基準測評報告,2023》中,大廠和創業公司大模型的平均成績差值約1分,幾乎持平。

“國內大模型公司的發展都非常快,突破也很大。畢竟過去的一年,這些公司基本都是all in AI大模型。”IDC中國研究總監盧言霞向21世紀經濟報導記者表示,“當然每家公司都需要時間,這些投入才能真正體現在模型能力上。”

通用大模型創業窗口關閉

新年伊始,各家大模型企業紛紛推出新一代大模型:智譜AI發佈了新一代基座大模型GLM-4,相比上一代性能全面提升了接近60%,表示在多個測評集中評分逼近GPT-4;百川智能發佈超千億參數的大語言模型Baichuan 3,宣佈在中文任務上超越了GPT-4;MiniMax發佈大語言模型abab6,是國內首個MoE(Mixture of Experts混合專家模型)大語言模型,也宣稱對標GPT-4。

雖然從各家公司的口徑中不難看出其追趕OpenAI的野心,但仔細觀察便可知,各家大模型通常只在某一項或幾項能力上接近或超越GPT-4,尤其在中文能力上做得更加突出。

在OpenCompass2.0大語言模型評測中,評測結果顯示,國內模型在中文場景下相比海外模型具有性能優勢,在中文語言理解、中文知識和中文創作上相比GPT-4 Turbo具有較強的競爭力,甚至部分模型實現了部分維度上對GPT-4 Turbo的超越。

但整體來看,與GPT-4的差距仍然較大。“現在國內主流的大模型的能力水平基本上在GPT3.5上下。”非凡資本合夥人吳畏向21世紀經濟報導記者表示,在他看來,其中差距至少在半年以上。

大模型的核心壁壘包括算力、數據、算法,一切需從底層做起。度小滿CTO許冬亮曾在2023金融街論壇年會上表示,只有極少的企業能夠從頭到尾地完成產業級研發。

不僅如此,這條賽道已經十分擁擠。公開資料顯示,到去年10月時,國內已湧現了238個大模型;自2023年8月第一批國產大模型通過備案起,截至今年2月,已經有40餘款大模型獲批對外開放。到現在這個時間點,這顯然已經不再是一個適合創業公司的賽道。

在吳畏看來,通用大模型不是創業者的應許之地,且通用大模型的創業窗口已經關閉了。而對於已經成長起來的大模型企業來說,也面臨著諸多挑戰。

“對於國內大模型企業來說,不是拿了多少錢才是成功,而是誰能把商業模式跑通的問題。”陳冉向記者表示,“如果商業模式沒有驗證清楚,拿的錢越多其實負擔越大。”

過去的一年,大模型處於泡沫期,擁有技術力量的公司不想被時代的浪潮拋下,所以有了百模大戰、千模大戰。當行業進入成熟期,只有少量企業能真正賦能行業,擠掉泡沫後才能沉澱出價值。

“大模型之後會逐漸呈現寡頭的趨勢,因為算力有限的情況下,大模型過於同質化,會使得算力資源以及數據資源在未來集中,有一些價值性不高的大模型也會逐漸被淘汰。”沙利文大中華區總監李慶向21世紀經濟報導記者表示。業內普遍認為,在通用大模型中,最後勝出的只會是少數的幾家巨頭。

未來押注基座還是應用?

經過了一年的生長,大模型企業的方向逐漸明晰:要麼深耕基座技術,要麼聚焦應用創新。而後者則被認為是當前更合適的創業路徑。

在去年11月的西麗湖論壇上,百度創始人、董事長兼CEO李彥宏就曾表示,“AI原生時代,我們需要100萬量級的AI原生應用,但是不需要100個大模型。”在百度世界2023現場,百度率先甩出了十餘款AI原生應用。

目前,應用創業一種路徑是基於原有的產品來融合大模型的能力,另一種路徑是重新搭載關於大模型的基於場景的應用。大多數應用都是選擇了後者。

對於創業者來說,應用方面的創業確實更容易起步,對於投資者來說,也傾向於更快見到商業上的反饋。

“投資人一方面關注這個項目本身AI的含量,另一方面也關注應用的商業化程度。”吳畏向記者表示,在他看來,已經具有場景和數據+AIGC應用層公司,其商業成功概率無疑更高。

去年,大模型應用的創業已經顯露頭角,如上傳20張照片生成寫真照的妙鴨相機,輸入幾個關鍵詞就可生成高質量視頻的Pika等等,在市場上掀起極高的討論度。業內普遍認為,原生應用能夠撬動更大的商業價值。

但遺憾的是,去年國內沒有產生一款持續火熱的應用,究其原因,陳冉認為,去年國內的大模型基礎設施還未做好準備,造成應用得不到持續的保障;另一方面技術層面也沒有非常成熟,應用形成不了客戶黏性。

他同時強調了生態的重要性,他認為,目前國內大模型的生態站位還沒有形成,上下遊還沒有完全打通,還需要一段時間的彙集,當生態成熟之後應用會更加蓬勃發展。

“我能感覺到的是,90%以上的人都會在應用方面去創業,5%左右在生態創業,剩下的5%在大模型其他要素裡面或者大模型本身。”陳冉向記者表示。

當然,深耕大模型的初創企業仍然堅持在打磨基座的路上繼續走下去,短期內業內對於大模型發展的路徑並不一致。

“有人認為中國原創大模型的基礎不行,就等著看應用;也有人認為還有機會,值得努力一把,比如像我們。”張鵬向記者表示。

他認為,大模型的技術還沒有到天花板,也沒有到穩定的階段,過早地強調應用,反而有可能把整個勢頭拖慢下來。“總有第一撥人做0到1的事情的。”

張鵬表示,大模型發展速度過快,短期之內業內對發展路徑的觀點很難統一。但將時間維度拉長到十年,業內對於大模型帶來的機遇和變革是認同的。

對於國內的大模型創業者來說,2024年確實是比上一年有著更加成熟的基礎設施以及更加清晰的路徑選擇。但這也是一條長征路,需要人工智能行業所有的參與者、產業鏈上下遊合作夥伴、開發者社區、學術界的共同建設。

(作者:董靜怡 編輯:巫燕玲)