估值200億元!百川智能完成50億元A輪融資,北上深國資入局
今日,有消息曝出:大模型初創公司「百川智能」已於近期完成A輪融資,總融資金額達50億元人民幣。
i黑馬就以上信息向百川智能求證,百川智能給出的回應如下:
百川智能確實已經於近期完成了A輪融資,總融資金額達50億元人民幣,並且將以200億估值開啟B輪融資。
A輪投資方既有阿里、小米、騰訊、亞投資本、中金等頭部大廠和市場化投資機構,也包括北京市人工智能產業投資基金、上海人工智能產業投資基金、深創投等國資背景產業投資基金。
百川智能一直堅持「超級模型+超級應用」雙輪驅動的發展戰略。截止目前,已經發佈了12款大模型,並於今年5月推出了首款AI助手——百小應。
百川智能一直認為醫療是「大模型皇冠上的明珠」,是打造超級應用的最佳場景。作為國內唯一一家專注醫療的頭部大模型公司,百川智能在AI醫療技術和應用上均取得了階段性進展。
自研的通用醫療增強大模型,已在多個權威評測中超越了GPT-4,並且還在7月初舉辦的世界人工智能大會(WAIC)上首次對外展示了AI醫療類應用——AI健康顧問。
在近日舉辦的2024全球數字經濟大會人工智能專題論壇,王小川進行了分享。以下為王小川分享內容,經i黑馬編輯:
今天整個中國社會,尤其是科技界,都處於一種既興奮又焦慮的狀態。
一方面,我們要跟美國卷模型,要投入十億、百億美金去做超級模型;另一方面,又在呼喚大模型落地應用的場景。大家擔心,只做落地應用會錯過未來,但只考慮未來又沒有當下。
百川是去年4月成立的,今年1月份,朋友們給我發微信祝賀,說「2024年元旦快樂」。我回覆的是,「智能紀元二年快樂」。
這句話的含義是什麼?我們已經進入到一個全新的時代,到了智能時代。雖然現在還沒有做到AGI。
我們很幸運,大家是從互聯網時代走過來的,享受了互聯網20年的高速發展,現在又見證和參與到了智能時代的發展。
01
通過語言,我們在接近智能
我想用一個關鍵詞來表達對智能時代的中軸的理解,就是把語言轉變成數學模型。
我們今天講大模型LLM的時候,第一個關鍵詞叫Scale,就是規模。從百億參數到千億參數到萬億參數,再到號稱GPT5的百萬億級參數,數據規模上去之後就能帶來智能。到最後變成,大家覺得投入多少錢進去,就能實現智能。同時我們也會歡呼,比如今年影片生成領域Sora的推出,是不是代表了未來的另一種智能。
這些其實都不是完整的答案。因為今天我們走通的人工智能路徑,不是在Sora,而在語言。通過將語言變成數學模型之後,能夠獲得今天這樣的人工智能。
很多人說,人和動物的區別,可能是人會語言。
比如圖像識別很厲害、無人駕駛很厲害,我開玩笑講,狗也會無人駕駛和圖像識別。區別在於,語言是我們思考、溝通的載體,是文化和知識的載體。因此通過語言,我們在接近智能。今天這個範式體系並沒有脫離掉語言,因此我們強調語言為中軸。這是在通用智能里的一個關鍵邏輯。
另一個關鍵詞是能源。數據、算法、算力,大家都已經很清楚了,但今年上半年以來,提到更多的是能源問題。尤其是在國外,已經開始有可控核聚變,在為大規模的新模式部署做準備。如果說AGI或者人工智能再往下爆發,那算力背後的能源會構成一個大的短板。中國目前為止還沒有開始探索這個問題,在電力方面還沒有美國這種瘋狂的想法。這也是中美大模型發展的區別之一。
02
大模型帶來的是生產力的提升
有個知識管理框架叫DIKW模型,即Data Information Knowledge Wisdom。以前機器產生的是信息,這個時代的智能核心是產生知識。也就是說,大模型帶來的不僅是信息的傳遞,而是能夠產生knowledge,代表著對世界的認知。再往後發展,則可以產生智慧。
我們知道,在互聯網時代,更多的是改變了生產關係。不管是淘寶、滴滴還有美團,都是通過互聯網讓更多的商家跟更多的用戶連接在一起,提高供需匹配的效率。
但在智能時代,大模型帶來的是生產力的直接提升。GPT是這個時代的第一個應用產品,未來我相信會有更多新的應用產生。
在信息時代,我們是用一種工具思維來使用計算機。現在,我們應該把大模型當成夥伴來思考。如果還是把大模型當成原來的計算器來對待,那它能夠發揮的作用就太有限了。我們更應該把AI當作可以產生陪伴和服務的夥伴。我預測,在未來兩三年,我們可以走出這種工具思維,並且讓AI變得像人類一樣具備服務能力和陪伴能力。
這種情況下,目前的探索方向,一是賦能千行百業,也就是對生產力的提升。另外還有兩個領域:智能助理和虛擬世界。
在個人領域,這種智能助理之前其實做得不太好。目前來講,Perplexity在智能助理領域應該算是不錯的,通過對於搜索的總結,可以提供更好的知識的呈現。GPT4O更多代表的是一種交互模式的革新,是以人的方式來跟用戶溝通。我認為,未來智能助理會有新的To C產品形態產生,而不只是在原來的電商、遊戲以及其他領域再重做一遍。
在虛擬世界,隨著技術的進步,未來3到5年,我們預見到人工智能將在虛擬世界的多個方面扮演更重要的角色,特別是在娛樂遊戲行業。隨著虛擬世界的發展,它將為全球經濟帶來新的動力和變革。我們認為,這將是一個從生產關係向生產力轉變的過程,最終將實現對虛擬世界的賦能。
目前,我們已經討論了許多概念,包括搜索增強、多模態、智能體等,這些都是當下提升大模型能力的主要技術路線。這些技術的發展可能會在未來引發一場變革性的力量。
03
強化學習讓大模型具備思考能力
在語言和規模之外,大模型還有一個發展思路是強化學習。OpenAI曾提到,他們的模型可以在某些地方實現超越,包括在18個月之後讓大模型達到博士生的能力。這不是在當下這個範式中能夠解決的,以目前的範式解決問題來講,大模型能達到高中生的水平就不錯了,所以只能做輔助工作。
但未來會有新的一種範式出現,這是值得大家期待和關注的。這種範式的核心是,用強化學習來改變今天的模型設置。廣義上來講,這就像之前大家熟悉的AlphaGo,專門下圍棋的人工智能。AlphaGo跟大模型走了兩條相反的道路。大模是數據越多越好,有多少數據就可以帶來多少智能。而AlphaGo的第一版本是結合了數百萬人類圍棋專家的棋譜。但是到AlphaGoZero之後,就不需要人類的棋譜了,不用數據反而變得更加智能。
今天大模型只能解決快思考的問題,其實不具備慢思考的能力。所以大家提到AI超越人類,還需要很長一段時間來通過強化學習產生慢思考。用孔子提倡的學習方法來講,大模型是「學而不思則罔」,學了很多東西,但是不會思考,並不是特別智能;AlphaGo則是「思而不學則殆」,只在一個領域鑽研得很深。因此,將學習和思考系統進行結合,才可能實現智能時代最終的爆發。我們現在掌握的兩種技術,還沒有融合在一起,這是我對未來的一些基本判斷。國內有高校在做這方面的探索,我們甚至預言美國已經在這方面實現了突破。
隨著我們自己的實踐,我們強調如何平衡理想與現實之間的關係。追求「詩和遠方」就是去追趕OpenAI,但沒有落地場景。如果去做落地場景,則有可能走不到了大模型的遠方,丟掉了「慢思考」,丟掉了大模型所代表的通用智能的可能性。
因此,針對當前中國的情況,包括芯片能力、人才儲備和市場環境,我們提出了一種邏輯,即「理想上慢一步,落地上快三步」。也就是說,理想上我們不是不跟,而是通過他們驗證之後來確保我們的方向。我們的首要任務是打開落地場景,同時確保我們不會失去對大模型終極理想的追求。因此,我們的目標是既要發展超級模型,也要發展超級應用。所以我們在賦能千行百業時,選擇這些知識密度特別高,真的需要千億模型、萬億模型的場景,然後我們把它降到百億,這是百川的定位。
百川去年整體發展很快,成為第一批獲得工信部備案的八家大模型公司之一,也是唯一一家當年成立的公司。在今年5月,百川推出最新一代基座大模型Baichuan 4,並同期推出首款AI助手「百小應」。
04
醫療是大模型皇冠上的明珠
百川在落地場景上選擇的是醫療領域。醫療是大模型皇冠上的明珠。反向傳播之父Geoffrey Hinton強調,醫療將是最重要的AI應用領域之一,將發揮AI的最大潛力。大模型對於知識的掌握,對經驗的掌握,大模型的多模態能力、記憶能力、思考能力,大模型減少幻覺、溝通共情的能力,所有這些在醫療領域都能夠用到。甚至是模型做得越好,醫療就能越發達。
目前在醫療領域比較成功的是互聯網醫院,包括好大夫等,需要依靠現有的醫生,其實還是對生產關係的改變。因為醫生供給是不足的,提升醫生供給就是一個重大的機會,所以醫療行業叫做「得醫生者得天下」。
同時,我們也對AI醫療進行了等級劃分,從L0到L5,這一分級類似於無人駕駛。
L0就是傳統醫療,沒有AI介入。
L1是依靠單一功能的機器輔助,在單點上可以給出建議。
L2是多模態輔助,AI可以整合病曆、影像等多種數據提供信息。
L3是條件自動化診療,類似於現在的自動駕駛,已經可以完全取代司機開車,但在關鍵時刻還需要司機的確認。我們的目標是,在今年到明年,做到L3的水平,讓AI給醫生做助理,也能為消費者提供後期的健康顧問,但關鍵決策需要醫生確認。
L4就需要AGI的水平了。AGI的能力可以造出醫生來,完全像醫生一樣工作,就是一個通用的人工智能。
L5是完全自動化健康管理,可以超越AGI,從預防、診斷到治療,可以管理患者的全部健康旅程。到這個時候,我們開始從語言模型走向生命模型,對生命做解碼,做到超越醫生的水平。
在這個過程中,我們落地了兩件事情。一是在前期做全病程的管理,二是在此基礎上做精準醫療。
現在醫生資源遠遠不夠,不可能有醫生一直陪著患者。大模型可以在院內做醫生助理,在院外做健康顧問,能做全病程的管理。在這個過程中,大模型可以患者進行儘可能多的數據收集,這對醫生來說也就像臨床實驗一樣。因為醫生不僅是臨床工作者,也是科研工作者,他們需要把自己的觀察和經驗總結出來,寫成論文,變成知識。每個醫生的精力是有限的,在中國一個醫生一輩子可能只能為3萬個患者做診斷。大模型能夠快速地迭代學習,可以為每個患者單獨建模,最終走向精準醫療,讓預防、診斷、干預都達到新的高度。
對於未來,百川一方面是繼續攻堅,以語言為中心去突破模型規模,做出超級模型。同時,我們在醫療上做很多增強,期待通過AIGC的方式去達到AGI,並在此過程當中提高醫療的相關服務。