一邊訓一邊跑,京東雲搶跑大模型產業落地

眼瞅著大模型的熱鬧就兩週年了,市場不再相信故事。大模型玩家們,也逐漸分成了兩大派別。

第一派繼續卷性能。比如Meta發佈Llama 3.1,最大參數可達405B 。法國AI公司Mistral AI則推出新一代旗艦模型Mistral Large 2,以1230億參數應戰Llama 3.1,GPT4-o和Claude 3.5 Sonnet。

第二派開始聚焦大模型應用。比如OpenAI剛剛發佈了全新AI搜索引擎SearchGPT,號稱是一種「新搜索方式」。而國內的企業也開始愈發重視模型的落地,比如京東公佈超35萬小哥已經用上了大模型。

模型大不大與應用好不好,是否存在必然的聯繫?一個超強的大模型,又是否能解決一切難題?我相信市場沒有絕對正確的答案,但每個企業都有適合自己的選擇。

基礎大模型靠卡堆出來的,企業模型要自己用出來的

據測評,Llama 3.1 405B能力超強,在超過150個基準測試集中的表現追平甚至超越了GPT-4o 和 Claude 3.5 Sonnet 等強大的閉源模型。但訓練Llama 3.1也是代價極高。儘管Meta 優化了整個訓練堆棧,還是使用了超過 1.6萬塊H100 GPU。

GPU萬卡集群已是超大規模,僅僅是GPU的採買就極其燒錢。然而,科技狂人馬斯克今年底的新目標,再次推高了大模型訓練算力資源規模上限。他計劃年底推出Grok-3大模型,「有可能超越目前的人工智能基準」,但需要10萬塊英偉達的H100。

雖然模型能力越來越強大,但堆卡訓練超大參數的模型應用卻有兩難。

第一難是「你太貴了」。現實情況是,Llama 3.1405B的參數規模太大,本地部署及運行非常消耗算力。外國網民用一張英偉達4090運行Llama 3.1405B,僅僅一個問題的回答,就整整用了20個小時。

第二難是「你不懂我」。儘管大模型越來越強,但通用大模型依舊缺乏特定領域的知識,無法滿足企業的業務需求,所以企業應用還需要對模型進行微調。這背後又是大量的財務和時間成本。

2023年7月,京東雲發佈言犀大模型。經過一年來大模型在京東供應鏈場景的大規模應用,京東雲對上述問題的回應是:基座大模型是靠卡訓出來的,企業大模型是靠人用出來的。

與其等待或費盡心思挑選能力強大的大模型,不如對現有的低成本模型進行適企化改造,通過持續的數據注入和場景迭代,實現大模型在企業的落地。

讓企業把大模型先用起來,首先需要解決大模型的應用成本和效率問題。為此他們提出了模型壓縮及拉升技術,使模型耗能更低的同時,更符合企業需求。其次需要找到真正體現大模型價值的應用的場景。讓大模型在特定場景跑出業務價值絕非易事。京東的策略是,把大模型業務應用場景的決策權交給一線員工。

比如,京東雲言犀打造的采銷東哥數字人、京東618總裁數字人直播,在直播電商賽道率先實現大規模商業化。還依託全新升級3.0版本,以超100位個性化角色、超50個行業特定屬性場景,閑時直播超30%的轉化率提升,向企業提供更加個性化、風格化的數字人定製解決方案。

京東雲言犀數字人3.0 京東雲言犀數字人3.0 

又比如,京東科技金融運營團隊,將數十年在行業理解、營銷流程、運營策略知識、實操經驗的積累,結合大模型封裝進AI增長營銷平台,大幅優化營銷機會洞察、營銷素材生成、營銷策略製定與投放全流程,據京東數據顯示,實現整體運營配置提效超30%,推動業務增長25%。

大模型先在供應鏈上跑起來了

從本次京東雲峰會發佈的多個產品來看,近35萬京東自有配送員、超20萬商家、超5萬副主任級別以上醫生、超2萬采銷運營、超1萬研發人員,已經在京東100多個AI場景開始應用。

京東言犀大模型深度融入業務流程,得益於京東供應鏈長鏈路、複雜協同的原生數據,更適合產業大模型訓練及落地。回看過去這一年,京東在產業土壤中種植大模型,秉承「把大模型做實、把供應鏈做透」的理念,越來越多的大模型應用,正在京東供應鏈上生長。

在零售行業,基於京東言犀大模型的AIGC營銷工具「京點點」,不僅可以幫助商家一鍵生成商品圖,還支持了超過2000種視覺元素道具;不僅可以豐富圖片的視覺層次,還能根據商品的特點和營銷需要個性化佈局。支持能生成商品賣點文案、商品種草文案、直播腳本,還具備商品短影片、AI店舖運營等多個場景的生成能力。如今,據京東數據統計,京點點AIGC營銷生成圖片的採納率能達到65%,生成營銷文案的準確率能達到95%以上。它服務了京東商城20多萬商家,幫助平台商家提升經營轉化。

大模型在零售全流程應用大模型在零售全流程應用

在物流行業,小哥終端智能助手將物流配送這一流程複雜的工作效率,大幅提升。小哥的工作包括攬收、派送、站內、輔助、客戶服務五大類,需要熟悉的規範包括貨物處理規程、安全操作標準、客戶服務要求等多達上百個,把這些統統記牢,需要耗費大把時間。如今有了小哥終端智能助手,這些問題就都迎刃而解,關於物流的問題它都能回答。不僅會「動腦」,還能直接「下手」,只需要快遞小哥動動嘴,小哥終端智能助手就能將送貨通知直接發給客戶。如今,小哥終端智能助手已服務近35萬京東自有配送員。

在健康行業,基於行業內首個實物與服務相聯通、知識與數據相融合的醫療大模型京醫千詢,免費智能醫生「康康」,結合京東健康億級高質量醫患會話和豐富的實物、服務、內容等供應鏈資源,提供專業、有溫度的健康諮詢服務;專屬個人醫助,可以支持病情收集、診斷推薦、治療方案推薦、病情解釋、智能病曆等功能,全流程輔助醫生提升問診效率。京東數據顯示,如今,京東健康皮膚醫院基於大模型的AI輔診準確率超過95%。

開放平台支持企業用出自己的大模型

基於內部豐富的場景打磨,京東雲構建了簡單、開放的全棧產品,從基礎設施到Agent應用,構建面向全場景的大模型服務能力。

在Agent應用方面,京東雲最新發佈了言犀智能體平台。作為一站式 AI Agent 開發平台,言犀智能體平台平台目前已接入數十個大模型,無論用戶是否有編程基礎,從解決簡單的問答到處理複雜邏輯的業務問題,都可以在言犀智能體平台上低成本快速搭建基於 AI 模型的各類快捷應用。通過言犀智能體平台,AI場景的探索落地從3個月縮短到1周,新應用的創建,從以前幾個月排期研發一個應用,到每個月產生上千應用。目前,京東內部基於言犀智能體平台的智能體超過3300個。

言犀智能體平台 言犀智能體平台 

在模型服務方面,京東雲推出了企業大模型服務,將垂直領域知識注入到模型的同時,不損失模型的通用能力,且更加經濟適用。通過大模型壓縮技術,減去對企業權重低的模型神經元,同時提高模型推理速度,使模型耗能更低;基於大模型拉升技術,通過激活更匹配企業訴求的神經元,實現特定領域數據自進化並注入拉升模型中,使得問題處理結果更符合企業使用訴求;大模型推拉技術的使用,讓推理側模型顯存節約 70%,速度提升 1.5倍,極大提升企業模型使用效率。

在工具鏈方面,京東雲言犀AI開發計算平台2.0,提供包括數據準備、模型開發、模型訓練、模型部署在內的AI開發全鏈路服務,讓用戶可以快速把一個通用模型,轉化成適合自身場景的專業模型,新版本進一步簡化了模型開發流程,內置20餘種開源模型和豐富的數據集,並提供100餘種算法和工具鏈,為客戶的大模型開發,提供低門檻、高性價比的AI服務能力。

在基礎設施方面,京東雲高性能計算集群、超低延遲網絡、高性能分佈式存儲等,提供極致的數字基礎設施能力,並基於混合多雲操作系統,對AI異構資源進行靈活調度,更好地滿足大模型的算力需求。最新升級的新一代存儲雲海3.0,在性能層面持續提升,基於融合超低延時RDMA網絡及軟件架構優化,4K隨機寫IOPS達到1000萬級,平均延遲在100微秒級,支持百GB級超大帶寬,更好地支持千億級參數AI大模型。

在產業的沃土中孕育而生,大模型正以不可阻擋之勢,成為企業數智化轉型的中堅力量。京東雲以其深厚的技術底蘊和創新實踐,不僅為大模型在行業落地和企業應用提供了堅實的基石,更在這場技術革新的征途中,率先邁出了堅定而有力的一步。