獵戶星空發佈MOE大模型,推出AirDS數據服務
11月27日,獵戶星空聯合聚雲科技舉辦了題為《Data Ready for Al,MoE大模型發佈暨商業閉環分享》媒體見面會。獵戶星空正式發佈了自主研發的Orion-MoE8×7B大模型,並攜手聚雲科技推出了基於該大模型的數據服務產品——AI數據寶AirDS(AI-Ready Data Service)。這兩項重要成果的發佈,不僅標誌著獵戶星空在AI技術領域的又一重大突破,更為AI行業商業化進程注入新動能。
(獵豹移動董事長兼CEO、獵戶星空董事長傅盛線上接受媒體採訪)
Orion-MoE 8×7B-Base:引領多語言大模型新潮流
獵戶星空首席科學家韓堃出席會議,首先對Orion-MoE8×7B大模型進行了詳細介紹。這款大模型是獵戶星空自主研發的開源混合架構專家大模型,擁有8×70億參數,採用了生成式混合專家的設計,涵蓋了中文、英語、日語、韓語等多種語言,展現出卓越的性能。
早在2024年年初,獵戶星空隆重發佈自研「為企業應用而生」的百億參數大語言基座模型Orion-14B。為什麼要在2024年底發佈MoE大模型?
獵戶星空在探索AI應用場景過程中,一方面以客戶視角為出發點,模型既要效果好又要速度快;另一方面從大模型技術發展來看,相比稠密模型的「通才」、一群「專家」的MoE能更高效專業地完成企業複雜任務,而且在不顯著增加計算成本的前提下大幅增加模型容量。所以,這款極具性價比的Orion-MoE 8x7B大模型是「為匹配企業客戶需求而生」。
在主流的公開基準評測中,Orion-MoE8×7B與同規模參數級別的基座大模型對比,各項評測指標均表現優異,特別是在多語言能力方面展現出強大實力。此外,在推理速度方面也表現搶眼,顯著高於同等參數規模的稠密模型。
AI數據寶AirDS:開啟大模型商業化閉環
獵戶星空基於研發MoE大模型對數據訓練的認知理解和能力積累,攜手獵豹移動旗下聚雲科技共同推出大模型數據服務產品——AI數據寶AirDS(AI-Ready Data Service),為全球化企業提供更為高效、精準的AI數據服務支持,助力其在AI應用落地過程中實現「最後一公里」的突破。
獵戶星空首席科學家韓堃介紹道,近年來,由於計算能力的提升、大規模數據集的可用性以及算法的改進,AI大模型進入爆發增長期,算力、算法、數據,是大模型發展的關鍵三要素。然而,相比於算法和算力,在大模型商業閉環中,數據明顯成為最直接影響其在垂直行業落地效果的關鍵。
「捅破AI行業窗戶紙,百模大戰靠數據」,AI數據寶AirDS提供全方位的大模型數據服務,涵蓋數據收集、清洗、標註、提示詞工程以及評估等環節。在實際應用中,已服務包括移動通信終端、互聯網娛樂、新能源汽車等多個領域的中國領先出海品牌,幫助客戶顯著提升AI應用的效果與效率,助力全球市場競爭。
獵豹移動副總裁童寧在會上詳細介紹了AI數據寶AirDS的成功案例。例如,在移動通信終端領域,AI數據寶AirDS通過收集多場景、多語⾔數據,完成開發測試平台,優化prompt⼯程,提升⼤模型針對用戶需求的數據返回準確率;還有,AI數據寶AirDS通過開發⼤模型⾃動化⼯具測試平台以及prompt⼯程,實現移動終端多語⾔用戶之間語⾳交互翻譯,準確率大幅提升。在互聯網娛樂領域,AI數據寶AirDS服務讓用戶可通過⾃然語⾔交互實現⼤模型對外部互聯⽹應⽤API的調⽤。在這些案例之外,AI數據寶還服務於出海新能源汽車、出海互聯網金融、出海消費零售等行業。
總結:獵豹移動的集團基因及整合優勢
會議接近尾聲,獵豹移動高級副總裁孫明焱總結此次推出AI數據寶AirDS是基於獵豹移動在多個領域的既有基因和顯著優勢,包括出海全球化經驗、應用開發能力、AI機器人和大模型行業實踐與技術積累。
做為中國第一批成功出海的互聯網企業,獵豹移動憑藉工具應用開拓了全球市場。近年來,獵豹移動戰略轉型從傳統的ToC業務轉向以AI和大模型為核心的ToB業務,並通過控股獵戶星空,進一步加強在AI服務機器人和AI大模型領域的佈局。
在獲取客戶需求層面,獵豹移動旗下聚雲科技擁有超過十年的出海運維經驗,對外賦能、服務中國企業出海上雲、用雲、管理雲,擁有了一大批服務中國品牌出海的實踐案例,深刻掌握著客戶在雲端的GenAI應用需求;在AI數據服務能力層面,獵豹移動控股的獵戶星空對通過提升數據質量來改善大模型效果有著充分的實踐經驗。此次獵戶星空攜手聚雲科技聚合大模型數據收集、清洗、標註、提示詞工程和評估的全方位服務,共創AI數據寶AirDS(AI-Ready Data Service)。相對於傳統的數據標註公司,擁有在AI數據服務能力上劃時代的技術優勢,是大模型業內對外開放數據能力的唯一廠商。
除了發佈Orion-MoE8×7B大模型和AI數據寶AirDS外,獵戶星空宣佈與香港大學計算與數據科學學院簽訂了合作協議,雙方將聯合研發用於課程教學場景的AI應用教育工具,並開展「專注具身智能相關的課程項目」,共同推動AI技術在應用領域的普及與應用。
Orion-MoE8×7B線上體驗參考鏈接:
GitHub: https://github.com/OrionStarAI/Orion-MoE
HuggingFace: https://huggingface.co/OrionStarAI/Orion-MoE8x7B
ModelScope: https://www.modelscope.cn/models/OrionStarAI/Orion-MOE8x7B-Base