李開複親自下場發佈大模型,公司成立8個月估值10億美元

·Yi-34B在關鍵指標上勝過市場上已有的領先開源模型,包括備受推崇的Meta的Llama 2,其分別在Hugging Face英文開源社區平台和C-Eval中文評測的最新榜單爬升到第一位,成為全球開源大模型“雙料冠軍”。

·零一萬物已經儲備了未來所需的芯片,於今年早些時向風險投資機構創新工場借款,進行了大規模的半導體儲備。

創新工場董事長兼CEO李開複。

11月6日,由創新工場董事長兼CEO李開複創辦的人工智能公司“零一萬物”(01.AI)發佈首款開源中英雙語大模型“Yi”。與此同時,零一萬物已完成新一輪融資,由阿里雲領投。目前,零一萬物估值超過10億美元,在成立不到8個月的時間即躋身獨角獸行列。

Yi-34B在關鍵指標上勝過市場上已有的領先開源模型,分別在Hugging Face英文開源社區平台(Hugging Face負責運行最佳性能大語言模型排行榜)和C-Eval中文評測的最新榜單爬升到第一位。

截至11月5日,Yi-34B在關鍵指標上勝過市場上已有的領先開源模型,包括備受推崇的Meta開發的大語言模型LLaMA 2。其分別在Hugging Face英文開源社區平台(Hugging Face負責運行最佳性能大語言模型排行榜)和C-Eval中文評測的最新榜單爬升到第一位,成為全球開源大模型“雙料冠軍”,這是迄今為止唯一成功登頂Hugging Face全球開源模型排行榜的國產模型。

“34B是開源大模型稀缺的‘黃金比例’尺寸”

中英雙語開源大模型“Yi”系列,包括Yi-6B(參數規模為60億基礎模型)和Yi-34B(參數規模為340億的基礎模型)兩個版本。

中英雙語開源大模型“Yi”系列,包括Yi-6B(參數規模為60億基礎模型)和Yi-34B(參數規模為340億的基礎模型)兩個版本。

李開複認為,340億參數量屬於開源大模型稀缺的“黃金比例”尺寸,達到“湧現”門檻、滿足精度要求的同時,對廠商而言能夠採用高效率單卡推理,訓練成本友好。在參數量和性能方面,Yi-34B相當於只用了不及LLaMA 2-70B一半的參數量,取得了在各項測試任務中超越全球領跑者的成績。

據介紹,Yi目前擁有全球大模型中最長的200K上下文窗口,可處理約40萬字的文本。這意味著Yi-34B可以理解超過1000頁的PDF文檔,同時可以讓很多依賴向量數據庫構建外部知識庫的場景,用上下文窗口來完成替代。

在大語言模型中,上下文窗口是大模型綜合運算能力的重要指標之一,其對於理解和生成與特定上下文相關的文本至關重要,擁有更長窗口的語言模型意味著可以處理更豐富的知識庫信息,從而在如法律、財務、傳媒等場景中生成更連貫、準確的文本。OpenAI的GPT-4上下文窗口為32K,文字處理量約2.5萬字。今年3月,矽谷知名AI創業公司Anthropic的大模型Claude2-100K將上下文窗口擴展到了100K規模。

“團隊對標 OpenAI、Google等一線大廠,已儲備未來所需芯片”

今年3月下旬,李開複宣佈將以Project AI 2.0入局大模型。7月,李開複上線了“AI 2.0”公司零一萬物。

李開複表示,“零一萬物堅定進軍全球第一梯隊目標,從招的第一個人,寫的第一行代碼,設計的第一個模型開始,就一直抱著成為‘World’s No.1’(世界第一)的初衷和決心。我們組成了一支有潛力對標OpenAI、Google等一線大廠的團隊,經曆了近半年的厚積薄發,以穩定的節奏和全球齊平的研究工程能力,交出了第一張極具全球競爭力的耀眼成績單。Yi-34B可以說不負眾望,一鳴驚人。”

據零一萬物透露,該公司員工規模已超過100人,其中一半以上是來自大型跨國公司和中國科技公司的大語言模型專家。技術副總裁是Google聊天機器人Bard團隊的早期成員,主導或參與了從Bert、LaMDA等大模型在多輪對話、個人助理等多個方向的研究和工程落地;首席架構師是TensorFlow的核心創始成員之一,並與Google大腦的著名研究人員傑夫·迪恩(Jeff Dean)和薩米·本吉奧(Samy Bengio)等合作。

Yi-34B背後的關鍵人物是黃文灝與戴宗宏,預訓練負責人黃文灝來自智源人工智能研究院,曾擔任健康計算研究中心技術負責人。加入智源前,他曾任微軟亞洲研究院研究員,負責自然語言理解、實體抽取、對話理解以及人機協同等研究工作,加入零一萬物後,黃文灝團隊主要負責Yi的訓練。零一萬物AI Infra副總裁戴宗宏曾是阿里達摩院機器智能技術資深算法專家,以及華為雲人工智能領域CTO。在阿里期間,他構建了阿里巴巴搜索引擎平台,後帶領團隊研發了圖像搜索應用拍立淘。

對於對大語言模型至關重要的底層算力,李開複表示其在創業之初便有儲備籌劃。

去年,美國總統拜登禁止英偉達向中國客戶出售最先進的人工智能半導體,上個月,美國進一步收緊了這些限制,禁止英偉達向中國銷售專門為中國設計的略低級別的芯片。李開複近日在接受外媒採訪時稱這種情況“令人遺憾”,但表示零一萬物已經儲備了未來所需的芯片。該初創公司今年早些時候向風險投資機構創新工場借款,進行了大規模的半導體儲備。李開複說:“我們基本上全部’押寶’,甚至超出了原有的賬戶餘額,我們覺得我們必須這樣做。”

零一萬物已經在剛剛推出的開源模型之外規劃了其商業戰略。該初創公司將與客戶合作開發專有的替代方案,以滿足特定行業的需求。Yi-34B的名稱來自於訓練中使用的340億參數,但該初創公司已經在開發一種1000億參數以上的模型。李開複說,“我們的專有模型將與GPT-4(OpenAI研發的大語言模型)進行基準測試(也稱之為性能測試,是一種用於衡量計算機系統、軟件應用或硬件組件性能的測試方法)。”

據李開複透露,接下來,零一萬物將基於Yi系列大模型打造To C的超級應用(Super App),“一個Super App的雛形會在不久的將來跟大家分享。AI 2.0 時代,最大的商機一定是超級應用,而這超級應用一定很可能是在一個消費者級別的超級應用,面向海內外的To C超級應用。”

“AI 2.0是有史以來最大的科技革命,它帶來的改變世界的最大機會一定是平台和技術,正如PC時代的微軟Office,移動互聯網時代的微信、抖音、美團一樣,商業化爆髮式增長概率最高的一定是To C應用。”李開複強調,在AI 2.0時代,做出收入,並且是持續做出高質量收入就非常重要,零一萬物接下來的App以及未來的Super App都應該基於此原則去推動與發展。