天橋腦科學研究院團隊自研的OMNE AI大模型框架登上基準測試GAIA榜首|鈦媒體AGI

天橋腦科學研究院創始人陳天橋雒芊芊夫婦(圖片來源:天橋腦科學研究院官網)天橋腦科學研究院創始人陳天橋雒芊芊夫婦(圖片來源:天橋腦科學研究院官網)

天橋腦科學研究院(Tianqiao and Chrissy Chen Institute,TCCI)的 AI 團隊在 AI 技術領域取得了重要進展。

近期,天橋腦科學研究院自研OMNE Multiagent大模型——是一個基於長期記憶(Long Term Memory, LTM)的多智能體協作框架,每個智能體擁有相同且獨立的系統結構,能夠自主學習和理解完整的世界模型,從而獨立理解環境。基於LTM的多智能體協同體系,使AI系統能夠實時適應個體行為變化,優化任務規劃與執行,推動個性化與高效的自我進化。

根據Hugging Face 發佈的 GAIA 基準測試排行榜,目前,OMNE的整體成功率為40.53%,領先於Meta、微軟、Hugging Face、普林斯頓大學、香港大學、英國 AI 安全研究所、百川等知名機構提交的結果,而GPT-4僅為15%。因此,OMNE Multiagent大模型多智能體框架登上了GAIA基準測試排行榜榜首,超越了包括微軟研究院在內的眾多頂尖機構提交的多智能體框架。

TCCI表示,這是自去年天橋腦科學研究院創始人、前中國互聯網大佬陳天橋宣佈All In AI戰略以來,旗下AI團隊取得的一項重大成果。

GAIA 是由 Meta AI、Hugging Face 和 AutoGPT 聯合推出的基準測試系統,旨在提供一個涵蓋真實世界問題集的測試環境,用於全面評估 AI 助手的能力,包括推理、大模型多智能體處理、網頁瀏覽和工具使用等核心功能,是當前最具挑戰性的多代理智能評估數據集。

OMNE框架登上該榜單榜首,充分體現了AI 團隊的技術深度與創新能力。本次重大突破在於,借鑒了天橋腦科學研究院多年的大腦研究積累,通過給予Agent長期記憶的能力,讓模型能夠進行深度慢思考,加強了LLM對複雜問題的決策能力,同時融合了長期記憶的機制,通過長期記憶大幅降低了MCTS的搜索空間,提高了在複雜問題上的決策能力。通過引入更高效的邏輯推理,OMNE不僅提升了單個智能體的智能水平,還通過優化協作機制,顯著增強了多智能體系統的整體能力。這一提升機制正是受到了人類大腦皮層柱狀結構研究的啟發,皮質柱作為大腦認知和行為功能的基礎單元,通過複雜的協作機制實現信息處理。AI模型通過強化單體智能與智能體間的協作,可能逐漸產生認知能力的湧現,構建出內部的表徵模型,進而推動系統整體智能的飛躍。

天橋腦科學研究院AI團隊負責人表示,「我們非常自豪地看到 OMNE 框架登上 GAIA 榜首。這表明了利用LTM進行AI自我進化以及解決現實世界問題的巨大潛力。我們相信,推進長期記憶和AI自進化的研究,對於AI技術的持續發展和實際應用至關重要。」

據悉,天橋腦科學研究院由陳天橋、雒芊芊夫婦出資10億美元創建,是世界上最大的私人腦科學研究機構之一。研究院始終圍繞全球化、跨學科和青年科學家三大重點,支持AI和腦科學研究,致力於造福人類。今年以來,天橋腦科學研究院與《Science》雜誌合作推出了全球AI驅動科學大獎,並舉辦和支持了包括”AI+精神健康”在內的各種高水平國際會議和夏校項目,致力於培養跨學科的青年AI人才。

(本文正選於鈦媒體App,作者|林誌佳,編輯|胡潤峰)