天橋腦科學研究院團隊自研的OMNE AI大模型框架登上基準測試GAIA榜首｜鈦媒體AGI

天橋腦科學研究院創始人陳天橋雒芊芊夫婦（圖片來源：天橋腦科學研究院官網）

天橋腦科學研究院（Tianqiao and Chrissy Chen Institute，TCCI）的 AI 團隊在 AI 技術領域取得了重要進展。

近期，天橋腦科學研究院自研OMNE Multiagent大模型——是一個基於長期記憶（Long Term Memory, LTM）的多智能體協作框架，每個智能體擁有相同且獨立的系統結構，能夠自主學習和理解完整的世界模型，從而獨立理解環境。基於LTM的多智能體協同體系，使AI系統能夠實時適應個體行為變化，優化任務規劃與執行，推動個性化與高效的自我進化。

根據Hugging Face 發佈的 GAIA 基準測試排行榜，目前，OMNE的整體成功率為40.53%，領先於Meta、微軟、Hugging Face、普林斯頓大學、香港大學、英國 AI 安全研究所、百川等知名機構提交的結果，而GPT-4僅為15%。因此，OMNE Multiagent大模型多智能體框架登上了GAIA基準測試排行榜榜首，超越了包括微軟研究院在內的眾多頂尖機構提交的多智能體框架。

TCCI表示，這是自去年天橋腦科學研究院創始人、前中國互聯網大佬陳天橋宣佈All In AI戰略以來，旗下AI團隊取得的一項重大成果。

GAIA 是由 Meta AI、Hugging Face 和 AutoGPT 聯合推出的基準測試系統，旨在提供一個涵蓋真實世界問題集的測試環境，用於全面評估 AI 助手的能力，包括推理、大模型多智能體處理、網頁瀏覽和工具使用等核心功能，是當前最具挑戰性的多代理智能評估數據集。

OMNE框架登上該榜單榜首，充分體現了AI 團隊的技術深度與創新能力。本次重大突破在於，借鑒了天橋腦科學研究院多年的大腦研究積累，通過給予Agent長期記憶的能力，讓模型能夠進行深度慢思考，加強了LLM對複雜問題的決策能力，同時融合了長期記憶的機制，通過長期記憶大幅降低了MCTS的搜索空間，提高了在複雜問題上的決策能力。通過引入更高效的邏輯推理，OMNE不僅提升了單個智能體的智能水平，還通過優化協作機制，顯著增強了多智能體系統的整體能力。這一提升機制正是受到了人類大腦皮層柱狀結構研究的啟發，皮質柱作為大腦認知和行為功能的基礎單元，通過複雜的協作機制實現信息處理。AI模型通過強化單體智能與智能體間的協作，可能逐漸產生認知能力的湧現，構建出內部的表徵模型，進而推動系統整體智能的飛躍。

天橋腦科學研究院AI團隊負責人表示，「我們非常自豪地看到 OMNE 框架登上 GAIA 榜首。這表明了利用LTM進行AI自我進化以及解決現實世界問題的巨大潛力。我們相信，推進長期記憶和AI自進化的研究，對於AI技術的持續發展和實際應用至關重要。」

據悉，天橋腦科學研究院由陳天橋、雒芊芊夫婦出資10億美元創建，是世界上最大的私人腦科學研究機構之一。研究院始終圍繞全球化、跨學科和青年科學家三大重點，支持AI和腦科學研究，致力於造福人類。今年以來，天橋腦科學研究院與《Science》雜誌合作推出了全球AI驅動科學大獎，並舉辦和支持了包括”AI+精神健康”在內的各種高水平國際會議和夏校項目，致力於培養跨學科的青年AI人才。

（本文正選於鈦媒體App，作者｜林誌佳，編輯｜胡潤峰）

你可能喜歡