全球首個地理科學大模型發佈,用戶秒變「地理學家」

9月19日,中國科學院地理科學與資源研究所發佈全球首個多模態地理科學大模型「坤元」(Sigma Geography)。該大模型是專注於地理科學的專業語言大模型,具備處理地理科學相關問題的專業能力,實現了地理專業問題解答、地理學文獻智能分析、地理數據資源查詢、地理數據挖掘分析、專題地圖繪製等功能。

大模型可精準判別用戶並差異化回覆

「坤是大地,元是起始,也有神經元的意思。坤元就是大地的神經元系統,也就是地理科學大模型。」據中國科學院地理科學與資源研究所副所長、首席科學家蘇奮振研究員介紹,這個大模型是由該所聯合中國科學院青藏高原研究所、中國科學院自動化研究所等單位研發的。研發團隊完成了地理學全譜系高質量語料庫構建、地理科學語言大模型構建、地理科學研究智導平台研發等工作,讓「坤元」具備「懂地理」「精配圖」「知人心」「智生圖」等特點。

他進一步介紹說,在「懂地理」方面,研發團隊建立了涵蓋4大類、16小類的地理全學科語料庫,提供320億詞元供大模型自監督學習,並製作了4萬餘條高質量地理學指令進行模型微調。「‘坤元’學習了300萬科技文獻、98部經典教材、88部經典著作和34部標準規範。不僅是一個巨大圖書庫的管理員,也是讀書破萬卷的讀者。」他說,相比通用語言大模型,「坤元」更熟悉地理學的語言模式、專業術語和領域知識,在地理學基準測試集上的準確性提升了31.3%。

在「精配圖」方面,團隊自主研發了面向多層次地圖信息的多模態檢索技術、支持地理認知與圖形表達的知識推理技術。這些技術使「坤元」在解答地理學提問的同時,可以根據生成的文字答案檢索不同地理要素,並匹配地理景觀照片、專題地圖或示意圖表呈現給提問者。

全球首個多模態地理科學大模型「坤元」界面。中國科學院地理科學與資源研究所供圖全球首個多模態地理科學大模型「坤元」界面。中國科學院地理科學與資源研究所供圖

在「知人心」方面,團隊創新提出了用戶畫像精準判別與響應技術,保證「坤元」能夠充分考慮地理知識愛好者、地理學專業學生以及科研人員的地理科學知識體系認知和表達差異,以圖文共現的方式給出適配用戶知識結構的地理學專業問題解答。

「和通用大模型經常給出一套說辭不同,‘坤元’可以通過分析問題,瞭解提問者的知識背景,給出更適配需求的答案。比如針對愛好者給出更加科普的回答,針對研究者給出更專業的解答。」蘇奮振說,如果長期和「坤元」互動,它還能總結出提問者的關心和愛好,完成地理知識相關內容的精確組織。」

未來大模型有望讀懂地圖

在「智生圖」方面,團隊基於「坤元」開發的科研助手,可以根據用戶指令完成概念理解、數據獲取、信息分析、製圖綜合等流程,最終生成用戶需要的專業地理圖表。

「坤元」旨在拓寬普通大眾的地理視野,解放地理從業者的雙手,推動地理智能發展,賦能地理科學研究、加速重大地理科學發現。目前「坤元」已支撐發表Nature子刊、The Innovation、Earth’s Future等高水平學術論文10餘篇。

據蘇奮振介紹,目前「坤元」正處於試用階段,在既定的三個階段研發完成後,還將從支撐科研轉向支撐行業,它也可以成為普通用戶的地理老師和旅遊嚮導。

未來,研發團隊將推進地圖大模型及地理推理機研發,有望讓地理科學語言大模型讀懂地圖;將打造地理科研協作大平台,以期讓每個科學家和科研團隊都可以擁有專屬的地理大模型,能夠與數百萬科學家通過共享數據、模型、研究思路等方式協同工作。

新京報記者 張璐

編輯 張磊 校對 趙琳