天文預測新SOTA!紫東太初&國家天文台聯手攻克恒星耀發難題

FLARE團隊 投稿

量子位 | 公眾號 QbitAI

還記得劉慈欣在《全頻帶阻塞干擾》中描繪的耀斑爆發嗎?

現在科幻照進現實,人類踏出了理解耀斑的重要一步——預測。

來自紫東太初中國科學院國家天文台的研究團隊,聯合開發了天文耀發預測大模型FLARE(Forecasting Light-curve-based Astronomical Records via features Ensemble)

該模型能精準預測恒星耀發事件,為天文學研究提供了全新的有力工具,也展示了AI for Science在天文學領域的巨大潛力。

相關研究論文已成功被人工智能領域國際頂級會議IJCAI 2025錄用。

以下是更多詳細內容介紹。

恒星耀發從何而來

恒星耀發是恒星大氣中磁場能量的快速釋放過程,對於理解恒星結構、演化、磁活動以及探索系外宜居行星和外星生命意義重大。

然而,目前通過觀測獲得的耀發樣本數量有限,難以滿足全面深入的研究需求。

因此,準確預測恒星耀發時間成為天文學研究的重要任務,但此前這一領域一直缺乏相關研究成果。

與相對容易預測的太陽耀斑不同,恒星耀發預測主要依賴光變曲線

△恒星的光變曲線△恒星的光變曲線

光變曲線不僅常存在數據缺失問題,而且不同恒星、同一恒星在不同時期的光變曲線變化趨勢差異極大,這些複雜因素給預測工作帶來諸多挑戰。

在此背景下,紫東太初研究團隊與國家天文台聯合開展研究。

他們發現,恒星的物理屬性(如年齡、自轉速度、質量等)以及歷史耀發記錄,與恒星耀發存在顯著關聯。

基於此,雙方合作開發了FLARE模型

該模型通過獨特的軟提示模塊(Soft Prompt Module)殘差記錄融合模塊(Residual Record Fusion Module),有效整合了恒星物理屬性和歷史耀發記錄,提升了光變曲線特徵提取能力,進而提高了耀發預測的準確性。

FLARE模型架構解析

在模型架構方面,FLARE首先將光變曲線分解為趨勢和殘差成分,利用移動平均法去除數據缺失的影響,分別對其進行處理,並通過殘差記錄融合模塊將歷史耀發記錄融入殘差中,增強模型的穩健性。

△天文耀發預測大模型FLARE的整體結構圖△天文耀發預測大模型FLARE的整體結構圖

對於恒星物理屬性,軟提示模塊將屬性名稱和數值組織成文本結構,借鑒P-tuning方法,部分替換詞向量為可訓練參數,更好地保留了物理屬性的意義,有助於區分不同恒星。

此外,研究團隊採用預訓練大模型,並利用低秩微調LoRA技術對模型進行微調,使其能夠同時處理文本和光變曲線數據,最終通過多層感知器預測未來24小時內恒星耀發的概率。

模型性能實驗

為驗證FLARE模型的性能,研究人員使用7160顆恒星的高精度光變曲線數據進行實驗。

他們將FLARE模型與多種基線模型對比,涵蓋了基於時間序列表示學習的各類方法,如多層感知器(MLPs)循環神經網絡(RNNs)卷積神經網絡(CNNs)圖神經網絡(GNNs)Transformer,以及基於預訓練語言大模型的時間序列分析方法。

△FLARE模型與多種基線模型的對比結果△FLARE模型與多種基線模型的對比結果

實驗結果顯示,FLARE模型在準確率、F1值、召回率、精度等多項評估指標上表現優異,準確率超過70%,顯著優於其他模型。

通過具體實例研究,FLARE模型展現出強大的適應性。

它能夠根據不同恒星的光變曲線變化模式,準確預測耀發事件,即使是同一恒星不同變化模式的光變曲線,也能實現精準預測。

△FLARE模型對多個樣本耀發預測結果△FLARE模型對多個樣本耀發預測結果

未來,隨著研究的深入,FLARE模型有望在天文研究中發揮更大作用,助力科學家們探索更多宇宙奧秘。

論文鏈接:https://arxiv.org/abs/2502.18218

一鍵三連「點讚」「轉發」「小心心」

歡迎在評論區留下你的想法!