Nature重磅:AI擊敗最先進全球傳統天氣、氣候模型,30秒生成22.8天大氣模擬,準確預測40年全球變暖趨勢

來自世界氣象組織(WMO)的數據顯示,在過去 50 年里,平均每一天都會發生一場與天氣、氣候或水患有關的災害,而每一場災害平均會造成約 115 人死亡、約 2.02 億美元的經濟損失

更令人唏噓的是,近年來,由人類活動加速的氣候變化,更是使得熱浪、寒潮、強降水、乾旱等極端天氣和氣候災害異常頻發。

因此,及時、準確的天氣預測和氣候模擬不僅可以每年幫助挽救數萬人的生命,還能夠降低極端天氣和氣候事件對人類社會和生態系統的災難性影響。

如今,由 Google Research 研究團隊及其合作者開發的人工智能(AI)模型 NeuralGCM,將天氣預測和氣候模擬提升到了一個新的高度——

NeuralGCM 對 1-15 天預報的準確率,媲美歐洲中期天氣預報中心(ECMWF),後者擁有世界上最先進的傳統物理天氣預報模型;

對提前 10 天預報的準確率,NeuralGCM 與現有其他 AI 模型性能相當,甚至更好;

加入海平面溫度後,NeuralGCM 的 40 年氣候預測結果,與從 ECMWF 數據中發現的全球變暖趨勢一致;

NeuralGCM 在預測氣旋及其軌跡方面也超過了現有的氣候模型。

值得一提的是,NeuralGCM 不僅在準確度方面達到甚至超過了現有傳統數值天氣預報模型和其他機器學習(ML)模型;在速度上也是「遙遙領先」,可以在30 秒計算時間內生成 22.8 天大氣模擬;且可以比傳統模型節省數量級的計算量。

相關研究論文以「Neural general circulation models for weather and climate」為題,已發表在權威科學期刊 Nature 上。

這些結果共同表明,NeuralGCM 可以生成確定性天氣、天氣和氣候的集合預報,在長期天氣和氣候模擬方面顯示出了足夠的穩定性。

研究團隊認為,這種端到端深度學習與傳統大氣環流模型(GCM,表徵大氣、海洋和陸地的物理過程,是天氣和氣候預測的基礎)所執行的任務是兼容的,且能夠增強對理解和預測地球系統至關重要的大規模物理模擬。

此外,NeuralGCM 的混合建模方法還可以應用於其他科學領域,比如材料發現、蛋白質摺疊和多物理工程設計等。

真實效果怎麼樣?

減少長期預報的不確定性以及估算極端天氣事件,是理解氣候緩解和適應的關鍵。

ML 模型一直被認為是天氣預測的一種替代手段,具有節省算力成本的優勢,甚至在確定性天氣預報方面已經達到或超過了大氣環流模型的水平,但在長期預報的表現常常不如大氣環流模型

在這項工作中,研究團隊結合機器學習和物理方法設計了 NeuralGCM,利用 ML 組件替換或校正 GCM 中的傳統物理參數化方案,由以下幾個關鍵部分組成:

可微分的動力核心:該核心負責求解離散化的動力方程,模擬大尺度流體運動和熱力學過程,受重力、科氏力和其他因素影響。動力核心使用水平偽譜離散化和垂直 sigma 坐標,並使用 JAX 庫實現,支持自動微分。它模擬七個預報變量:水平風渦度、水平風散度、溫度、地表壓力和三種水物質(比濕、冰雲水含量和液態雲水含量)。

學習物理模塊:該模塊使用 GCM 中的單柱方法,僅使用單個大氣柱的信息來預測該柱內未解析過程的影響。它使用具有殘差連接的全連接神經網絡,並在所有大氣柱之間共享權重。神經網絡的輸入包括大氣柱中的預報變量、總入射太陽輻射、海冰濃度和海表溫度,以及預報變量的水平梯度。神經網絡的輸出是預報變量趨勢,按目標字段無條件標準差進行縮放。

編碼器和解碼器:由於 ERA5 數據存儲在壓力坐標中,而動力核心使用 sigma 坐標系統,因此需要編碼器和解碼器進行轉換。這些組件執行壓力水平和 sigma 坐標水平之間的線性插值,並使用與學習的物理模塊相同的神經網絡架構進行校正。編碼器可以消除初始化衝擊引起的重力波,從而避免汙染預測結果。

圖|NeuralGCM 模型架構。NeuralGCM 結合了傳統的流體動力學求解器和用於小尺度物理的神經網絡。這些組件由微分方程求解器組合而成,在時間上依次向前推進系統。(來源:Google Research)

結果顯示,NeuralGCM 在天氣預測方面展現出強大的能力,在超短期、短期和中期時間尺度上與最先進的模型相媲美。如下:

超短期預測(0-1 天)

泛化能力:與 GraphCast 相比,NeuralGCM 在未經訓練的天氣條件下表現更好,因為它使用局部神經網絡來預測大氣垂直柱中的物理過程。

短期預測(1-10 天)

準確性:在 1-3 天的短期預測中,NeuralGCM-0.7° 和 GraphCast 的表現最佳,準確追蹤天氣模式的變化。

物理一致性:與其他機器學習模型相比,NeuralGCM 的預測更加清晰,避免了物理上不一致的模糊預測。

可解釋性:通過診斷降水減去蒸發,NeuralGCM 的結果更具可解釋性,方便進行水資源分析。

地轉風平衡:與 GraphCast 相比,NeuralGCM 更準確地模擬了地轉風和地轉風的垂直結構及其比率。

中期預測(7-15 天)

集合預報:NeuralGCM-ENS 在 1.4° 解像度下的集合平均 RMSE、RMSB 和 CRPS 誤差均低於 ECMWF-ENS,表明其能夠更好地捕捉可能的天氣平均狀態。

可校準性:NeuralGCM-ENS 的集合預報與 ECMWF-ENS 一樣,具有大約 1 的發散率-技能比,這是校準預報的必要條件。

此外,除了在天氣預測方面表現出色,NeuralGCM 在氣候模擬方面也展現出了強大的能力,表現在季節循環模擬、熱帶氣旋模擬和歷史溫度趨勢模擬等方面。如下:

季節循環模擬

準確性:NeuralGCM 能夠準確地模擬季節循環,包括全球可降水和全球總動能的年度循環,以及哈德利環流和經向平均風等關鍵大氣動力學。

與全球雲分辨模型的比較:與全球雲分辨模型 X-SHiELD 相比,NeuralGCM 在可降水方面的偏差更小,並且在熱帶地區具有更低的溫度偏差。

熱帶氣旋模擬

軌跡和數量:即使在 1.4° 的粗糙解像度下,NeuralGCM 也能產生與 ERA5 相似的熱帶氣旋軌跡和數量,而全球雲分辨模型 X-SHiELD 在 1.4° 解像度下卻低估了熱帶氣旋數量。

影片|NeuralGCM 預測了 2020 年全球熱帶氣旋的路徑。預測結果與 ECMWF 再分析第 5 版(ERA5)數據集顯示的當年實際氣旋的數量和強度相吻合。(來源:Google Research)

歷史溫度趨勢模擬

AMIP 模擬:NeuralGCM-2.8° 進行了 40 年的 AMIP 模擬,結果表明,所有模擬均準確地捕捉了 ERA5 數據中觀察到的全球變暖趨勢,並且年際溫度趨勢與 ERA5 數據具有強相關性,表明 NeuralGCM 能夠有效地模擬海溫強迫對氣候的影響。

與 CMIP6 模型的比較:與 CMIP6 AMIP 模型相比,NeuralGCM-2.8° 在 1981-2014 年期間的溫度偏差更小,即使在消除了 CMIP6 AMIP 模型的全球溫度偏差之後,這一結果仍然成立。

圖|NeuralGCM 在十年時間尺度上的準確性和捕捉全球變暖的能力。NeuralGCM 和 AMIP 在預測 1980 年至 2020 年全球平均氣溫方面的表現比較。(來源:Google Research)

儘管 NeuralGCM 在天氣和氣候預測方面展現了強大的能力,但它仍然存在一些局限性

首先,NeuralGCM 預測未來氣候的能力有限。NeuralGCM 目前無法預測與歷史氣候明顯不同的未來氣候。當海表溫度(SST)增加幅度較大時(比如 +4K),NeuralGCM 的響應與預期不符,並出現氣候漂移現象。

其次,NeuralGCM 模擬未觀測氣候的能力不足。與其他機器學習氣候模型類似,NeuralGCM 也面臨著模擬未觀測氣候的挑戰,比如未來氣候或與歷史數據差異較大的氣候。這需要模型具備更強的泛化能力,以及更先進的訓練策略,比如對抗訓練或元學習。

然後,NeuralGCM 還存在物理約束和數值穩定性問題。例如,NeuralGCM 的譜分佈仍然比 ECMWF 物理預報模糊,且在模擬熱帶極端事件方面存在低估現象。這需要進一步研究和改進模型的物理過程參數化和數值方法,以提高模型的物理一致性和數值穩定性。

最後,缺乏與其他地球系統組件的耦合。目前 NeuralGCM 僅模擬大氣系統,而氣候系統是一個複雜的相互作用系統,包括海洋、陸地、冰雪和生物圈等。要進行更全面的氣候模擬,NeuralGCM 需要與這些組件進行耦合,並考慮它們之間的相互作用。這需要開發新的模型架構和訓練策略,以實現多物理場耦合模擬。

傳統天氣預測、氣候模擬,正被 AI 顛覆

在天氣預測和氣候模擬方面,NeuralGCM 並非「先行者」

在過去幾年中,包括華為、Google和清華大學等在內的科技公司和高校在這一方向均取得了重大進展。

2023 年 7 月,由華為雲開發的盤古氣象(Pangu-Weather)模型登上了 Nature,其使用 39 年的全球再分析天氣數據作為訓練數據,預測準確率與全球最好的數值天氣預報系統 IFS 相當,且在相同的空間解像度下比 IFS 系統快 10000 倍以上。

同期發表在 Nature 上的另一篇論文則介紹了NowcastNet,其出自機器學習領域泰鬥、加州大學伯克利分校教授 Michael Jordan 和清華大學教授王建民領導的研究團隊,該模型可以結合物理規律和深度學習,進行實時預報降水。

2023 年 11 月,Google DeepMind 推出了一款基於機器學習的天氣預測模型——GraphCast,在全球 0.25° 的解像度下,該模型可以在一分鐘內預測未來 10 天的數百個天氣變量,顯著優於傳統氣象預報方法,同時在預測極端事件方面表現良好。相關研究論文已發表在權威科學期刊 Science 上。

今年 3 月,同樣來自 Google Research 團隊開發的 AI 模型,擊敗了最先進全球洪水預警系統,其利用現有的 5680 個測量儀進行訓練,可預測未測量流域在 7 天預測期內的日徑流。

如今,傳統的天氣預測和氣候模擬正在被 AI 顛覆。在未來,AI 將進一步加速氣象預測的速度和精度,造福全人類。

參考鏈接:

https://www.nature.com/articles/s41586-024-07744-y

https://www.science.org/doi/10.1126/science.adi2336

https://www.nature.com/articles/s41586-024-07145-1

https://www.nature.com/articles/s41586-023-06185-3

https://www.nature.com/articles/s41586-023-06184-4

本文來自微信公眾號「學術頭條」,作者:學術頭條,36氪經授權發佈。