研究人員打造AI框架,幾秒鍾實現心臟電信號98%預測精度

近日,西北工業大學本科校友、美國布朗大學博士畢業生、美國約翰斯霍普金斯大學博士後研究人員尹明朗和所在團隊,提出了一種基於 AI 的神經算子框架(DIMON,DIffeomorphic Mapping Operator learNing)來預測偏微分方程(PDEs,Partial differential equations)在不同幾何形狀的計算域上的解,並證明 DIMON 具備廣適用性和可擴展性。

圖 | 尹明朗(來源:尹明朗)研究中,他們使用 DIMON 成功預測了上千名心臟病患者的心臟電信號傳播。在這個任務中,DIMON 把原來需要在超算上演算 3-5 個小時的任務轉移到了個人筆記本上,並且只需幾秒鍾就完成了精度高達 98-99% 的預測結果。此外,訓練 DIMON 只需在個人筆記本上花費 10 分鐘,與數值偏微分方程求解所需計算成本比起來可忽略不計。

相關論文發表於 Nature Computational Science。在論文上線的三個多月中獲得了超過 22000 次點擊。

其認為,這種框架在工程領域和醫學領域有很大的應用前景,例如可用於工程領域的外形優化以及偏微分方程快速求解等等。舉一個醫學的例子:尹明朗所在團隊通過研發新的計算技術以及 AI 模型來解決心臟病專家所面臨的臨床問題,其中包括一項名為數字孿生(digital twins)的技術。

數字孿生是一種為精確醫療帶來革命性的技術,並且已經被用於提升心臟病患者護理和治療計劃。但是鑒於在現階段應用中過高的計算成本,這項技術在進一步擴大臨床中的應用面臨挑戰。

而本次成果可以當作一種新型的解決方案,推動並擴大數字孿生技術在心臟病學以及精確醫療中的應用。尹明朗等人預計,心臟病醫生未來可以在一系列的應用中利用和轉化這項技術,例如用於支持臨床診斷、預測患者對藥物的反應或者優化手術方案等等。

但尹明朗特別強調,DIMON 的適用性遠比上述領域要廣。目前,他和所在團隊也在積極與其他領域的學者進行合作。

偏微分方程刻畫了客觀世界中物理量隨時間、空間變化的關係。例如,偏微分方程可以用來描述水流的運動、藥物在人體中的代謝和擴散、為金融衍生品的期權定價,以及用於計算機圖像處理等。

使用數值方法求解偏微分方程是科學和工程領域中一項非常常見的任務。在優化設計或計算科學等許多應用場景下,經常需要在不同形狀的計算域上對偏微分方程進行重覆求解。

一次偏微分方程求解可能會在超級計算機的數十乃至上千個計算核心上花費幾十小時甚至更久,但如果在上千個不同形狀計算域上重覆次過程,計算成本會高得難以承受。

而本次研究的動力也來自於臨床應用的迫切需求,尹明朗等人意識到當前生物醫學工程領域亟需一種能夠快速預測偏微分方程在不同計算域上解的手段,來推廣數字孿生技術並輔助臨床醫學。針對這個挑戰,他和所在團隊希望能夠研發一種新型 AI 解決方案。

此前,針對本次問題的理論框架以及模型探索處於幾乎空白的狀態。與此同時,這也是尹明朗在博士後訓練中接手的第一個項目。

經過大量的文獻閱讀之後,尹明朗意識到,微分流形和形狀分析的一些理論以及方法可以引入到 AI 模型中。很多相關領域學者就在尹明朗目前所在的約翰斯霍普金斯大學的應用數學系和生物醫學工程系。

所以,尹明朗主動聯繫了相關學者並達成了合作意向。在合作的過程中,兩位數學系教授提供了大量的理論幫助。「有時候我會開玩笑地說,有問題解決不了我就走到隔壁樓。尹明朗表示。而在與他們的合作中,DIMON 的理論框架也被確定下來。

隨後,尹明朗尋找實際數據並著手產生訓練所需的數據。其表示:「我堅持認為自己的研究應該是問題導向的,並且一定要用實際數據來驗證模型表現。

但是,處理實際數據非常費時費力。他所遇到的幾個挑戰包括:由於數據來源於心臟病患者的核磁影像因此圖像分割質量層次不齊,由於之前並沒有相關方面的代碼積累因此缺少自動化的 code,由於數據來源於上千個心臟病人因此數據量十分龐大。為此,針對所產生的訓練數據,他們花費了將近六個月的時間。

當然,也可以選擇不用患者數據,而是使用合成數據作為替代。但是,尹明朗認為這種方案無法百分百地確定模型在實際數據上的表現。幸運的是,他對於使用實際數據的堅持最終是值得的。

尹明朗是第一作者,約翰斯霍普金斯大學娜塔莉亞·特拉也諾娃(Natalia Trayanova)教授和毛羅·曼吉奧尼(Mauro Maggioni)教授擔任共同通訊作者。

(來源:Nature Computational Science

總的來說,本次框架提供了一種基於 AI 的快速預測偏微分方程解的解決方案,並使 AI 能夠促進許多下遊應用。

除了在臨床醫學中的應用,研究人員的框架在拓撲優化方面也很有前景。在拓撲優化中,形狀被優化以滿足某些設計要求,在這種優化過程中,偏微分方程需要在大量不同幾何域上反復求解。

DIMON 允許通過自動微分計算成本函數相對於描述域形狀的參數的導數,這反過來又簡化了形狀優化中容許變形的計算。該框架方便地允許在不同的幾何形狀上施加邊界條件、初始條件或局部材料特性。

DIMON 也有幾個局限性。在這項工作中,研究人員只考慮映射標量函數,而映射向量場或張量場尚未討論,因為它在表示流體和固體力學中的應力和速度方面具有特別重要的意義。結合跨形狀或流形傳輸矢量場和張量場的方法可能會解決這個問題,並在未來引起人們的興趣。

本次框架旨在學習一系列微分域上的算子,而在非微分域或拓撲不同域上的學習算子需要先討論偏微分方程解的存在性,需要視情況討論,超出了 DIMON 的討論範圍。

此外,儘管主成分分析(PCA,principal component analysis)確實是一種不考慮拓撲結構對形狀進行參數化的通用方法,但由於非均勻有理 B 樣條(NURBS,non-uniform rational B-spline)等局部形狀參數化方法具有樣條或多項式的顯式形式,所以也可以採用這些方法。

此外,對網絡的收斂速度進行嚴格分析超出了本研究的範圍,因此很難先驗地估計實現給定解精度所需的訓練集的大小。

此外,本次工作對尹明朗等人未來的研究具有奠基性的意義。尹明朗等人在一方面在積極利用 DIMON 驗證它在實際臨床中的應用,比如預測房顫或者缺血性心臟病患者的電生理過程。另一方面,尹明朗在與計算數學家與工程師合作,在拓展 DIMON 在外形設計中的應用。

參考資料:

1.Yin, M., Charon, N., Brody, R. et al. A scalable framework for learning the geometry-dependent solution operators of partial differential equations. Nat Comput Sci 4, 928–940 (2024). https://doi.org/10.1038/s43588-024-00732-2

排版:劉雅坤