科學家打造新型AI模型,檢測19360張多模態影像,實現乳腺癌風險的病理級別精準分級

近日,上海科技大學助理教授錢學駿和合作者開發出一種多模態 AI 系統——BMU-Net 模型,推動了乳腺癌篩診方法的發展 [1]。

圖 | 錢學駿(來源:錢學駿)

BMU-Net,是一個結合傳統卷積神經網絡與 Transformer 的混合深度學習框架。通過引入不同癌變風險等級的乳腺疾病樹,課題組實現了多層級乳腺癌風險預測。

研究中,該團隊利用 5025 名患者的 19360 張乳腺影像開展了本次模型的開發和測試。

相比由資深放射科醫生進行的 158 例鉬靶檢查診斷結果和 146 例超聲檢查診斷結果,BMU-Net 在乳腺癌良惡性分類上與專家水平相當,在組織病理學分級診斷上則能超越人類專家的表現。

針對 187 名患者進行賽前分析性多模態數據驗證時,BMU-Net 取得 90.1% 的準確率,這已經非常接近人類專家 92.7% 的準確率。

針對乳腺癌和其他乳腺疾病的風險分層,該 AI 系統提供了一個精細化的全新解決方案。

其以精準的乳腺癌風險分層能力為基礎,為健康篩查和門診病人的檢測與管理提供一條智能化的路徑,不僅在醫療實踐中具有顯著的應用價值,也能帶來重要的社會價值和經濟效益。

總的來說,這一系統的預測能力強於資深放射科醫生,並能初步達到資深病理科醫生的水準,為乳腺癌的篩查和診斷提供了新途徑。

錢學駿表示,本次研究是針對多模態 AI 在乳腺癌風險分層上開展的可行性驗證,預計經過進一步的數據調優、工程化驗證之後,可以廣泛用於不同層級的篩查與診斷。

同時,它還將助力於滿足國家「兩癌」篩查戰略需求,通過提高早期診斷的效率與準確性,助力提升整體醫療服務質量、改善患者預後以及減少公共衛生負擔。

(來源:Nature Biomedical Engineering)(來源:Nature Biomedical Engineering

中國乳腺癌患者的發病特點:高、快、早

據錢學駿介紹,乳腺癌是全球女性中發病率最高的癌症。而在中國它呈現出三個顯著特點:首先,發病率基數高;其次,患者增速是全球平均增速的兩倍(居世界首位);最後,發病年齡更早,中國患者的平均發病年齡較西方國家提前十年。

然而,乳腺癌患者如能得到及時治療,其患病五年後生存率可以高達 90% 以上。

因此,早期的篩查與診斷對於乳腺癌的防治至關重要,甚至比之後的治療措施更重要。正因此,從 2009 年開始國家將「兩癌」(乳腺癌和宮頸癌)篩查列入重大公共衛生服務項目。

在乳腺癌的篩查和診斷中,需要針對龐大且具多層次特點的人群提供解決方案,要想實現從一線城市到二三線城市再到鄉村的廣泛覆蓋,就要求影像檢查設備具有成本低、可及性強和檢測準確度高等特點。

然而,由於種族構成(比如緻密性乳腺與脂肪性乳腺的差異)、經濟條件和社會因素等不同,該領域逐漸發展出兩個主要的檢查思路。

在歐美等西方國家,通常以鉬靶為主,超聲為輔。而在亞洲等東方國家尤其是中國,超聲通常是主要的篩診工具,鉬靶則主要起到輔助作用。

當然,具體選擇要根據每位患者的具體情況而定,並非一成不變。總體而言,超聲和鉬靶影像各有優缺點,兩者互為補充,能夠形成有效的合力,同時這也是當前乳腺癌篩查與臨床診斷的普遍共識。

經過長期的臨床實踐總結,全球範圍內形成了「鉬靶+超聲」這一黃金組合策略,以便提供更準確、更全面的乳腺癌篩查與診斷。

在乳腺癌的體檢中,許多常規體檢套餐都會要求體檢者在乳腺超聲和鉬靶影像這兩者之間選擇其一;門診醫生則會根據患者的具體情況選擇適合的檢查方式,必要時兩者結合使用。這一情景也是上述「黃金組合」的真實寫照。

之所以這樣組合是因為:儘管超聲影像技術在乳腺疾病的診斷中具有無輻射、成本低以及廣泛可用的優點,但其在探測癌症早期跡象,特別是微小鈣化灶方面相對不夠敏感。

而鉬靶影像正是彌補這一不足的關鍵工具,這也是為何在國際範圍內鉬靶影像常被推薦為乳腺癌篩查唯一標準的原因。

影像學檢查,是乳腺癌篩查與早期診斷的重要環節,但並非唯一的判斷依據。患者的主訴、既往病史以及臨床發現,同樣是醫生做出精準診斷的重要參考。

超聲影像的解讀高度依賴於醫師的經驗,這也是該技術面臨的主要限制。此外,乳腺癌的篩診往往需要針對一系列的指標、參數和影像進行綜合評估,而這會帶來巨大的數據量和分析挑戰。

值得注意的是,這些解讀所面臨的挑戰恰好是 AI 技術所擅長解決的,即 AI 具有提供穩定且高效影像解讀的能力,從而能夠減少人為偏差。即通過處理多種輸入信息進行融合學習,實現高效且穩定的診斷。

作為一名致力於醫學超聲技術開發的學者,錢學駿非常明白超聲診斷的重要性以及其廣泛的應用潛力。

正是因為無輻射、低成本且易於普及的特點,超聲影像才得以成為中國乳腺疾病檢測首選方案。因此,他和合作者多年前就開始著手利用多模態超聲影像數據來輔助乳腺癌的診斷。

而之所以開展本次研究,是因為他和合作者希望為這項需求量極大、檢測範圍廣泛、需要長期監測的工作提供更好的智能化支持,進一步推動乳腺癌篩查和診斷工作的進步與優化。

用 AI 為「黃金組合」錦上添花

需要指出是,儘管乳腺磁共振成像也是一種用於乳腺檢查的常見手段,但由於其昂貴的成本和嚴格的使用條件(需要專門的場地和乳腺線圈),其更適合用於乳腺癌確診後的分期評估或術後監測,因此並不適合用於大規模的常規篩查與門診檢查。而多模態影像策略則有助於提升早期乳腺癌的篩查與診斷效率。

影像學檢查,在現代醫學實踐中佔據著重要地位。然而,到底該選擇哪種影像檢查方式,需要醫生在綜合考量患者的主訴、既往病史以及臨床發現後做出決策。

因此,臨床指標不僅可以指導後續的影像檢查選擇,也是全面評估病患狀況的關鍵因素之一。

例如,對於年輕患者(如 30 歲),醫生通常會優先考慮超聲檢查,而非選擇會產生輻射的鉬靶影像。至於最終的診斷結論,一般由超聲報告和臨床觀察共同決定。

鑒於此,本次研究也將臨床問診納入模型的構建之中。錢學駿表示,這一環節的複雜性遠超影像信息的處理。

對於鉬靶和超聲圖像的影像數據獲取來說,這是一個相對流程化且規範的操作,只需經過脫敏和安全檢查之後,這些圖像數據就能很好地進行保存。

然而,臨床信息的獲取則難度更高。此類信息的記錄依賴於與患者的直接交流,只有這樣才能獲取他們的年齡、身高、體重和病史等信息。

但是,這種方式常常面臨患者在信息提供上的猶豫,這也是本次項目所面臨的一個挑戰。

不過,經過團隊的不懈努力,課題組最終克服了這些困難,順利完成了數據的全面整合。

(來源:Nature Biomedical Engineering)(來源:Nature Biomedical Engineering

錢學駿表示,在當今的精準醫療時代,疾病的鑒別診斷對於優化患者的治療方案和疾病管理具有重要意義。

因此在本次項目中,他們摒棄了傳統的簡單良惡性分類方法,轉而採用更為有效的樹狀結構分類法。

這種結構在處理和組織層次化的信息時十分有用,非常有助於他們直觀地理解各種數據的結構和關係。

比如,在該團隊設計的乳腺疾病樹中,第一層是乳腺疾病(根節點),接下來細分為良性疾病(一級子節點),再往下分為風險很低的良性病變(二級子節點),最終到達具體的乳腺纖維腺瘤(葉子節點)。

這種樹狀結構的優勢在於,它允許研究人員從根節點出發,通過層級結構逐步深入,從而明確地得出粗粒度或細粒度的診斷結果,進而支持醫生做出更全面和個性化的判斷。

與此同時,AI 模型的構建通常需要大量的數據。然而,在該領域他們很難收集到大規模完整匹配的鉬靶信息、超聲信息和臨床信息。

因此在實際臨床中,患者可能不會進行所有類型的檢查,這就導致多模態數據的不完整問題非常常見。

為解決這一難題,他們開發出一種模塊化 AI 模型設計策略。在這種設計中,每個模塊採用單獨數據集進行獨立訓練。

這樣一來即便多模態數據集較為稀缺,但是單一的超聲或鉬靶數據集則相對更易獲取。

通過利用這些單獨的數據集,可以先行訓練各自模塊,隨後在完整模型的搭建過程中,通過少量匹配數據進行整體微調從而實現多模態的整合。

值得一提的是,這一構建與微調的過程是持續且複雜的。在癌症研究中,目標人群本身就相對小眾,而當他們進一步細分至乳腺疾病樹的具體癌症類型時,目標樣本量更是有限(例如原位癌)。

事實上,這裏涉及到 AI 模型設計中的經典問題:長尾效應。針對此他們通過一系列技術手段進行優化,比如利用調整訓練策略、優化損失函數、隨機采樣以及遷移學習等,來提升少樣本類別的識別準確性,同時還不會影響其他類別的表現力。

圖 | 相關論文(來源:Nature Biomedical Engineering)圖 | 相關論文(來源:Nature Biomedical Engineering

最終,相關論文以《一種用於分層乳腺癌風險的多模態機器學習模型》(A multimodal machine learning model for the stratification of breast cancer risk)為題發在 Nature Biomedical Engineering(IF 26.80),錢學駿是第一作者兼通訊作者。

另據悉,錢學駿於 2019 年在美國南加州大學獲得生物醫學工程博士學位,後在該校從事博士後研究。

隨後,他回國加入上海科技大學,目前主要研究多模態醫學數據融合方法、超快速高解像度超聲成像技術以及人工智能在醫學影像中的應用。

參考資料:

參考資料:

1.Qian, X., Pei, J., Han, C.et al. A multimodal machine learning model for the stratification of breast cancer risk. Nat. Biomed. Eng (2024). https://doi.org/10.1038/s41551-024-01302-7

運營/排版: 何晨龍