哈佛推出全新類ChatGPT癌症診斷AI,登上Nature,準確率高達96%

能夠執行多種任務,識別19種癌症類型,預測患者生存率……哈佛醫學院研究人員提出CHIEF,一種多功能AI癌症診斷模型,表現出類似於ChatGPT的靈活性,遠超其他現有的癌症診斷模型。

近日,來自哈佛醫學院等機構的科學家們開發了一種名為CHIEF(Clinical Histopathology Imaging Evaluation Foundation,臨床組織病理學成像評估基礎)的多功能AI癌症診斷模型。

並於9月4日登上「Nature」。

論文地址:https://www.nature.com/articles/s41586-024-07894-z論文地址:https://www.nature.com/articles/s41586-024-07894-z

值得一提的是,儘管最近出現了其他用於醫學診斷的病理圖像基礎AI模型,但CHIEF是第一個能夠預測患者預後並在多個國際患者群體中驗證的模型。

工作原理

當前,大多數AI癌症診斷系統通常被訓練來執行特定任務。例如,檢測癌症的存在,或分析腫瘤的基因特徵,且通常僅適用於少數幾種癌症類型。

相比之下,全新的CHIEF模型則具有類似於ChatGPT的靈活性——不僅能夠執行多種任務,而且還能識別不同癌症類型需要特別關注的區域。

通過讀取腫瘤組織的數字切片,它可以檢測癌細胞並根據圖像中觀察到的細胞特徵分析腫瘤的基因特徵。

此外,還可以預測多種癌症類型的患者生存率,並精確定位腫瘤周圍組織的特徵,即腫瘤微環境。這些特徵與患者對手術、化療、放療和免疫治療等標準治療的反應有關。

更進一步的,CHIEF還具有生成新見解的潛力——它發現了此前未被認為與患者生存相關的特定腫瘤特徵。

研究團隊指出,這些發現進一步證明了AI可以幫助臨床醫生高效、準確評估癌症,包括識別可能對標準癌症療法反應不佳的患者。

論文主要作者,哈佛醫學院Blavatnik研究所生物醫學信息學助理教授Kun-Hsing Yu論文主要作者,哈佛醫學院Blavatnik研究所生物醫學信息學助理教授Kun-Hsing Yu

模型訓練與表現

首先,CHIEF在1500萬張未標記的圖像上進行訓練,這些圖像被分成多個模型可能需要特別關注的部分。

然後,CHIEF在6萬張全切片圖像上進行了訓練,其中包括肺、乳腺、前列腺、結腸、胃、食管、腎臟、腦、肝、甲狀腺、胰腺、宮頸、子宮、卵巢、睾丸、皮膚、軟組織、腎上腺和膀胱等組織的全切片圖像。

這種訓練方法,使得模型不僅關注圖像的局部,還能夠結合整個圖像,將某一局部的特定變化與整體聯繫起來。從而,CHIEF在進行癌症分析時能夠考慮更廣泛的背景信息,更全面地解讀圖像,而不是僅僅專注於某個特定區域。

訓練完成後,研究團隊在19400多張全切片圖像上測試了CHIEF的性能。這19400多張全切片圖像來自全球24家醫院和患者群體中收集的32個獨立數據集。

總體上,CHIEF在以下任務中比其他最先進的AI方法卡奧出36%:癌細胞檢測、腫瘤起源識別、預測患者結果、以及識別與患者治療反應相關的基因和DNA模式。

無論腫瘤細胞是通過活檢還是手術切除獲得,CHIEF的表現都同樣出色。無論使用何種技術對癌細胞樣本進行數字化處理,它的準確性也同樣高。

研究人員表示,這種適應性使CHIEF能夠在不同的臨床環境中使用,而當前大部分AI癌症診斷模型通常只能在通過特定技術獲取的組織中表現良好。

CHIEF的4種應用

癌症檢測

CHIEF在癌症檢測中的準確率達到了近94%,測試涵蓋了15個數據集,其中包含11種癌症類型。

在另一個涵蓋5個活檢數據集的測試中,CHIEF達到了96%的準確率,其中包括食道、胃、結腸和前列腺在內的多種癌症類型檢測。

當研究人員用數據集之外的手術切除腫瘤切片來測試CHIEF時,模型的準確率超過了90%。

模型注意力得分的可視化顯示,CHIEF準確識別了黑色素瘤、肺癌和腎癌的癌變區域模型注意力得分的可視化顯示,CHIEF準確識別了黑色素瘤、肺癌和腎癌的癌變區域

分析腫瘤的基因特徵

腫瘤的基因構成包含了未來腫瘤發展和最佳治療方案的關鍵線索。為了獲取這些信息,腫瘤學家通常會對腫瘤樣本進行DNA測序。

但由於將樣本送往專業的DNA測序實驗室需要一定的成本和時間,世界各地普遍沒有進行常規的詳細的基因組分析。即使是在資源充足的地區,這一過程也可能需要數週時間。

不過,這是AI可以填補的空白。

研究人員稱,對於圖像中特定的基因組異常,識別其細胞模式,可能提供一種快速且經濟的替代基因組測序的方案。

CHIEF在預測腫瘤的基因變異方面優於現有的AI方法。這種新的AI方法成功識別了與癌症生長和抑制相關的多個重要基因特徵,並預測了腫瘤在各種標準癌症療法過程中的關鍵基因突變。

CHIEF還檢測到了特定的DNA模式,這些模式與結腸腫瘤對一種稱為免疫檢查點抑制的免疫療法的反應效果相關。

在觀察全組織圖像時,CHIEF識別出54個常見突變癌症基因中的突變,總體準確率超過70%,優於當前用於基因組癌症預測的最先進AI方法。

研究團隊使用CHIEF模型來預測特定基因突變,這些突變與FDA(美國食品藥品監督管理局)批準的靶向治療方法的效果有關。研究涉及的18個基因分佈在人體的15個不同解剖部位。

CHIEF在多種癌症類型中都達到了高準確率。在檢測一種名為瀰漫性大B細胞淋巴瘤的血液癌症中的EZH2基因突變時,CHIEF達到了96%的準確率;在檢測甲狀腺癌中的BRAF基因突變時,CHIEF的準確率達到了89%;在檢測頭頸部癌症中的NTRK1基因突變時,準確率為91%。

CHIEF 在預測癌症類型的組織病理學圖像中的基因突變狀態方面取得了很高的成績CHIEF 在預測癌症類型的組織病理學圖像中的基因突變狀態方面取得了很高的成績

預測患者生存率

基於初次診斷時獲得的腫瘤組織病理圖像,CHIEF能夠成功預測患者的生存期。

總體上,CHIEF預測高風險和低風險死亡率的能力在來自17家不同機構的患者樣本中得到了測試和驗證。

在所有研究的癌症類型和患者群體中,CHIEF能夠區分長期生存的患者和短期生存的患者。CHIEF的表現比其他模型好8%。

在患有晚期癌症的患者中,CHIEF的表現比其他AI模型高出10%。

識別不同癌症類型需要特別關注的區域

該模型在圖像上識別出與腫瘤侵襲性和患者生存率相關的明顯模式。

為了可視化特定的區域,CHIEF在圖像上生成了熱圖。當人類病理學家分析這些由AI生成的熱點時,他們發現了一些反映癌細胞與周圍組織相互作用的有趣信號。

模型注意力的可視化顯示了肺癌患者生存預測中的重要區域模型注意力的可視化顯示了肺癌患者生存預測中的重要區域

其中一個特徵是,在長期生存者的腫瘤區域中,免疫細胞的數量比短期生存者更多。Yu指出,這一發現有其合理性,因為更多的免疫細胞可能表明免疫系統已被激活來攻擊腫瘤。

在觀察短期生存者的腫瘤時,CHIEF識別出了一些需要關注的區域。這些區域的特徵包括各種細胞成分的異常大小比例、細胞核上更多的非典型特徵、細胞之間較弱的連接,以及腫瘤周圍區域中較少的結締組織。

這些腫瘤周圍還有更多的死亡細胞。例如,在乳腺腫瘤中,CHIEF指出組織內的壞死(或細胞死亡)是一個需要關注的區域。另一方面,生存率較高的乳腺癌患者腫瘤周圍,更有可能保持類似於健康組織的細胞結構。

研究團隊指出,與生存率相關的視覺特徵和需要關注的區域因癌症類型而異。

參考資料

96% Accuracy: Harvard Scientists Unveil Revolutionary ChatGPT-Like AI for Cancer Diagnosis

https://hms.harvard.edu/news/new-artificial-intelligence-tool-cancer

本文來自微信公眾號「新智元」,作者:新智元,36氪經授權發佈。