哈佛重磅突破:AI確定17000多種疾病候選藥物,罕見病「孤兒藥」不再遙遠?

「對於罕見病患者而言,有藥可用永遠都是第一位的。」

中國國際經濟交流中心理事長畢井泉曾於 2022 年這樣說。

罕見病,顧名思義,是患病相對較低的一類疾病。由於患病人數少、市場需求小,以及藥物研發難度大、成本高、週期長,罕見病治療難度居高不下,罕見病用藥更被稱為「孤兒藥」。絕大多數罕見病患者都面臨著治療困難、藥物短缺的問題。

據世界衛生組織(WHO)報導,在全球發現的超過 7000 種的罕見病中,有獲批的相應治療方案或藥物的病種不到10%,且大多需要終身藥物治療。在這一嚴峻背景下,如何為罕見病尋求有效治療藥物是緩解罕見病患者治療困境的關鍵一步。

這一步,在人工智能(AI)的幫助下有望向前邁出「一小步」。

日前,來自哈佛醫學院的研究團隊及其合作者開發了一個名為 TxGNN 的 AI 模型,這是首個專門為識別罕見疾病和無藥可治病症的候選藥物而開發的新辦法,它從現有藥物中確定了 17000 多種疾病的候選藥物,其中許多疾病沒有任何現有治療方法。與用於藥物再利用的同類 AI 模型相比,TxGNN 在識別候選藥物方面平均提高了近 50%,在預測哪些藥物會有禁忌症方面,準確率也高出 35%。

相關研究論文以「A foundation model for clinician-centered drug repurposing」為題,已發表在 Nature 子刊 Nature Medicine 上。

AI 如何促進藥物再利用?

傳統的藥物再利用(drug repurposing)策略,雖然利用現有藥物的安全性和有效性數據,可以加快新藥物在臨床中的應用,但這種方法往往是偶然的且機會性較強,很難系統地解決罕見病的藥物研發問題。

在這種背景下,TxGNN 應運而生,為藥物重新利用帶來了革命性的突破,特別是在罕見病藥物發現中展現出巨大的潛力。

TxGNN 是一種基於圖神經網絡(GNN)的基礎模型,專門用於零樣本藥物再利用。與傳統方法不同,TxGNN 並不局限於現有藥物和疾病的已知關係,而是通過訓練一個醫學知識圖譜(KG),將疾病和藥物之間的複雜關係嵌入到一個潛在的表示空間中,從而能夠針對任何給定的疾病預測潛在的治療藥物。該知識圖譜包含了 17080 種疾病、7957 種藥物、27671 種蛋白質等醫學概念,為 TxGNN 的訓練提供了豐富的數據基礎。

圖|TxGNN 是藥物再利用的圖基礎模型,可為治療選擇有限且分子數據有限的疾病確定候選藥物。(來源:該論文)圖|TxGNN 是藥物再利用的圖基礎模型,可為治療選擇有限且分子數據有限的疾病確定候選藥物。(來源:該論文)

在多次實驗中,TxGNN 展現出了其強大的預測能力。與 8 種現有的方法進行對比,TxGNN 在零樣本環境下表現出了顯著的優勢。根據論文中的實驗數據,TxGNN 在藥物指征預測的準確率上提高了 19%,在副作用預測上提高了 23.9%。

這些結果表明,TxGNN 不僅能夠在現有治療方案中找到潛在的新用途,更能夠在沒有已知治療方案的情況下,準確地預測出可能的藥物。這對於罕見病的治療具有重要意義,因為罕見病中超過 95% 沒有現有的治療藥物,而 TxGNN 為這些疾病快速發現新藥物創造了可能性。

圖|TxGNN 可準確預測藥物適應症和禁忌症。(來源:該論文)圖|TxGNN 可準確預測藥物適應症和禁忌症。(來源:該論文)

除了預測能力,TxGNN 還特別設計了一個解釋模塊,用於幫助醫生和研究人員理解模型的預測邏輯。這個模塊通過多跳路徑(multi-hop paths),展示了藥物與疾病之間的潛在聯繫。

解釋模塊不僅能夠指出某種藥物為何對特定疾病可能有效,還能提供詳細的醫學知識路徑,讓使用者能夠追溯到預測背後的科學依據。通過這項功能,TxGNN 克服了許多 AI 模型在醫學應用中的「黑箱問題」,大大提高了模型的可解釋性和信任度。

圖|TxGNN Explainer 中多跳可解釋路徑的開發、可視化和評估。(來源:該論文)圖|TxGNN Explainer 中多跳可解釋路徑的開發、可視化和評估。(來源:該論文)

研究團隊對 TxGNN 在罕見病藥物發現中的實際應用進行了驗證,並取得了令人鼓舞的成果。在實驗中,TxGNN 的許多預測與實際的臨床非處方藥物使用具有高度一致性。

例如,在對 1272085 名患者的電子病曆數據分析中,研究人員發現,TxGNN 預測的頂級藥物在這些患者群體中的使用頻率顯著高於隨機預測。log(OR)(共現比值)的分析顯示,TxGNN 預測出的藥物與罕見病的使用關聯性比底層藥物預測高出 107%,進一步證明了該模型在實際臨床環境中的有效性。

圖|在大型醫療系統中評估 TxGNN 的預測結果。(來源:該論文)圖|在大型醫療系統中評估 TxGNN 的預測結果。(來源:該論文)

一個具體的案例是,TxGNN 在預測 Wilson 病(一種導致銅代謝異常的罕見病)的潛在治療藥物時,推薦了去鐵酮(Deferasirox)作為最有前途的候選藥物。該藥物在臨床中已被用於治療鐵超載疾病,TxGNN 通過其解釋模塊展示了去鐵酮可能通過代謝途徑對 Wilson 病的治療產生積極作用。這一預測也與醫學文獻中的相關研究結果相符,顯示了該模型的科學合理性。

在當前藥物開發週期漫長、成本高昂的背景下,TxGNN 為現有藥物的重新利用提供了系統化的解決方案。

未來,隨著這一技術的不斷完善,它有望成為加速藥物開發、特別是使罕見病患者「有藥可用」的關鍵驅動力。

在醫學領域,AI 大有可為

除罕見病領域,AI 在其他醫學領域也有著廣泛的應用。

2019 年 9 月,AI 藥物研發公司 Insilico Medicine 開發了一個名為 GENTRL 的生成式 AI 平台,該平台已用於設計用於治療纖維化和癌症等疾病的新藥。通過使用 GENTRL,研究人員僅使用 21 天就發現了盤狀蛋白結構域受體 1 (DDR1) 的強效抑製劑,極大縮短了藥物發現時間。

2022 年,倫敦癌症研究所的研究人員創建了一個原型測試,可以在 24-48 小時內預測哪些藥物組合可能對癌症患者有效。他們使用 AI 分析來自腫瘤樣本的大規模數據,可以比目前的方法更準確地預測患者對藥物的反應。

2023 年,美國公司 Nuance Communications 推出一款新型 AI 驅動的語音激活軟件應用程序——Dragon Ambient Experience (DAX) Express。該計劃旨在通過利用自然語言處理技術,促進患者諮詢期間醫療記錄的實時轉錄,有效幫助減輕臨床醫生的管理負擔。

2024 年,來自哈佛醫學院的研究團隊及其合作者提出了臨床組織病理學成像評估基礎(CHIEF)模型,用於提取病理成像特徵以進行系統的癌症評估。在包含 11 種癌症類型的 15 個數據集上,CHIEF 在癌症檢測方面實現了近 94% 的準確率,顯著優於之前的 AI 方法。

毋庸置疑,AI 在改善罕見疾病檢測、藥物再利用以及臨床流程優化方面的潛力將會越來越大,能夠更好地幫助我們更好抗擊疾病。

本文來自微信公眾號「學術頭條」(ID:SciTouTiao),作者:阮文韻,36氪經授權發佈。