北京啟動醫療人工智能應用評測服務,驗證臨床輔助決策能力和效果

IT之家 11 月 9 日消息,11 月 7 日,北京市衛生健康委發佈《關於開展醫療領域人工智能應用評測工作的通知》,正式向各企業、研究機構提供評測服務。

據介紹,隨著近年來人工智能技術的飛速進步,醫療 AI 正在加速向輔助醫生、承擔部分醫生技術勞動的方向發展。如何堅持科技為民、科技向善,確保醫療 AI 應用的規範安全有效,成為公眾關注和行業關心的問題。

為此,北京市衛生健康委在國家基地建設中專門設立了醫療人工智能應用評測中心(IT之家註:以下稱評測中心),旨在建立醫療 AI 評測的制度體系與規範標準,依託首都高水平醫院和專家隊伍、高質量醫療數據,驗證醫療 AI 的臨床輔助決策能力和效果,築牢醫療人工智能應用安全底線,同時助力醫療人工智能產品迭代優化。

首先,在評測內容上,評測中心專門建了一套多維度考核標準,從百姓和醫生最關心的角度出發,形成了 6 個核心維度(醫學合規倫理、醫學循證與知識、通用輔助能力、專科診療質控管理、診療流程適配性、診療決策準確性)的評測指標體系,包含 70 多項具體評測任務,全面覆蓋了看「安全」,查有沒有泄露隱私、有沒有違背醫學倫理;看「專業」,測會不會用最新的醫學教材、診療指南;看「適用」,查是否符合醫生的思考邏輯和日常工作流程;看「準確」,看 AI 診斷對不對,給的治療建議合不合理。

其次,在評測數據上,評測中心聯合重點醫院、科研機構及權威專家團隊,用臨床案例、國內外權威醫學教材和最新臨床診療指南,共同構建高質量評測數據集。權威醫學教材確保基礎知識紮實,臨床診療指南保證與臨床實踐同步,典型案例覆蓋常見病、罕見病及疑難病。「考題」由國內頂級專科高年資醫師全程深度參與編撰與審核而成,確保評測的科學性和權威性。

最後,在評測方法上,評測中心嚴格實施用戶申請、系統評測、專家複核三個環節,系統根據應用類型自動匹配評測任務並生成評測報告,由臨床專家進行複核。在計分方式上,除採用國際通用基礎評測指標外,評測中心還創新引入了基於人工智能的評分機制,也就是用一個「球證模型」來判卷,綜合「考生」的診療思路、推理邏輯、答題結果進行量化打分,避免只看最終結果的片面性。比如兩款人工智能應用都診斷對了,評測系統會給推理邏輯更嚴謹、依據更充分的那款打更高分,確保評測結果客觀公正、科學可信。

《通知》中還提到,本次評測服務是醫療領域國家人工智能應用中試基地首次提供對外評測服務,主要聚焦胸外科診療領域開展專項評測。評測結果將根據參評單位意願適時公佈,評測表現優秀的應用將優先納入國家人工智能應用中試基地推廣渠道,向各級醫療機構重點推薦。

後續,評測中心將陸續開展更多醫學領域的評測服務,覆蓋內科、外科、兒科等專業領域,助力醫療人工智能產業健康發展,更好地服務人民群眾健康需求。

廣告聲明:文內含有的對外跳轉鏈接(包括不限於超鏈接、二維碼、口令等形式),用於傳遞更多信息,節省甄選時間,結果僅供參考,IT之家所有文章均包含本聲明。