國內首個行業數據空間 一場「菌」與「數據」的碰撞
作者/ IT時報記者 潘少穎
編輯/ 潘少穎 孫妍
在以創新、科技為牽引的醫藥領域,無論是藥物還是醫療器械的研發,都繞不開數據。當數據成為醫藥領域創新與科技的「新引擎」,數據資源整合、共享與安全性也面臨著前所未有的挑戰。
數據的價值在於流動與共享,在確保醫療數據隱私與安全的前提下,實現高效流通與利用,是擺在行業面前的一道必答題。
「希望借此打造彙聚高質量、標準化數據資源和數據服務的新型基礎設施,以應用場景提升醫療健康數據流通效率,釋放和激活醫療健康數據要素價值和潛能。」在9月12日舉行的上海數交所行業數據空間發佈會上,上海數交所副總經理徐彥堯這樣表示。
釋放和激活醫療健康數據要素價值和潛能的「抓手」之一是數據空間,由上海數交所聯合生物芯片上海國家工程研究中心、大數據流通與交易技術國家工程實驗室、芯超數據牽頭組織國內醫療機構、藥企、體外診斷企業、健康管理服務機構等多類主體共同建設的重大疾病行業創新中心幽門螺杆菌數據空間,是國內首個行業數據空間,依託數據空間實現數據安全提供,推動數據在醫療、科研、藥物研發等領域的多場景應用、多主體複用,更好發揮數據要素乘數效應。
精準對接數據個性化需求
數據安全、數據質量、法律法規……在不少業內人士看來,醫療健康數據的交易流通存在諸多痛點和難點。比如在數據安全方面,醫療健康數據包含大量個人隱私信息,確保數據在採集、存儲、處理、傳輸及共享過程中的安全性是首要任務;此外,由於健康數據來源多樣、格式不一、標準不統一,往往存在缺失、錯誤、重覆等問題,而提高數據質量需要製定統一的數據標準和規範,以確保數據準確性、完整性和一致性。
2024年5月,上海數交所和芯超數據啟動重大疾病數據行業創新中心建設,旨在確立統一的行業數據標準體系,加速重大疾病數據的價值轉化進程。
芯超數據重大疾病數據行業創新中心副主任朱春榮表示,數據空間是重大疾病數據行業創新中心數據要素流通的重要基礎設施,幽門螺杆菌數據空間以幽門螺杆菌試劑盒研發與藥物開發、推廣應用場景需求為牽引,彙聚來自醫院、體檢機構、檢驗所等多方數據資源,可以有效降低試劑盒研發成本,利用多維度數據支撐,提高醫療器械證的獲批率。
醫療項目的發展高度依賴於龐大而精準的醫療數據支持,然而,數據資源一直面臨著「流動性受阻」與「供給不暢」的雙重困境。同樣是提供數據,數據空間和數據產品有什麼區別?
「數據產品是企業看到發佈信息去購買,從供方視角出發,需求方只能從現有的數據產品中選。而數據空間更多從需求方角度出發,更加貼近應用場景,比如幽門螺杆菌數據空間,企業提出需求後,數據空間會直接響應企業需求,更有針對性,但不會將醫療數據公開。這一機制既精準對接企業個性化需求,又確保數據安全。」徐彥堯解釋。
數據空間極度依賴產業,每一個數據空間都對應具體的場景,行業數據空間基於產業上下遊而構建。
「本次選擇幽門螺杆菌行業數據,是因為在中國人的健康檢測中,幽門螺杆菌感染比例越來越高,感染檢出比例接近30%,如果其產生耐藥性或病變將更難根除。而且幽門螺杆菌檢測涉及的機構較多,更需要多方數據共享。」朱春榮說,因此,此次數據空間的簽約主體包括上海市第一人民醫院、同濟醫院、廣東省中醫院、上海瑞慈醫療投資集團等企業等不同類型機構、不同地區的主體,可以更好地促進醫療健康數據的開發、利用、流通和交易。
實現數據安全提供
數據基礎設施的構建步伐正在加速,其核心聚焦於優化數據流通與利用機制,圍繞關鍵行業領域及典型應用場景,積極部署並試點包括數據空間在內的多項前沿技術路線。
醫療健康是加快培育發展新質生產力的重要領域,但醫療數據的安全性問題一直受到普遍關注。
數據空間可以有效應對數據流通領域面臨的共享壁壘、使用失控、互操作性差及安全可信環境缺失等挑戰,深度融合我國獨特的數據流通生態特性,是一個可信可控、互聯互通、價值共創的數據空間生態系統。
幽門螺杆菌數據空間並非直接讓原始數據流動,而是首先對數據進行精細化的畫像與標識處理,流通的是數據標識,而非數據本身。
「各方並不直接動用原始數據,而是對原始數據進行‘畫像’‘標識’,讓數據‘可用不可看’,既不涉及患者隱私,也可以讓數據在‘社群’萊恩全、合規、高效地流動。」徐彥堯說,行業數據空間設計採用分佈式架構,在管理數據系統的同時,確保數據不被過度濫用。
據《IT時報》記者瞭解,「2+3+4」體系化建設模式是幽門螺杆菌數據空間建設的「關鍵先生」,上海數交所基礎架構兼項目總監劉聖威解釋,提供核心服務和賦能服務,構建數據連接器、數據空間運營服務平台、數據空間門戶三大組件,應用信任體系、標識解析網絡、互操作協議、分佈式架構四大關鍵技術,打造安全可信的跨組織、跨行業、跨地域數據要素流通環境。
朱春榮透露,目前已有企業針對幽門螺杆菌的試劑盒研發提出需求,未來計劃推出糖尿病、胰腺癌、脂肪肝等多個疾病領域的數據空間, 最終希望建設成重大疾病數據可信空間。
據瞭解,下一階段,上海數交所還將結合產業需求,推動數據在醫療、科研、藥物研發等領域的多場景應用、多主體複用,並聯合「鏈主」企業探索不同類型數據空間互聯互通,讓數據供得出、流得動、用得好,促進擴大數據產業規模。
構建數據互信生態體系
早在2020年,歐盟委員會提出《歐洲數據戰略》,旨在建立一個單一的歐洲數據市場,促進數據自由流動和共享,這也是「數據空間」概念首次被歐盟提出。目前,歐盟已規劃建設了多類通用數據空間,以支持不同領域的數據流通和應用。並探索形成了多個行業數據空間,覆蓋製造業、能源、供應鏈、交通等多個領域。
作為數據要素市場的新型基礎設施,「數據空間」已成為促進數據流通共享的關鍵技術。我國也正著手推動數據空間試點工作,以數據為牽引,推動企業、行業、城市、個人及跨境等五類數據空間的建設,形成一批解決方案和最佳實踐,促進數據要素的合規、高效流通使用。
幽門螺杆菌數據空間是國內首個行業數據空間,近期貴陽召開的全國數據基礎設施建設先行先試會上,國家數據局確定南昌成為全國數據基礎設施建設(數據空間方向)先行先試城市之一。
上海數據集團總裁朱宗堯曾表示,城市數據空間是數據高效合規流通、綜合開發利用的有效組織形式,是深化城市數字化轉型的重要抓手。上海城市數據空間建設要堅持可發現、可訪問、可開發、可共享、可流通五個原則,推動數據空間發展。此外,上海城市數據空間由數據可信流通平台、數據加工處理平台和數據信任平台組成,需要多方共同探索數據空間在不同場景下的應用模式和價值釋放路徑,共同形成可持續發展的商業模式。
上海數交所將聯合多類主體構建行業數據空間標杆,加快推動共性標準研製、核心技術攻關、數據基礎設施建設、安全和規範管理等工作,形成可信認證的數據流通機制和收益分配機制,構建數據提供方、需求方、平台方等各參與主體的互信生態體系。
排版/ 季嘉穎
圖片/ 採訪對象 東方IC pixabay
來源/《IT時報》公眾號vittimes