上海交大學者開發DNA可編程門陣列,實現通用性數字DNA計算,系20年來領域重大突破

1994 年,南加州大學計算機科學家 Leonard Adleman 在 Science 上發表了關於 DNA 計算的開創性研究,提出用 DNA 計算解決「旅行商」問題的方案。這項實驗為 DNA 計算奠定了基礎,並展示了其解決計算難題的潛力。

2001 年,以色列魏茨曼科學研究所的研究人員取得重大突破,構建了由 DNA 分子和酶分子組成的「生物計算機」,首次實現了 DNA 計算設備的自主運行。這項研究展示了 1 千億 DNA 計算器件在溶液中平行運行,僅需 0.0000000001 瓦能量即可支持 1 億次綜合狀態跳轉,為開發更複雜的 DNA 計算系統開闢了道路。

2006 年,加州理工大學的研究人員取得重大突破,通過 DNA 序列編碼構建了多種 DNA 邏輯門,實現了 DNA 數字邏輯電路。這項研究首次提出了 DNA 邏輯運算元件的模塊化設計和構建方法,為系統地創建複雜而可靠的數字邏輯電路開闢了道路。

隨著人類產生數據的爆炸式增長,DNA 分子的高信息密度特性逐漸得到關注,使用 DNA 作為數據存儲介質的概念開始流行,為解決日益凸顯的「數據存儲危機」提供了可能性。

2023 年,上海交通大學的研究人員在 DNA 計算領域取得重要進展並在 Nature 發文。他們發展了一種支持通用性數字計算的 DNA 可編程門陣列(DNA-based programmable gate array, DPGA),可通過分子指令編程的方式實現通用數字 DNA 計算,實現了無衰減大規模液相分子電路的構建。

這項研究的通訊作者之一王飛是上海交通大學長聘教軌副教授,她長期致力於發展大規模、高性能 DNA 計算系統與大數據 DNA 存儲系統,在設計策略、觀測方法、反應模型等方面深入研究 DNA 計算體系的化學反應與信息處理機制,於近兩年取得了里程碑式的突破。

憑藉著首次在實驗上展示了包含 30 個邏輯門元件、30 層 DNA 鏈取代反應的大規模計算電路的可靠運行,突破了近 20 年 DNA 分子計算在電路規模和電路深度的瓶頸。王飛成為 2023 年度《麻省理工科技評論》「35 歲以下科技創新 35 人」 中國入選者之一。

興趣使然

成為科學家是大多數學子兒時的夢想,王飛也不例外。從中學時期就以李政道和黃昆先生為榜樣的她最終考取了中國科學技術大學物理學院,並在選修《現代生命科學導論》課程後,開始對生命系統產生濃厚的興趣。

2013 年,王飛保研至中國科學院上海應用物理研究所,師從樊春海院士及王麗華研究員。樊春海團隊很早就展開新興的 DNA 納米技術研究,彼時已在結構技術、分子成像、核酸傳感等方面積累了很多成果。

在樊春海的鼓勵和引導下,王飛開始了自己的研究之路。

博士期間,王飛的研究項目是「基於 DNA 的分子計算和超分辨成像」。這一階段,她構築了一系列基於 DNA 納米技術的分子計算電路,並首次實現了對納米電路分子信號傳輸軌跡的 10 納米級光學超分辨成像。

2018 年,王飛申請上海交通大學博士後,期間將 DNA 計算反應網絡與 CRISPR 基因編輯工具結合,致力於實現活細胞基因表達的可控編程。最終實現了 DNA 計算的活細胞編程,包括邏輯門控制的 CRISPR 基因成像以及細胞抑癌基因拯救等功能。

如今,王飛就職於上海交通大學,致力於 DNA 計算體系設計範式的創新,其設計了具有通用性編程能力的 DNA 可編程門陣列,突破了溶液相分子的無序碰撞對 DNA 分子電路規模的限制。

回顧一路的研究歷程,王飛感慨道,「當初選擇這些方向投入主要是出於對 DNA 計算的研究熱情。博士期間通過設計原則與觀測方法的研究,加深對 DNA 計算體系運行機制的理解;博後期間,將 DNA 計算的研究拓寬到活細胞編程,探索 DNA 計算體系的生物應用;建立課題組,回歸到 DNA 計算系統的設計本質。我認為,這樣的研究過程有助於使我在 DNA 計算領域的研究逐步深入,解決其中重要的科學問題,同時也為未來持續的創新能力奠定基礎。」

發展通用性數字 DNA 計算

DNA 計算是一種利用生物有機分子的信息處理能力來代替數字物理開關元器件的計算模式。

要想用 DNA 進行計算,就要建立 DNA 邏輯門作為基本的計算組件。邏輯門是一種通過邏輯運算將一組輸入轉換為可檢測輸出的組件。當具有特殊設計序列的 DNA 分子彼此混合時,它們可以結合在一起並以某種方式分離,從而可以充當邏輯門(執行與、或、非等邏輯運算)。

近年來,DNA 計算得到了快速發展,通過編程 DNA 分子間的相互作用進行可定義的信息處理,已經形成了一種高並行度、低能耗的新型計算模式。然而,受限於溶液中分子間的無序碰撞,DNA 分子計算功能複雜度與可擴展性提升逐漸遭遇瓶頸。目前,可以實現的 DNA 計算大多數是為實現特定算法或有限數量的計算任務而在硬件上定製的。

「一旦 DNA 溶液中分子種類增多,產生相互干擾,規模無法擴大,導致運算能力無法提高,因此也無法面向實際應用場景。」王飛進一步解釋道。

可編程性和可擴展性是實現通用計算的兩個關鍵因素。可編程性使設備能夠執行各種算法,而可擴展性允許通過向系統添加資源來處理越來越多的工作。

王飛及團隊開發了一種支持通用性數字計算的 DNA 可編程門陣列(DPGA),並支持器件層次的多 DPGA 集成,實現了器件內的可編程性和器件間可集成性。

當電路的複雜度超出單個 DPGA 可執行規模時,DPGA 可分解為多個子任務,並生成對應的分子指令;每一個子電路的分子指令通過邏輯地址調用並連接參與運算的 DNA 元件,實現 DPGA 的編程;子電路之間的信號傳輸則通過 DNA 摺紙寄存器介導的多 DPGA 布線實現,從而實現器件級的多 DPGA 集成。

利用 DPGA 的可編程性與高集成度,該研究突破了 DNA 分子計算在電路規模和電路深度的瓶頸,首次在實驗上展示了高達 30 個邏輯元件、500 條 DNA鏈,包含 30 層 DNA 鏈取代反應的電路規模。這也代表了近 20 年來 DNA 計算領域的新突破。

由於 DPGA 的可擴展性,理論上任何實際問題都可以在模數轉換後接入 DPGA 電路。這項研究概念性展示了將 DPGA 作為分子診斷中的信息處理核心,對疾病相關的分子靶標進行非線性分類。

提及該研究的產業化前景,王飛表示,通用 DNA 分子計算集成電路的設計,有助於實現 DNA 計算器件的量產以及用戶與設計者的分離,有望在分子醫學領域取得更廣泛的應用;此外,DNA 作為一種信息材料,可以將數字信息編碼成 DNA 堿基序列而實現對人類生產數據的存儲。

據悉,其未來的目標之一就是構建大數據 DNA 存儲系統,利用分子組裝取代從頭的化學合成,顯著降低 DNA 數據的寫入成本,有可能將 DNA 存儲推向實際應用。通過發展新一代的高密度、低能耗、長壽命的數字信息存儲技術,解決全球生產的數據指數增長帶來的數據存儲難題。

參考鏈接:

1.https://www.bbvaopenmind.com/en/science/research/biological-computing-future-dna/