Nature重磅:顛覆AI計算,提升460倍能效,新型分子憶阻器有望為Transformer提速

人工智能(AI)硬件有望徹底被顛覆,在計算速度和能效方面實現前所未有的改進。

日前,來自印度科學研究所、德克薩斯農工大學和利梅利克大學的研究團隊,在一篇發表在權威科學期刊 Nature 上的研究論文中介紹了一種新型分子憶阻器,將神經形態計算提升到了前所未有的高精度。

加之神經形態計算固有的功耗低、延遲小、可擴展性高等特點,這一研究為人工智能的未來發展,尤其在能效需求迫切的領域提供了新的可能性。

據介紹,他們設計了一種基於釕(Ru)復合物的新型分子憶阻器(神經形態硬件中的核心組件),其使用一種偶氮芳香配體,能夠實現 14 位的解像度,並通過精確的動力學控制,可訪問多達 16520 個不同的模擬電導水平。相比於傳統的計算方式,這種新型分子憶阻器具備以下特點

超高精度:信噪比達到 73 dB,超過現有技術四個數量級。

極低能耗:相比數字計算機,能效提升 460 倍

大規模並行運算:可以在分子級別完成計算任務,顯著提升計算效率。

研究團隊表示,這種新型分子憶阻器的應用可能擴展神經形態計算的範圍,使其超越目前的小眾應用,增強從雲端到邊緣的數字電子設備的核心功能。

值得一提的是,這種新型憶阻器有望成為複雜人工智能模型(如 GAN 和 Transformer)的重要加速器

研究團隊表示:「我們的終極目標是用這種基於環保節能材料的高性能計算系統,取代現有的計算架構,並將其應用到日常生活的各個領域,從服裝、食品包裝到建築材料,真正實現分佈式的無處不在的信息處理。」

迄今最大,克服傳統計算架構瓶頸

神經形態計算的核心理念是模擬生物神經網絡的工作方式,從而提高計算效率並降低能耗。在這一架構下,神經元和突觸的行為被仿真為計算元件,能夠在硬件中直接執行大量向量-矩陣乘法(VMM)運算。相比傳統的馮·諾依曼架構,其具有三大優勢:

並行處理:像大腦一樣,可以同時處理大量信息。

低功耗:受生物神經元啟發,功耗遠低於傳統計算機。

自適應學習:可以像人類大腦一樣,通過不斷調整連接權重,完成複雜的學習任務。

在神經形態計算系統中,憶阻器模擬了神經元突觸的功能,通過改變電阻來存儲和傳遞信息,使得運算可以在存儲單元中直接進行,提升了計算的速度和效率。

傳統計算架構在執行 VMM 時,通常需要頻繁地在存儲器和處理器之間移動數據,耗費大量時間和能量。而憶阻器使得數據可以直接在存儲單元中完成計算,可以顯著提高效率。

然而,受材料特性和電子元件性能的限制,現有神經形態硬件在計算精度、效率和複雜任務處理方面仍面臨許多挑戰,尤其在執行信號處理、神經網絡訓練和自然語言處理等核心計算任務中。

在這項工作中,為了提升神經形態計算的效率,他們利用先進的納米技術和材料科學,構建了迄今為止最大的 64×64 的分子憶阻器交叉陣列。這一設計不僅增加了系統的規模和複雜性,還能夠在單一步驟中直接執行 VMM 運算,徹底避免了傳統計算架構中的數據移動瓶頸。

他們表示,這一設計受人腦工作機制的啟發,利用分子在晶格中的自然運動處理和存儲信息。這種「分子遊覽日記」式的運作方式,為未來的數據中心、內存密集型應用以及在線遊戲帶來了巨大的節能潛力。

圖|線性和對稱性(a:64×64 的分子憶阻器交叉陣列的顯微圖像;b:一個交叉點在 50 個測量週期內的模擬重量更新特徵;c:2000 個不同電導水平和 10,002、10,003 的讀出值及其各自的分佈;d:根據每個電導水平的 2000 個數據點計算出的不同電導水平的累積分佈函數;e:所有 16520 個電導水平的 σn 和 ΔGn;f:所有電導水平均通過 500 mV 和 -500 mV 兩種不同幅度的脈衝讀取)

研究發現,這種憶阻器展現出模擬權重更新的特性,通過施加不同幅度和持續時間的方波脈衝,實現了 16520 個獨特的模擬電導狀態,這些狀態覆蓋了從 200ns 到 5.9ms 的四個數量級範圍。

性能顛覆傳統硬件架構

為了確保這種分子憶阻器的精度,研究團隊設計了一個超過 16 位精度的 CMOS 電路,並對交叉陣列的電導性能進行了詳細驗證。結果顯示,相鄰電導水平的誤差概率低於 10^-9,展現了優異的低誤差率和高穩定性。

在長達 10^9 次操作後,該憶阻器的權重更新特性依然保持穩定,且其模擬電導狀態表現出與生物突觸類似的尖峰時間依賴可塑性(STDP),為未來在神經形態計算中的廣泛應用提供了技術支撐。

為了進一步研究分子憶阻器的工作機制,研究人員使用原位拉曼光譜技術揭示了其背後的分子電子動力學。他們發現,電導水平的轉變是由兩種分子電子狀態之間的超分子電荷轉移驅動的,這為控制憶阻器行為提供了科學依據。

實驗中,基於這種憶阻器的 VMM 運算成功實現了單步(one-step)離散傅里葉變換(DFT)。

圖|VMM 的實現圖|VMM 的實現

實驗結果顯示,基於這種新型分子憶阻器的 VMM 運算獲得了 74 dB 的信噪比(SNR)和 76.5 dB 的峰值信噪比(PSNR),這比現有技術提高了 10^4 倍。

他們表示,這種新型分子憶阻器為執行計算密集型任務提供了精確而高效的解決方案,尤其在人工神經網絡、自動編碼器和生成式對抗網絡(GAN)等領域的應用前景廣闊。

不足與展望

儘管這項研究在神經形態計算領域取得了顯著進展,但距離實際應用仍然面臨一些挑戰。

當前的實驗成果主要集中在較小規模的交叉陣列上,要將這項技術大規模應用於實際計算設備,還需要進一步擴大陣列規模並實現芯片級集成。如何在更大規模下維持相同的精度和性能,是未來技術發展的關鍵難題。

儘管研究團隊提出了能效優化設計,但要真正達到實驗中預測的能效提升,還需進一步優化外圍電路。此外,分子級憶阻器的製造工藝複雜,要實現大規模低成本生產,還有很長的路要走。

儘管面臨這些局限,該研究依然展示出廣闊的應用前景。

首先,這項技術在多種矩陣乘法中展現出一致的高精度,使其在信號處理、機器學習等領域具有廣泛的應用潛力。尤其是在支持複雜的人工智能模型方面,如生成式對抗網絡(GAN)和 Transformer 等,這種新型憶阻器有望成為重要的加速器。

此外,這項技術在邊緣計算中的應用前景尤其值得期待。憑藉極高的能效,它可以推動智能設備和物聯網中低功耗應用的發展,尤其是在需要實時響應的場景中,如自動駕駛或智能醫療設備。

未來,隨著陣列規模的擴大和能效的進一步提升,這種分子憶阻器有望成為推動神經形態計算和人工智能發展的關鍵技術,為數據中心、邊緣計算設備和 AI 加速器提供更高效、更節能的計算解決方案。

本文來自微信公眾號「學術頭條」(ID:SciTouTiao),作者:田小婷,36氪經授權發佈。