GPU正在蠶食FPGA的信號處理市場
今天有位群友在群裡發了一個國外的GPU+FPGA的SDR產品,專為高性能無線信號處理應用而設計。我就去官網看了這個產品的介紹:它由 NVIDIA Jetson Orin NX 16GB 提供動力,集成了寬帶射頻收發器、FPGA、ARM 處理器。它與基於 Python 的框架以及預安裝的 AirStack 軟件無縫兼容,簡化了部署過程,同時其緊湊的設計確保了在實驗室和野外環境中的可靠性。
筆者是FPGA信號處理工程師出身,經歷過FPGA+DSP的經典信號處理架構時代,後來又有了FPGA+x86 CPU,雖然這幾年Xilinx推出了RFSOC,也得到了市場的認可,但在信號處理這個領域,FPGA的市場正在被其他處理器蠶食。
在本文最後的章節,我們簡單介紹一下這個GPU+FPGA的SDR產品。
我們都知道,信號處理是FPGA一個非常重要的市場。FPGA 具有高度的靈活性,可以根據不同的信號處理需求進行定製化編程。它能夠實現並行處理,對於一些對實時性要求極高、算法複雜度較低且需要頻繁調整邏輯的信號處理任務,如雷達信號處理、通信基站的信號調製解調等,FPGA 是理想的選擇。
軟件化雷達
我是雷達信號處理專業出身,在讀書那幾年時,就一直在提軟件化雷達,後面幾年發展得確實也不慢,我瞭解到的很多公司或研究所都開始用刀片服務器,會用CPU來做一些FPGA做起來並不是很容易的信號處理工作。所以FPGA的定位更偏向信號預處理,以及做一些採集、重播等CPU做不到的工作。
GPU 的崛起及其在信號處理中的優勢
1. 強大的並行計算能力
GPU 最初是為圖形處理而設計的,但隨著其發展,它的並行計算能力逐漸被發掘並應用於信號處理領域。現代 GPU 擁有數千個核心,可以同時處理大量的數據。以 NVIDIA 的 RTX 系列 GPU 為例,它們具有強大的 CUDA 核心,能夠並行執行大量的計算任務。在信號處理中,很多算法都可以並行化,例如快速傅里葉變換、卷積運算等。GPU 的並行計算能力使得這些算法能夠在極短的時間內完成,大大提高了信號處理的效率。
2. 軟件生態系統豐富
GPU 擁有豐富的軟件生態系統,這是其在信號處理市場中逐漸佔據優勢的重要因素之一。NVIDIA 提供了 CUDA 編程框架,使得開發者可以方便地在 GPU 上進行編程。此外,還有許多開源的深度學習框架,如 TensorFlow、PyTorch 等,都支持 GPU 加速。這些軟件工具和框架降低了開發者的門檻,使得更多的人能夠利用 GPU 進行信號處理算法的開發和優化。相比之下,FPGA 的開發需要專門的硬件描述語言(如 Verilog、VHDL),開發週期長,難度較大。
3. 成本效益
在大規模信號處理應用中,GPU 的成本效益更高。GPU 可以在通用的計算機硬件平台上使用,不需要專門的 FPGA 開發板和編程設備。而且,隨著 GPU 技術的不斷髮展,其價格逐漸下降,性能不斷提升。
2014年英偉達發佈嵌入式平台Jetson 系列的第一個產品Jetson TK1,2018年,Jetson Xavier和2022年Jetson AGX Orin相繼推出,最近幾年,用GPU來做信號處理的也越來越多。
下面我們就介紹下本文最開始提到的GPU+FPGA的SDR產品:
整體外形長下面這個樣子,典型的信號處理機的模樣,尺寸也比VPX/PXIE的機箱要小很多。
核心的架構如下:

Specification如下:
-
通用處理器:NVIDIA® Jetson Orin™ NX 16GB;
-
安培 GPU:1024 個 NVIDIA® CUDA® 核心,32 個張量核心;
-
ARM® CPU:8 核 Cortex® v8.2 64 位;
-
共享內存:16GB 128 位 LPDDR5 DRAM;
-
AMD® FPGA:Artix™ 7 FPGA – XC7A200T – 2FFG1156C;
-
網絡:1 GbE RJ45 端口,精確時間協議(IEEE – 1588);
-
數據存儲:2TB NVMe 存儲(4 GB/s 讀 / 寫);
-
數字連接:雙 USB – A 3.2,HDMI 2.1(Micro HDMI 連接器),外部 RF 系統控制(GPIO),板載傳感器報告;
-
電源:PoE++ 或 12 VDC(典型 30 W,最大 60 W);
-
機械規格:18.7 x 23.0 x 4.4 cm(7.3 x 9.1 x 1.7 in),1.51 kg(3.3 lbs);
-
射頻規格:單收發器子卡,2×2 MIMO,100 MHz IBW(125 MSPS),300 MHz 至 6 GHz,14 位 ADC / 16 位 DAC;
-
收發器性能:+35 dB 接收器增益,3.0 dB 接收器噪聲係數,+20 dBm 最大發射輸出功率;
-
GNSS / GPS 性能:與 UTC 偏差 5 ns(1 – sigma);
-
信號連接:10 MHz 參考輸入 / 輸出,1PPS 時鍾輸入 / 輸出,觸發輸入。
可以看到,射頻收發頻率可以從300M到6GHz,只是ADC采樣率略低,導致的信號帶寬並不是特別高,但100MHz的帶寬也基本可以覆蓋很多場景了。FPGA使用的A7-200T,屬於中低端FPGA,畢竟也只是做信號的採集和發射使用,當然,簡單的信號預處理也可以放到FPGA,其他的複雜處理都可以通過PCIE傳給GPU來做。這樣整個板卡的總體成本也不高,由於有了GPU的加持,板卡的處理性能還非常不錯。
不知道國內有沒有廠家在模仿這個產品?
本文來自微信公眾號:傅里葉的貓,作者:張海軍