康奈爾大學首創「微波大腦」芯片,同時處理超高速數據和無線通信信號,176 毫瓦功耗下準確率達 75% 原創
高帶寬應用正以無形卻深刻的方式重塑現代社會的運轉肌理,在數字經濟、民生服務、產業升級等多元領域構筑起高效運轉的「隱形脈絡」。如人們指尖輕點完成的跨境購物,亦或是游戲玩家同步沉浸的云端游戲,這些看似尋常的日常背后,都依賴著高速數據中心的強勁支撐——而高帶寬正是保障數據中心高效運行的關鍵。
然而高帶寬應用對應的高性能計算成本正日益高昂。其所需的采樣和處理時鐘速率受到半導體物理特性和功率限制的雙重約束,導致速率越高,功耗和散熱壓力就會越大。如數據中心中采用的傳統電子信號處理鏈中,信號經過有損耗的介質傳導時,需要被精確計時和采樣,然后通過復雜的同步電路重建傳輸、恢復完整性,才能確保信息準確傳遞至下一個節點。這一過程依賴大量耗電的并行處理,成為制約效率提升的關鍵瓶頸。
深度學習技術為高帶寬應用提供了新的探索方向。不過當前將模擬計算模式與深度學習相結合的方案,通常只針對圖像、語音或手勢在內的低帶寬應用。即便已經開發出專為高寬帶設計的微波光子芯片,也僅限于少數固定的數據函數,且存在體積龐大、功率效率低下等問題。
針對這一困境,康奈爾大學團隊提出了微波神經網絡(Microwave Neural Network, MNN)——一種可同時處理超高速數據和無線通信信號的集成電路。 MNN 通過捕獲信息稀疏但帶寬寬廣的輸入數據特征來處理頻譜分量。其優勢是僅需兆赫茲(MHz)級的低速控制,便能以可編程方式處理跨數吉赫茲(GHz)的信號。然后利用耦合微波振蕩中的強非線性,在較窄的頻譜中表達其計算結果,便于電子讀出。在后期處理中,可通過線性回歸模型將其映射為二進制輸出。

傳統數字中繼和 MNN 方案對比
此外,MNN 還具有無可比擬的集成性能。其采用標準的互補金屬氧化物半導體(CMOS)技術制造,芯片面積僅占 0.088 mm2,功耗低于 200 毫瓦,可直接集成于通用模擬處理器當中。
相關研究成果以「An integrated microwave neural network for broadband computation and communication」為題,發表于 Nature Electronics 。
研究亮點:
* 研究開發并制造了首款可同時處理超高速數據和無線通信信號的低功耗集成電路,突破了傳統數字電路框架,利用微波物理原理實現計算
* 與依賴于數字時鐘的傳統神經網絡不同,MNN 在微波頻段利用模擬、非線性行為,可處理數十吉赫茲的數據流,且功耗低于 200 毫瓦,精度達 88%
* 應用場景廣泛,涵蓋雷達跟蹤、便攜式智能設備(如智能手表)等多元領域,為高帶寬應用提供了低功耗、高性能且輕量化的解決方案

論文地址:
關注公眾號,后臺回復「微波神經網絡」獲取完整 PDF
更多 AI 前沿論文:
訓練數據生成:針對多項任務「量身裁衣」
在數字模擬的后端訓練中,MNN 輸出的光譜數據包含從原始輸入中提取的信息,而非直接的數字輸出。對此,研究人員使用線性回歸模型,在降低帶寬內對 625 個測量頻率進行了處理,并將這些特征映射到最終輸出。
之后,為得到最佳的參數化比特流,研究人員通過隨機選擇參數化比特流并在實驗中運行,最終為每個任務選擇出驗證性能/準確率最佳的選項。以下為在具體任務的優化和評估中的數據設置:
* 在線性搜索和條件算法模擬方面,每個參數化比特流包含 500 個隨機生成 32 位序列的數據集,在十折交叉驗證中,將數據集分為 10 份,輪流用 9 份訓練,1 份用于驗證。使用 sklearn software package(scikit-learn 軟件包)的線性支持向量機,最大迭代次數為 5,000 次,采用平方合頁損失函數,正則化參數為 C=0.02,在 40 個參數化比特流上進行測試。
* 比特計數方面,類似于線性搜索,但最多進行 10,000 次迭代,并對 C 從 0.02 到 0.22 進行超參數掃描,構建一個 32 類分類任務,標簽來自線性搜索數據集。
* 在基本位運算方面(與非、異或和或非),通過隨機梯度下降法擬合一個線性模型,采用邏輯損失函數和 0.3 的 L1 正則化強度,數據集包含 500 個隨機生成的 32 位序列,其中 16 位為固定標簽位。使用十折交叉驗證,任務是對每個輸出位進行多標簽分類,并在 120 個參數化比特流上進行測試。
* 在編碼分類方面,采用了 RadioML2016.10A 數據集,按照 8:2 的比例劃分為訓練集和驗證集。在 PyTorch 框架中,使用交叉熵損失訓練一個線性模型(單層),然后通過 AdamW 在 150 個 epoch 上進行優化(學習率為 0.05;權重衰減為 0.03;批量大小為 128;衰減因子為 0.98)。訓練期間,數據會添加高斯噪聲(標準差為 0.01)進行增強,并在 13 個參數化比特流上進行測試。
在 MNN 雷達任務評估中,研究人員使用了一個數字神經網絡后端預測目標的飛行模式,每次捕獲提供一個寬帶為 2GHz 的頻譜,每個場景的輸入為(L, S),其中 L=1000 次捕獲(涵蓋場景的總時間),S 為頻譜大小。之后研究人員采用深度 ResNet 架構直接處理 MNN 輸出的頻譜數據。
其中,ResNet 由一個兩倍下采樣池化層和一個帶有兩個卷積層(內核大小為 3)的殘差分支組成。卷積之間采用批量歸一化、修正線性單元激活和隨機失活正則化。
為訓練該模型,研究人員采用將比特流搜索與在實驗輸出上訓練后端神經網相結合,以生成所需的分類結果。研究人員選擇了在目標計數任務中準確率最高的比特流,并收集了 500 種飛行場景實驗數據來訓練最終模型。為了訓練后端,研究人員應用了交叉熵損失、二元交叉熵損失和均方誤差損失對模型進行優化。
最后為了提升泛化性能,研究人員采用數據增強的方式進行,其中包括隨機移位、隨機偏置、隨機噪聲和隨機掩蔽等操作,所有增強操作以 20% 的概率應用于每個樣本。
模型架構及方法:通過非線性系統實現瞬間計算
MNN 微芯片的整體構造如下圖所示。作為一款可同時處理超高速數據和無線通信信號的低功耗、輕量化集成電路,研究團隊將其稱為「一個以大腦為模型的計算系統」。其核心由一個非線性波導(標記為 A)和三個線性波導(分別標記為 B 、 C 、 D),以及增益單元(標記為 E)和耦合器(標記為 F)組成。

基于 45 nm RF CMOS 工藝制程的 MNN 芯片
具體來說,MNN 是一個非線性系統(下圖為其工作機制)。該系統通過 GSGSG(接地-信號-接地-信號-接地)波導注入千兆赫速度的信號,然后利用兩個重疊金屬層構建的微型正交混合耦合器將這些輸入信號的功率分配到各個波導,這些較小部分的驅動信號隨后從波導反射回來并在耦合器的輸出端口疊加,最終再通過另一組 GSGSG 波導提取出來。
其中,非線性波導的頻率受入射微波驅動信號的幅度和相位影響較大;線性波導則不受其影響,提供穩定的諧振模式。

輸入敏感源主要是波導 A 內的級聯耦合非線性諧振器。這些諧振器由非線性電容器與電感段組合而成,利用反并聯二極管產生具有多項式非線性的電容,其非線性程度受偏置電壓和微波信號強度影響。線性波導為可調長度的傳輸線,通過安裝在其長度上的開關調整微波信號返回路徑的長度,且不會引入失真。
之后更重要的是,通過一對連接在成對波導之間的開關(Spar)來建立參數(時變)耦合,這些開關由 N 型金屬氧化物半導體(NMOS)晶體管構成,開關由速度僅為輸入數據百分之一(150 Mbit/s)的比特流控制,并通過第三條 GSGSG 波導傳輸。這種通斷參數耦合序列是為各種計算任務動態重新編程該神經網絡模式的關鍵。
最后,為維持電路中由高幅度微波傳輸引起的非線性,研究采用薄柵氧化層功率放大器級 NMOS 晶體管的交叉耦合晶體管對提供再生飽和增益。
這套設計與傳統的 CMOS 振蕩器、用于光譜分析的復雜脈沖銳化電路,以及通過被動耦合高品質因數諧振器產生窄帶梳的設計均有不同,它利用了商用 CMOS 工藝,故意讓耦合波導暴露于輸入微波中,借助諧振器內部的非線性和不對稱性,實現了近乎瞬間的計算。
實驗設置及結果:分類任務最高準確率可達 88%,功耗低于 200 毫瓦
在實驗中,研究人員認為將電路簡化為最基本的組件可能會有所幫助,因此通過使線性波導與波導 A 的標稱振蕩頻率高度失諧,減少了物理電路參數的數量。
MNN 中的非線性動力學建模方面,研究人員利用廣義耦合模理論簡化了 MNN 電路分析,將其簡化為耦合模模型。線性諧振器簡化為 LC tank 電路,通過調整開關改變傳輸線長度,以此改變其固有頻率;非線性波導包含多項式非線性電容器。電路中的損耗由交叉耦合晶體管對實現的飽和增益元件補償,且存在時變耦合。
之后進一步簡化實驗參數,重點關注非線性分布式諧振和線性諧振器的相互作用,將參數驅動開關表示為可調電容器。通過一組耦合模式表示簡化電路的非線性動力學,包括非線性諧振器與線性諧振器之間的耦合、內部損耗以及與輸入驅動的相互作用等,這些動力學受非線性偏置電壓初始條件和微波驅動、慢速參數比特流的影響。
在電路仿真和布局上,研究人員在 Cadence Virtuoso 環境,基于 GlobalFoundries 45nm RF 絕緣體上硅(silicon-on-insulator)工藝的晶體管模型設計和仿真 CMOS 芯片,利用西門子的 Calibre 工具提取寄生電阻和電容,通過 2.5D EMX 電磁工具模擬波導、耦合器和傳輸線的布局,以準確建模高頻性能。
在用微波電路模擬高速數字任務中,因為由方波信號組成的千兆比特速率數字信號本質上是頻譜范圍跨越數十吉赫茲的模擬信號,表明了 MNN 可以利用微波電路特性直接在頻域中執行計算。這與在時域中運行的傳統數字硬件形成鮮明對比。 MNN 處理信號時,將輸出以特定振蕩模式呈現于窄頻段,無需嚴格保證時域信號完整性,還能從輸入信號寬帶寬捕獲特征,減少訓練單層數字神經網絡所需的壓縮特征數量。
下圖所示展示了不依賴固定功能數字 CMOS 電路的情況下模擬超高速數字運算。期間以 150 Mbit/s 速率輸入 32 位比特流,非線性諧振迅速響應,頻譜分析儀記錄并平均輸出以確保傅里葉變換可靠。重點關注 10-14 GHz 范圍(對應衛星通信 X 波段和 Ku 波段頻率)的計算特征。

MNN 模擬數十吉赫茲的超高速數字計算
結果表明,調整 150 Mbit/s 32 位參數比特流內容并提取特定頻譜特征,可產生正確數字邏輯操作結果,如 8 位 NAND 操作,盡管存在有損傳輸電纜,測得的最佳準確率依然能達到約 85% 。而在由數百個邏輯門組成的一個總數計數器,即一種對輸入比特流中 1 的數量進行計數的電路,通過使用參數化比特流模擬這種行為的方法,經線性層映射輸出,在驗證集上也達到了 81% 的準確率。這表明了其計算能力不因等效數字電路的復雜度增加而顯著下降。
另外,MNN 還被證明可在 10 Gbit/s 的數據流中執行比特序列搜索,具有非常高的準確率,這為傳統通信中的高功耗最大似然序列檢測(Maximum Likelihood Sequence Detection, MLSD)技術提供了替代方案。同時,通過組合搜索和技術功能,MNN 成功模擬了一個條件算法,在保持低于 200 毫瓦功耗(176 毫瓦)的同時實現了 75% 的準確率。
在雷達目標檢測任務中,研究人員發現 MNN 檢測細微頻率變化的能力非常適用于寬帶雷達應用。研究通過模擬多架飛機沿不同多邊形軌跡飛行的空域場景,記錄雷達反射信號并轉換為模擬電壓波形,再調制方波中心頻率后輸入 MNN ,提取 8-10 GHz 頻譜范圍內的平均輸出響應,由數字神經網絡后端推斷飛行軌跡。如下圖所示:

結果表明,在模擬 500 個飛行場景后,發現 MNN 可通過對長時間捕獲的頻率變化形成不同響應來學習飛行模式,從而表征目標飛行模式。 MNN 不僅可以預測動態目標數量、隔離特定目標運動、估計目標速度,還能識別多種多邊形飛行軌跡,且在不同數量飛機場景下均能實現高 F1 分數。
在無線信號分類任務中,研究人員測試了 MNN 處理最低頻率信號的能力,從而探索其在無線通信編碼方案識別中的應用。實驗使用 RadioML2016.10A 數據集,包括 11 種調制類別(9 種數字調制和 2 種模擬調制)。各種基帶信號調制 50 MHz 載波后輸入 MNN,利用其靈敏度將低頻驅動信號的瞬態變換轉換為可觀測特征,在 8-8.5 GHz 范圍內提取特征訓練后端線性層。
結果表明,部分參數能使 MNN 在調制分類任務中達到非常高的準確率,無線信號分類任務準確率可達 88%,與數字神經網絡相匹配。這表明了 MNN 可作為深度學習加速器,在邊緣計算中發揮重要作用,不僅如此,還能大幅減小模型尺寸。
深度學習融合模擬計算大有可為
正如開篇所提,深度學習技術的不斷發展,為高帶寬應用探索出一條新路徑。在本次研究之前,不少機構已經在此領域展開了探索,并發表多篇研究成果。這些成果為模擬計算和深度學習相結合的方式不斷演進、革新奠定了理論與實踐基礎。
例如,康奈爾大學團隊與馬里蘭大學團隊聯合發表的「Microwave signal processing using an analog quantum reservoir computer」提出,利用超導微波電路的連續時間模擬量子非線性動力學作為量子水庫,可直接處理模擬微波輸入信號,無需離散化,且連續變量系統能讓量子水庫訪問更大的希爾伯特空間。與以往基于數字量子電路的實驗不同,該方法能直接接收弱模擬微波信號并提取特征,克服了輸入瓶頸。
論文地址:
??https://www.nature.com/articles/s41467-024-51161-8??
又如,牛津大學、明斯特大學和埃克塞特大學等團隊聯合發表的題為「Higher-dimensional processing using a photonic tensor core with continuous-time data」的研究。其中提出一種利用連續時間數據表示,開發空間、波長和射頻三個自由度,實現三維陣列輸入的矩陣向量乘法(MVM)計算。通過電光控制的光子張量核心與可重構非易失性相變材料存儲器實現光子內存計算,系統并行度高達 100,較僅使用兩個自由度的先前實現高兩個數量級,驗證了為光子內存計算添加射頻自由度的可行性。
論文地址:
??https://www.nature.com/articles/s41566-023-01313-x??
而康奈爾大學此次提出的 MNN,進一步推動了模擬計算與深度學習在高帶寬場景的融合。其無需依賴數字時鐘、以微波物理原理實現超高速信號處理的特性,不僅彌補了傳統數字電路在功耗、帶寬上的局限,更展示了模擬計算在復雜任務中的潛力 —— 從雷達軌跡跟蹤到無線信號分類,MNN 以低功耗、小體積的優勢,為邊緣計算、高速通信等領域提供了全新范式。
未來,隨著動態參數調節、端到端聯合訓練等技術的發展,模擬計算與深度學習的融合有望突破更多帶寬與效率瓶頸,為超高速數據處理、毫米波通信等前沿領域開辟更廣闊的應用空間。一鍵獲取 2023—2024 年 AI4S 領域高質量論文及深度解讀文章 ??


















