英偉達,開啟硅光新紀元
如果您希望可以時常見面,歡迎標星收藏哦~
隨著人工智能計算的快速發(fā)展,數(shù)據(jù)中心網(wǎng)絡基礎設施面臨著日益增長的需求。在2025年3月18日的GTC2025會議上,NVIDIA公布了其開創(chuàng)性的NVIDIA光子學硅光子技術。通過采用共封裝光學來取代傳統(tǒng)可插拔的光學收發(fā)器,這一創(chuàng)新使光纖可以直接連接到交換機,預計可將數(shù)據(jù)中心的電力消耗減少40兆瓦。該技術同時提高了人工智能計算集群的網(wǎng)絡傳輸效率,為下一代大規(guī)模人工智能數(shù)據(jù)中心奠定了基礎。
基于這一創(chuàng)新,NVIDIA推出了Spectrum-X和Quantum-X硅光子網(wǎng)絡交換機,將電子電路與光通信技術深度集成。這些解決方案使AI工廠能夠跨地區(qū)互聯(lián)數(shù)百萬個GPU集群,同時降低能源消耗和運營費用。
-
Spectrum-X以太網(wǎng)平臺:專為多租戶、超大規(guī)模人工智能工廠設計,提供比傳統(tǒng)以太網(wǎng)架構高1.6倍的帶寬密度,支持世界上最先進的超級計算基礎設施。
-
Quantum-X光子學InfiniBand平臺:利用200GbpsSerDes技術,它擁有該平臺將144x800Gbps端口,配備液體冷卻的硅光子學塊。與前幾代相比,AI計算速度提高了一倍,實現(xiàn)了5倍的更大可擴展性。
Spectrum-X
NVIDIA Spectrum-X光子學交換機提供多種配置,包括 128 個800 Gb/s 端口或512個200 Gb/s端口,總帶寬高達 100Tb/s,以及512個800 Gb/s端囗或2048個200Gb/s 端口,總吞吐量高達 400 Tb/s。
Spectrum-XCPO采用多芯片設計。其以太網(wǎng)交換機ASIC具有單芯片包處理引擎,周圍有八個SerDes芯片和四個額外的芯片在角落。Spectrum-XCPO芯片的每邊包括九個端口,總計36個端口,以800 Gb/s的速度運行。
Quantum-X
這款115.2 Tb/s Quantum-X光子交換器包含2個CPO模塊。每個封裝模塊由一個量子X800 ASIC和6個光學組件組成,總共包含18個硅光子引擎。量子X800 ASIC提供28.8Tb/s的吞吐量,并使用臺積電的4N工藝,集成了1070億個晶體管。在每個CPO模塊中,直接連接的光學組件具有3個硅光子引擎和3個緊湊的可插拔連接器,實現(xiàn)4.8 Tb/s的吞吐能力。每個硅光子引擎都采用200 Gb/s微環(huán)調制器,將功耗降低3.5倍。
在外部連接方面,Quantum-X光子交換器具有144個單模光纖MPO連接器。每個外部光源配備有八個激光器(200 mWCW-DFB),并提供自動溫度跟蹤以及穩(wěn)定的波長和功率輸出。
總的來說,一個Quantum-X光子學交換機集成了2個CPO模塊、18個外部光源和144個MPO連接器,總計4460億個晶體管,并提供115 Tb/s的吞吐量。
InfiniBand CPO將于2025年下半年首先推出,而以太網(wǎng)CPO將于2026年下半年推出。請注意,CPO將是可選的-NVIDIA將繼續(xù)提供具有可插拔模塊的交換機系統(tǒng)。
CPO 技術
CPO是高速網(wǎng)絡集群的核心組件,特別是對于需要低延遲和高帶寬連接的人工智能集群。與傳統(tǒng)基于DSP的可插拔光模塊相比,CPO具有顯著優(yōu)勢。它通過將ASIC和光學組件-嵌入DSP功能直接集成在ASIC中,消除了對單獨DSP芯片的需求。這種創(chuàng)新的封裝方法極大地提高了整體模塊性能,同時顯著降低了數(shù)據(jù)中心的功耗,而效率是數(shù)據(jù)中心的關鍵。此外,由于AI集群需要超高的帶寬,CPO可以最小化與信號轉換相關的延遲和功率損耗。博通和思科都聲稱,在一臺配備64個800GbE端口的51.2T交換機中,CPO可以比標準的可插拔光模塊降低30%的功耗。
NVIDIA的CPO基于新的微環(huán)調制器,以提高能效。博通的CPO提供了50%的功耗降低(通過去除DSP),但它是基于馬赫-曾德爾調制器(MZM)-光收發(fā)器的標準組件。
下圖說明了NVIDIA CPO中涉及的各種組件。它從臺積電制造的電子和光子集成電路開始,并組裝在一個3D堆棧中。臺積電的緊湊型通用光子引擎(COUPE)技術包含一個微透鏡,用于表面耦合到光纖陣列。在量子-X光子平臺中,這些光引擎組件通過中間件連接到開關ASIC。NVIDIA的CPO合作伙伴包括Browave、Corning、Fabrinet、富士康、Lumentum、Senko、SPlL、住友商事、TFC和臺積電。
然而,CPO也面臨著一些挑戰(zhàn)。CPO模塊的固定配置可能帶來限制,平衡可靠性與可替換性仍然是一個問題。在傳統(tǒng)可插拔光模塊系統(tǒng)中,光鏈路故障只需要移除和更換故障模塊。相比之下,CPO系統(tǒng)中的故障需要更換整個系統(tǒng)。CPO光學引擎中使用的硅光子器件提供的可靠性與其他硅基組件相當,只有ELSFPS可能面臨光學故障問題。幸運的是,這些設備支持現(xiàn)場更換。
雖然CPO技術提供了顯著的優(yōu)勢,如降低功耗和簡化部署,但可插拔的光塊仍然是市場的主流。它們的靈活性和成熟的標準化使其繼續(xù)成為數(shù)據(jù)中心的首選。
NADDOD 提供高速可插拔的光學解決方案,涵蓋200G、400G、800G和前沿的1.6T 硅光子模塊。經(jīng)過大規(guī)模集群部署驗證,NADDOD 模塊表現(xiàn)出卓越的性能、穩(wěn)定性和兼容性,確保 AI 計算集群的可靠運行。同時,我們行業(yè)領先的制造設施和強大的生產管理系統(tǒng)能夠無縫支持 InfiniBand/RoCE AI基礎設施,確保高質量產品和大規(guī)??焖俳桓丁?/p>
總結
英偉達推出其1.6Tb/s硅光子CPO交換機,標志著交換和半導體市場的轉型階段。在市場需求激增和技術突破的推動下,CPO正在引領整個行業(yè)的顛覆。隨著技術的成熟和普及,CPO交換領域有望加速增長,為下一代AI基礎設施解鎖前所未有的可擴展性。
CPO是人工智能行業(yè)漫長旅程的第一步。在短期內,CPO可能會在特定場景下進行試點,例如超大規(guī)模集群,而可插拔模塊仍將是主流。然而,從長遠來看,隨著對高帶寬傳輸?shù)男枨筮_到高頻信號傳輸?shù)臉O限,CPO技術將獲得動力。未來,可能會出現(xiàn)混合的“CPO+可插拔”架構,根據(jù)應用需求提供靈活的選擇。
半導體精品公眾號推薦
專注半導體領域更多原創(chuàng)內容
關注全球半導體產業(yè)動向與趨勢
今天是《半導體行業(yè)觀察》為您分享的第4071期內容,歡迎關注。
『半導體第一垂直媒體』
實時 專業(yè) 原創(chuàng) 深度
公眾號ID:icbank
喜歡我們的內容就點“在看”分享給小伙伴哦
聲明:本網(wǎng)轉發(fā)此文章,旨在為讀者提供更多信息資訊,所涉內容不構成投資、消費建議。文章事實如有疑問,請與有關方核實,文章觀點非本網(wǎng)觀點,僅供讀者參考。