在 AI、HPC 與云計(jì)算基礎(chǔ)設(shè)施飛速演進(jìn)的當(dāng)下,性能瓶頸不再源于算力,而是網(wǎng)絡(luò)系統(tǒng)中的每一個(gè)微秒延遲與每一瓦能耗。
為應(yīng)對(duì)這一挑戰(zhàn),星融元推出了旗艦級(jí)產(chǎn)品:CX864E-N 64x800G 超低時(shí)延 RoCE 交換機(jī)。
該產(chǎn)品具備業(yè)界領(lǐng)先的560ns端口轉(zhuǎn)發(fā)時(shí)延和基于 SONiC 的開放網(wǎng)絡(luò)架構(gòu),為下一代 AI 智算網(wǎng)絡(luò)提供極致性能保障和靈活的方案集成空間。
近期國(guó)內(nèi)外展會(huì)上,CX864E-N已吸引了大量客戶與行業(yè)專家的關(guān)注。對(duì)此,我們決定不再“藏著掖著”,而是大方展示我們的技術(shù)實(shí)力與設(shè)計(jì)理念 —— 星融元將一直以坦誠(chéng)、開放的態(tài)度與客戶和同行共同推動(dòng)開放網(wǎng)絡(luò)的行業(yè)進(jìn)步。

CX864E-N 早在去年已實(shí)現(xiàn)量產(chǎn)并成功部署于多家頭部互聯(lián)網(wǎng)企業(yè)與云服務(wù)提供商的數(shù)據(jù)中心,并且交付周期已縮短至約2周,在性能、交期與成本的多維度比較中名列前茅。
CX864E-N 硬件外觀概覽
設(shè)備前面板
在2U高的前面板上,排布著64個(gè)800G OSPF 端口,其前后向兼容性可確保從現(xiàn)有的 100GE/200GE/400GE 網(wǎng)絡(luò)無縫過渡到更高級(jí)的800GE,保護(hù)歷史投資。

在管理口方面,CX864E-N 提供RJ45 MGMT、USB2.0接口及RJ45 Console。
另外,CX864E-N 還提供兩個(gè)額外的 10G SFP+ 端口,專門用于增強(qiáng)帶內(nèi)網(wǎng)絡(luò)遙測(cè) (INT) 等管理功能。這一考慮至關(guān)重要,因?yàn)?800G 交換機(jī)上的每個(gè)端口都承擔(dān)著相當(dāng)大的工作負(fù)載,如出現(xiàn)問題,影響會(huì)顯著放大,因此需要更精準(zhǔn)、實(shí)時(shí)的通信監(jiān)控。(當(dāng)然,客戶也還可以根據(jù)其他網(wǎng)絡(luò)需求靈活運(yùn)用這兩個(gè)端口)

面板右側(cè)還有6個(gè)LED指示燈,其中靠近RJ45口的兩個(gè)分別為:
- LINK/ACT燈,指示 MGMT接口的link及數(shù)據(jù)通訊狀態(tài)
- SYS燈,指示整機(jī)系統(tǒng)的運(yùn)行狀態(tài);
面板右側(cè)豎排四個(gè)指示燈從上到下依次為:
- BMC狀態(tài)指示燈(BMC)
- 電源指示燈(P)
- 風(fēng)扇狀態(tài)指示燈(F)
- 設(shè)備定位指示燈(L)
前面板分布著橫、縱向排列的三排小型進(jìn)風(fēng)孔。外部冷空氣正是通過這些氣孔進(jìn)入機(jī)箱內(nèi)部,與風(fēng)冷系統(tǒng)協(xié)同工作,有效提升整體散熱效率。
設(shè)備背部
CX864E-N 設(shè)備背部配備了4個(gè)風(fēng)扇模塊以及2個(gè)電源模塊,為系統(tǒng)提供穩(wěn)定、高效的散熱與供電保障。所有風(fēng)扇與電源均支持熱插拔,無需中斷系統(tǒng)運(yùn)行。電源模塊集中布局于設(shè)備左側(cè),單個(gè)功率為 3200W。


您可能會(huì)問:市面上的800G交換機(jī)大多有6到8個(gè)風(fēng)扇,而CX864E-N僅有4個(gè),散熱如何保證?關(guān)于這個(gè)問題我們會(huì)在下一個(gè)部分來解答。
CX864E-N 內(nèi)部硬件
讓我們揭開這臺(tái)高性能交換機(jī)的蓋版,從左至右,依次探索這款設(shè)備的核心構(gòu)造,深入了解其內(nèi)部硬件設(shè)計(jì)。

散熱板
首先看到的是大面積覆蓋的散熱板(已拆出放置),這是我們采用了 3D真空腔均熱板技術(shù)的高效風(fēng)冷散熱模塊。

相比部分廠商選擇的水冷方案,該散熱設(shè)計(jì)在整機(jī)滿配功耗高達(dá) 2180W 的極限工況下,依然能夠穩(wěn)定滿足系統(tǒng)運(yùn)行需求,同時(shí)將整機(jī)功耗控制在業(yè)內(nèi)較低水平,能效表現(xiàn)出色。在該負(fù)載條件下,風(fēng)扇僅需以約 60% 轉(zhuǎn)速運(yùn)行便可維持散熱系統(tǒng)的正常運(yùn)作,有效控制噪音水平,避免對(duì)運(yùn)行環(huán)境造成干擾。
ASIC 模塊

散熱板下即是 Marvell Teralynx 10 ASIC 模塊(以下簡(jiǎn)稱“TL10”), 安裝在 OSFP 接口背后,是整機(jī)網(wǎng)絡(luò)交換處理能力的核心。TL10是一顆基于 5nm 工藝、單芯片架構(gòu)的可編程交換芯片,提供51.2 Tbps的吞吐能力。
TL10 的超低時(shí)延性能是其最大亮點(diǎn)之一,可將端到端時(shí)延控制在約 560 納秒,在同類芯片中表現(xiàn)極為出色。對(duì)于 AI 模型訓(xùn)練、推理以及大規(guī)模并行計(jì)算任務(wù),低延遲意味著更快的同步、更高的吞吐、更低的能耗浪費(fèi),從而提升整個(gè)集群效率。
大容量片上緩存(200+ MB):顯著提升 RoCE 傳輸性能,能夠有效緩解網(wǎng)絡(luò)擁塞引發(fā)的數(shù)據(jù)排隊(duì)與等待問題。相比競(jìng)品采用的外置 HBM 方案,片上緩存在功耗、訪問延遲以及成本控制方面具備顯著優(yōu)勢(shì)。
- 先進(jìn)的帶內(nèi)遙測(cè)(INT)功能
- Flowlet 調(diào)度機(jī)制:通過引入 Flowlet 級(jí)別的負(fù)載均衡策略,TL10 在高吞吐場(chǎng)景下依然可保持穩(wěn)定的數(shù)據(jù)分發(fā)效率。該機(jī)制顯著降低了對(duì)緩存資源的依賴,僅需約 200MB,即可滿足復(fù)雜網(wǎng)絡(luò)環(huán)境下的調(diào)度與擁塞控制需求。
- 高 Radix 架構(gòu)(512×100GbE):支持網(wǎng)絡(luò)大規(guī)模橫向擴(kuò)展,助力數(shù)據(jù)中心從傳統(tǒng)三層架構(gòu)向扁平化兩層架構(gòu)演進(jìn),顯著減少網(wǎng)絡(luò)設(shè)備數(shù)量與布線復(fù)雜度,提高整體網(wǎng)絡(luò)效率與可靠性。
- 領(lǐng)先的能效比:在面向大規(guī)模 AI 訓(xùn)練集群的實(shí)際部署中,TL10 相較于同類方案可節(jié)省超過 1MW 功耗,在每瓦帶寬和計(jì)算密度方面處于業(yè)界領(lǐng)先水平,顯著降低長(zhǎng)期運(yùn)營(yíng)成本(TCO)。

文末我們將展示基于 TL10 芯片設(shè)備的實(shí)際延遲測(cè)試結(jié)果。
電源模組
在ASIC上方是斜向排列的一組電源模組。它們?yōu)楹诵牡?ASIC 芯片提供穩(wěn)定電力支持。值得一提的是,這種非平行布局經(jīng)過優(yōu)化,可有效提升電源完整性,為高速數(shù)據(jù)傳輸保駕護(hù)航。

PTP模塊
電源模組上方為 PTP(精確時(shí)間協(xié)議)模塊,支持高達(dá)10ns 的PTP與SyncE精度。該模塊為可選功能,采用可插拔設(shè)計(jì),客戶可按需定制,靈活部署。下圖是PTP模塊已安裝與未安裝狀態(tài)的實(shí)物圖對(duì)比。


COMe 模塊
長(zhǎng)方體組件正是我們的 COMe 模塊,基于 x86 架構(gòu),搭載 Intel Xeon 處理器,具備強(qiáng)大的計(jì)算性能,能夠支持 INT-based Routing 等高級(jí)網(wǎng)絡(luò)功能。上面運(yùn)行我們自研的基于 SONiC -based AsterNOS 操作系統(tǒng),為交換機(jī)提供穩(wěn)定、高效的控制平面核心,確保整機(jī)在復(fù)雜網(wǎng)絡(luò)環(huán)境下的靈活調(diào)度與可靠運(yùn)行。

BMC 模塊
COMe模塊右側(cè)是BMC模塊,它同樣采用可插拔設(shè)計(jì),客戶可根據(jù)需求升級(jí)BMC模塊,解鎖更高性能與更豐富的管理功能。

NVMe 插槽
COMe 模塊左側(cè)是兩個(gè)全長(zhǎng) 2280 的 NVMe 插槽,以及一個(gè)兼容 2280 和 2242 尺寸的 M.2 SATA 插槽,為用戶提供靈活的本地存儲(chǔ)擴(kuò)展能力。
此外,兩個(gè) 2280 NVMe 插槽還可選配最多兩顆 Hailo-10 AI 加速引擎,支持實(shí)時(shí)、低延遲且高能效的邊緣 AI 推理計(jì)算,滿足多種智能和AI應(yīng)用場(chǎng)景的部署需求。

風(fēng)扇
整機(jī)后部配備 4 個(gè)可熱插拔風(fēng)扇模塊,構(gòu)成高效簡(jiǎn)潔的風(fēng)冷系統(tǒng)。這里也回答了之前的問題,在滿負(fù)載運(yùn)行(2180W)下,這套散熱方案已完全能夠穩(wěn)定運(yùn)行,無需塞入額外的風(fēng)扇來控制溫度,大大降低了功耗與系統(tǒng)復(fù)雜度。更少的組件,意味著更高的可靠性與更低的運(yùn)營(yíng)成本。

其他補(bǔ)充
CX864E-N 整機(jī)內(nèi)部?jī)H使用了一根線纜,其他連接均通過高性能連接器實(shí)現(xiàn)板間互聯(lián),避免了因復(fù)雜線纜引起的信號(hào)干擾和維護(hù)難題。相比一些友商使用多根線纜的做法,這種設(shè)計(jì)更可靠,也更利于長(zhǎng)期穩(wěn)定運(yùn)行。

CX864E-N的PCB采用全球領(lǐng)先的制造工藝,并選用業(yè)內(nèi)已大規(guī)模量產(chǎn)的頂級(jí)高性能板材,結(jié)合Vippo、盲孔(Blind Hole)、背鉆(Back Drill)等先進(jìn)技術(shù)工藝,全面滿足112G高速SerDes在信號(hào)完整性(Signal Integrity)、損耗(Loss)、串?dāng)_(Crosstalk)等方面的嚴(yán)苛技術(shù)要求。
CX864E-N 軟件概述
星融元 CX864E-N交換機(jī)搭載企業(yè)級(jí) SONiC 發(fā)行版 —— AsterNOS。我們致力于打造業(yè)界領(lǐng)先的企業(yè)版 SONiC,助力客戶構(gòu)建高性能、智能化的網(wǎng)絡(luò)系統(tǒng),從控制面到數(shù)據(jù)面構(gòu)建起軟硬一體的協(xié)同架構(gòu)。

加速 AI 網(wǎng)絡(luò),釋放超算潛能
作為超以太網(wǎng)聯(lián)盟(UEC)的早期成員,Asterfusion 借助超級(jí)以太網(wǎng)技術(shù),將網(wǎng)絡(luò)利用率提升至 90% 甚至更高,全面加速 AI 網(wǎng)絡(luò)部署與數(shù)據(jù)中心演進(jìn)。
解鎖AI數(shù)據(jù)中心潛力:網(wǎng)絡(luò)利用率如何突破90%?
星融元 CX864E-N RoCE交換機(jī)通過 Flowlet 負(fù)載均衡、基于 INT 的智能路由與 WCMP 等先進(jìn)技術(shù),實(shí)現(xiàn) AI 訓(xùn)練與推理網(wǎng)絡(luò)超過 90% 的利用率。這不僅顯著提升 AI 工作負(fù)載效率,同時(shí)有效降低數(shù)據(jù)中心建設(shè)與運(yùn)營(yíng)成本
- 全功能交鑰匙解決方案:AsterNOS 基于社區(qū) SONiC 構(gòu)建,強(qiáng)化了 EVPN 多歸屬、RoCEv2、Ansible 自動(dòng)化 等企業(yè)特性,專為復(fù)雜部署環(huán)境而設(shè)計(jì)。與自研的開放網(wǎng)絡(luò)硬件深度適配,提供真正即插即用的一體化解決方案。
- 更快的版本發(fā)布節(jié)奏與響應(yīng)機(jī)制:相比社區(qū)半年一版的發(fā)布頻率AsterNOS 實(shí)現(xiàn)了季度新版本發(fā)布,確??蛻粜枨笈c問題能被快速響應(yīng)與解決。
- 專業(yè)支持團(tuán)隊(duì),靈活定制服務(wù):超過 120 名SONiC軟件研發(fā)工程師,為客戶提供專業(yè)、靈活的服務(wù)支持,包括定制功能開發(fā)、問題定位優(yōu)化以及全方位的技術(shù)咨詢。
- 雙模式CLI風(fēng)格,提升用戶體驗(yàn):除了 Linux 風(fēng)格的 Bash CLI,AsterNOS 還基于 Klish 實(shí)現(xiàn)了 Cisco 風(fēng)格的命令行界面,幫助網(wǎng)絡(luò)工程師更輕松上手,降低學(xué)習(xí)曲線。
- 560ns 超低轉(zhuǎn)發(fā)時(shí)延、64×800G OSFP 高密度接口、TL10單芯片架構(gòu)、超大片上緩存、板間無纜互聯(lián)、定制級(jí) PTP和AI 模塊、每一行走線,每一個(gè)模塊、都是星融元面向 AI 工作負(fù)載與低延遲網(wǎng)絡(luò)的工程化答案。
附錄:相關(guān)測(cè)試數(shù)據(jù)



-
交換機(jī)
+關(guān)注
關(guān)注
21文章
2701瀏覽量
101060 -
AI
+關(guān)注
關(guān)注
87文章
33554瀏覽量
274198 -
硬件系統(tǒng)
+關(guān)注
關(guān)注
0文章
49瀏覽量
11575
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
POE交換機(jī)接口詳解
如何實(shí)現(xiàn)POE交換機(jī)串聯(lián)?
適用于數(shù)據(jù)中心和AI時(shí)代的800G網(wǎng)絡(luò)
DeepSeek推動(dòng)AI算力需求:800G光模塊的關(guān)鍵作用
優(yōu)化800G數(shù)據(jù)中心:高速線纜、有源光纜和光纖跳線解決方案
為什么400G光模塊和800G光模塊如此火爆?
24口全千兆交換機(jī)方案設(shè)計(jì)參考原理圖資料(資料可直接使用)
數(shù)據(jù)中心與AI人工智能的基礎(chǔ)設(shè)施保障:800G光模塊
800G光模塊:超算中心、智算中心、大規(guī)模數(shù)據(jù)中心基石
華迅光通AI計(jì)算加速800G光模塊部署
新華三集團(tuán)推出首款1.6T智算交換機(jī)
反射內(nèi)存交換機(jī)與普通交換機(jī)的區(qū)別

二層交換機(jī)和三層交換機(jī)有什么區(qū)別
51.2T交換機(jī)網(wǎng)絡(luò)解決方案

園區(qū)交換機(jī) VS 數(shù)據(jù)中心交換機(jī)

評(píng)論