一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

光通信+分布式架構(gòu),突破傳統(tǒng)網(wǎng)絡(luò)架構(gòu)瓶頸

Hobby觀察 ? 來(lái)源:電子發(fā)燒友 ? 作者:綜合報(bào)道 ? 2025-06-20 09:10 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

電子發(fā)燒友網(wǎng)綜合報(bào)道,隨著大語(yǔ)言模型(LLM)參數(shù)規(guī)模突破萬(wàn)億級(jí),傳統(tǒng)數(shù)據(jù)中心網(wǎng)絡(luò)架構(gòu)(如NVL、TPUv4、SiP-Ring)逐漸暴露出瓶頸。

傳統(tǒng)方案依賴(lài)昂貴的交換機(jī)(如NVIDIA的NVLink Switch)或光學(xué)電路(如TPUv4的OCS),其成本隨集群規(guī)模呈指數(shù)級(jí)增長(zhǎng)。例如,NVLink Switch單臺(tái)成本高達(dá)數(shù)萬(wàn)美元,且僅支持單節(jié)點(diǎn)級(jí)擴(kuò)展(如DGX H100集群最多8-GPU互聯(lián))。TPUv4雖采用光學(xué)環(huán)形網(wǎng)絡(luò),但其OCS交換機(jī)需定制化光纖布線,限制了跨Pod級(jí)擴(kuò)展能力。

由于拓?fù)湎拗?,單個(gè)GPU故障可能引發(fā)級(jí)聯(lián)失效。以SiP-Ring為例,其靜態(tài)環(huán)形拓?fù)湟笏泄?jié)點(diǎn)嚴(yán)格同步,若某一節(jié)點(diǎn)故障,整個(gè)TP組需重新初始化,導(dǎo)致GPU浪費(fèi)率高達(dá)37%(TP-64場(chǎng)景)。NVL架構(gòu)中,單節(jié)點(diǎn)故障甚至?xí)袛嗳?a href="http://www.www27dydycom.cn/v/tag/1301/" target="_blank">通信,迫使作業(yè)暫停重試。

跨ToR(Top of Rack)通信也成為網(wǎng)絡(luò)架構(gòu)的性能瓶頸。研究顯示,GPT-3訓(xùn)練任務(wù)中35%的通信流量為跨機(jī)架傳輸,導(dǎo)致網(wǎng)絡(luò)擁塞,帶寬利用率不足40%。傳統(tǒng)Fat-Tree拓?fù)潆m支持高帶寬,但其樹(shù)狀結(jié)構(gòu)易在核心層形成熱點(diǎn),限制了大規(guī)模并行效率。

為了解決這些問(wèn)題,最近,曦智科技聯(lián)合北京大學(xué)、階躍星辰的研究團(tuán)隊(duì)提出了一種以光交換(OCS)模組為中心的高帶寬域架構(gòu)InfiniteHBD。InfinitePOD通過(guò)無(wú)交換機(jī)架構(gòu)設(shè)計(jì) 、動(dòng)態(tài)拓?fù)渚幣?a href="http://www.www27dydycom.cn/v/tag/2562/" target="_blank">算法和光通信技術(shù)優(yōu)化 ,系統(tǒng)性解決了現(xiàn)有的問(wèn)題。

InfinitePOD采用分布式節(jié)點(diǎn)直連網(wǎng)絡(luò),每個(gè)GPU節(jié)點(diǎn)配備QSFP-DD OCSTrx光模塊(51.2Tbps帶寬),通過(guò)預(yù)定義光纖鏈路實(shí)現(xiàn)跨ToR的3跳內(nèi)直連??梢允∪?zhuān)用交換機(jī),僅使用標(biāo)準(zhǔn)化光模塊,單節(jié)點(diǎn)互連成本下降60%。

同時(shí)物理層支持任意規(guī)模集群互聯(lián),實(shí)驗(yàn)驗(yàn)證可擴(kuò)展至65536 GPU,遠(yuǎn)超NVL(16384 GPU)和TPUv4(單Pod級(jí))。在拓?fù)潇`活性上,通過(guò)軟件動(dòng)態(tài)配置通信組,支持K-Hop Ring(環(huán)形)和K-Hop Line(線性)等拓?fù)洌m配TP、DP、PP等不同并行策略。

InfinitePOD采用了兩階段部署機(jī)制,首先是物理層預(yù)定義,在部署階段規(guī)劃節(jié)點(diǎn)間3跳光纖連接,形成Rail-Optimized拓?fù)?,減少跨機(jī)架流量;在運(yùn)行時(shí)動(dòng)態(tài)編排,基于圖切割算法(Graph Partitioning)和貪心策略,實(shí)時(shí)調(diào)整通信組拓?fù)洹?/p>

容錯(cuò)機(jī)制上,當(dāng)GPU故障時(shí),編排算法自動(dòng)重構(gòu)通信路徑,僅隔離故障節(jié)點(diǎn)而不影響全局。實(shí)驗(yàn)表明,在TP-64場(chǎng)景下,GPU浪費(fèi)率從NVL的24%降至11%,作業(yè)中斷概率降低72%。

在光通信技術(shù)上,InfinitePOD采用QSFP-DD OCSTrx光模塊,光模塊基于曦智科技硅光子技術(shù)的分布式光交換dOCS,將基于馬赫曾德(MZI,Mach-Zehnder Interferometer)交換矩陣的光交換芯片集成到商用QSFP-DD 800Gbps光電轉(zhuǎn)換模組中,大幅簡(jiǎn)化了器件結(jié)構(gòu)的同時(shí),有效提升了器件集成度,從而降低了成本和功耗,顯著提升了InfiniteHBD的性?xún)r(jià)比和系統(tǒng)可擴(kuò)展性。

同時(shí)采用Rail-Optimized拓?fù)?,針?duì)機(jī)架間通信優(yōu)化,通過(guò)3跳內(nèi)光纖直連實(shí)現(xiàn)流量局部化 ,AllReduce帶寬利用率提升至77.26%,接近理論極限。

InfinitePOD的核心價(jià)值在于將光通信技術(shù)與分布式架構(gòu)深度融合 ,通過(guò)“硬件簡(jiǎn)化+軟件智能”的設(shè)計(jì)理念,重新定義了高帶寬數(shù)據(jù)中心網(wǎng)絡(luò)。盡管當(dāng)前方案仍需解決長(zhǎng)距離光信號(hào)衰減和模塊功耗問(wèn)題,但其開(kāi)創(chuàng)性的設(shè)計(jì)已為下一代數(shù)據(jù)中心網(wǎng)絡(luò)指明方向——去中心化、軟硬協(xié)同、極致擴(kuò)展 。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 光通信
    +關(guān)注

    關(guān)注

    20

    文章

    926

    瀏覽量

    34502
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    突破精度極限,賦能光通信未來(lái)——武漢昊衡科技OLI光纖微裂紋檢測(cè)儀引領(lǐng)行業(yè)革新

    光通信網(wǎng)絡(luò)高速發(fā)展的今天,光纖及光器件的質(zhì)量直接決定了通信系統(tǒng)的穩(wěn)定性和傳輸效率。然而,傳統(tǒng)檢測(cè)技術(shù)受限于精度不足、效率低下等問(wèn)題,難以滿足日益嚴(yán)苛的行業(yè)需求。武漢昊衡科技有限公司憑借深厚的技術(shù)積累
    的頭像 發(fā)表于 06-05 17:31 ?695次閱讀
    <b class='flag-5'>突破</b>精度極限,賦能<b class='flag-5'>光通信</b>未來(lái)——武漢昊衡科技OLI光纖微裂紋檢測(cè)儀引領(lǐng)行業(yè)革新

    六博光電船載激光通信系統(tǒng):開(kāi)啟水上高速通信新紀(jì)元

    在浩瀚水域中實(shí)現(xiàn)穩(wěn)定、高速的無(wú)線通信,一直是海洋監(jiān)測(cè)、應(yīng)急救援及水上作業(yè)領(lǐng)域的技術(shù)難點(diǎn)。傳統(tǒng)射頻通信易受干擾、帶寬有限,而衛(wèi)星通信則面臨高延遲、高成本的
    的頭像 發(fā)表于 04-01 09:15 ?482次閱讀
    六博光電船載激<b class='flag-5'>光通信</b>系統(tǒng):開(kāi)啟水上高速<b class='flag-5'>通信</b>新紀(jì)元

    六博光電支持OpenVLC推出高性?xún)r(jià)比可見(jiàn)光通信模組

    在科技飛速發(fā)展的今天,通信技術(shù)領(lǐng)域不斷涌現(xiàn)出創(chuàng)新成果??梢?jiàn)光通信(VisibleLightCommunication,VLC)作為一種極具潛力的新興通信技術(shù),正逐漸走進(jìn)人們的視野。六博光電致力于無(wú)線
    的頭像 發(fā)表于 03-14 09:52 ?541次閱讀
    六博光電支持OpenVLC推出高性?xún)r(jià)比可見(jiàn)<b class='flag-5'>光通信</b>模組

    光通信網(wǎng)絡(luò)故障排除技巧

    光通信網(wǎng)絡(luò)以其高速、大容量和抗干擾性在現(xiàn)代通信系統(tǒng)中占據(jù)著舉足輕重的地位。然而,隨著網(wǎng)絡(luò)規(guī)模的擴(kuò)大和復(fù)雜性的增加,故障排除成為了網(wǎng)絡(luò)維護(hù)中的一項(xiàng)重要任務(wù)。 1. 故障診斷的基本原則 在
    的頭像 發(fā)表于 01-23 09:42 ?725次閱讀

    光通信網(wǎng)絡(luò)的優(yōu)勢(shì)分析

    。光纖通信利用光信號(hào)傳輸信息,相較于傳統(tǒng)的電信號(hào),光信號(hào)在光纖中的傳輸速度更快,損耗更低。這使得光通信網(wǎng)絡(luò)能夠支持更高的數(shù)據(jù)傳輸速率,滿足現(xiàn)代高速互聯(lián)網(wǎng)、數(shù)據(jù)中心等應(yīng)用場(chǎng)景的需求。 2. 大容量傳輸
    的頭像 發(fā)表于 01-23 09:36 ?749次閱讀

    光通信與電通信的區(qū)別

    在現(xiàn)代通信技術(shù)中,光通信和電通信是兩種主要的通信方式。隨著科技的發(fā)展,這兩種技術(shù)在各自的領(lǐng)域內(nèi)都取得了顯著的進(jìn)步。 1. 傳輸介質(zhì) 光通信
    的頭像 發(fā)表于 01-23 09:35 ?1603次閱讀

    光通信在數(shù)據(jù)中心的應(yīng)用

    在數(shù)字化時(shí)代,數(shù)據(jù)中心作為信息處理和存儲(chǔ)的核心,承擔(dān)著海量數(shù)據(jù)的傳輸和處理任務(wù)。隨著云計(jì)算、大數(shù)據(jù)、人工智能等技術(shù)的發(fā)展,數(shù)據(jù)中心的規(guī)模和復(fù)雜性不斷增加,對(duì)內(nèi)部通信網(wǎng)絡(luò)的性能要求也越來(lái)越高。光通信
    的頭像 發(fā)表于 01-23 09:33 ?699次閱讀

    基于ptp的分布式系統(tǒng)設(shè)計(jì)

    。 PTP概述 PTP是一種網(wǎng)絡(luò)時(shí)間同步協(xié)議,它允許網(wǎng)絡(luò)中的設(shè)備同步它們的時(shí)鐘。PTP基于IEEE 1588標(biāo)準(zhǔn),旨在提供亞微秒級(jí)別的時(shí)間同步精度。PTP通過(guò)在網(wǎng)絡(luò)中傳播時(shí)間信息,并使用這些信息來(lái)校正本地時(shí)鐘,從而實(shí)現(xiàn)精確的時(shí)間
    的頭像 發(fā)表于 12-29 10:09 ?524次閱讀

    分布式、域控及SOA架構(gòu)車(chē)身功能測(cè)試方案

    北匯信息推出分布式、域控以及SOA架構(gòu)的車(chē)身功能測(cè)試解決方案,支持在實(shí)驗(yàn)室環(huán)境下完成車(chē)身單部件、系統(tǒng)級(jí)功能自動(dòng)化測(cè)試,可以極大地提升車(chē)身功能的可靠性和穩(wěn)定性。
    的頭像 發(fā)表于 12-27 09:05 ?2585次閱讀
    <b class='flag-5'>分布式</b>、域控及SOA<b class='flag-5'>架構(gòu)</b>車(chē)身功能測(cè)試方案

    光放大器與光通信的關(guān)系是什么

    光放大器與光通信之間存在著密不可分的關(guān)系,兩者共同構(gòu)成了現(xiàn)代光通信系統(tǒng)的核心組成部分。光放大器作為光通信系統(tǒng)中的關(guān)鍵器件,通過(guò)放大光信號(hào),解決了光信號(hào)在傳輸過(guò)程中的衰減問(wèn)題,從而極大地延長(zhǎng)了光信號(hào)
    的頭像 發(fā)表于 08-09 15:46 ?847次閱讀

    量子光通信的概念和原理

    量子光通信,作為量子通信領(lǐng)域的一個(gè)重要分支,是一種利用量子光學(xué)原理和量子力學(xué)特性進(jìn)行信息傳遞的先進(jìn)技術(shù)。它不僅繼承了光通信的高速、大容量?jī)?yōu)勢(shì),還融合了量子通信的高安全性和絕對(duì)保密性,成
    的頭像 發(fā)表于 08-09 14:22 ?2555次閱讀

    WDM系統(tǒng)和光通信有哪些區(qū)別

    WDM(Wavelength Division Multiplexing,波分復(fù)用)系統(tǒng)和光通信是兩個(gè)密切相關(guān)但又有所區(qū)別的概念。光通信是一種利用光波作為載波進(jìn)行信息傳輸?shù)?b class='flag-5'>通信技術(shù),而WDM則是
    的頭像 發(fā)表于 08-09 14:18 ?1258次閱讀

    簡(jiǎn)述光通信的發(fā)展歷史

    光通信的發(fā)展歷史是一段充滿創(chuàng)新與突破的旅程,它極大地推動(dòng)了現(xiàn)代通信技術(shù)的進(jìn)步,為人類(lèi)社會(huì)帶來(lái)了前所未有的便捷與高效。以下是對(duì)光通信發(fā)展歷史的詳細(xì)介紹,分為幾個(gè)關(guān)鍵階段進(jìn)行闡述。
    的頭像 發(fā)表于 08-09 11:47 ?4102次閱讀

    一體式IO與分布式IO:工業(yè)控制系統(tǒng)的兩種架構(gòu)

    一體式IO與分布式IO架構(gòu)各有優(yōu)勢(shì)和局限性。選擇合適的IO架構(gòu)需要根據(jù)實(shí)際的生產(chǎn)需求、系統(tǒng)規(guī)模、成本預(yù)算和維護(hù)能力綜合考慮。隨著工業(yè)自動(dòng)化技術(shù)的發(fā)展,分布式IO
    的頭像 發(fā)表于 07-17 16:12 ?2048次閱讀
    一體式IO與<b class='flag-5'>分布式</b>IO:工業(yè)控制系統(tǒng)的兩種<b class='flag-5'>架構(gòu)</b>

    水下光通信都能應(yīng)用于哪些場(chǎng)景呢?

    水下光通信設(shè)備應(yīng)用場(chǎng)景:武漢六博光電技術(shù)有限責(zé)任公司專(zhuān)注于水下光通信設(shè)備研發(fā)與制造。我司嚴(yán)格按照水下光通信機(jī)”(T/CASME925-2023)團(tuán)體標(biāo)準(zhǔn)生產(chǎn)與銷(xiāo)售,分別推出了水下全自動(dòng)跟蹤設(shè)備、水下
    的頭像 發(fā)表于 07-02 10:24 ?987次閱讀
    水下<b class='flag-5'>光通信</b>都能應(yīng)用于哪些場(chǎng)景呢?