一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

INT-based Routing(基于遙測(cè)的智能路由)如何重構(gòu)AI集群流量調(diào)度?

星融元Asterfusion ? 2025-05-12 17:06 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

路由協(xié)議的演進(jìn)史:從靜態(tài)配置到AI時(shí)代的神經(jīng)網(wǎng)

一、路由協(xié)議的誕生:靜態(tài)路由時(shí)代(1960s—1970s)

互聯(lián)網(wǎng)的雛形ARPANET誕生時(shí),網(wǎng)絡(luò)規(guī)模極小,節(jié)點(diǎn)間路徑固定。工程師手動(dòng)配置每一條路由表,如同在紙質(zhì)地圖上標(biāo)注每條街道的通行規(guī)則。這種“靜態(tài)路由”雖簡(jiǎn)單可靠,卻完全依賴人工維護(hù)——任何鏈路中斷或新增節(jié)點(diǎn)都需要重新配置,無法適應(yīng)動(dòng)態(tài)變化的網(wǎng)絡(luò)環(huán)境。這種模式在小規(guī)模網(wǎng)絡(luò)中勉強(qiáng)可用,但隨著節(jié)點(diǎn)數(shù)量增加,其脆弱性暴露無遺。

局限的本質(zhì):網(wǎng)絡(luò)被視為靜態(tài)拓?fù)洌狈?duì)動(dòng)態(tài)變化的感知與響應(yīng)能力。

二、動(dòng)態(tài)路由協(xié)議:網(wǎng)絡(luò)學(xué)會(huì)“自我修復(fù)”(1980s—2000s)

1989年,OSPF(開放最短路徑優(yōu)先)和BGP(邊界網(wǎng)關(guān)協(xié)議)的發(fā)布,標(biāo)志著網(wǎng)絡(luò)進(jìn)入動(dòng)態(tài)自治時(shí)代。動(dòng)態(tài)路由協(xié)議通過兩種核心能力徹底改變了網(wǎng)絡(luò):

  1. 拓?fù)涓兄篛SPF基于鏈路狀態(tài)數(shù)據(jù)庫(LSDB),實(shí)時(shí)計(jì)算最短路徑;BGP通過AS-PATH屬性在自治系統(tǒng)間傳遞路由信息。
  2. 故障自愈:當(dāng)某條鏈路中斷,協(xié)議自動(dòng)重新計(jì)算路徑,保障連通性。

技術(shù)突破:網(wǎng)絡(luò)從“靜態(tài)地圖”升級(jí)為“實(shí)時(shí)導(dǎo)航系統(tǒng)”,但流量調(diào)度仍依賴固定策略(如ECMP均分流量),無法應(yīng)對(duì)復(fù)雜場(chǎng)景。

三、SDN革命:集中控制的理想與困境(2008年—2010s)

為追求更靈活的流量控制,軟件定義網(wǎng)絡(luò)(SDN)橫空出世。其核心理念是將控制平面集中化,由中央控制器全局調(diào)度流量。理論上,SDN能實(shí)現(xiàn)精細(xì)化的流量工程,例如為關(guān)鍵業(yè)務(wù)預(yù)留帶寬、動(dòng)態(tài)規(guī)避擁塞鏈路。

但在實(shí)現(xiàn)過程中遇到瓶頸。感知延遲:控制器依賴秒級(jí)更新的網(wǎng)絡(luò)狀態(tài),面對(duì)AI流量的毫秒級(jí)波動(dòng),決策嚴(yán)重滯后。協(xié)調(diào)成本:集中式架構(gòu)難以應(yīng)對(duì)大規(guī)模分布式網(wǎng)絡(luò)的復(fù)雜性,控制器成為性能瓶頸。

SDN未能取代動(dòng)態(tài)路由協(xié)議,但啟發(fā)了后續(xù)技術(shù)對(duì)“集中與分布”平衡的探索。

四、協(xié)同進(jìn)化:動(dòng)態(tài)路由與控制器聯(lián)姻(2010s—2020s)

為彌補(bǔ)傳統(tǒng)路由的靈活性不足,技術(shù)社區(qū)提出“協(xié)議與控制協(xié)同”方案:

  1. Segment Routing(SR):通過源路由標(biāo)記路徑,結(jié)合控制器實(shí)現(xiàn)流量工程。
  2. BGP EVPN:在數(shù)據(jù)中心多租戶場(chǎng)景中,動(dòng)態(tài)管理虛擬網(wǎng)絡(luò)拓?fù)洹?/li>

進(jìn)步與局限:這些技術(shù)提升了流量調(diào)度的靈活性,但仍依賴預(yù)定義策略,無法實(shí)時(shí)響應(yīng)突發(fā)流量。例如,ECMP均分流量時(shí),一條“大象流”仍可能壓垮某條路徑,而控制器無法即時(shí)干預(yù)。

五、INT-based Routing:AI時(shí)代的“神經(jīng)感知路由”(2020s—)

當(dāng)AI驅(qū)動(dòng)的流量徹底顛覆傳統(tǒng)網(wǎng)絡(luò)模型時(shí),路由技術(shù)迎來質(zhì)變——INT-based Routing通過三項(xiàng)革新,讓網(wǎng)絡(luò)具備“自主神經(jīng)系統(tǒng)”:
1. 微秒級(jí)感知:數(shù)據(jù)包成為“偵察兵”

  • INT(帶內(nèi)網(wǎng)絡(luò)遙測(cè)):在業(yè)務(wù)數(shù)據(jù)包中嵌入元數(shù)據(jù)(如隊(duì)列深度、鏈路時(shí)延),逐跳收集路徑狀態(tài),精度達(dá)微秒級(jí)。
  • 分布式計(jì)算:每臺(tái)交換機(jī)實(shí)時(shí)分析本地INT數(shù)據(jù),結(jié)合OSPF/BGP的全局拓?fù)湫畔ⅲ瑒?dòng)態(tài)計(jì)算最優(yōu)路徑。

2. 動(dòng)態(tài)負(fù)載均衡:從“均分”到“自適應(yīng)”

  • WCMP(加權(quán)多路徑):根據(jù)實(shí)時(shí)鏈路負(fù)載(而非靜態(tài)權(quán)重)分配流量。例如,某路徑因“大象流”導(dǎo)致時(shí)延上升,新流量立即切換至低負(fù)載路徑。
  • Flowlet級(jí)調(diào)度:將長(zhǎng)連接流劃分為片段(flowlet),按路徑狀態(tài)動(dòng)態(tài)分發(fā),避免傳輸層亂序問題。

3. 故障自愈:從“分鐘級(jí)”到“毫秒級(jí)”

傳統(tǒng)網(wǎng)絡(luò)中,鏈路故障需數(shù)秒至分鐘才能恢復(fù);而INT-based Routing通過實(shí)時(shí)感知與分布式?jīng)Q策,可在10ms內(nèi)切換備用路徑,業(yè)務(wù)完全無感。

案例:AI數(shù)據(jù)中心的性能躍遷

以一個(gè)典型的Spine-Leaf拓?fù)涞臄?shù)據(jù)中心網(wǎng)絡(luò)為例。

wKgZO2ghuVCAS1_5AAC0gJTV304002.png

如上圖所示,Server0和Server1分別連接到兩個(gè)Leaf交換機(jī),這一對(duì)Leaf交換機(jī)間存在4個(gè)路徑。

在Server側(cè)看不到這4個(gè)路徑,因此智能網(wǎng)卡無法實(shí)現(xiàn)流量調(diào)度。

在Leaf交換機(jī)上,如果僅依賴OSPF,能看到4條靜態(tài)的等價(jià)路徑,但它們的負(fù)載實(shí)際上是不同的。

如果借助INT的感知能力,Leaf1交換機(jī)上現(xiàn)在就能夠知道去往Server0有4條時(shí)延不相等的路徑。這樣Leaf1交換將能夠選擇更優(yōu)的策略將流量分配到這4條路徑上,如最小時(shí)延路徑或者WCMP(Weighted Cost Multiple Path),從而實(shí)現(xiàn)完全自適應(yīng)的路由,讓網(wǎng)絡(luò)流量和網(wǎng)絡(luò)負(fù)載完全匹配,最大化網(wǎng)絡(luò)的吞吐量、最小化尾部延遲,最大化網(wǎng)絡(luò)利用率。

INT-Based Routing可以與Packet Spray和flowlet結(jié)合,實(shí)現(xiàn)逐包級(jí)別或逐flowlet級(jí)別的流量調(diào)度。借助OSPF和BGP的拓?fù)浒l(fā)現(xiàn)能力,它能夠在任意拓?fù)涞木W(wǎng)絡(luò)上應(yīng)用。

相比傳統(tǒng)的ECMP技術(shù),INT-Based Routing可將網(wǎng)絡(luò)利用率提升到90%以上,網(wǎng)絡(luò)吞吐量提升20~45%, P99 tail latency 降低50%以上,從而顯著提高AI訓(xùn)練的作業(yè)完成時(shí)間(JCT)。

OSPF擅長(zhǎng)在鏈路級(jí)別感知網(wǎng)絡(luò)拓?fù)?,BGP則擅長(zhǎng)在AS級(jí)別感知網(wǎng)絡(luò)拓?fù)?,INT通過逐跳嵌入元數(shù)據(jù),徹底解決了原來單個(gè)交換機(jī)無法動(dòng)態(tài)感知整個(gè)路徑上流量和負(fù)載的問題。它們的結(jié)合釋放出強(qiáng)大的流量調(diào)度能力。

新路由范式將帶來新一輪網(wǎng)絡(luò)設(shè)備升級(jí)

AI的發(fā)展告訴我們,當(dāng)我們做更多更有效率的分布式計(jì)算,就可以改變世界。網(wǎng)絡(luò)本身又何嘗不是如此。當(dāng)我們?cè)诮粨Q機(jī)中對(duì)網(wǎng)絡(luò)拓?fù)洹⒕W(wǎng)絡(luò)流量和設(shè)備負(fù)載進(jìn)行實(shí)時(shí)分布式計(jì)算后,我們就能大幅改善網(wǎng)絡(luò)的性能。

Smart Switch的基本構(gòu)成是“可編程ASIC數(shù)據(jù)平面 + DPU化的控制平面 + 控制平面到控制平面的高速數(shù)據(jù)通道”。

wKgZO2ghuZuAbzMBAACkFjGNp9U150.png

關(guān)于CX864E-N:51.2T 800G AI智算交換機(jī)軟硬件系統(tǒng)設(shè)計(jì)全揭秘

Smart Switch 是“網(wǎng)絡(luò)智能化”的結(jié)構(gòu)性演進(jìn)。它不再依賴主機(jī)上的智能網(wǎng)卡、也不依賴集中控制器,而是將 “實(shí)時(shí)感知 + 智能調(diào)度” 嵌入網(wǎng)絡(luò)最核心的物理單元Switch中,使網(wǎng)絡(luò)成為分布式計(jì)算平臺(tái),具備自感知、自調(diào)度能力,從而自適應(yīng)處理毫秒級(jí)的流量變化,是網(wǎng)絡(luò)應(yīng)對(duì)AI時(shí)代的關(guān)鍵變革。

在此基礎(chǔ)上,INT-Based Routing應(yīng)運(yùn)而生,推動(dòng)網(wǎng)絡(luò)控制面進(jìn)一步走向智能化,是路由技術(shù)的最新范式??梢哉f,INT-Based Routing 是為AI而生的智能路由!

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • Int
    Int
    +關(guān)注

    關(guān)注

    0

    文章

    24

    瀏覽量

    16260
  • 路由技術(shù)
    +關(guān)注

    關(guān)注

    0

    文章

    13

    瀏覽量

    6593
  • 網(wǎng)絡(luò)流量
    +關(guān)注

    關(guān)注

    0

    文章

    61

    瀏覽量

    10710
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    AI重構(gòu)實(shí)體生意:智能體如何重塑家居行業(yè)增長(zhǎng)邏輯?

    重構(gòu)實(shí)體生意·2025AI智能營(yíng)銷大會(huì)”現(xiàn)場(chǎng),鴻雁電器總裁王米成、螢石網(wǎng)絡(luò)智能算法部總經(jīng)理程戰(zhàn)戰(zhàn)、百度家居行業(yè)高級(jí)客戶經(jīng)理韓仲秋、騰訊云行業(yè)解決方案專家張金繁、群
    的頭像 發(fā)表于 07-16 20:46 ?126次閱讀
    <b class='flag-5'>AI</b><b class='flag-5'>重構(gòu)</b>實(shí)體生意:<b class='flag-5'>智能</b>體如何重塑家居行業(yè)增長(zhǎng)邏輯?

    AI智能時(shí)代重構(gòu)PCB價(jià)值的核心邏輯

    AI智能時(shí)代的PCB價(jià)值重構(gòu)研究 一、引言 (一)研究背景與意義 在AI技術(shù)驅(qū)動(dòng)下,全球電子信息產(chǎn)業(yè)加速變革,PCB(印制電路板)作為電子系統(tǒng)的物理載體,其價(jià)值正從基礎(chǔ)連接件向技術(shù)核心
    的頭像 發(fā)表于 07-16 18:55 ?1362次閱讀

    信而泰×DeepSeek:AI推理引擎驅(qū)動(dòng)網(wǎng)絡(luò)智能診斷邁向 “自愈”時(shí)代

    、DDoS攻擊跡象、性能劣化趨勢(shì)。l 智能推送優(yōu)化建議(如流量調(diào)度策略調(diào)整、安全規(guī)則預(yù)加載),將風(fēng)險(xiǎn)扼殺在萌芽狀態(tài)。 方案價(jià)值:AI推理引擎帶來的運(yùn)維變革 信而泰融合DeepSeek
    發(fā)表于 07-16 15:29

    智能路徑調(diào)度AI驅(qū)動(dòng)負(fù)載均衡的異常路徑治理實(shí)踐

    AI驅(qū)動(dòng)的數(shù)據(jù)中心網(wǎng)絡(luò)環(huán)境中,傳統(tǒng)的“盡力而為”和“無差別均分”負(fù)載均衡策略已力不從心。基于路徑綜合質(zhì)量的動(dòng)態(tài)WCMP機(jī)制,通過實(shí)時(shí)感知路徑狀態(tài)、果斷剔除異常、智能調(diào)度“健康”資源,有效解決了
    的頭像 發(fā)表于 07-03 16:26 ?760次閱讀
    <b class='flag-5'>智能</b>路徑<b class='flag-5'>調(diào)度</b>:<b class='flag-5'>AI</b>驅(qū)動(dòng)負(fù)載均衡的異常路徑治理實(shí)踐

    Path Bandwidth Extended Community:藏在BGP屬性里的智能路由革命

    傳統(tǒng)BGP協(xié)議雖能實(shí)現(xiàn)路由可達(dá)性,但缺乏對(duì)路徑質(zhì)量的動(dòng)態(tài)感知能力,導(dǎo)致流量分配不均、高延遲鏈路未被規(guī)避等問題。為提升網(wǎng)絡(luò)資源利用率,動(dòng)態(tài)智能選路技術(shù)應(yīng)運(yùn)而生。該技術(shù)基于BGP擴(kuò)展機(jī)制,通過實(shí)時(shí)收集路徑質(zhì)量指標(biāo),實(shí)現(xiàn)數(shù)據(jù)流的
    的頭像 發(fā)表于 06-24 14:00 ?310次閱讀
    Path Bandwidth Extended Community:藏在BGP屬性里的<b class='flag-5'>智能</b><b class='flag-5'>路由</b>革命

    高性能計(jì)算集群AI領(lǐng)域的應(yīng)用前景

    隨著人工智能技術(shù)的飛速發(fā)展,高性能計(jì)算集群(HPC)在AI領(lǐng)域的應(yīng)用前景日益受到關(guān)注。HPC提供的計(jì)算能力與AI智能分析能力相結(jié)合,為解決
    的頭像 發(fā)表于 06-23 13:07 ?440次閱讀
    高性能計(jì)算<b class='flag-5'>集群</b>在<b class='flag-5'>AI</b>領(lǐng)域的應(yīng)用前景

    破局智算瓶頸:400G光模塊如何重構(gòu)AI時(shí)代的網(wǎng)絡(luò)神經(jīng)脈絡(luò)

    隨著5G、AI和云計(jì)算技術(shù)的爆發(fā)式增長(zhǎng),400G光模塊作為新一代高速光通信的核心組件,正在重構(gòu)數(shù)據(jù)中心網(wǎng)絡(luò)架構(gòu)。本文從技術(shù)標(biāo)準(zhǔn)、封裝形態(tài)、傳輸性能等維度全面解析400G光模塊的突破性創(chuàng)新,重點(diǎn)闡述其
    的頭像 發(fā)表于 05-12 09:58 ?225次閱讀

    AI賦能安全調(diào)度系統(tǒng):智能升級(jí)與功能躍遷

    安全調(diào)度系統(tǒng) 通過AI技術(shù)的深度整合,實(shí)現(xiàn)了從傳統(tǒng)監(jiān)控到智能決策的質(zhì)變升級(jí)。這種智能化轉(zhuǎn)型不僅提升了系統(tǒng)的響應(yīng)速度和處理精度,更重塑了整個(gè)安全管理的運(yùn)行范式。以下是古河云科技
    的頭像 發(fā)表于 04-24 12:02 ?196次閱讀

    施耐德電氣發(fā)布數(shù)據(jù)中心高密度AI集群部署解決方案

    在人工智能AI)驅(qū)動(dòng)的產(chǎn)業(yè)革命浪潮中,數(shù)據(jù)中心正迎來深刻變革。面對(duì)迅猛增長(zhǎng)的人工智能算力需求,部署高密度AI集群已成為數(shù)據(jù)中心發(fā)展的必然選
    的頭像 發(fā)表于 04-19 16:54 ?782次閱讀
    施耐德電氣發(fā)布數(shù)據(jù)中心高密度<b class='flag-5'>AI</b><b class='flag-5'>集群</b>部署解決方案

    適用于數(shù)據(jù)中心和AI時(shí)代的800G網(wǎng)絡(luò)

    提出了三大核心需求: 超低延遲和高帶寬:確保大規(guī)模數(shù)據(jù)傳輸高效進(jìn)行。 智能流量調(diào)度:采用自適應(yīng)路由和負(fù)載均衡技術(shù),減少網(wǎng)絡(luò)擁塞。 性能隔離與穩(wěn)定性:在多租戶環(huán)境下保障帶寬分配,防止性能
    發(fā)表于 03-25 17:35

    AI賦能邊緣網(wǎng)關(guān):開啟智能時(shí)代的新藍(lán)海

    ,準(zhǔn)確率達(dá)到99.9%。 這一技術(shù)革新正在創(chuàng)造巨大的商業(yè)價(jià)值。在智慧城市領(lǐng)域,AI邊緣網(wǎng)關(guān)可以實(shí)現(xiàn)交通流量實(shí)時(shí)分析、違章行為智能識(shí)別;在工業(yè)互聯(lián)網(wǎng)中,能夠?qū)崿F(xiàn)設(shè)備預(yù)測(cè)性維護(hù)、生產(chǎn)工藝優(yōu)化;在智慧能源領(lǐng)域
    發(fā)表于 02-15 11:41

    中科曙光以AI加速智能計(jì)算服務(wù)千行萬業(yè)

    近年來,中科曙光以AI為中心,全面重構(gòu)底層芯片、液冷、計(jì)算、存儲(chǔ)、智算集群、基礎(chǔ)軟件棧、管理平臺(tái),并與AI場(chǎng)景有機(jī)適配、融合,加速智能計(jì)算服
    的頭像 發(fā)表于 02-10 17:45 ?905次閱讀

    華迅光通AI計(jì)算加速800G光模塊部署

    ,對(duì)人工智能服務(wù)器集群的需求也急劇上升。隨著數(shù)據(jù)中心基礎(chǔ)設(shè)施的不斷擴(kuò)大,光模塊的使用量呈指數(shù)級(jí)增長(zhǎng)。目前,200G和400G光模塊已經(jīng)大規(guī)模部署,800G光模塊已經(jīng)開始進(jìn)入量產(chǎn)和引進(jìn)階段。 為什么需要
    發(fā)表于 11-13 10:16

    Supermicro推出面向AI數(shù)據(jù)中心的液冷超級(jí)集群

    Supermicro, Inc.,作為人工智能AI)、云端、存儲(chǔ)和5G/Edge領(lǐng)域的整體IT解決方案提供商,近日宣布推出面向人工智能數(shù)據(jù)中心的液冷超級(jí)集群。該
    的頭像 發(fā)表于 10-22 17:37 ?964次閱讀

    vivo發(fā)布藍(lán)心智能AI戰(zhàn)略

    在2024年的vivo開發(fā)者大會(huì)上,vivo隆重推出了全新的AI戰(zhàn)略——“藍(lán)心智能”。該戰(zhàn)略的核心是利用AI技術(shù)重構(gòu)系統(tǒng)體驗(yàn),為用戶帶來更加智能
    的頭像 發(fā)表于 10-10 16:57 ?791次閱讀