一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

RoCE網(wǎng)絡(luò)規(guī)劃還在手動(dòng)算IP?這套工具讓運(yùn)維效率飆升

星融元Asterfusion ? 2025-06-30 14:33 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

隨著AI算力集群規(guī)模指數(shù)級增長,網(wǎng)絡(luò)架構(gòu)復(fù)雜度陡增。傳統(tǒng)網(wǎng)絡(luò)規(guī)劃依賴人工計(jì)算與經(jīng)驗(yàn)判斷,存在效率低、易出錯(cuò)、可視化弱三大痛點(diǎn)。尤其在RoCE(RDMA over Converged Ethernet)網(wǎng)絡(luò)場景中,需協(xié)同計(jì)算、存儲、管理等多類網(wǎng)絡(luò),并確保無損傳輸特性——EasyRoCE-AID 正是為解決這一挑戰(zhàn)而生。

EasyRoCE-AID:AI基礎(chǔ)設(shè)施智能網(wǎng)絡(luò)規(guī)劃引擎

通過系統(tǒng)化建模與自動(dòng)化工具鏈,將抽象的AI網(wǎng)絡(luò)架構(gòu)(計(jì)算/存儲/管理/帶外網(wǎng)絡(luò))轉(zhuǎn)化為可視化藍(lán)圖,輸出精準(zhǔn)部署指南,降低80%規(guī)劃耗時(shí),規(guī)避人工配置風(fēng)險(xiǎn)。

wKgZPGhiLj-AP-bKAAEF5LLMaMo354.png

作為 EasyRoCE Toolkit 的核心組件,AID 與以下免費(fèi)工具深度協(xié)同:
? 一鍵配置RoCE網(wǎng)絡(luò)(ORD)
? GPU節(jié)點(diǎn)路由規(guī)劃(IRM)
? 主動(dòng)路徑優(yōu)化(PPD)
? 多租戶網(wǎng)絡(luò)部署(MVD)
? 高精度流量監(jiān)控(RTR)

AI智算中心從網(wǎng)絡(luò)規(guī)劃到部署落地5大步驟

步驟1:硬件資源數(shù)字化

輸入關(guān)鍵參數(shù):GPU/存儲/管理服務(wù)器的名稱、型號、功耗、U高度、網(wǎng)口數(shù)量及帶寬(決定網(wǎng)絡(luò)拓?fù)涞年P(guān)鍵因子)。建立設(shè)備數(shù)據(jù)庫,為后續(xù)模塊提供引用依據(jù)。

步驟2:智能組網(wǎng)設(shè)計(jì)

自動(dòng)化選型:基于集群規(guī)模選擇二層/三層模板,輸入服務(wù)器與交換機(jī)規(guī)格后:
1. 自動(dòng)計(jì)算:每層交換機(jī)數(shù)量與堆疊關(guān)系

wKgZPGhiLmmAC9g0AABH5crNvl8508.png

2. 生成方案:設(shè)備互聯(lián)邏輯圖與端口映射

wKgZO2hiLnWAAj6IAAEM3oqbB4E553.png

根據(jù)生成的組網(wǎng)方案,補(bǔ)充信息,完善交換機(jī)型號、序列號、功耗等參數(shù)(影響機(jī)柜布局)。

步驟3:機(jī)柜空間優(yōu)化

該步驟依據(jù)設(shè)備性能特點(diǎn)、散熱需求及數(shù)據(jù)交互邏輯,為實(shí)施規(guī)劃人員制定機(jī)柜內(nèi)部的最優(yōu)空間分布方案提供參考。機(jī)柜的布局信息包括機(jī)柜所在的園區(qū)、樓棟、樓層、房間、排/列、機(jī)柜編碼、U#、設(shè)備名稱。點(diǎn)擊左側(cè)按鈕展開,可以看到這排機(jī)柜的情況,其中機(jī)柜中每臺設(shè)備的名稱都引用于已填寫的表格信息。

wKgZPGhiLpaAfgH_AAFUylsHDC8661.png

步驟4:一鍵生成網(wǎng)絡(luò)配置

全自動(dòng)配置輸出:

  • 互聯(lián)IP地址分配
  • 服務(wù)器Bond口配置
  • 帶外管理網(wǎng)絡(luò)規(guī)劃
wKgZO2hiLs6ALRdyAAEFCHrTvK8196.png

步驟5:生態(tài)工具無縫對接

由AID規(guī)劃配置的模塊主要有,GPU Node內(nèi)部路由規(guī)劃器(IRM)、端到端路徑規(guī)劃(EPS)、主動(dòng)路徑規(guī)劃(PPD)、多租戶網(wǎng)絡(luò)部署(MVD)等。
以主動(dòng)路徑規(guī)劃工具(PPD)為例,我們使用 AID 工具規(guī)劃交換機(jī)的設(shè)備名稱、設(shè)備型號、設(shè)備角色、上行端口序號、下行端口序號、實(shí)例 ID、實(shí)例描述信息、下行 IP 列表、管理口地址、管理地址掩碼、交換機(jī)的帳號密碼.

其中除了實(shí)例 ID 和實(shí)例描述信息需要人為規(guī)劃,其他字段都可以點(diǎn)擊“填充設(shè)備信息”按鈕完成自動(dòng)填充。

wKgZO2hiLumAMicPAAD5uOII4mk807.png

AID還可以聯(lián)動(dòng)基于 Prometheus+Grafana 的監(jiān)控面板,輔助實(shí)現(xiàn) RDMA 網(wǎng)絡(luò)在大屏的可視化呈現(xiàn)功能。

  • 拓?fù)渥詣?dòng)呈現(xiàn)(TG):
wKgZO2hiLwqAZhmGAAD_7F88WsQ689.png
  • 光模塊地圖(TM):
wKgZO2hiLxiAETe1AANvEYH7YH4266.png
  • 鏈路分布地圖(LM)
wKgZO2hiLySAGDMAAAHq0BlHm6Q002.png

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    88

    文章

    35164

    瀏覽量

    279992
  • 網(wǎng)絡(luò)規(guī)劃

    關(guān)注

    0

    文章

    13

    瀏覽量

    10963
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    RDMA over RoCE V2設(shè)計(jì)2:ip 整體框架設(shè)計(jì)考慮

    設(shè)計(jì)IP需要考慮如下因素: 1)基于 IBTA 1.5 協(xié)議規(guī)范,支持 RoCE v2 標(biāo)準(zhǔn)協(xié)議傳輸,同時(shí)支持 ARP協(xié)議和 ICMP 協(xié)議。 2)基于 Xilinx CMAC 集成塊進(jìn)行開發(fā)并獨(dú)立
    發(fā)表于 07-16 08:51

    自動(dòng)化運(yùn)工具Terraform和Ansible的區(qū)別

    在現(xiàn)代云原生時(shí)代,基礎(chǔ)設(shè)施即代碼(Infrastructure as Code,IaC)已成為運(yùn)工程師的核心技能。面對復(fù)雜的多云環(huán)境和日益增長的基礎(chǔ)設(shè)施需求,傳統(tǒng)的手動(dòng)配置方式已無法滿足快速、可靠
    的頭像 發(fā)表于 07-09 09:59 ?235次閱讀

    力革命:RoCE實(shí)測推理時(shí)延比InfiniBand低30%的底層邏輯

    AI 訓(xùn)練與推理中的網(wǎng)絡(luò)效率瓶頸,助力數(shù)據(jù)中心在高帶寬、低延遲、高可靠性的需求下實(shí)現(xiàn)力資源的最優(yōu)配置。
    的頭像 發(fā)表于 05-28 14:08 ?624次閱讀
    <b class='flag-5'>算</b>力革命:<b class='flag-5'>RoCE</b>實(shí)測推理時(shí)延比InfiniBand低30%的底層邏輯

    人工巡檢漏檢率高?這套系統(tǒng)設(shè)備隱患無處遁形,運(yùn)效率飆升

    開篇:你的變電所還在 “靠人盯、靠腿跑”?這些難題該終結(jié)了! ? 在寫字樓的配電室里,運(yùn)人員每天奔波于各個(gè)配電柜之間抄表記錄;在工業(yè)園區(qū)的變電所中,巡檢員深夜冒雨排查故障卻難以及時(shí)定位問題;在商業(yè)
    的頭像 發(fā)表于 05-13 16:28 ?331次閱讀
    人工巡檢漏檢率高?<b class='flag-5'>這套</b>系統(tǒng)<b class='flag-5'>讓</b>設(shè)備隱患無處遁形,<b class='flag-5'>運(yùn)</b><b class='flag-5'>維</b><b class='flag-5'>效率</b><b class='flag-5'>飆升</b>!

    光伏電站運(yùn)管理系統(tǒng)光伏電站運(yùn)透明化

    光伏電站運(yùn)管理系統(tǒng)光伏電站運(yùn)透明化 光伏電站的穩(wěn)定運(yùn)行離不開對海量數(shù)據(jù)的精準(zhǔn)把控,而數(shù)據(jù)監(jiān)測管理系統(tǒng)就像電站的數(shù)字神經(jīng),串聯(lián)起每一塊光
    的頭像 發(fā)表于 04-02 16:26 ?300次閱讀
    光伏電站<b class='flag-5'>運(yùn)</b><b class='flag-5'>維</b>管理系統(tǒng)<b class='flag-5'>讓</b>光伏電站<b class='flag-5'>運(yùn)</b><b class='flag-5'>維</b>透明化

    智慧光伏運(yùn)管理系統(tǒng)電站更聰明更省心

    ?,F(xiàn)在,智慧光伏運(yùn)管理系統(tǒng)就像給電站裝上了聰明的大腦和眼睛,它自己發(fā)現(xiàn)問題、解決問題,還能不斷優(yōu)化發(fā)電效率。 ?????? 一、系統(tǒng)如何
    的頭像 發(fā)表于 03-31 15:44 ?277次閱讀
    智慧光伏<b class='flag-5'>運(yùn)</b><b class='flag-5'>維</b>管理系統(tǒng)<b class='flag-5'>讓</b>電站更聰明更省心

    儲能運(yùn)平臺在換電站的應(yīng)用 有效提高運(yùn)效率

    儲能運(yùn)云平臺在換電站的應(yīng)用是新能源汽車能源補(bǔ)給領(lǐng)域的重要?jiǎng)?chuàng)新,通過數(shù)字化技術(shù)優(yōu)化換電站的能源管理、運(yùn)效率和用戶體驗(yàn)。以下是其核心應(yīng)用場景
    的頭像 發(fā)表于 03-19 14:00 ?447次閱讀

    光伏電站的智能運(yùn)管理管家來了

    光伏電站的智能運(yùn)管理管家來了 在光伏電站的日常運(yùn)營中,許多問題常常人頭疼:設(shè)備突然故障、發(fā)電效率時(shí)高時(shí)低、人工巡檢費(fèi)時(shí)費(fèi)力等等,這些問題不僅影響電站收益,還可能帶來安全隱患?,F(xiàn)在,
    的頭像 發(fā)表于 03-07 16:17 ?307次閱讀
    光伏電站的智能<b class='flag-5'>運(yùn)</b><b class='flag-5'>維</b>管理管家來了

    愛立信如何網(wǎng)絡(luò)運(yùn)更簡單

    在愛立信“可編程網(wǎng)絡(luò)”這一創(chuàng)新概念里,差異化連接、AI賦能和意圖驅(qū)動(dòng)、網(wǎng)絡(luò)能力開放作為三大基石,各司其職,網(wǎng)絡(luò)更智能、更靈活、更開放。本期《信觀察》,愛立信專家將從AI賦能和意圖驅(qū)動(dòng)
    的頭像 發(fā)表于 03-03 09:27 ?9820次閱讀

    數(shù)據(jù)驅(qū)動(dòng)的光伏運(yùn):平臺如何提升發(fā)電效率?

    ? ? 近年來,光伏行業(yè)的迅猛增長促使光伏電站的規(guī)模持續(xù)擴(kuò)張,從而使得運(yùn)管理的核心地位愈發(fā)顯著。以往依賴人工進(jìn)行的巡檢以及粗放的管理手段,不僅效率低下,而且易于忽略潛在隱患,造成發(fā)電量的減少和成本
    的頭像 發(fā)表于 02-21 10:49 ?404次閱讀
    數(shù)據(jù)驅(qū)動(dòng)的光伏<b class='flag-5'>運(yùn)</b><b class='flag-5'>維</b>:平臺如何提升發(fā)電<b class='flag-5'>效率</b>?

    云服務(wù)器計(jì)算池的運(yùn)團(tuán)隊(duì)需要掌握的網(wǎng)絡(luò)工具

    云服務(wù)器計(jì)算池的運(yùn)團(tuán)隊(duì)需要掌握多種網(wǎng)絡(luò)工具,以實(shí)現(xiàn)高效的網(wǎng)絡(luò)監(jiān)控、故障排查、安全管理和資源優(yōu)化。以下是運(yùn)
    的頭像 發(fā)表于 02-17 15:50 ?311次閱讀

    智慧光伏運(yùn)管理平臺光伏運(yùn)管理更省心

    智慧光伏運(yùn)管理平臺光伏運(yùn)管理更省心 隨著全球?qū)稍偕茉葱枨蟮脑鲩L,光伏發(fā)電作為一種清潔、可持續(xù)的能源形式,在各國能源結(jié)構(gòu)中的地位日益
    的頭像 發(fā)表于 12-06 16:37 ?546次閱讀
    智慧光伏<b class='flag-5'>運(yùn)</b><b class='flag-5'>維</b>管理平臺<b class='flag-5'>讓</b>光伏<b class='flag-5'>運(yùn)</b><b class='flag-5'>維</b>管理更省心

    RoCE與IB對比分析(一):協(xié)議棧層級篇

    在 AI 力建設(shè)中, RDMA 技術(shù)是支持高吞吐、低延遲網(wǎng)絡(luò)通信的關(guān)鍵。目前,RDMA技術(shù)主要通過兩種方案實(shí)現(xiàn):Infiniband和RoCE(基于RDMA的以太網(wǎng)技術(shù),以下簡稱為RoCE
    的頭像 發(fā)表于 11-15 13:58 ?2195次閱讀
    <b class='flag-5'>RoCE</b>與IB對比分析(一):協(xié)議棧層級篇

    OCTC發(fā)布&quot;力工廠&quot;!力促智中心高效規(guī)劃建設(shè)投運(yùn)

    創(chuàng)新提出面向未來數(shù)據(jù)中心的"力工廠"模式,核心是以規(guī)(劃)、建(設(shè))、運(yùn)(營)一體化的交鑰匙工程,實(shí)現(xiàn)智中心快速投運(yùn)、綠色低碳,在當(dāng)前AIGC
    的頭像 發(fā)表于 10-11 09:10 ?868次閱讀
    OCTC發(fā)布&quot;<b class='flag-5'>算</b>力工廠&quot;!力促智<b class='flag-5'>算</b>中心高效<b class='flag-5'>規(guī)劃</b>建設(shè)投<b class='flag-5'>運(yùn)</b>

    桌面運(yùn)工具之打印機(jī)驅(qū)動(dòng)安裝

    window系統(tǒng)中 人工安裝需要經(jīng)過三個(gè)步驟,操作繁瑣,效率較低?;诖?,我們想開發(fā)一個(gè)自動(dòng)化安裝打印機(jī)驅(qū)動(dòng)的程序,用戶可以自行安裝打印機(jī)驅(qū)動(dòng),以此減少打印機(jī)驅(qū)動(dòng)安裝工單,提高運(yùn)
    的頭像 發(fā)表于 09-12 15:29 ?2380次閱讀
    桌面<b class='flag-5'>運(yùn)</b><b class='flag-5'>維</b><b class='flag-5'>工具</b>之打印機(jī)驅(qū)動(dòng)安裝