一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

智算中心網(wǎng)絡(luò)交換機需要什么樣的緩存架構(gòu)

SDNLAB ? 來源:西貝吹風 ? 2024-11-14 16:53 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

?在交換機上,緩存就是數(shù)據(jù)交換的緩沖區(qū),被交換機用來協(xié)調(diào)不同網(wǎng)絡(luò)設(shè)備之間的速度匹配問題,突發(fā)數(shù)據(jù)可以存儲在緩沖區(qū)內(nèi),直到被慢速設(shè)備處理為止。數(shù)據(jù)中心交換機應(yīng)用在HPC/AI大模型訓(xùn)練、分布式存儲等場景時,并非緩存越大越好,過大的緩存會導(dǎo)致更長的隊列、更高的時延和抖動、更高的成本,所以不能簡單地去擴大緩存,交換機避免丟包所需的緩存與此帶寬延遲積BDP直接相關(guān),借助于帶寬時延積BDP可以確定合適的內(nèi)存大小。

緩存架構(gòu)分類

按照緩沖區(qū)的大小,以太網(wǎng)交換機通常分為深緩沖區(qū)交換機和淺緩沖區(qū)交換機,深緩沖區(qū)交換機緩沖區(qū)容量高達數(shù)GB,與淺緩沖區(qū)交換機的幾十MB形成鮮明對比。這種設(shè)計上的差異源于應(yīng)用場景的差異,深緩沖區(qū)交換機(或路由器)主要面向路由和廣域網(wǎng)場景,RTT時間長,希望能夠容納更多的數(shù)據(jù)流量,對微突發(fā)流量不敏感,但也意味著更高的尾延遲和抖動,這一點與HPC/AI大模型訓(xùn)練、分布式存儲等場景的低時延要求顯然是相違背的,淺緩沖區(qū)交換機在這種場景下更適合,以目前最高端的51.2Tbps(64個800G)的交換機為例,如果RTT時間是3~5微秒,緩存僅需33MB左右,這是交換機中所需的總緩存,那么這個總的緩存能否被每一個端口充分利用嗎?

這就取決于交換機(交換芯片)所采用緩存架構(gòu)。交換芯片的緩存架構(gòu)通常分為:完全共享緩存架構(gòu)和分片報文緩存架構(gòu)(也稱分割緩沖區(qū)結(jié)構(gòu))。

完全共享緩存架構(gòu):設(shè)備中的所有緩存都可用于動態(tài)分配到任何端口,意味著在所有輸入-輸出端口之間共享緩存而沒有任何限制,最大限度地提高了可用內(nèi)存的效率。

分片報文緩存架構(gòu):由多片較小的緩存共同組成了芯片內(nèi)部的緩存,所有的物理接口也被劃分成了不同的組,同一組內(nèi)的物理接口共享對應(yīng)的緩存單元。

不同緩存架構(gòu)影響

如下圖所示,同樣是16MB的緩存情況下,完全共享緩沖架構(gòu)中的每個端口極限情況下(如多打一的Incast場景,)可以最大利用到16MB;如果是兩個分片的分組端口緩存架構(gòu)下,每個端口極限情況下僅可以最大利用到8MB;而如果是四個分片的分組端口緩存架構(gòu)下,每個端口極限情況下僅可以最大利用到4MB。

2719230e-906c-11ef-a511-92fbcf53809c.jpg

思科之前的文檔中也做過分析,分片報文緩存架構(gòu)下,不同的流量模型對微突發(fā)流量吸收的影響或限制也不同,如下圖所示:

273abf0a-906c-11ef-a511-92fbcf53809c.jpg

以圖中右側(cè)圖示情況為例,4個分片的架構(gòu)下,如果四個輸出端口位于4個不同的分片上,最理想的情況可以達到100%的緩存利用,但是任意一個輸出端口最多僅可以消耗總內(nèi)存的25%。在復(fù)雜的流量模式下,這種限制可能會更加痛苦,如圖中右側(cè)圖示為例,此情況下,一個輸出端口的緩存被限制為總緩沖區(qū)的1/16(6.25%),這種限制使得Incast下的緩沖行為不可預(yù)測。 在完全共享緩存架構(gòu)中,設(shè)備中的所有數(shù)據(jù)包緩沖區(qū)都可用于動態(tài)分配到任意一個端口,這意味著在所有輸入輸出端口之間共享緩存而沒有任何限制,最大限度地提高了可用內(nèi)存的效率,并且使微突發(fā)流量吸收能力可預(yù)測,與流量模型沒有任何關(guān)系。

完全共享緩存的優(yōu)勢也體現(xiàn)在RoCEv2網(wǎng)絡(luò)中,RoCEv2是TCP/IP協(xié)議中UDP層實現(xiàn),因為使用不需要確認的UDP協(xié)議,此時RTT不是緩沖區(qū)需求的直接驅(qū)動因素,但是RDMA的無損特性往往要依靠PFC來實現(xiàn),PFC逐級反壓控制會導(dǎo)致?lián)砣樱耆蚕砭彺嫱ㄟ^在需要的時間和節(jié)點支持更多的緩存,有助于最大限度地減少觸發(fā)PFC流量控制的需要。

主流廠商實現(xiàn)當前市場上,大多數(shù)數(shù)據(jù)中心交換機都是使用商用交換芯片ASIC構(gòu)建的,這些ASIC針對傳統(tǒng)的數(shù)據(jù)流量模式和數(shù)據(jù)包大小進行了成本優(yōu)化,為了在實現(xiàn)帶寬目標的同時保持低成本,芯片供應(yīng)商更多使用了分片緩存架構(gòu),犧牲了公平性,同時面臨不可預(yù)測性和微突發(fā)吸收的問題。

但是,當前幾個主要廠商51.2Tbps最高容量的交換芯片,由于應(yīng)對場景以HPC/AI大模型訓(xùn)練等為主,基本都采用完全共享緩存架構(gòu),相關(guān)的交換芯片或交換機如博通Tomahawk5、英偉達Spectrum-4、思科Silicon One G200都是宣傳采用完全共享緩存架構(gòu)。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 網(wǎng)絡(luò)交換機

    關(guān)注

    1

    文章

    72

    瀏覽量

    16408
  • 緩存
    +關(guān)注

    關(guān)注

    1

    文章

    246

    瀏覽量

    27205
  • 智算中心
    +關(guān)注

    關(guān)注

    0

    文章

    94

    瀏覽量

    2066

原文標題:智算中心網(wǎng)絡(luò)交換機需要什么樣的緩存架構(gòu)?

文章出處:【微信號:SDNLAB,微信公眾號:SDNLAB】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    什么是工業(yè)級交換機?工業(yè)交換機作用有哪些?

    重中之重!??! ? ? 工業(yè)級交換機 是專為工業(yè)環(huán)境設(shè)計的 網(wǎng)絡(luò)設(shè)備 ,主要作用是實現(xiàn)以太網(wǎng)設(shè)備的互聯(lián),擴大網(wǎng)絡(luò)覆蓋范圍。與普通的商業(yè)交換機相比,工業(yè)級
    的頭像 發(fā)表于 07-07 16:25 ?199次閱讀

    工業(yè)交換機與普通交換機的區(qū)別:為什么工廠網(wǎng)絡(luò)寧貴不?。?/a>

    在工業(yè)4.0和智能制造的浪潮下,工廠的每一臺設(shè)備、每一處傳感器都成了網(wǎng)絡(luò)中的“神經(jīng)元”,而連接這些“神經(jīng)元”的核心設(shè)備——工業(yè)交換機,卻常被忽視。許多人會問:“工業(yè)交換機和普通交換機
    的頭像 發(fā)表于 05-23 17:14 ?316次閱讀

    工業(yè)級交換機選型指南

    在工業(yè)自動化和物聯(lián)網(wǎng)應(yīng)用中,工業(yè)級交換機是不可或缺的網(wǎng)絡(luò)設(shè)備。它不僅需要具備高度的穩(wěn)定性和可靠性,還需要適應(yīng)各種惡劣的環(huán)境條件。但對于初次接觸工業(yè)級
    的頭像 發(fā)表于 04-17 16:38 ?436次閱讀
    工業(yè)級<b class='flag-5'>交換機</b>選型指南

    交換機和分交換機的連接光纖接口是否是lc

    交換機和分交換機的連接光纖接口是否采用LC接口,取決于設(shè)備型號、設(shè)計需求和場景要求,并非固定選擇。 在光纖網(wǎng)絡(luò)中,主交換機和分交換機之間的
    的頭像 發(fā)表于 04-15 10:42 ?375次閱讀

    POE交換機接口詳解

    在現(xiàn)代網(wǎng)絡(luò)設(shè)備中,PoE(以太網(wǎng)供電)技術(shù)已成為不可或缺的一部分。PoE交換機接口不僅能傳輸數(shù)據(jù),還能通過同一條網(wǎng)線為終端設(shè)備供電,有效簡化布線,降低成本,并提升網(wǎng)絡(luò)部署效率。本文將全面解析PoE
    發(fā)表于 03-27 17:17

    如何實現(xiàn)POE交換機串聯(lián)?

    提供連接與供電。然而,POE交換機的串聯(lián)需要合理的連接方式與配置,以確保網(wǎng)絡(luò)性能和穩(wěn)定性。本文將詳細介紹如何實現(xiàn)POE交換機串聯(lián)。 POE交換機
    發(fā)表于 03-25 19:10

    PoE交換機如何助力智慧城市基礎(chǔ)設(shè)施建設(shè)?

    交換機在構(gòu)建這些網(wǎng)絡(luò)中發(fā)揮著至關(guān)重要的作用。本文將探討PoE交換機如何助力智慧城市發(fā)展,以及它們在構(gòu)建強大城市網(wǎng)絡(luò)中的重要性。 智慧城市中的網(wǎng)
    發(fā)表于 03-25 10:20

    PoE交換機與非PoE交換機的比較:兩者能否協(xié)同工作?

    號線對并接地)而影響網(wǎng)絡(luò)運行。 如果您需要通過非PoE交換機為PoE設(shè)備供電,可以使用PoE供電器,它能在數(shù)據(jù)傳輸過程中為設(shè)備提供電力,確保PoE設(shè)備正常運行。 PoE交換機可以連接
    發(fā)表于 03-21 19:20

    廣西南寧企業(yè)級綜合網(wǎng)關(guān)、網(wǎng)絡(luò)核心交換機等售后維修服務(wù)中心點深妙科技

    隨著信息技術(shù)的迅猛發(fā)展,云計算和網(wǎng)絡(luò)架構(gòu)的復(fù)雜性日益增加,核心交換機作為網(wǎng)絡(luò)中心節(jié)點,擔負著至關(guān)重要的角色。本文旨在探討云管框式核心
    的頭像 發(fā)表于 12-18 15:41 ?483次閱讀
    廣西南寧企業(yè)級綜合網(wǎng)關(guān)、<b class='flag-5'>網(wǎng)絡(luò)</b>核心<b class='flag-5'>交換機</b>等售后維修服務(wù)<b class='flag-5'>中心</b>點深妙科技

    24口全千兆交換機方案設(shè)計參考原理圖資料(資料可直接使用)

    交換機設(shè)計領(lǐng)域,多數(shù)需要千兆交換機。本設(shè)計參考原理圖旨在幫助工程師和技術(shù)人員在開發(fā)24口全千兆交換機時更好地理解硬件架構(gòu)和電路設(shè)計。它基于R
    發(fā)表于 12-10 10:22

    交換機的工作原理是什么?3類交換機故障詳解

    傳統(tǒng)的交換機本質(zhì)上是具有流量控制能力的多端口網(wǎng)橋,即傳統(tǒng)的(二層) 交換機。把路由技術(shù)引入交換機,可以完成網(wǎng)絡(luò)層路由選擇,故稱為三層交換,這
    的頭像 發(fā)表于 11-05 10:12 ?1392次閱讀

    如何測試交換機端口速率

    交換機端口速率是指交換機端口在數(shù)據(jù)傳輸過程中的最大傳輸速率。在網(wǎng)絡(luò)環(huán)境中,交換機端口速率對于確保網(wǎng)絡(luò)性能和數(shù)據(jù)傳輸效率至關(guān)重要。測試
    的頭像 發(fā)表于 10-18 09:48 ?4280次閱讀

    反射內(nèi)存交換機與普通交換機的區(qū)別

    ,實現(xiàn)低延遲、確定性的數(shù)據(jù)傳輸。普通交換機則依據(jù)網(wǎng)絡(luò)協(xié)議(如以太網(wǎng)協(xié)議)進行數(shù)據(jù)轉(zhuǎn)發(fā),通常需要軟件參與處理,數(shù)據(jù)傳輸?shù)难舆t和確定性相對較難保證。傳輸速度和延遲:反射
    的頭像 發(fā)表于 09-05 09:57 ?1148次閱讀
    反射內(nèi)存<b class='flag-5'>交換機</b>與普通<b class='flag-5'>交換機</b>的區(qū)別

    網(wǎng)管型交換機和非網(wǎng)管型交換機的區(qū)別

    網(wǎng)管型交換機和非網(wǎng)管型交換機是兩種不同類型的交換機,它們在功能、性能、應(yīng)用場景等方面存在明顯的差異。 定義 網(wǎng)管型交換機(Managed Switch)是一種具有
    的頭像 發(fā)表于 08-05 15:41 ?4283次閱讀

    Is交換機組成的環(huán)形網(wǎng)絡(luò)中,當位于主控節(jié)點的Ism網(wǎng)管交換機故障后,為什么環(huán)網(wǎng)中其他交換機不受影響?

    當位于主控節(jié)點的交換機故障斷掉,環(huán)網(wǎng)中其他交換機是如何保持正常運行的?或者說什么原理讓環(huán)網(wǎng)其他交換機不受影響?
    發(fā)表于 07-25 06:14