一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

高性能、低延遲的InfiniBand式網(wǎng)絡(luò)并不是唯一的選擇

芯片半導(dǎo)體 ? 來(lái)源:半導(dǎo)體行業(yè)觀察 ? 2023-08-27 09:44 ? 次閱讀

正如我們喜歡指出的那樣,當(dāng)談到高性能、低延遲的 InfiniBand 式網(wǎng)絡(luò)時(shí),Nvidia 并不是唯一的選擇,自 20 世紀(jì) 90 年代末 InfiniBand 互連出現(xiàn)以來(lái)就一直不是唯一的選擇。三年前從英特爾收購(gòu)了 Omni-Path 互連業(yè)務(wù)的Cornelis Networks 就是另一種選擇。雖然它跳過(guò)了 200 Gb/秒一代,但仍在銷售改進(jìn)的 100 Gb/秒 Omni-Path Express 變體,并為未來(lái)的 400 Gb/秒一代奠定了基礎(chǔ)。

Cornelis Networks 的高管們從 SilverStorm 和 PathScale 的 InfiniBand 開始,最終成為 QLogic 的 TruScale InfiniBand 的基礎(chǔ),而 QLogic 又成為來(lái)自 Mellanox Technologies 的 InfiniBand 的替代供應(yīng)商。早在 2012 年 1 月,英特爾就以 1.25 億美元的價(jià)格從 QLogic 手中收購(gòu)了 TruScale InfiniBand 業(yè)務(wù)——這似乎是很久以前的事了?三個(gè)月后又斥資 1.4 億美元從Cray 收購(gòu)了“Gemini”XT 和“Aries”XC 互連業(yè)務(wù),將它們整合起來(lái)創(chuàng)建 Omni-Path 互連。

從技術(shù)上講,這是 InfiniBand 主題的三種不同變體,而 Cornelis Networks 正在做的事情在許多方面代表了第四種變體。

InfiniBand 的最初目標(biāo)是取代 PCI-Express、光纖通道,或許還有以太網(wǎng),并創(chuàng)建融合結(jié)構(gòu)。TruScale 變體采用了一種稱為 Performance Scale Messaging (PSM) 的技術(shù),QLogic 當(dāng)然認(rèn)為該技術(shù)比 InfiniBand verbs approach更好,并且其創(chuàng)建者認(rèn)為可以提供更好的擴(kuò)展性。但 PSM 已有二十多年歷史,Cornelis Networks 正在基于 libfabric 驅(qū)動(dòng)程序構(gòu)建新的軟件堆棧,該驅(qū)動(dòng)程序是 Linux 操作系統(tǒng)的一部分,并取代了 QLogic TruScale 和 Intel Omni-Path 中的 PSM 提供程序與Open Fabrics Interfaces 工作組的 OPX 提供商進(jìn)行堆棧。

這個(gè)新堆棧經(jīng)過(guò)開發(fā),可以在 Cornelis Networks 從 Intel 購(gòu)買的 100 Gb/秒 Omni-Path 硬件上運(yùn)行(該公司稱之為 Omni-Path Express,縮寫為 OPX),并且將是未來(lái) 400 Gb 上唯一可用的堆棧/sec Omni-Path Express CN5000 系列目前正在開發(fā)中。

2ede39b2-4423-11ee-a2ef-92fbcf53809c.jpg

libfabric 庫(kù)是 OFI 標(biāo)準(zhǔn)的第一個(gè)實(shí)現(xiàn),它是一個(gè)位于網(wǎng)絡(luò)接口卡和 OFI 提供程序驅(qū)動(dòng)程序之上的層,位于 MPI、SHMEM、PGAS 和通常在 HPC 分布式計(jì)算系統(tǒng)上運(yùn)行的其他內(nèi)存共享協(xié)議之間和人工智能。它看起來(lái)像這樣:

以下是 Omni-Path Express 主機(jī)軟件堆?,F(xiàn)在的樣子,其中第二代 PSM2 提供程序和本機(jī) OFI 提供程序并行運(yùn)行:

2ef6c8ec-4423-11ee-a2ef-92fbcf53809c.jpg

您會(huì)注意到,原始 OpenFabrics Alliance Verbs 仍然可以在 Linux 內(nèi)核模式下使用,以支持舊版協(xié)議和框架的 InfiniBand verbs 提供程序,但 PSM2 和 OFI 提供程序都在 Linux 用戶空間中運(yùn)行,其MPI的各種實(shí)現(xiàn)也是如此——它們有很多。

在下一代 CN5000 平臺(tái)中,紫色的 PSM2 內(nèi)容將消失,我們推測(cè) Verbs 提供程序以及運(yùn)行在 Linux 內(nèi)核中的 OFA Verbs 代碼之上的內(nèi)容也會(huì)消失。Cornelis Networks 軟件工程副總裁 Doug Fuller 本周在Hot Interconnects 30 會(huì)議上發(fā)表演講,他表示,OPX 和 Nvidia InfiniBand 之間的主要區(qū)別之一是 Cornelis Networks 使用的所有堆棧都將是開放的源并添加到內(nèi)核的上游。

“我們的 Omni-Path OFI 驅(qū)動(dòng)程序是 Linux 內(nèi)核的一部分,”Fuller 在演講中解釋道?!拔业囊馑际牵覀?cè)趦?nèi)核開發(fā)方面也首先處于上游。因此,我們所有的補(bǔ)丁都在上游合并,并且我們有來(lái)自 Linus 的火焰來(lái)證明這一點(diǎn)。然后我們合并。我們鼓勵(lì)它向下游合并并集成到各種 Linux 發(fā)行版中。因此,在大多數(shù)情況下,如果您啟動(dòng)現(xiàn)代 Linux 發(fā)行版,您的驅(qū)動(dòng)程序已經(jīng)存在,無(wú)需安裝其他軟件。我們致力于上游優(yōu)先開發(fā),我們希望確保回饋我們使用的社區(qū),并為用戶提供良好的用戶體驗(yàn)?!?/p>

三年來(lái)我們一直希望看到的,以及 Fuller 向 Hot Interconnects 觀眾提供的,是備受期待的 Cornelis Network 硬件路線圖。話不多說(shuō),這里是:

2f1c2100-4423-11ee-a2ef-92fbcf53809c.jpg

HPC 中心、云構(gòu)建商和超大規(guī)模企業(yè)都喜歡可預(yù)測(cè)的路線圖,這些路線圖使每一代的比特轉(zhuǎn)移成本越來(lái)越低,并且還增加了網(wǎng)絡(luò)規(guī)模,即可以通過(guò)合理的響應(yīng)連接到網(wǎng)絡(luò)的端點(diǎn)數(shù)量時(shí)間。這些是 Cornelis Networks 最終公開投入的賭注,眾所周知,公司不會(huì)購(gòu)買點(diǎn)產(chǎn)品,而是購(gòu)買路線圖,因?yàn)槲覀兌忌钤谖磥?lái)。

通過(guò) Omni-Path 100 系列,Cornelis Networks 正在轉(zhuǎn)售由英特爾創(chuàng)建的硬件,該硬件于 2015 年底開始在基于其“Knights”系列多核處理器的早期采用者 HPC 系統(tǒng)中推出。(我們認(rèn)為 Cornelis 忘記將品牌的“Express”部分放入路線圖中。) 該產(chǎn)品系列包括 100 Gb/秒適配器、48 端口邊緣交換機(jī)、288 端口導(dǎo)向器交換機(jī)和 1,152 端口導(dǎo)向器交換機(jī)。Omni-Path 100 互連支持 3 米及更短的直連電纜 (DAC) 和 100 米或更短的有源光纜 (AOC)。交換機(jī)的基數(shù)在fat tree上以全二分帶寬支持多達(dá) 13,800 個(gè)節(jié)點(diǎn),或以半二分帶寬支持 27,600 個(gè)節(jié)點(diǎn),在網(wǎng)絡(luò)逐漸變細(xì)的情況下最多支持 36,800 個(gè)節(jié)點(diǎn)。

考慮到其聯(lián)合創(chuàng)始人多年來(lái)推出的產(chǎn)品的悠久歷史,憑借 Omni-Path CN5000 CN5000 系列(Cornelis Networks 稱之為第五代高性能互連),交換機(jī)和適配器中的 ASIC 正在發(fā)生變化高達(dá) 400 Gb/秒,這將是性能的巨大飛躍。將會(huì)有一個(gè) 48 端口邊緣交換機(jī)(看起來(lái)像一個(gè)普通的披薩盒機(jī)器,而不是英特爾在 Omni-Path 100 上做的那種時(shí)髦的形狀),并且將在導(dǎo)向器交換機(jī)上進(jìn)行差異化,并與單個(gè) 576 端口機(jī)器一起使用。至于電纜,將支持 DAC 和 AOC,以及將銅電纜拉伸到 5 米或更短長(zhǎng)度的有源銅電纜 (ACC),這比 DAC 長(zhǎng) 2 米,從而提供更具創(chuàng)意的接線配置。

CN5000 系列將支持全二分帶寬樹和部分二分帶寬樹,例如 Omni-Path 100,還將支持 Dragonfly 和 Megafly(有時(shí)稱為 Dragonfly+)拓?fù)?,并且單個(gè)集群中最多可擴(kuò)展至 330,000 個(gè)節(jié)點(diǎn)。(我們不知道這樣的網(wǎng)絡(luò)中有多少層和跳數(shù),但我們的目標(biāo)是找出答案。)Cornelius Networks 正在添加基于遙測(cè)的動(dòng)態(tài)自適應(yīng)路由和擁塞控制,這聽起來(lái)可能基于一些想法是從 Cornelis Networks 通過(guò)英特爾獲得的 Cray“Aries”技術(shù)中挑選出來(lái)的。(同樣,我們會(huì)找到結(jié)果。)延遲(我們假設(shè)是從節(jié)點(diǎn)到節(jié)點(diǎn))承諾低至 1 微秒以下,消息速率預(yù)計(jì)為每秒 12 億條。CN5000 導(dǎo)向器交換機(jī)將提供風(fēng)冷和液冷選項(xiàng)。

以下是 CN5000 邊緣交換機(jī)的一些規(guī)格和機(jī)械結(jié)構(gòu):

2f397138-4423-11ee-a2ef-92fbcf53809c.jpg

這些是 CN5000 導(dǎo)向器交換機(jī)的規(guī)格:

2f567242-4423-11ee-a2ef-92fbcf53809c.jpg

最后,主機(jī)結(jié)構(gòu)適配器如下所示:

2f8ef8ba-4423-11ee-a2ef-92fbcf53809c.jpg

到 2026 年,Cornelis 路線圖將超越 Omni-Path CN6000,后者具有支持 800 Gb/秒的交換機(jī)和適配器 ASIC。交換機(jī)電纜選項(xiàng)的適配器在二等分帶寬、拓?fù)溥x項(xiàng)以及 330,000 個(gè)節(jié)點(diǎn)的規(guī)模方面保持不變。這里有趣的變化是使用 RISC-V 內(nèi)核的 DPU,插入 CXL 端口,并且可能會(huì)執(zhí)行一些集體操作卸載以及安全和存儲(chǔ)加速功能。某些結(jié)構(gòu)功能將被卸載,并且可能在交換機(jī)和適配器中都有特定于結(jié)構(gòu)的加速器。

隨著第七代產(chǎn)品將于 2028 年推出,Cornelis Networks 將把端口速度提高到 1.6 Tb/秒,并將 HyperX 拓?fù)涮砑拥骄W(wǎng)絡(luò)幾何結(jié)構(gòu)列表中,并對(duì) DPU 核心以及結(jié)構(gòu)和應(yīng)用程序卸載進(jìn)行增強(qiáng)。

我們已經(jīng)有一段時(shí)間沒(méi)有看到 Nvidia 或 Mellanox 的 InfiniBand 路線圖了,而且肯定不會(huì)走那么遠(yuǎn)。但節(jié)奏和減速帶可能會(huì)在某個(gè)時(shí)刻或多或少同步。






審核編輯:劉清

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 以太網(wǎng)
    +關(guān)注

    關(guān)注

    40

    文章

    5547

    瀏覽量

    174203
  • 人工智能
    +關(guān)注

    關(guān)注

    1804

    文章

    48449

    瀏覽量

    244975
  • InfiniBand
    +關(guān)注

    關(guān)注

    1

    文章

    30

    瀏覽量

    9308
  • PSM
    PSM
    +關(guān)注

    關(guān)注

    1

    文章

    43

    瀏覽量

    13662
  • LINUX內(nèi)核
    +關(guān)注

    關(guān)注

    1

    文章

    317

    瀏覽量

    22092

原文標(biāo)題:InfiniBand的挑戰(zhàn)者,來(lái)勢(shì)洶洶

文章出處:【微信號(hào):TenOne_TSMC,微信公眾號(hào):芯片半導(dǎo)體】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    適用于數(shù)據(jù)中心和AI時(shí)代的800G網(wǎng)絡(luò)

    )作為家備受信賴的信息通信技術(shù)產(chǎn)品及解決方案提供商,提供高可靠性的800G光模塊和解決方案,為AI工廠和AI云平臺(tái)提供高性能、延遲且可擴(kuò)展的網(wǎng)絡(luò)
    發(fā)表于 03-25 17:35

    在STM32L431上使用內(nèi)部RTC,時(shí)間運(yùn)行到23:59:59秒后,變?yōu)榱?4:00:00并不是00:00:00,為什么?

    大家好,我在STM32L431上使用內(nèi)部RTC,時(shí)間運(yùn)行到23:59:59秒后,變?yōu)榱?4:00:00,并不是00:00:00,并且weekday也沒(méi)有加,這是為什么呢?
    發(fā)表于 03-11 06:32

    專線直播和公共網(wǎng)絡(luò)直播相比,延遲差多少?

    網(wǎng)絡(luò)中復(fù)雜的路由跳轉(zhuǎn)和網(wǎng)絡(luò)擁堵。例如,專線網(wǎng)絡(luò)可以將延遲控制在毫秒級(jí)別,甚至在些優(yōu)化場(chǎng)景下,延遲
    的頭像 發(fā)表于 02-26 20:37 ?255次閱讀

    信道選擇對(duì)網(wǎng)絡(luò)性能的影響

    在現(xiàn)代通信網(wǎng)絡(luò)中,信道選擇是確保數(shù)據(jù)傳輸效率和可靠性的關(guān)鍵因素之。無(wú)線通信網(wǎng)絡(luò),尤其是蜂窩網(wǎng)絡(luò),依賴于無(wú)線電波在設(shè)備之間傳輸信息。這些無(wú)線
    的頭像 發(fā)表于 01-22 15:45 ?545次閱讀

    延遲、高效傳輸?shù)?b class='flag-5'>網(wǎng)絡(luò)環(huán)境中,異地組網(wǎng)和內(nèi)網(wǎng)穿透哪種技術(shù)更勝籌?

    在現(xiàn)代企業(yè)網(wǎng)絡(luò)架構(gòu)中,異地組網(wǎng)和內(nèi)網(wǎng)穿透是兩種常見的網(wǎng)絡(luò)連接技術(shù),它們?cè)诓煌瑘?chǎng)景下發(fā)揮著重要作用。然而,在追求延遲、高效傳輸?shù)?b class='flag-5'>網(wǎng)絡(luò)環(huán)境中,
    的頭像 發(fā)表于 01-07 10:52 ?444次閱讀

    用ADS1299-FE評(píng)估版測(cè)試時(shí),在測(cè)試的時(shí)候VREFP是-2.45,并不是設(shè)計(jì)所說(shuō)的4.5v,為什么?

    在用ADS1299-FE評(píng)估版測(cè)試時(shí) 采用內(nèi)部參考,雙電源供電模式 ,-2.5-2.5,但是在測(cè)試的時(shí)候 VREFP是-2.45,并不是設(shè)計(jì)所說(shuō)的4.5v? 在提供的LABview測(cè)試時(shí)總得不到想看到的結(jié)果,想請(qǐng)問(wèn)下是什么問(wèn)題呢? 是10uF電容擊穿了?
    發(fā)表于 12-16 06:43

    不是,電容ESR寄生電阻并不是越好!

    、電源硬件文章精選華為海思軟硬件開發(fā)資料 原文標(biāo)題:不是,電容ESR寄生電阻并不是越好
    的頭像 發(fā)表于 11-20 15:27 ?712次閱讀

    在FPGA接收ADC的DCLKP和DCLKM引腳,DCLK信號(hào)會(huì)出現(xiàn)規(guī)律性持續(xù)為0,在有DCLK信號(hào)時(shí)波形并不是恒定的,為什么?

    你好,我在FPGA接收ADC的DCLKP和DCLKM引腳(也即接收DCLK信號(hào)),用ILA抓出來(lái)的波形如下圖所示,可以發(fā)現(xiàn)DCLK信號(hào)會(huì)出現(xiàn)規(guī)律性持續(xù)為0,且在有DCLK信號(hào)的時(shí)候,他的波形并不是
    發(fā)表于 11-19 08:08

    高性能連接器的選擇與應(yīng)用

    連接器的選擇標(biāo)準(zhǔn) 電氣性能 :包括接觸電阻、絕緣電阻和抗電強(qiáng)度。高性能連接器應(yīng)具有接觸電阻以減少信號(hào)損耗,高絕緣電阻以防止漏電,以及足夠的抗電強(qiáng)度以保證安全。 機(jī)械
    的頭像 發(fā)表于 11-07 09:30 ?631次閱讀

    InfiniBand網(wǎng)絡(luò)內(nèi)計(jì)算的關(guān)鍵技術(shù)和應(yīng)用

    InfiniBand高性能計(jì)算(HPC)和人工智能(AI)應(yīng)用中發(fā)揮著關(guān)鍵作用,體現(xiàn)在它提供了高速、延遲網(wǎng)絡(luò)通信能力,以支持大規(guī)模數(shù)據(jù)
    的頭像 發(fā)表于 10-23 11:33 ?768次閱讀

    端到端InfiniBand網(wǎng)絡(luò)解決LLM訓(xùn)練瓶頸

    的,這需要大量的計(jì)算資源和高速數(shù)據(jù)傳輸網(wǎng)絡(luò)。端到端InfiniBand(IB)網(wǎng)絡(luò)作為高性能計(jì)算和AI模型訓(xùn)練的理想選擇,發(fā)揮著重要作用。在
    的頭像 發(fā)表于 10-23 11:26 ?940次閱讀
    端到端<b class='flag-5'>InfiniBand</b><b class='flag-5'>網(wǎng)絡(luò)</b>解決LLM訓(xùn)練瓶頸

    InfiniBand與以太網(wǎng)的對(duì)比分析

    InfiniBand作為種先進(jìn)的內(nèi)網(wǎng)計(jì)算平臺(tái),已成為驅(qū)動(dòng)高性能計(jì)算(HPC)、人工智能(AI)以及超大規(guī)模云基礎(chǔ)設(shè)施演進(jìn)的核心力量,其展現(xiàn)出無(wú)可比擬的性能優(yōu)勢(shì)。專為滿足服務(wù)器級(jí)連接需
    的頭像 發(fā)表于 10-23 11:23 ?1188次閱讀
    <b class='flag-5'>InfiniBand</b>與以太網(wǎng)的對(duì)比分析

    交互延遲音頻解碼器

    普通音頻解碼器在處理音頻時(shí)可能會(huì)引入較高的延遲,通常適合于音樂(lè)播放或錄音等場(chǎng)景。而交互延遲音頻解碼器則專為實(shí)時(shí)應(yīng)用設(shè)計(jì),延遲通常在10毫
    的頭像 發(fā)表于 09-28 11:15 ?423次閱讀
    交互<b class='flag-5'>式</b><b class='flag-5'>低</b><b class='flag-5'>延遲</b>音頻解碼器

    設(shè)計(jì)高性能、EMI汽車電源

    電子發(fā)燒友網(wǎng)站提供《設(shè)計(jì)高性能EMI汽車電源.pdf》資料免費(fèi)下載
    發(fā)表于 08-26 11:15 ?0次下載
    設(shè)計(jì)<b class='flag-5'>高性能</b>、<b class='flag-5'>低</b>EMI汽車電源

    INA333輸出為紋波電壓,并不是平滑的電壓,為什么?

    我最近在歐時(shí)購(gòu)買了TI的INA333芯片,輸入的差分電壓為32MV,共模電壓為2.5V,VREF為2.5V,供電電壓為5V,增益設(shè)置為60,輸出為紋波電壓,并不是平滑的電壓,不知道是為什么。
    發(fā)表于 08-13 07:57