一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

PCIe?結(jié)構(gòu)和RAID如何在GPUDirect存儲(chǔ)中釋放全部潛能

jf_pJlTbmA9 ? 來源:jf_pJlTbmA9 ? 作者:jf_pJlTbmA9 ? 2023-07-08 15:10 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

隨著更快的圖形處理單元(GPU)能夠提供明顯更高的計(jì)算能力,存儲(chǔ)設(shè)備和GPU存儲(chǔ)器之間的數(shù)據(jù)路徑瓶頸已經(jīng)無法實(shí)現(xiàn)最佳應(yīng)用程序性能。NVIDIA的Magnum IO GPUDirect存儲(chǔ)解決方案通過在存儲(chǔ)設(shè)備和GPU存儲(chǔ)器之間實(shí)現(xiàn)直接路徑,可以極大地幫助解決該問題。然而,同等重要的是要使用容錯(cuò)系統(tǒng)來優(yōu)化其已經(jīng)非常出色的能力,從而確保在發(fā)生災(zāi)難性故障時(shí)備份關(guān)鍵數(shù)據(jù)。該解決方案通過PCIe?結(jié)構(gòu)連接邏輯RAID卷,在PCIe 4.0規(guī)范下,這可以將數(shù)據(jù)速率提高到26 GB/s。為了解如何實(shí)現(xiàn)這些優(yōu)勢,首先需要檢查該解決方案的關(guān)鍵組件及其如何協(xié)同工作來提供結(jié)果。

Magnum IO GPUDirect存儲(chǔ)

Magnum IO GPUDirect存儲(chǔ)解決方案的關(guān)鍵優(yōu)勢是其能夠消除主要性能瓶頸之一,方法是不使用CPU中的系統(tǒng)存儲(chǔ)器將數(shù)據(jù)從存儲(chǔ)設(shè)備加載到GPU中進(jìn)行處理。通常將數(shù)據(jù)移動(dòng)到主機(jī)存儲(chǔ)器并傳送到GPU,這依賴于CPU系統(tǒng)存儲(chǔ)器中的回彈緩沖區(qū),在數(shù)據(jù)傳送到GPU之前,會(huì)在其中創(chuàng)建數(shù)據(jù)的多個(gè)副本。但是,通過這種路徑移動(dòng)大量數(shù)據(jù)會(huì)產(chǎn)生延遲時(shí)間,降低GPU性能,并在主機(jī)中占用許多CPU周期。借助Magnum IO GPUDirect存儲(chǔ)解決方案,無需訪問CPU并避免了回彈緩沖區(qū)效率低下(圖1)。

1672907747484612.jpg

圖1. Magnum IO GPUDirect存儲(chǔ)解決方案無需訪問CPU,避免了從數(shù)據(jù)路徑回彈緩沖

性能直接隨著傳送數(shù)據(jù)量的增加而提高,傳送數(shù)據(jù)量則隨著人工智能AI)、機(jī)器學(xué)習(xí)(ML)、深度學(xué)習(xí)(DL)和其他數(shù)據(jù)密集型應(yīng)用所需的大型分布式數(shù)據(jù)集呈指數(shù)級增長。當(dāng)數(shù)據(jù)在本地存儲(chǔ)或遠(yuǎn)程存儲(chǔ)時(shí),可以實(shí)現(xiàn)這些優(yōu)勢,從而允許以比CPU存儲(chǔ)器中的頁面緩存更快的速度訪問數(shù)拍字節(jié)的遠(yuǎn)程存儲(chǔ)。

優(yōu)化RAID性能

該解決方案中的下一個(gè)元素是包括RAID功能,用于保持?jǐn)?shù)據(jù)冗余和容錯(cuò)能力。雖然軟件RAID可以提供數(shù)據(jù)冗余,但底層軟件RAID引擎仍然使用精簡指令集計(jì)算機(jī)(RISC)架構(gòu)進(jìn)行操作,例如奇偶校驗(yàn)計(jì)算。當(dāng)比較高級RAID級別(例如RAID 5和RAID 6)的寫I/O延遲時(shí)間時(shí),硬件RAID仍然比軟件RAID快得多,因?yàn)樘峁┝藢S?a target="_blank">處理器來執(zhí)行這些操作和回寫高速緩存。在流傳輸應(yīng)用中,軟件RIAD的長期RIAD響應(yīng)時(shí)間會(huì)導(dǎo)致數(shù)據(jù)堆積在高速緩存中。硬件RAID解決方案不存在緩存數(shù)據(jù)堆積問題,并且具有專門的備用電池,可以防止出現(xiàn)災(zāi)難性系統(tǒng)掉電時(shí)數(shù)據(jù)丟失的情況。

標(biāo)準(zhǔn)硬件RAID雖然減輕了主機(jī)的奇偶校驗(yàn)管理負(fù)擔(dān),但大量數(shù)據(jù)仍需經(jīng)過RAID控制器才能發(fā)送到NVMe?驅(qū)動(dòng)器,導(dǎo)致數(shù)據(jù)路徑更加復(fù)雜。針對此問題的解決方案是NVMe優(yōu)化的硬件RAID,該解決方案提供了簡化的數(shù)據(jù)路徑,無需經(jīng)過固件或RAID片上控制器即可傳送數(shù)據(jù)。它還允許維護(hù)基于硬件的保護(hù)和加密服務(wù)。

混合PCIe結(jié)構(gòu)

PCIe Gen 4現(xiàn)在是存儲(chǔ)子系統(tǒng)內(nèi)的基本系統(tǒng)互連接口,但標(biāo)準(zhǔn)PCIe交換網(wǎng)具有與前幾代相同的基于樹的基本層級。這意味著,主機(jī)間通信需要非透明橋接(NTB)來實(shí)現(xiàn)跨分區(qū)通信,這使其變得復(fù)雜,特別是在多主機(jī)多交換網(wǎng)配置中。Microchip的PAX PCIe高級結(jié)構(gòu)交換網(wǎng)等解決方案能夠克服這些限制,因?yàn)樗鼈冎С秩哂嗦窂胶脱h(huán),而這是使用傳統(tǒng)PCIe無法實(shí)現(xiàn)的。

結(jié)構(gòu)交換網(wǎng)具有兩個(gè)獨(dú)立的域,主機(jī)虛擬域(專用于每個(gè)物理主機(jī))和結(jié)構(gòu)域(包含所有端點(diǎn)和結(jié)構(gòu)鏈路)。來自主機(jī)域的事務(wù)會(huì)在結(jié)構(gòu)域中轉(zhuǎn)換為ID和地址,反之,結(jié)構(gòu)域中通信的非分層路由也是如此。這樣,系統(tǒng)中的所有主機(jī)便可共享連接到交換網(wǎng)和端點(diǎn)的結(jié)構(gòu)鏈路。

嵌入式CPU上運(yùn)行的結(jié)構(gòu)固件通過可配置的下行端口數(shù)虛擬化符合PCIe標(biāo)準(zhǔn)的交換網(wǎng)。因此,交換網(wǎng)將始終顯示為具有直連端點(diǎn)的標(biāo)準(zhǔn)單層PCIe設(shè)備,而與這些端點(diǎn)在結(jié)構(gòu)中的位置無關(guān)。由于結(jié)構(gòu)交換網(wǎng)會(huì)攔截來自主機(jī)的所有配置平面通信(包括PCIe枚舉過程)并選擇最佳路徑,因此它可以實(shí)現(xiàn)這一點(diǎn)。這樣,GPU等端點(diǎn)便可綁定到域中的任何主機(jī)(圖2)。

1672907741572600.jpg

圖2. 交換網(wǎng)固件虛擬化的主機(jī)域顯示為每個(gè)主機(jī)符合PCIe標(biāo)準(zhǔn)的單層交換網(wǎng)

在以下示例(圖3)中,我們給出了雙主機(jī)PCIe結(jié)構(gòu)引擎設(shè)置。此處,我們可以看到,結(jié)構(gòu)虛擬化允許每個(gè)主機(jī)看到一個(gè)透明PCIe拓?fù)?,其中包含一個(gè)上行端口、三個(gè)下行端口和三個(gè)連接到它們的端點(diǎn),并且主機(jī)可以正確枚舉它們。圖3中的有趣之處是具有一個(gè)包含兩個(gè)虛擬功能的SR-IOV SSD,通過Microchip的PCIe高級結(jié)構(gòu)交換網(wǎng),同一驅(qū)動(dòng)器的虛擬功能可以共享給不同的主機(jī)。

1672907735729851.jpg

圖3. 雙主機(jī)PCIe?結(jié)構(gòu)引擎

這種PAX結(jié)構(gòu)交換網(wǎng)解決方案還支持在各結(jié)構(gòu)之間直接跨域點(diǎn)對點(diǎn)傳輸,因此可減少根端口阻塞并進(jìn)一步緩解CPU性能瓶頸,如圖4所示。

1672907726831240.jpg

圖4. 通過結(jié)構(gòu)路由通信,可減少根端口阻塞

性能優(yōu)化

在探索了NVMe驅(qū)動(dòng)器和GPU之間數(shù)據(jù)傳輸?shù)男阅軆?yōu)化過程中涉及的所有組件之后,現(xiàn)在可以結(jié)合使用這些組件來實(shí)現(xiàn)預(yù)期的結(jié)果。說明這一點(diǎn)的最佳方式是利用圖示演示各個(gè)步驟,圖5顯示了主機(jī)CPU及其根端口以及可實(shí)現(xiàn)最佳結(jié)果的各種配置。

如圖5左側(cè)所示,盡管使用的是高性能NVMe控制器,但由于根端口的開銷,PCI Gen 4 x 4(4.5 GB/s)的最大數(shù)據(jù)速率也限制為3.5 GB/s。不過,通過RAID(邏輯卷)同時(shí)聚合多個(gè)驅(qū)動(dòng)器(如右側(cè)所示),SmartRAID控制器可為四個(gè)NVMe驅(qū)動(dòng)器各創(chuàng)建兩個(gè)RAID卷,并通過根端口創(chuàng)建傳統(tǒng)PCIe點(diǎn)對點(diǎn)路由。這會(huì)將數(shù)據(jù)速率提高到9.5 GB/s。

但是,利用跨域點(diǎn)對點(diǎn)傳輸(底部的圖),可以通過結(jié)構(gòu)鏈路而不是根端口來路由通信,從而實(shí)現(xiàn)26 GB/s的速率,這是使用SmartROC 3200 RAID控制器可達(dá)到的最高速率。在最后一個(gè)場景中,交換網(wǎng)提供不受固件影響的直接數(shù)據(jù)路徑,并且仍然保持基于硬件的RAID保護(hù)和加密服務(wù),同時(shí)充分利用GPUDirect存儲(chǔ)的全部潛能。

1672907709348977.jpg

圖5. 實(shí)現(xiàn)26 GB/s的路徑

總結(jié)

高性能PCIe結(jié)構(gòu)交換網(wǎng)(例如Microchip的PAX)允許多主機(jī)共享支持單根I/O虛擬化(SR-IOV)的驅(qū)動(dòng)器,以及動(dòng)態(tài)劃分可在多個(gè)主機(jī)之間共享的GPU和NVMe SSD池。Microchip的PAX結(jié)構(gòu)交換網(wǎng)可以將端點(diǎn)資源動(dòng)態(tài)重新分配給需要這些資源的任何主機(jī)。

這種解決方案還使用了SmartROC 3200 RAID控制器系列支持的SmartPQI驅(qū)動(dòng)程序,因此無需自定義驅(qū)動(dòng)程序。Microchip的SmartROC 3200 RAID控制器是目前惟一能夠提供最高傳輸速率(即26 GB/s)的設(shè)備。它具有極低的延遲時(shí)間,可向主機(jī)提供最多16個(gè)PCIe Gen 4通道,并向后兼容PCIe Gen 2。與Microchip基于Flashtec?系列的NVMe SSD結(jié)合使用時(shí),可在多主機(jī)系統(tǒng)中發(fā)揮PCIe和Magnum IO GPUDirect存儲(chǔ)的全部潛能??傮w而言,上述所有特性使其能夠構(gòu)建一種強(qiáng)大的系統(tǒng),該系統(tǒng)可以滿足AI、ML、DL以及其他高性能計(jì)算應(yīng)用的實(shí)時(shí)需求。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 存儲(chǔ)
    +關(guān)注

    關(guān)注

    13

    文章

    4533

    瀏覽量

    87466
  • PCIe
    +關(guān)注

    關(guān)注

    16

    文章

    1342

    瀏覽量

    85167
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    服務(wù)器數(shù)據(jù)恢復(fù)—OceanStor存儲(chǔ)RAID5陣列數(shù)據(jù)恢復(fù)案例

    華為OceanStor T系列某型號存儲(chǔ)中有一組由24塊機(jī)械硬盤組建的一組RAID5陣列。 運(yùn)行過程存儲(chǔ)設(shè)備RAID5陣列上多塊硬盤出
    的頭像 發(fā)表于 12-31 13:49 ?446次閱讀
    服務(wù)器數(shù)據(jù)恢復(fù)—OceanStor<b class='flag-5'>存儲(chǔ)</b><b class='flag-5'>RAID</b>5陣列數(shù)據(jù)恢復(fù)案例

    如何配置 RAID 5 存儲(chǔ)系統(tǒng)

    配置 RAID 5 存儲(chǔ)系統(tǒng)是一個(gè)涉及硬件和軟件設(shè)置的過程。以下是配置 RAID 5 存儲(chǔ)系統(tǒng)的一般步驟,以及一些注意事項(xiàng)。請注意,具體步驟可能會(huì)因不同的硬件和操作系統(tǒng)而有所不同。 1
    的頭像 發(fā)表于 12-27 17:02 ?2165次閱讀

    服務(wù)器數(shù)據(jù)恢復(fù)—華為OceanStor存儲(chǔ)RAID5陣列數(shù)據(jù)恢復(fù)案例

    存儲(chǔ)設(shè)備raid5陣列上多塊硬盤出現(xiàn)故障離線,raid5陣列失效,數(shù)據(jù)無法正常訪問。 關(guān)機(jī)后將存儲(chǔ)中所有硬盤標(biāo)記&取出,硬件工程師
    的頭像 發(fā)表于 11-14 10:53 ?617次閱讀
    服務(wù)器數(shù)據(jù)恢復(fù)—華為OceanStor<b class='flag-5'>存儲(chǔ)</b><b class='flag-5'>中</b><b class='flag-5'>RAID</b>5陣列數(shù)據(jù)恢復(fù)案例

    raid 在大數(shù)據(jù)分析的應(yīng)用

    RAID(Redundant Array of Independent Disks,獨(dú)立磁盤冗余陣列)在大數(shù)據(jù)分析的應(yīng)用主要體現(xiàn)在提高存儲(chǔ)系統(tǒng)的性能、可靠性和容量上。以下是RAID
    的頭像 發(fā)表于 11-12 09:44 ?730次閱讀

    raid 硬件與軟件的區(qū)別

    在現(xiàn)代數(shù)據(jù)中心和企業(yè)級存儲(chǔ)解決方案RAID技術(shù)扮演著至關(guān)重要的角色。它通過將多個(gè)物理磁盤組合成一個(gè)邏輯單元,提供了數(shù)據(jù)冗余、性能提升和容錯(cuò)能力。RAID的實(shí)現(xiàn)方式主要分為硬件
    的頭像 發(fā)表于 11-12 09:39 ?1687次閱讀

    raid 存儲(chǔ)方案適合哪些場景

    在現(xiàn)代數(shù)據(jù)存儲(chǔ)領(lǐng)域,RAID技術(shù)已經(jīng)成為提高數(shù)據(jù)可靠性、可用性和性能的關(guān)鍵技術(shù)之一。RAID通過將多個(gè)物理磁盤組合成一個(gè)邏輯單元,提供了數(shù)據(jù)冗余和性能優(yōu)化。 RAID技術(shù)概述
    的頭像 發(fā)表于 11-12 09:36 ?1448次閱讀

    raid 和備份的區(qū)別是什么

    在現(xiàn)代數(shù)據(jù)管理,數(shù)據(jù)保護(hù)是至關(guān)重要的一環(huán)。RAID和備份是兩種常見的數(shù)據(jù)保護(hù)技術(shù),它們各自有著獨(dú)特的優(yōu)勢和應(yīng)用場景。 一、RAID的基本概念和優(yōu)勢 RAID的定義
    的頭像 發(fā)表于 11-12 09:34 ?1581次閱讀

    PCIe與NVMe存儲(chǔ)的關(guān)系

    在現(xiàn)代計(jì)算機(jī)系統(tǒng),存儲(chǔ)技術(shù)的發(fā)展對于提高整體性能至關(guān)重要。PCI Express(PCIe)和NVMe(Non-Volatile Memory Express)是兩種關(guān)鍵技術(shù),它們共同推動(dòng)了
    的頭像 發(fā)表于 11-06 09:29 ?2337次閱讀

    服務(wù)器數(shù)據(jù)恢復(fù)—用5盤RAID5陣列的4塊盤重建RAID5陣列后如何恢復(fù)原始數(shù)據(jù)?

    服務(wù)器數(shù)據(jù)恢復(fù)環(huán)境: 一臺(tái)服務(wù)器掛接一臺(tái)存儲(chǔ),該存儲(chǔ)中有一組由5塊硬盤組建的RAID5陣列。 服務(wù)器故障: 存儲(chǔ)raid5陣列中有
    的頭像 發(fā)表于 10-30 15:07 ?675次閱讀

    軟件RAID 5的實(shí)現(xiàn)過程詳解

    RAID 5 是一種存儲(chǔ)性能、數(shù)據(jù)安全和存儲(chǔ)成本兼顧的存儲(chǔ)解決方案。RAID 5可以理解為是RAID
    的頭像 發(fā)表于 10-29 16:39 ?941次閱讀
    軟件<b class='flag-5'>RAID</b> 5的實(shí)現(xiàn)過程詳解

    RAID5數(shù)據(jù)恢復(fù)—如何重組RAID5陣列?

    RAID5數(shù)據(jù)恢復(fù)環(huán)境: 一臺(tái)存儲(chǔ)上有一組由12塊SCSI硬盤(11塊數(shù)據(jù)盤+1塊熱備盤)組建的RAID5磁盤陣列,F(xiàn)reeBSD操作系統(tǒng)+zfs文件系統(tǒng)。 RAID5故障: 其
    的頭像 發(fā)表于 10-22 15:48 ?782次閱讀
    <b class='flag-5'>RAID</b>5數(shù)據(jù)恢復(fù)—如何重組<b class='flag-5'>RAID</b>5陣列?

    總線類型raid是什么意思

    RAID(Redundant Array of Independent Disks,獨(dú)立磁盤冗余陣列)是一種將多個(gè)硬盤驅(qū)動(dòng)器組合成一個(gè)邏輯單元的數(shù)據(jù)存儲(chǔ)虛擬化技術(shù)。它通過在多個(gè)硬盤之間分散數(shù)據(jù)來提高
    的頭像 發(fā)表于 10-15 15:33 ?999次閱讀

    服務(wù)器數(shù)據(jù)恢復(fù)—從數(shù)據(jù)恢復(fù)的角度討論RAID磁盤陣列的存儲(chǔ)安全問題

    出于盡可能避免數(shù)據(jù)災(zāi)難的設(shè)計(jì)初衷,RAID解決了3個(gè)問題:容量問題、IO性能問題、存儲(chǔ)安全(冗余)問題。從數(shù)據(jù)恢復(fù)的角度討論RAID存儲(chǔ)安全問題。
    的頭像 發(fā)表于 09-07 10:21 ?548次閱讀

    服務(wù)器數(shù)據(jù)恢復(fù)—LeftHand存儲(chǔ)結(jié)構(gòu)介紹和數(shù)據(jù)恢復(fù)案例

    LeftHand存儲(chǔ)支持RAID5、RAID6、RAID10磁盤陣列,同時(shí)還支持卷快照,卷動(dòng)態(tài)擴(kuò)容等。下面簡單聊一下LeftHand存儲(chǔ)
    的頭像 發(fā)表于 08-29 11:22 ?412次閱讀
    服務(wù)器數(shù)據(jù)恢復(fù)—LeftHand<b class='flag-5'>存儲(chǔ)</b><b class='flag-5'>結(jié)構(gòu)</b>介紹和數(shù)據(jù)恢復(fù)案例

    服務(wù)器數(shù)據(jù)恢復(fù)—raid5陣列熱備盤未全部成功啟用的數(shù)據(jù)恢復(fù)案例

    塊熱備盤啟用替換掉其中一塊離線盤,另外1塊熱備盤未成功啟用,raid5陣列崩潰,存儲(chǔ)不可用。 磁盤陣列硬盤離線的原因通常是磁盤存在物理故障或者硬盤出現(xiàn)壞道。由于EMC存儲(chǔ)
    的頭像 發(fā)表于 08-14 11:27 ?667次閱讀
    服務(wù)器數(shù)據(jù)恢復(fù)—<b class='flag-5'>raid</b>5陣列熱備盤未<b class='flag-5'>全部</b>成功啟用的數(shù)據(jù)恢復(fù)案例