一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

浪潮信息AS13000G7存儲創(chuàng)造MLPerf佳績,揭秘三大秘密武器!

全球TMT ? 來源:全球TMT ? 作者:全球TMT ? 2024-11-01 14:33 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

北京2024年11月1日/美通社/ -- 如果說2023年是全球認(rèn)識生成式AI(GenAI)的開始,那么2024年則是全球各大組織/企業(yè)真正探索人工智能商業(yè)價值的一年。

隨著越來越多用戶開始采用生成式AI等人工智能技術(shù),存儲等數(shù)據(jù)基礎(chǔ)設(shè)施也面臨著嚴(yán)峻考驗,用戶意識到存儲需要滿足人工智能數(shù)據(jù)訓(xùn)練與推理對于性能、延時、容量、擴展性等各種嚴(yán)苛需求。

近日,在最新發(fā)布的MLPerf AI存儲基準(zhǔn)評測中,浪潮信息分布式存儲平臺AS13000G7通過一系列創(chuàng)新技術(shù),顯著提升數(shù)據(jù)處理效率,勇奪8項測試中5項性能最佳成績,實現(xiàn)集群帶寬360GB/s、單節(jié)點帶寬達(dá)120GB/s,在滿足AI場景下的高性能存儲需求方面展現(xiàn)出卓越能力,為大規(guī)模數(shù)據(jù)處理和AI應(yīng)用提供堅實基礎(chǔ)。

不僅是"容器",還是"加速器"

在傳統(tǒng)觀念里,存儲等數(shù)據(jù)基礎(chǔ)設(shè)施就像一個存儲數(shù)據(jù)的"容器";進入到AI時代,在各種AI應(yīng)用場景中,存儲則搖身一變,成為推動AI應(yīng)用和推動AI產(chǎn)業(yè)化的"加速器"。

以此次MLPerf測試為例,通過運行一個分布式AI訓(xùn)練測試程序,模擬GPU計算過程,要求在GPU利用率高達(dá)90%或70%的條件下,以存儲帶寬和支持的模擬 GPU (模擬加速器)數(shù)量為關(guān)鍵性能指標(biāo),來評估AI訓(xùn)練場景下存儲的性能表現(xiàn),從而驗證存儲對GPU算力的加速能力。

如果把計算節(jié)點比作"數(shù)據(jù)工廠",存儲介質(zhì)則相當(dāng)于數(shù)據(jù)倉庫。提升存儲性能,意味著用戶能夠在同一時間內(nèi)通過"存儲高速"在"數(shù)據(jù)工廠"和"數(shù)據(jù)倉庫"之間更高效地存取"數(shù)據(jù)物料"。

例如,人工智能的大模型訓(xùn)練數(shù)據(jù)加載、PB級檢查點斷點續(xù)訓(xùn)(其中,檢查點相關(guān)開銷平均可占訓(xùn)練總時間的12%,甚至高達(dá)43%)和高并發(fā)推理問答等場景下,存儲系統(tǒng)的性能直接關(guān)乎整個訓(xùn)練與推理過程中GPU的有效利用率。尤其是在萬卡集群規(guī)模下,相當(dāng)于規(guī)模龐大"數(shù)據(jù)工廠","生產(chǎn)機器"GPU一旦開動,如果沒有及時輸送"數(shù)據(jù)物料",約等于讓GPU閑置。有數(shù)據(jù)顯示,存儲系統(tǒng)1小時的開銷,在千卡集群中就意味著將浪費1000卡時,造成計算資源的損失和業(yè)務(wù)成本劇增。

wKgZomckdjCASb7YAABTSM2KaMs663.jpg


那么,要實現(xiàn)"數(shù)據(jù)物料"的快速高效運輸,可以從存儲哪些方向入手?

其一,減少中轉(zhuǎn)站--數(shù)控分離。通過軟件層面的創(chuàng)新,將控制面(數(shù)據(jù)工廠)和數(shù)據(jù)面(介質(zhì)倉庫)分離,減少數(shù)據(jù)中轉(zhuǎn),縮短傳輸路徑,提升存儲單節(jié)點及集群的整體性能。

其二,增加車道數(shù)--硬件升級。硬件層面采用新一代的高性能硬件,通過DDR5和PCIe5.0等,升級存儲帶寬,增加傳輸通道數(shù)量,提升存儲性能的上限。

其三,物料就近存儲--軟硬協(xié)同。在軟硬協(xié)同層面,基于數(shù)控分離架構(gòu),自主控制數(shù)據(jù)頁緩存(儲備倉)分配策略,靈活調(diào)度內(nèi)核數(shù)據(jù)移動,數(shù)據(jù)就近獲取,從而實現(xiàn)快速I/O。

接下來,我們將一一介紹這三大性能提升手段背后的實現(xiàn)原理及其主要價值。

軟件優(yōu)化

數(shù)控分離,降低80%節(jié)點間數(shù)據(jù)轉(zhuǎn)發(fā)量

在傳統(tǒng)分布式文件系統(tǒng)中,數(shù)據(jù)和元數(shù)據(jù)高度耦合,導(dǎo)致數(shù)據(jù)讀寫信息的分發(fā)、傳輸和元數(shù)據(jù)處理都需要經(jīng)過主存儲節(jié)點。在AI應(yīng)用場景下,隨著客戶端數(shù)量激增和帶寬需求擴大,CPU、內(nèi)存、硬盤和網(wǎng)絡(luò)I/O的處理能力面臨嚴(yán)峻考驗。盡管數(shù)控一體的分布式文件系統(tǒng)在穩(wěn)定性方面表現(xiàn)優(yōu)異,但在面對AI訓(xùn)練等大I/O、高帶寬需求時,其性能瓶頸逐漸顯現(xiàn)。數(shù)據(jù)需通過主節(jié)點在集群內(nèi)部進行轉(zhuǎn)發(fā),這不僅占用了大量的CPU、內(nèi)存、帶寬和網(wǎng)絡(luò)資源,還導(dǎo)致了數(shù)據(jù)傳輸?shù)难舆t。

為解決該問題,業(yè)界曾嘗試通過RDMA技術(shù)來提升存儲帶寬。RDMA允許外部設(shè)備繞過CPU和操作系統(tǒng)直接訪問內(nèi)存,從而降低了數(shù)據(jù)傳輸延遲并減輕了CPU負(fù)載,進而提升了網(wǎng)絡(luò)通信效率。然而,這種方式并未從根本上解決數(shù)據(jù)中轉(zhuǎn)帶來的延遲問題。

wKgaomckdjGAWWXYAABnsUzgCy4181.jpg


基于此背景,浪潮信息創(chuàng)新自研分布式軟件棧,采用全新數(shù)控分離架構(gòu),將文件系統(tǒng)的數(shù)據(jù)面和控制面完全解耦??刂泼嬷饕?fù)責(zé)管理數(shù)據(jù)的屬性信息,如位置、大小等,通過優(yōu)化邏輯控制和數(shù)據(jù)管理算法來提高存儲系統(tǒng)的訪問效率和數(shù)據(jù)一致性。而數(shù)據(jù)面則直接負(fù)責(zé)數(shù)據(jù)的讀寫操作,消除中間環(huán)節(jié)的數(shù)據(jù)處理延遲,從而縮短"數(shù)據(jù)物料"的存取時間。

wKgZomckdjGAIrqDAAA26YFm7tA342.jpg


這種數(shù)控分離的方式顯著減少數(shù)據(jù)流在節(jié)點間的轉(zhuǎn)發(fā)次數(shù),降低80%的東西向(節(jié)點間)數(shù)據(jù)轉(zhuǎn)發(fā)量,充分發(fā)揮硬盤帶寬,特別是全閃存儲性能。以浪潮信息分布式存儲平臺AS13000G7為例,在相同配置下,相比于單一TCP和單一RDMA方案,數(shù)控分離架構(gòu)能夠帶來60%讀帶寬提升和110%寫帶寬提升。

硬件升級

拓寬傳輸通路,實現(xiàn)存儲性能翻倍

在AI應(yīng)用場景下,"數(shù)據(jù)物料"的快速運輸依賴于高效的"存儲高速"通道。隨著CPU、內(nèi)存、硬盤等硬件技術(shù)的不斷創(chuàng)新,升級"存儲高速"通道的硬件成為提升存儲性能的重要途徑。

浪潮信息分布式存儲平臺AS13000G7采用業(yè)界最新高端處理器芯片,如Intel第五代至強可拓展處理器,單顆最大支持60核,支持Intel 最新2.0版本睿頻加速技術(shù)、超線程技術(shù)以及高級矢量拓展指令集512(AVX-512)。同時,支持DDR5內(nèi)存,如三星、海力士的32G、64G高性能、大容量內(nèi)存,單根內(nèi)存在1DPC1情況下,可以支持5600MHz頻率,相比與DDR4的3200MHz的內(nèi)存,性能提升75%。

基于最新處理器的硬件平臺,AS13000G7已經(jīng)支持PCIe5.0標(biāo)準(zhǔn),并在此基礎(chǔ)上支持NVDIA最新的CX7系列400G IB卡及浪潮信息自研PCIe5.0 NVMe。相較于上一代AS13000G6的PCIe4.0的I/O帶寬,實現(xiàn)帶寬提升100%。

在設(shè)計上,G7一代硬件平臺將硬件模塊化設(shè)計理念最大化,將處理器的I/O全部扇出,采用線纜、轉(zhuǎn)接卡等標(biāo)準(zhǔn)設(shè)計,實現(xiàn)配置的靈活性。最大可支持4張PCIe5.0 X16的FHHL卡,所有后端的SSD設(shè)備均通過直連實現(xiàn),取消了AS13000G6 的PCIe Switch設(shè)計,從而消除了數(shù)據(jù)鏈路上的瓶頸點。前端IO的性能及后端IO的理論性能均提升了4倍。

wKgaomckdjGAJSDYAAA_NZOgvwM003.jpg


為測試性能表現(xiàn),浪潮信息將兩種軟件棧分別部署在兩代硬件上并進行讀寫測試。結(jié)果顯示,與上一代硬件平臺相比,在不同軟件棧上AS13000G7的性能可提升170%-220%,有效保障了AI應(yīng)用場景下的存儲性能。

軟硬協(xié)同

內(nèi)核親和力調(diào)度,內(nèi)存訪問效率提升4倍

在當(dāng)前的AI基礎(chǔ)設(shè)施平臺中,計算服務(wù)器配置非常高,更高性能的CPU和更多的插槽數(shù)帶來了NUMA(Non-Uniform Memory Access)節(jié)點數(shù)據(jù)的增加。在NUMA架構(gòu)中,系統(tǒng)內(nèi)存被劃分為多個區(qū)域,每個區(qū)域?qū)儆谝粔K特定的NUMA節(jié)點,每個節(jié)點都有自己的本地內(nèi)存。因此,每個處理器訪問本地內(nèi)存的速度遠(yuǎn)快于訪問其他節(jié)點內(nèi)存的速度。

然而,在多核處理器環(huán)境下,會產(chǎn)生大量的跨NUMA遠(yuǎn)端訪問。在分布式存儲系統(tǒng)中,由于IO請求會經(jīng)過用戶態(tài)、內(nèi)核態(tài)和遠(yuǎn)端存儲集群,中間頻繁的上下文切換會帶來內(nèi)存訪問延遲。如下圖,在未經(jīng)過NUMA均衡的存儲系統(tǒng)中,存儲的緩存空間集中在單個NUMA節(jié)點內(nèi)存內(nèi)。當(dāng)IO請求量增大時,所有其他NUMA節(jié)點的CPU核的數(shù)據(jù)訪問均集中在單個Socket內(nèi),造成了大量跨Socket 、跨NUMA訪問。這不僅導(dǎo)致了CPU核的超負(fù)荷運載和大量閑置,還使得不同Socket上的內(nèi)存帶寬嚴(yán)重不均衡,單次遠(yuǎn)端NUMA節(jié)點訪問造成的微小時延累積將進一步增大整體時延,導(dǎo)致存儲系統(tǒng)聚合帶寬嚴(yán)重下降。

wKgZomckdjOAfYUTAACcKPv1hto928.jpg


為了降低跨NUMA訪問帶來的時延,浪潮信息通過內(nèi)核親和力調(diào)度技術(shù),在全新數(shù)控分離架構(gòu)下,使內(nèi)核客戶端可自主控制數(shù)據(jù)頁緩存分配策略并主動接管用戶下發(fā)的IO任務(wù)。這種方式能夠更加靈活地實現(xiàn)各類客戶端內(nèi)核態(tài)到遠(yuǎn)端存儲池的數(shù)據(jù)移動策略。其中,針對不同的IO線程進行NUMA感知優(yōu)化,將業(yè)務(wù)讀線程與數(shù)據(jù)自動分配到相同的NUMA節(jié)點上,這樣,所有數(shù)據(jù)均在本地NUMA內(nèi)存命中,有效減少了高并發(fā)下NUMA節(jié)點間數(shù)據(jù)傳輸,降低了IO鏈路時延,4倍提升內(nèi)存訪問效率,保證負(fù)載均衡。

總體而言,進入到AI時代,存儲性能關(guān)系到整個人工智能訓(xùn)練、推理和應(yīng)用的效率。浪潮信息分布式存儲平臺AS13000G7軟件優(yōu)化、硬件升級和軟硬協(xié)同三個優(yōu)勢,具備極致性能,成為AI時代各大用戶的存儲理想之選。

審核編輯 黃宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 數(shù)據(jù)傳輸
    +關(guān)注

    關(guān)注

    9

    文章

    2020

    瀏覽量

    66104
  • 存儲
    +關(guān)注

    關(guān)注

    13

    文章

    4535

    瀏覽量

    87498
  • 浪潮
    +關(guān)注

    關(guān)注

    1

    文章

    475

    瀏覽量

    24714
  • AI
    AI
    +關(guān)注

    關(guān)注

    88

    文章

    35194

    瀏覽量

    280278
  • MLPerf
    +關(guān)注

    關(guān)注

    0

    文章

    36

    瀏覽量

    826
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    耐達(dá)訊RS232轉(zhuǎn)Ethercat網(wǎng)關(guān):建筑驅(qū)動連接的“秘密武器

    在建筑行業(yè)中,工程師們常常會面臨各種設(shè)備連接的挑戰(zhàn)。特別是驅(qū)動器的連接,其穩(wěn)定性和高效性直接影響著建筑設(shè)備的運行。而耐達(dá)訊通信技術(shù)Rs232轉(zhuǎn)Ethercat網(wǎng)關(guān),就是解決這些問題的“秘密武器
    發(fā)表于 07-21 15:29

    飛利信與浪潮信息達(dá)成戰(zhàn)略合作

    近日,2025年浪潮信息北京ISP戰(zhàn)略伙伴簽約授牌儀式成功舉辦。浪潮信息與北京飛利信電子技術(shù)有限公司等22家戰(zhàn)略合作伙伴達(dá)成簽約,其中將面向北京人工智能應(yīng)用大市場,在產(chǎn)品技術(shù)共創(chuàng)、行業(yè)場景深化及區(qū)域
    的頭像 發(fā)表于 06-24 17:37 ?565次閱讀

    浪潮信息存儲SATA SSD:技術(shù)創(chuàng)新引領(lǐng)數(shù)據(jù)存儲新時代

    解決方案。 近期,浪潮信息推出了自研的SATA SSD新品——TS6000G1。這款SSD產(chǎn)品憑借出色的性能和穩(wěn)定的品質(zhì),成為了浪潮信息存儲產(chǎn)品線中的一顆璀璨明珠。 TS6000
    的頭像 發(fā)表于 02-07 13:41 ?659次閱讀

    浪潮信息存儲SATA SSD:以技術(shù)創(chuàng)新,開啟數(shù)據(jù)存儲新篇章

    計算平臺以及個人用戶的數(shù)字化需求,迫切需要高效、可靠的存儲解決方案。 浪潮信息存儲積極響應(yīng)市場需求,通過自主研發(fā)不斷積累技術(shù)優(yōu)勢,推出了SATA、NVMe、雙端口、ZNS等全系列存儲產(chǎn)
    的頭像 發(fā)表于 01-24 10:02 ?465次閱讀

    浪潮信息與智源研究院攜手共建大模型多元算力生態(tài)

    近日,浪潮信息與北京智源人工智能研究院正式簽署戰(zhàn)略合作協(xié)議,雙方將緊密合作,共同構(gòu)建大模型多元算力開源創(chuàng)新生態(tài)。 此次合作旨在提升大模型創(chuàng)新研發(fā)的算力效率,降低大模型應(yīng)用開發(fā)的算力門檻,推動
    的頭像 發(fā)表于 12-31 11:49 ?608次閱讀

    浪潮信息剖析智能時代數(shù)據(jù)存儲領(lǐng)域面臨的挑戰(zhàn)與機遇

    在當(dāng)今數(shù)字化時代,算力與存力的協(xié)同增長已成為驅(qū)動各行各業(yè)發(fā)展的關(guān)鍵力量。特別是在人工智能(AI)這一前沿領(lǐng)域,隨著數(shù)據(jù)量的爆炸式增長,對存儲系統(tǒng)的需求日益復(fù)雜和多樣。近期,在首屆CCF中國存儲大會上,浪潮信息
    的頭像 發(fā)表于 12-30 09:43 ?783次閱讀

    浪潮信息與智源研究院達(dá)成戰(zhàn)略合作協(xié)議

    近日,浪潮信息與智源研究院達(dá)成戰(zhàn)略合作協(xié)議,雙方將緊密協(xié)作共建大模型多元算力開源創(chuàng)新生態(tài),提升大模型創(chuàng)新研發(fā)的算力效率,降低大模型應(yīng)用開發(fā)的算力門檻。目前,智源Triton算子庫FlagGems已
    的頭像 發(fā)表于 12-26 10:25 ?595次閱讀

    浪潮信息與17家元腦伙伴共簽億級分銷協(xié)議

    近日,一場意義非凡的簽約儀式——2025年浪潮信息億級分銷伙伴簽約大會圓滿落幕。在這場盛會中,浪潮信息與來自全國12個省區(qū)的17家元腦生態(tài)伙伴共同簽署了億級分銷合作協(xié)議,攜手開啟合作共贏的新篇章
    的頭像 發(fā)表于 12-25 15:46 ?764次閱讀

    工業(yè)網(wǎng)絡(luò)管理新紀(jì)元:揭秘五大“利器”,化繁為簡的智慧轉(zhuǎn)型

    亟需解決的難題。本文將揭秘五大“秘密武器”, 助力工業(yè)網(wǎng)絡(luò)管理化繁為簡,邁向智能化、高效化 的新紀(jì)元。 秘密武器一 統(tǒng)一平臺,集成管理(一站式解決方案,打破信息孤島) 在復(fù)雜的工業(yè)環(huán)境
    的頭像 發(fā)表于 12-21 17:51 ?484次閱讀
    工業(yè)網(wǎng)絡(luò)管理新紀(jì)元:<b class='flag-5'>揭秘</b>五大“利器”,化繁為簡的智慧轉(zhuǎn)型

    浪潮信息分布式存儲平臺AS13000G7的優(yōu)越性能

    近年來,人工智能相關(guān)技術(shù)在社會發(fā)展中扮演著日漸重要的角色。特別是在廣告、影視等多個行業(yè),AIGC將內(nèi)容生產(chǎn)效率提升數(shù)倍甚至數(shù)十倍,降低人力成本50%以上,是推動企業(yè)數(shù)字化轉(zhuǎn)型的關(guān)鍵動力。然而,在AI技術(shù)快速發(fā)展和相關(guān)應(yīng)用迅速增長的同時,其背后的數(shù)據(jù)基礎(chǔ)設(shè)施也面臨嚴(yán)峻的考驗。
    的頭像 發(fā)表于 11-12 11:42 ?892次閱讀
    <b class='flag-5'>浪潮信息</b>分布式<b class='flag-5'>存儲</b>平臺<b class='flag-5'>AS13000G7</b>的優(yōu)越性能

    浪潮信息AI存儲性能測試的領(lǐng)先之道

    AI技術(shù)的無限可能。近日,在MLCommons的子項目MLPerf Storage v1.0性能基準(zhǔn)評測中,浪潮信息再度展現(xiàn)了在AI存儲領(lǐng)域的卓越實力。
    的頭像 發(fā)表于 10-29 16:30 ?662次閱讀
    <b class='flag-5'>浪潮信息</b>AI<b class='flag-5'>存儲</b>性能測試的領(lǐng)先之道

    浪潮信息AS13000G7榮獲MLPerf? AI存儲基準(zhǔn)測試五項性能全球第一

    北京2024年9月27日?/美通社/ -- 9月25日,MLCommons協(xié)會發(fā)布最新MLPerf? Storage v1.0 AI存儲基準(zhǔn)測試成績。浪潮信息分布式存儲平臺
    的頭像 發(fā)表于 09-28 16:46 ?420次閱讀
    <b class='flag-5'>浪潮信息</b><b class='flag-5'>AS13000G7</b>榮獲<b class='flag-5'>MLPerf</b>? AI<b class='flag-5'>存儲</b>基準(zhǔn)測試五項性能全球第一

    浪潮信息:元腦企智EPAI助力金融大模型快速落地

    近日,2024金融科技應(yīng)用創(chuàng)新發(fā)展大會暨農(nóng)村金融機構(gòu)信息化發(fā)展創(chuàng)新座談會在上海舉辦。浪潮信息推出元腦企智EPAI企業(yè)大模型開發(fā)平臺,面向金融業(yè)務(wù)場景,實現(xiàn)7天完成POC驗證、2個月上線AI應(yīng)用,通過
    的頭像 發(fā)表于 09-20 16:07 ?713次閱讀
    <b class='flag-5'>浪潮信息</b>:元腦企智EPAI助力金融大模型快速落地

    33家元腦區(qū)域伙伴與浪潮信息簽署戰(zhàn)略合作協(xié)議

    近日,2024年浪潮信息區(qū)域ISP伙伴戰(zhàn)略簽約儀式圓滿落幕,標(biāo)志著浪潮信息在人工智能領(lǐng)域的合作版圖再度擴大。此次盛會匯聚了全國范圍內(nèi)33家實力雄厚的億級及千萬級元腦區(qū)域伙伴,共同簽署戰(zhàn)略合作協(xié)議,攜手開啟AI應(yīng)用新篇章。
    的頭像 發(fā)表于 08-14 16:25 ?755次閱讀

    長擎安全操作系統(tǒng)24與浪潮信息HF/AS存儲系列成功兼容

    在數(shù)字化轉(zhuǎn)型浪潮席卷全球的今天,信息安全與數(shù)據(jù)存儲的穩(wěn)定高效成為企業(yè)不可忽視的兩大核心要素。近日,一項重要的技術(shù)兼容性測試認(rèn)證結(jié)果揭曉,標(biāo)志著長擎安全操作系統(tǒng)24與浪潮信息集中式
    的頭像 發(fā)表于 07-22 16:20 ?1091次閱讀