一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

超帶寬域成為業(yè)內技術探索新領域

奇異摩爾 ? 來源:奇異摩爾 ? 2024-11-18 11:16 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

AI大模型的迅猛發(fā)展,使得網(wǎng)絡基礎設施技術的進步速度超乎想象。產(chǎn)業(yè)鏈上的每一個環(huán)節(jié)都需緊密追蹤AI驅動的技術革新,并據(jù)此進行同步的創(chuàng)新升級。

AI網(wǎng)絡的Scale-up正在上演一場熱烈的軍備賽,業(yè)界正在呼喚更統(tǒng)一開放的GPU計算卡互聯(lián)標準,從而打破NVIDIA主導的NVLink以及其所構建的強大的HBD 網(wǎng)絡架構的護城河。NVLink 是一種“多節(jié)點無損網(wǎng)絡”的代表,由一個強大的軟件協(xié)議組成,通常通過印在計算機板上的多對導線實現(xiàn),可以讓處理器以極高的速度收發(fā)共享內存池中的數(shù)據(jù)。NVLink 的主要設計目的,就是突破PCIe的屏障,達成GPU-GPU及CPU-GPU的片間高效數(shù)據(jù)交互。

wKgaoWc6sduALsx-AAHGpVuTpSM340.png

(來源: NVIDIA)

目前NVLink已經(jīng)升級到5.0版本。第五代 NVLink 大幅提高了大型多 GPU 系統(tǒng)的可擴展性。單個 NVIDIA Blackwell Tensor Core GPU 支持多達 18 個 NVLink 100 GB/s 連接,總帶寬可達 1.8 TB/s,比上一代產(chǎn)品提高了兩倍,是 PCIe 5.0 帶寬的 14 倍之多。

如今討論Scale-up網(wǎng)絡已經(jīng)不僅提及NVIDIA的NVLink,無論是國際還是國內,行業(yè)更多的是在找尋一種更加緊密連接的集群組網(wǎng),這種緊密耦合所形成的計算系統(tǒng)將有助于推動以GPU為核心的AI網(wǎng)絡獲得極高的帶寬與極低的延遲。

01超帶寬域(HBD)成為

業(yè)內技術探索新領域

大模型時代,需要更大的模型并行規(guī)模,模型并行中Tensor并行或MOE類型的Expert并行都會在GPU之間產(chǎn)生大量的通信,當前典型一機8卡服務器限制了Tensor并行的規(guī)?;駿xpert并行通過機間網(wǎng)絡。由此業(yè)界開始探索一種以超帶寬(HB)互聯(lián)GPU-GPU的系統(tǒng),又稱HBD(High Bandwidth Domain)。通過構建更大的HBD系統(tǒng),以Scale-up方式提升系統(tǒng)算力是解決萬卡到十萬卡集群以上互聯(lián)挑戰(zhàn)的有效途徑之一。

于是NVIDIA的暴力美學再度彰顯,以其強大的計算能力繼續(xù)發(fā)揮著引領HBD技術趨勢的威力。NVIDIA將HB互聯(lián)擴展至GPU片間通信之外的領域,將其應用到GPU-CPU/Memory之間的超大帶寬互聯(lián),例如GH200、GB200產(chǎn)品。借助NVLink-C2C技術的創(chuàng)新,為GPU提供一個超帶寬訪問CPU/Memory的能力。

NVIDIA的GB200NVL72服務器產(chǎn)品體現(xiàn)了典型的超大HBD域系統(tǒng),實現(xiàn)了36組GB200(36個Grace CPU,72個B200 GPU)之間的超高帶寬互聯(lián)。一個NVL72機架服務器內部共有18個Compute Tray和9個Switch Tray。

wKgZoWc6seCAZ98kAAEgfkXxLPs514.png

(來源:Semianalysis)

上圖右側是另外一種NVIDIA的Scale-up HBD 組網(wǎng)形態(tài):GB200 NVL36 * 2,它把兩個并排的機架互聯(lián)在一起。大多數(shù) GB200 機架都將使用此外形規(guī)格。每個機架包含 18 個 Grace CPU 和 36 個 Blackwell GPU。在 2 個機架之間,它仍然在 NVL72 中的所有 72 個 GPU 之間保持非阻塞全對全。每個Compute Tray(高度為2U )包含 2 個 Bianca 板。每個 NVSwitch Tray都有兩個 28.8Tb/s NVSwitch5 ASIC 芯片。

wKgaomc6sduAHDV0AAJ7RKs2_6k313.png

(來源:Semianalysis)

更夸張的是,黃仁勛表示GB200 NVLink 可以同時連接到 576 個 Blackwell GPU。據(jù)Semianalysis調研,該網(wǎng)絡系統(tǒng)使用具有 18 個平面的 2 層胖樹拓撲來完成。這意味著NVIDIA計劃讓 DGX H100 NVL256 連接 16 個 NVL36 機架。NVL576形成一個超級大的GPU HBD域,則包含288個GB200 GPU,576個B200 GPU。

據(jù)悉,該系統(tǒng)形態(tài)的互聯(lián)已經(jīng)超過銅纜能夠實現(xiàn)的物理連接距離,必須使用光纖連接,這意味著需要花費相當昂貴的成本來實現(xiàn)極高的加速卡帶寬。

事實上,超帶寬域的穩(wěn)定運行并非易事,其復雜性不僅體現(xiàn)在網(wǎng)絡和計算層面,還包括服務器機架的能耗管理、液冷散熱技術、以及機架間光模塊與光纜的通信效率等眾多挑戰(zhàn)。這些問題的解決非一家企業(yè)能夠獨立完成,它需要數(shù)據(jù)中心產(chǎn)業(yè)鏈的上下游運用集體的智慧來共同突破,以實現(xiàn)高達十萬個以上的加速卡的互聯(lián)。

02產(chǎn)業(yè)鏈集體對抗

英偉達的暴力美學

上個月底, AMD、AWS、Astera Labs、思科、谷歌、惠普企業(yè) (HPE)、英特爾、Meta 和微軟等九大董事會成員聯(lián)合宣布,由其主導的UALink 聯(lián)盟宣布正式成立,目前已經(jīng)對行業(yè)開放成員邀請。

Ultra Accelerator Link(UALink) 是一種用于GPU加速卡間通信的開放行業(yè)標準化互聯(lián)。UALink 聯(lián)盟是一個開放的行業(yè)標準組織,旨在制定Scale-up互聯(lián)技術規(guī)范,以促進 AI 加速卡(即 GPU)之間的高效互聯(lián)。該技術規(guī)范定義了一種創(chuàng)新的I/O架構,單通道可達200 Gbps傳輸速率,支持最多1024個AI加速卡互連。相比傳統(tǒng)以太網(wǎng)Ethernet)架構,UALink在性能和GPU互聯(lián)規(guī)模上都具有優(yōu)勢,互聯(lián)規(guī)模更是大幅超越NVIDIA NVLink技術。

UALink 1.0 規(guī)范可以利用開發(fā)和部署了各種加速卡和交換機的推廣者成員的經(jīng)驗。

UALink 聯(lián)盟總裁 Willie Nelson 表示:“UALink 標準定義了數(shù)據(jù)中心內擴展 AI 系統(tǒng)的高速、低延遲通信。我們鼓勵有興趣的公司以貢獻者成員的身份加入,以支持我們的使命:為 AI 工作負載建立開放且高性能的加速卡互聯(lián)。”預計UALink 1.0規(guī)范將在2025年第一季度發(fā)布,這與UEC超以太聯(lián)盟1.0規(guī)范的發(fā)布節(jié)奏同步。

國內:AI網(wǎng)絡生態(tài)聯(lián)盟百花齊放

國內AI網(wǎng)絡生態(tài)圈高度關注Scale-up互聯(lián)領域的發(fā)展,在短短幾個月內,以中國移動、阿里云及騰訊云等巨頭電信運營商及云廠商分別引領的Scale-up互聯(lián)生態(tài) OISA、ALink System以及ETH-X超節(jié)點等技術規(guī)范旨在推動國內智算中心互聯(lián)生態(tài)的快速發(fā)展。

OISA全向智感互聯(lián)

由中國移動引領的OISA主要包括四大設計理念,包括“大規(guī)模GPU對等互聯(lián)”、“極致報文格式”、“數(shù)據(jù)層流控和重傳”以及“高效物理傳輸”,核心思想是為GPU卡間互聯(lián)提供開放的高帶寬、低時延解決方案。此前在6月份的多樣性算力產(chǎn)業(yè)峰會上,中國移動重點展示了“OISA G1協(xié)議”并推出“OISA交換芯片原型”。

OISA G1的設計規(guī)格支持128張GPU通過8個Switch芯片互聯(lián),任意卡間點對點帶寬達到800GB/s,每個Switch芯片支持128個端口,芯片總速率達到51.2T。奇異摩爾目前已經(jīng)是OISA聯(lián)盟的成員,公司積極聯(lián)動運營商、GPU廠商、交換機及服務器領域的優(yōu)秀生態(tài)伙伴、共同推進國內GPU卡間互聯(lián)標準的建立與實施。

ALink System 加速器互連系統(tǒng)

ALS產(chǎn)業(yè)生態(tài)是業(yè)界首個支持UALink成立的產(chǎn)業(yè)生態(tài),旨在解決AI網(wǎng)絡縱向擴展(Scale-up)中的超高速、超大帶寬等技術難題,為下一代智算網(wǎng)絡打造開放的、統(tǒng)一的標準規(guī)范。在今年9月召開的2024 ODCC開放數(shù)據(jù)中心大會上, 阿里云聯(lián)合信通院、奇異摩爾等十多家業(yè)界合作伙伴發(fā)起了ALS(ALink System,加速器互連系統(tǒng))開放生態(tài)系統(tǒng)。

依托于ODCC(開放數(shù)據(jù)中心委員會)下設的ALS工作組,生態(tài)成員們攜手聚焦解決GPU卡間互聯(lián)系統(tǒng)的行業(yè)發(fā)展和規(guī)范問題,推動Scale-up互連系統(tǒng)標準統(tǒng)一建設,打造下一代AI互連網(wǎng)絡軟硬件系統(tǒng)。目前,ALS已形成從協(xié)議到芯片、從硬件設備到軟件平臺的系統(tǒng)體系,在ALS-D數(shù)據(jù)面支持UALink,在ALS-M管控面提供統(tǒng)一接口規(guī)范和管控軟件平臺。

ETH-X超節(jié)點

wKgZoWc6sduAQAgfAARA2bXgtSE215.png

ETH-X超節(jié)點聯(lián)盟選擇以太網(wǎng)為基礎設施作為GPU超節(jié)點項目的首選原型方案。以太網(wǎng)技術(ETH)作為當前最成熟、最開放的網(wǎng)絡技術,具有最大交換芯片容量、最高速Serdes技術、200ns交換芯片、最多參與企業(yè)的特點,并且已經(jīng)是當前眾多GPU廠商選擇的Scale-up接口技術。

據(jù)悉,超節(jié)點目前已完成Computer-Cable-Switch開放解偶架構設計,保證超節(jié)點系統(tǒng)的硬件可以由不同專業(yè)領域廠家獨立研發(fā)生產(chǎn),并確保了各子系統(tǒng)硬件可集成互通。系統(tǒng)解偶后,各子系統(tǒng)均具有兼容多種GPU芯片、多種Switch芯片及其獨立演進的能力,由此充分保證了GPU超節(jié)點系統(tǒng)參與廠家的專業(yè)性、多樣性和開放性。

正如之前我們所提及的加速卡間HBD的挑戰(zhàn),ETH-X以太超節(jié)點系統(tǒng)也面臨著集成測試、系統(tǒng)運維、協(xié)議設計、業(yè)務測試等一些列的技術挑戰(zhàn)。這一系列的問題需要業(yè)界充分協(xié)作,共同努力在現(xiàn)有開放生態(tài)基礎上不斷完善、加速GPU超節(jié)點系統(tǒng)的成熟與發(fā)展。

奇異摩爾自研的網(wǎng)絡加速芯粒GPU Link Chiplet——NDSA-G2G,以其極高的靈活性和可擴展性為Scale-up互聯(lián)生態(tài)提供了強有力的支撐。該產(chǎn)品基于可編程眾核流式架構,支持用戶自定義的協(xié)議和處理格式。通過將Chiplet芯粒集成在GPU加速卡內,并利用UCIe D2D接口與GPU互聯(lián),NDSA-G2G能夠實現(xiàn)高性能的數(shù)據(jù)流,從而全面加速分布式計算網(wǎng)絡。

“據(jù)中國IDC圈不完全統(tǒng)計,目前國內不同建設階段的智算中心項目已超過500個,其中投產(chǎn)運營的項目160個,開工在建項目超過200個。智算中心的建設可謂是如火如荼,其發(fā)展關乎到區(qū)域經(jīng)濟的發(fā)展和產(chǎn)業(yè)布局的未來?!?/p>

AI網(wǎng)絡基礎設施作為智算中心的重要基石,直接決定了智算中心的能力、效率、可靠性和安全性。從芯片、交換機、網(wǎng)卡、光模塊到其他IT硬件設備,每一個組件都不可或缺,共同構成了一套跨尺度、多層次的復雜系統(tǒng)工程。

奇異摩爾期待未來行業(yè)能夠擁抱一種開放而統(tǒng)一的物理接口,產(chǎn)業(yè)鏈通過標準制定、軟硬件結合等方面的協(xié)同最終實現(xiàn)以太網(wǎng)為基礎的Scale-up網(wǎng)絡和Scale-out網(wǎng)絡的融合,從而構建一個更加高效、靈活的智算網(wǎng)絡架構,為國內智算中心的發(fā)展釋放無限可能。

關于我們

AI網(wǎng)絡全棧式互聯(lián)架構產(chǎn)品及解決方案提供商

奇異摩爾,成立于2021年初,是一家行業(yè)領先的AI網(wǎng)絡全棧式互聯(lián)產(chǎn)品及解決方案提供商。公司依托于先進的高性能RDMA 和Chiplet技術,創(chuàng)新性地構建了統(tǒng)一互聯(lián)架構——Kiwi Fabric,專為超大規(guī)模AI計算平臺量身打造,以滿足其對高性能互聯(lián)的嚴苛需求。

我們的產(chǎn)品線豐富而全面,涵蓋了面向不同層次互聯(lián)需求的關鍵產(chǎn)品,如面向北向Scale out網(wǎng)絡的AI原生智能網(wǎng)卡、面向南向Scale up網(wǎng)絡的GPU片間互聯(lián)芯粒、以及面向芯片內算力擴展的2.5D/3D IO Die和UCIe Die2Die IP等。這些產(chǎn)品共同構成了全鏈路互聯(lián)解決方案,為AI計算提供了堅實的支撐。

奇異摩爾的核心團隊匯聚了來自全球半導體行業(yè)巨頭如NXP、Intel、Broadcom等公司的精英,他們憑借豐富的AI互聯(lián)產(chǎn)品研發(fā)和管理經(jīng)驗,致力于推動技術創(chuàng)新和業(yè)務發(fā)展。團隊擁有超過50個高性能網(wǎng)絡及Chiplet量產(chǎn)項目的經(jīng)驗,為公司的產(chǎn)品和服務提供了強有力的技術保障。我們的使命是支持一個更具創(chuàng)造力的芯世界,愿景是讓計算變得簡單。奇異摩爾以創(chuàng)新為驅動力,技術探索新場景,生態(tài)構建新的半導體格局,為高性能AI計算奠定穩(wěn)固的基石。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 處理器
    +關注

    關注

    68

    文章

    19899

    瀏覽量

    235411
  • NVIDIA
    +關注

    關注

    14

    文章

    5309

    瀏覽量

    106469
  • 網(wǎng)絡
    +關注

    關注

    14

    文章

    7816

    瀏覽量

    90993
  • AI
    AI
    +關注

    關注

    88

    文章

    35194

    瀏覽量

    280246

原文標題:Kiwi Talks | Scale-up 軍備賽愈演愈烈,集體對抗英偉達的暴力美學

文章出處:【微信號:奇異摩爾,微信公眾號:奇異摩爾】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    ?景深3D檢測顯微鏡技術解析

    在現(xiàn)代科技領域,顯微鏡技術的發(fā)展始終是推動科學研究和技術進步的重要引擎。上海桐爾作為這一領域探索者,其
    發(fā)表于 02-25 10:51

    無線新領域模塊780M

    眾所周知我們一直使用的無線頻段是 2.4G433780M是本公司研發(fā)的新領域,相對于 24G 433 有明顯的優(yōu)勢 如下圖典型參數(shù)2.4GHz433MHz780MHz通信頻率該頻段有藍牙、WiFi
    發(fā)表于 12-15 10:11

    細工業(yè)內窺鏡使用后應如何清潔?

      工業(yè)內窺鏡雖然不同于醫(yī)用內窺鏡使用后有水洗、酶洗、消毒等繁雜的清洗程序,但必要的清潔保養(yǎng)是使用者必須做到的。當代制造技術的提高已使研發(fā)制造出來的工業(yè)內窺鏡變得越來越小巧,除了便于攜帶,使用也是
    發(fā)表于 04-09 15:58

    電子技術幫助腦部治療探索新領域

    。”Batjer醫(yī)生解釋說,要在任何一個特定領域成為專家,至少需要大約10, 000小時的練習與實踐,無論是演奏樂器或是編寫代碼均是如此。按照他的說法,這10,000小時的指導性排練與預演能夠真正的重組腦部區(qū)域
    發(fā)表于 08-29 15:29

    基于材料技術的航空武器裝備應用

    近年來,在軍用天線等應用領域,國外材料技術取得了突破性進展。例如,英國BAE系統(tǒng)公司和倫敦瑪麗女王學院研制出一種新型材料平面天線,利用
    發(fā)表于 07-29 06:21

    電子技術幫助腦部治療探索的全新領域

    在德州大學達拉斯分校的部分實驗室中,Robert Rennaker博士所提出的“定向可塑”腦部康復研究正處于技術與現(xiàn)代醫(yī)學的最前沿。
    發(fā)表于 05-13 06:00

    【2020年ST工業(yè)峰會】3大領域、50場分論壇、100多個技術產(chǎn)品展示,激發(fā)智能 賦能創(chuàng)新

    `▌ST工業(yè)峰會簡介科技隨“芯”精彩,意法半導體伴您相行!作為擁有18500多項行業(yè)領先專利的先驅,意法半導體已經(jīng)成為許多技術創(chuàng)新領域長期領先的代名詞。ST工業(yè)峰會已經(jīng)成為一個業(yè)內重要
    發(fā)表于 10-26 15:31

    【2021年ST工業(yè)峰會】3大領域、30個分論壇、150多個技術方案演示,激發(fā)智能 賦能創(chuàng)新

    峰會簡介科技隨“芯”精彩,意法半導體伴您相行!作為擁有18500多項行業(yè)領先專利的先驅,意法半導體已經(jīng)成為許多技術創(chuàng)新領域長期領先的代名詞。ST工業(yè)峰會已經(jīng)成為一個業(yè)內重要的年度盛會,
    發(fā)表于 07-29 16:41

    【2021年ST工業(yè)峰會】3大領域、30個分論壇、150多個技術方案演示,激發(fā)智能 賦能創(chuàng)新

    ▌ST工業(yè)峰會簡介科技隨“芯”精彩,意法半導體伴您相行!作為擁有18500多項行業(yè)領先專利的先驅,意法半導體已經(jīng)成為許多技術創(chuàng)新領域長期領先的代名詞。ST工業(yè)峰會已經(jīng)成為一個業(yè)內重要的
    發(fā)表于 10-09 10:53

    愛綠Super Diamond LED廣色顯示技術

    愛綠光電為大家展示了Super Diamond LED廣色顯示和Silence節(jié)能兩種新技術。據(jù)了解,愛綠推出的Super Diamond LED
    發(fā)表于 07-23 14:10 ?1492次閱讀

    持續(xù)布局和探索具有顛覆性軍事能力的前沿技術,加強國防科技發(fā)展戰(zhàn)略謀劃

    12月,日本發(fā)布新版《防衛(wèi)計劃大綱》《中期防衛(wèi)力量整備計劃》,提出構建“多聯(lián)合防衛(wèi)力量”,加強太空、網(wǎng)絡、電磁頻譜與傳統(tǒng)作戰(zhàn)有機融合,全面提升指揮控制與情報能力,實現(xiàn)跨聯(lián)合;重點發(fā)展太空、網(wǎng)絡和電磁頻譜等
    的頭像 發(fā)表于 04-01 16:13 ?1.3w次閱讀

    納米技術研究的新領域

    作為納米技術研究的新領域,二維(2D)鐵磁(FM)材料在自旋電子學、傳感器、存儲技術等工程領域有巨大的應用潛力。目前已經(jīng)有大量的二維鐵磁材料被計算預測,包括一些通用的二維材料數(shù)據(jù)庫,包
    的頭像 發(fā)表于 06-05 10:46 ?3415次閱讀

    中國移動產(chǎn)品的新領域有哪些亮點?

    一直在觀察中國移動在供給側領域的改革,說明白點,就是產(chǎn)品新領域探索、研發(fā)和實踐;應該說還是可以找到亮點的,雖然目前亮光還很小,但是依然值得期待!
    的頭像 發(fā)表于 09-14 10:00 ?2997次閱讀

    揭秘國內主要電動夾爪廠商的專利技術分布:創(chuàng)新領域與競爭優(yōu)勢

    揭秘國內主要電動夾爪廠商的專利技術分布:創(chuàng)新領域與競爭優(yōu)勢
    的頭像 發(fā)表于 05-16 14:28 ?981次閱讀
    揭秘國內主要電動夾爪廠商的專利<b class='flag-5'>技術</b>分布:創(chuàng)<b class='flag-5'>新領域</b>與競爭優(yōu)勢

    OpenAI正深入探索文本水印技術的前沿領域

    8月5日最新資訊透露,OpenAI正積極投身于文本水印技術的尖端探索,但與此同時,公司也坦誠地指出了這一創(chuàng)新領域所面臨的艱巨技術障礙與未解之謎。
    的頭像 發(fā)表于 08-05 12:59 ?861次閱讀