2020年10月26日,燧原科技正式推出搭載燧原科技云燧T10的PCIe Gen4全互聯(lián)AI高算力訓(xùn)練系統(tǒng)。該系統(tǒng)目前為國內(nèi)第一套基于PCIe Gen4的全互聯(lián)AI高算力訓(xùn)練系統(tǒng),不僅使配備云燧T10的機(jī)內(nèi)PCIe帶寬得以全面提升,同時結(jié)合燧原科技GCU-LARE技術(shù)可實(shí)現(xiàn)系統(tǒng)高性能互聯(lián)。
Supermicro 4U A+ 服務(wù)器(搭載8張?jiān)旗軹10)
技術(shù)革新,GCU-LARE實(shí)現(xiàn)高性能互聯(lián)
PCIe Gen4全互聯(lián)AI高算力訓(xùn)練系統(tǒng)由燧原科技與Supermicro合作研發(fā),其中,燧原科技云燧系列產(chǎn)品PCIe Gen4的高帶寬和GCU-LARE智能互聯(lián)特點(diǎn),在此研發(fā)中發(fā)揮了關(guān)鍵作用。
以該系統(tǒng)的創(chuàng)新技術(shù)——GCU-LARE來說,燧原科技GCU-LARE智能互聯(lián)技術(shù)為系統(tǒng)提供了最大提供雙向200GB/s的互聯(lián)帶寬。在2D Torus 6x6節(jié)點(diǎn)連接方式中,若采用GCU-LARE互聯(lián),一個機(jī)柜內(nèi)3臺8卡服務(wù)器,垂直方向環(huán)6個節(jié)點(diǎn),水平方向用2張RDMA/RoCE網(wǎng)卡,通過類似可擴(kuò)展的連接方式,可以實(shí)現(xiàn)千卡級別高線性度互聯(lián),其線性加速比可達(dá)86%以上,遠(yuǎn)超業(yè)內(nèi)水平,故而實(shí)現(xiàn)其高性能互聯(lián)特色。
2D Torus 6x6節(jié)點(diǎn)示意圖(144張?jiān)旗軹10)
精準(zhǔn)攻克,強(qiáng)強(qiáng)聯(lián)手解決算力瓶頸
燧原科技產(chǎn)品部資深總監(jiān)鄧輝表示,隨著AI模型的復(fù)雜化和大型化,AI算力需求成指數(shù)級增長。其中,運(yùn)算集群和CPU的通信帶寬,以及運(yùn)算加速卡節(jié)點(diǎn)之間scale out時的高性能、低延遲、智能化互聯(lián)成為高算力集群的瓶頸。
此次燧原科技正式推出的PCIe Gen4全互聯(lián)AI高算力訓(xùn)練系統(tǒng),便著重解決通信帶寬與運(yùn)算加速卡節(jié)點(diǎn)之間的高性能、低延遲、智能化互聯(lián)問題。
PCIe Gen4連接拓?fù)?/p>
燧原科技通過直接連接PCIe Gen4 x16 CPU至云燧T10,使得Supermicro新的4U A+ Server 4124GS-TNR系統(tǒng)支持最多可8張?jiān)旗軹10 PCIe AI加速卡,而單機(jī)8張?jiān)旗軹10支持4卡作為一個節(jié)點(diǎn)的HCM(HybridCube Mesh)互聯(lián)拓?fù)?,?jié)點(diǎn)內(nèi)通過GCU-LARE橋接卡實(shí)現(xiàn)4卡間點(diǎn)對點(diǎn)全互聯(lián),節(jié)點(diǎn)之間通過GCU-LARE高速線纜實(shí)現(xiàn)互聯(lián),總互聯(lián)帶寬高達(dá)800GB/s。最終,該系統(tǒng)無需任何PCIe Switch,便可實(shí)現(xiàn)最低延遲、最高帶寬和最大限度的加速。
GCU-LARE互聯(lián)HCM拓?fù)洌▎螜C(jī)8卡)
此外,該系統(tǒng)還支持最多兩個額外高性能PCIe Gen4擴(kuò)展槽,且支持單個PCIe Gen4 x8以及最多2個用于RDMA高速網(wǎng)卡提供最高200Gb/s的高性能網(wǎng)絡(luò)連接,用于實(shí)現(xiàn)最先進(jìn)的2D Torus的高性能AI訓(xùn)練集群互聯(lián)拓?fù)洹?/p>
多方攻克,具有強(qiáng)大算力與超高加速的PCIe Gen4全互聯(lián)AI高算力訓(xùn)練系統(tǒng)搭載燧原科技云燧T10,應(yīng)運(yùn)而生。該系統(tǒng)加速了計(jì)算和網(wǎng)絡(luò)性能,極大的豐富和提升了整個AI高算力訓(xùn)練系統(tǒng)互聯(lián)拓?fù)浜蛶挘瑸榭蛻魩韽?qiáng)大的產(chǎn)品性能和可擴(kuò)展性,使其擁有前所未有的速度為最復(fù)雜的Al網(wǎng)絡(luò)進(jìn)行訓(xùn)練。
系統(tǒng)落地,彰顯訓(xùn)練芯片實(shí)力
燧原科技正是認(rèn)可Supermicro在全球企業(yè)服務(wù)器先進(jìn)解決方案上的突出地位,并與其創(chuàng)新性、革命性的研發(fā)特理念不謀而合,故而憑借其獨(dú)創(chuàng)的GCU-LARE互聯(lián)技術(shù)與Supermicro展開合作,成功地推出了中國第一套PCIe Gen4的多卡AI服務(wù)器訓(xùn)練系統(tǒng),解決了大型AI訓(xùn)練系統(tǒng)互聯(lián)接口的瓶頸和規(guī)模部署的門檻。此次合作的成功還為雙方后期深入合作奠定了良好基礎(chǔ),讓未來更多基于多卡互聯(lián)的AI模型訓(xùn)練系統(tǒng)逐一實(shí)現(xiàn)。
對于燧原科技而言,這款搭載云燧T10的中國第一套PCIe Gen4全互聯(lián)AI高算力訓(xùn)練系統(tǒng)成功推出,是對其研發(fā)方向的極致肯定,同時也彰顯了燧原科技在訓(xùn)練芯片領(lǐng)域的技術(shù)實(shí)力與企業(yè)地位。
燧原科技創(chuàng)始人兼COO張亞林認(rèn)為,能與全球企業(yè)服務(wù)器先進(jìn)解決方案的倡導(dǎo)者和領(lǐng)先者Supermicro保持前瞻性技術(shù)上的一致,并展開深入合作,最后成功落地合作成果,是燧原科技走向國際舞臺的標(biāo)志性一步,代表我國訓(xùn)練芯片行業(yè)曙光在即,前景遠(yuǎn)大。
未來,AI訓(xùn)練芯片的算力需求將以每三個月增長一倍的驚人速度增長,而AI應(yīng)用率到2025年將達(dá)80%。急速變化的AI訓(xùn)練芯片技術(shù)、產(chǎn)量需求為該領(lǐng)域企業(yè)帶來了嚴(yán)峻考驗(yàn),燧原科技必將全力踐行其研發(fā)戰(zhàn)略,全面攻克數(shù)據(jù)分析、深度學(xué)習(xí)和深度學(xué)習(xí)推理等多方難題,為真正的算力普惠和應(yīng)用落地創(chuàng)造價(jià)值和鋪平道路。
原文標(biāo)題:燧原科技上線AI高算力訓(xùn)練系統(tǒng)PCIe Gen4
文章出處:【微信公眾號:燧原科技Enflame】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
責(zé)任編輯:haq
-
芯片
+關(guān)注
關(guān)注
459文章
51952瀏覽量
433994 -
服務(wù)器
+關(guān)注
關(guān)注
12文章
9603瀏覽量
87027 -
AI
+關(guān)注
關(guān)注
87文章
33628瀏覽量
274365
原文標(biāo)題:燧原科技上線AI高算力訓(xùn)練系統(tǒng)PCIe Gen4
文章出處:【微信號:gh_1222367b8780,微信公眾號:燧原科技Enflame】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
電池充放電測試儀廠家:技術(shù)革新與市場動態(tài)的深度洞察
汽車座椅焊接技術(shù)革新與應(yīng)用展望
汽車車架焊接技術(shù)革新與應(yīng)用前景
蓄電池放電技術(shù)革新:引領(lǐng)能源存儲新時代
無人機(jī)自動巡檢系統(tǒng)技術(shù)革新與應(yīng)用前景
電池充放電測試儀廠家:技術(shù)革新與市場競爭的領(lǐng)航者|鑫達(dá)能
精密脈沖焊接技術(shù)的革新:探究高性能精密脈沖焊接電源的應(yīng)用與實(shí)現(xiàn)
霍爾傳感器的發(fā)展歷史與技術(shù)革新
NVH-FLASH語音芯片支持平臺做語音—打造音頻IC技術(shù)革新

iPhone 16 Pro電池技術(shù)革新:不銹鋼外殼引領(lǐng)續(xù)航新飛躍
炬芯科技與CyweeMotion攜手,共推AI體感技術(shù)革新智能穿戴領(lǐng)域應(yīng)用
超聲波傳感技術(shù):智能水表的高性能應(yīng)用革新

全球視野下的PCB線路板:技術(shù)革新引領(lǐng)產(chǎn)業(yè)變革

甬矽電子高密度SiP技術(shù)革新5G射頻模組
天馬微電子榮獲阿爾卑斯阿爾派2023年度“技術(shù)革新獎”

評論