一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

算力經(jīng)濟下DPU芯片的發(fā)展機遇

話說科技 ? 2021-03-25 14:54 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群


01算力,已經(jīng)成為先進生產(chǎn)力

當前承載算力的基礎設施是各種規(guī)模的的數(shù)據(jù)中心,從幾十個服務器節(jié)點的小規(guī)模企業(yè)級計算中心到數(shù)萬個節(jié)點的巨型數(shù)據(jù)中心,通過云計算的模式對應用層客戶提供存儲、軟件、計算平臺等服務。這個生態(tài)直接承載了全球數(shù)十萬億美元規(guī)模的數(shù)字經(jīng)濟,而且對全球服務業(yè)、工業(yè)、農(nóng)業(yè)的滲透率隨著大數(shù)據(jù)、5G人工智能等技術(shù)的發(fā)展還在不斷提高。算力,已不僅僅是一個技術(shù)指標,它已經(jīng)成為了先進生產(chǎn)力的代表。


算力源于芯片,通過基礎軟件的有效組織,最終釋放到終端應用上。目前數(shù)據(jù)中心中核心算力芯片包括CPUGPU、FPGA和少量的ASIC,其中各類通用CPU的占比還是絕對統(tǒng)治地位。數(shù)據(jù)顯示目前CPU的年出貨量超過200億顆,其中數(shù)據(jù)中心中使用的服務器端CPU的出貨量約2000萬顆,PC(包括桌面、工作站等)端約2.6億顆。僅在2020年第4季,全球基于ARM IP的芯片出貨達到了創(chuàng)紀錄的67億顆;GPU的出貨量也非??捎^,超過4億顆(包括Intel、AMD的集成核顯),大部分都應用在各種終端設備中,如大量消費級和工業(yè)級電子產(chǎn)品中。在云端,高性能CPU和GPU是主要的兩種算力芯片——也是規(guī)模最大,單價最高,應用環(huán)境最復雜的芯片。

02負載分化:從存內(nèi)計算到網(wǎng)內(nèi)計算,出現(xiàn)大量可從CPU卸載的任務

計算的兩個核心要素:數(shù)據(jù)和計算,在數(shù)據(jù)和計算之間通過復雜的存儲層次來均衡帶寬、延遲、容量、成本等因素,盡可能讓計算芯片對數(shù)據(jù)能做到“隨用隨取”,然而這在物理上是不可能實現(xiàn)的。將數(shù)據(jù)從生產(chǎn)側(cè)或存儲側(cè)搬運到計算節(jié)點上也需要時間和能耗。為了把數(shù)據(jù)搬運到完成布爾邏輯的計算單元,已經(jīng)消耗了90%以上的能耗了。過去50年,乘著摩爾定律的東風,單顆計算芯片的處理性能指數(shù)增長,然而訪存帶寬受限于管腳數(shù)和時鐘頻率僅能做到線性增長,相對而言數(shù)據(jù)搬運的開銷被繼續(xù)放大了。端到端的延遲越來越難以控制,要把處理器“喂飽”也變得越來越困難。為了不浪費處理器計算容量,只好通過各種共享機制來相互隱藏數(shù)據(jù)搬運的延遲和開銷——而這本身就是一種開銷。

一個直接的想法就是將數(shù)據(jù)靠近計算芯片、或者將計算芯片靠近數(shù)據(jù),而且是物理臨近。出現(xiàn)了“存內(nèi)處理(PIM,Process In Memory)”的概念,也稱之為"In-Memory Computing”,存內(nèi)計算。例如,將一些地址計算,地址轉(zhuǎn)換,校驗碼計算、查找表等設置在存儲控制器中。但這本質(zhì)上是卸載了部分CPU負載的計算到內(nèi)存控制器,其實并沒有把CPU完全“嵌入”內(nèi)存,但也算是一種間接的存內(nèi)計算的實現(xiàn)方式。還有一種更依賴新型器件技術(shù)的“存算一體”,比如非易失性存儲單元的阻抗(或?qū)Ъ{)作為被存數(shù)據(jù),當在一端施加輸入數(shù)據(jù)(電壓),輸出就是二者的乘積,再通過模擬信號處理,模擬-數(shù)字轉(zhuǎn)換后,得到CPU可以處理的二進制數(shù)據(jù);當把這些節(jié)點組織稱一個陣列,就相當于完成了一次兩個向量的乘累加(MAC)操作。
另外一種存算融合的方式是“近內(nèi)存計算(Near-Memory Computing)”, 主要體現(xiàn)為放置更多的存儲器件(包括非易失性存儲器件)到片上,可以視為一種通過片上集成大內(nèi)存作為一級高速緩存,這種方式更多是存儲技術(shù)和集成技術(shù)來驅(qū)動的,比如已經(jīng)開始采用的高帶寬存儲器(HBM), 得益于3D集成技術(shù),單個存儲堆棧帶寬即可以達到100GB/s,相比于GDDR5的DRAM的28GB/s,有接近4倍的提升!本質(zhì)上來看,CPU的存儲層次之所以發(fā)展為多層、多級,也是為了使處理器更“靠近”數(shù)據(jù)。

中科馭數(shù)SmartNIC產(chǎn)品

這些技術(shù)都是局部計算和存儲的融合技術(shù),即以單機、單節(jié)點為優(yōu)化對象。如果把一座數(shù)據(jù)中心視為一臺計算機,正所謂"The Datacenter as a Computer", 那么計算的分布就有新的可能性。數(shù)據(jù)中心雖然可以邏輯上被視為一臺計算機,但其中的節(jié)點是需要通過網(wǎng)絡互連的。計算的分配、存儲的共享、硬件資源的虛擬化等,都將成為整合數(shù)據(jù)中心資源的開銷。而數(shù)據(jù)中心的CPU和GPU都不是針對數(shù)據(jù)中心的這些負載來設計的,諸如網(wǎng)絡協(xié)議處理、存儲壓縮、數(shù)據(jù)加密。網(wǎng)卡設備在數(shù)據(jù)中心中起到了關(guān)鍵作用。既然網(wǎng)卡可以處理物理層和鏈路層的數(shù)據(jù)幀,為什么不繼續(xù)卸載網(wǎng)絡層和部分應用層的計算到網(wǎng)卡上來呢?所以網(wǎng)卡從只負責節(jié)點間的“互連互通”到可以幫助CPU處理一些底層數(shù)據(jù)處理,其名稱也就從NIC(Network Interface Card)升級成了SmartNIC。網(wǎng)卡也從單純的處理數(shù)據(jù)幀變成了附帶更多計算業(yè)務的“小服務器”,拓展成真正的“網(wǎng)內(nèi)計算(In- Network Computing)”。

無論是存內(nèi)計算、近內(nèi)存計算、還是網(wǎng)內(nèi)計算、其最終的目的都是將數(shù)據(jù)所經(jīng)歷的的存儲、傳輸、計算的環(huán)節(jié)做有針對性的處理,提升系統(tǒng)的整體效率。

03計算組織:從“端-云”一體,到“端-邊緣-云”一體

為了承載AIoT、自動駕駛、V2X、智慧城市、智能安防等新興產(chǎn)業(yè),計算的組織也有了很多新的變化。從端-云一體,到端-邊緣-云一體,例如未來自動駕駛中,車將會成為邊緣的一個載體;在5G時代,5G基站也可能會成為一個邊緣節(jié)點,云計算的部分計算功能會下放到邊緣端的算力節(jié)點上,獲得更及時響應時間,更節(jié)省的網(wǎng)絡帶寬 。除 了 邊 緣 計 算 , 在 端 - 云 之 間 甚 至 有 研 究 人 員 提 出 了 “ 霧 計 算 (Fog Computing)”,“霾計算(Mist Computing)”,來不斷的將計算進行分層處理,以獲得更好的服務質(zhì)量,更低的成本。類似于一個國家的行政治理結(jié)構(gòu):省、市、區(qū)、縣等,上級負責所轄的下一級整體規(guī)劃,下級負責具體實施;在下一級能處理的業(yè)務,就不需要往上一級推送。這樣就可以有序得將計算合理分配到各個計算層次。每個終端業(yè)務無須關(guān)心是哪一朵“云”在提供服務,也不需要關(guān)心有多少層“云”、是“云”還是“霧”在提供服務。計算能力將會像電力一樣,通過端-邊緣-云一體化系統(tǒng),“輸送”到用戶。至于電來自于哪一座發(fā)電站,并不重要。這個計算組織結(jié)構(gòu)的變化,直接影響了計算指標的演變:從高性能到高效能,進而到高通量,最終落實到高生產(chǎn)率計算。

04體系結(jié)構(gòu):通用、專用并舉孕育了“X”PU的新機遇

目前各類CPU(包括服務器端、桌面端、移動端、工控和各類嵌入式場景等)的年出貨量超過百億顆,全球平均每人都能達到3顆CPU的消費量,基本可以認為CPU已經(jīng)成為一個泛在的器件。建立在CPU上的軟硬件生態(tài),無論是x86還是ARM,也自然成為了整個算力系統(tǒng)的載體,CPU也責無旁貸地成為了這個體系中的主角。隨著對圖形圖像處理的需求,在上世紀90年代出現(xiàn)了GPU,并逐漸發(fā)展到目前的GPGPU。隨著深度學習算法的爆發(fā),GPU找到了除圖像處理之外的施展空間——神經(jīng)網(wǎng)絡模型的訓練。直至目前,神經(jīng)網(wǎng)絡訓練都是GPU占絕對統(tǒng)治地位。伴隨著這第四次AI浪潮,GPU的全球領導廠商NVIDIA的市值也在2020年8月一舉超越了X86 CPU的領導廠商Intel,并一騎絕塵。GPU同時也成為了下一代數(shù)據(jù)中心里算力芯片的又一個重要角色。適逢摩爾定律的放緩,GPU這一領域?qū)S眉軜?gòu)(DSA)技術(shù)路線下的代表,終于成為成為了數(shù)據(jù)中心的核心算力芯片之一。DSA這一技術(shù)路線已經(jīng)被業(yè)界在大范圍內(nèi)認可,問題是,下一個DSA的代表是誰?

NVIDIA在2020年公布了對這個問題的看法,他認為在未來,CPU、GPU、DPU將成為數(shù)據(jù)中心的三個重要算力芯片,這與我們兩年前的看法不謀而合。我們認為,CPU優(yōu)勢是通用和所承載的復雜的業(yè)務生態(tài),其定義了軟件生態(tài)和系統(tǒng)的可用性。GPU作為流媒體處理的核心,將繼續(xù)朝著AR、VR的方向發(fā)展。行業(yè)預測在5G時代,90%的數(shù)據(jù)都將是視頻、圖片等非結(jié)構(gòu)化數(shù)據(jù),GPU必將成為這處理這類負載的主要引擎。而DPU,將會成為SmartNIC的下一代核心引擎,將軟件定義網(wǎng)絡,軟件定義存儲,軟件定義加速器融合到一個有機的整體中,解決協(xié)議處理,數(shù)據(jù)安全、算法加速等“CPU做不好,GPU做不了”的計算負載。我們也大膽預測,未來數(shù)據(jù)中心的算力引擎將出現(xiàn)CPU、GPU和DPU并舉的情景。DPU不僅僅是網(wǎng)卡芯片,而是全面成為“軟件定義硬件”的重點對象。同時,DPU的市場也不會局限在服務器端,也會出現(xiàn)在邊緣端,例如智能駕駛的V2X場景,用于解決實時視頻結(jié)構(gòu)化、傳感器數(shù)據(jù)融合,和一些消費級的DPU產(chǎn)品,用于在隱私保護等業(yè)務上提升終端的用戶體驗。


05DPU如何變革下一代計算基礎設施

DPU是 Data Processing Unit的簡稱。

DPU將作為CPU的卸載引擎,釋放CPU的算力到上層應用。以網(wǎng)絡協(xié)議處理為例,要線速處理10G的網(wǎng)絡需要的大約4個Xeon CPU的核,也就是說,單是做網(wǎng)絡數(shù)據(jù)包處理,就可以占去一個8核高端CPU的一半的算力。如果考慮40G、100G的高速網(wǎng)絡,性能的開銷就更加難以承受了。Amazon把這些開銷都稱之為“Datacenter Tax”——還未運行業(yè)務程序,先接入網(wǎng)絡數(shù)據(jù)就要占去的計算資源。AWS Nitro產(chǎn)品家族旨在將數(shù)據(jù)中心開銷(為虛機提供遠程資源,加密解密,故障跟蹤,安全策略等服務程序)全部從CPU卸載到Nitro加速卡上,將給上層應用釋放30%的原本用于支付“Tax” 的算力!

DPU將成為新的數(shù)據(jù)網(wǎng)關(guān),將安全隱私提升到一個新的高度。在網(wǎng)絡環(huán)境下,網(wǎng)絡接口是理想的隱私的邊界,但是加密、解密的算法開銷都很大,例如國密標準的非對稱加密算法SM2、哈希算法SM3和對稱分組密碼算法SM4。如果用CPU來處理,就只能做少部分數(shù)據(jù)量的加密。在未來,隨著區(qū)塊鏈承載的業(yè)務的逐漸成熟,運行共識算法POW,驗簽等也會消耗掉大量的CPU算力。而這些都可以通過將其固化在DPU中來實現(xiàn),甚至DPU將成為一個可信根。

DPU將成為存儲的入口,將分布式的存儲和遠程訪問本地化。隨著SSD性價比逐漸變得可接受,部分存儲遷移到SSD器件上已經(jīng)成為可能,傳統(tǒng)的面向機械硬盤的SATA協(xié)議并不適用于SSD存儲,所以,將SSD通過本地PCIE或高速網(wǎng)絡接入系統(tǒng)就成為必選的技術(shù)路線。NVMe(Non Volatile Memory Express)就是用于接入SSD存儲的高速接口標準協(xié)議,可以通過PCIe作為底層傳輸協(xié)議,將SSD的帶寬優(yōu)勢充分發(fā)揮出來。同時,在分布式系統(tǒng)中,還可通過NVMe over Fabric協(xié)議擴展到InfiniBand、或TCP互連的節(jié)點中,實現(xiàn)存儲的共享和遠程訪問。這些新的協(xié)議處理都可以集成在DPU中來實現(xiàn)對CPU的透明處理。進而,DPU將可能承接各種互連協(xié)議控制器的角色,在靈活性和性能方面達到一個更優(yōu)的平衡點。

DPU將成為算法加速的沙盒,成為最靈活的加速器載體。DPU不完全是一顆固化的ASIC,在CXL, CCIX等標準組織所倡導CPU、GPU與DPU等數(shù)據(jù)一致性訪問協(xié)議的鋪墊下,將更進一步掃清DPU編程障礙,結(jié)合FPGA等可編程器件,可定制硬件將有更大的發(fā)揮空間,“軟件硬件化”將成為常態(tài),異構(gòu)計算的潛能將因各種DPU的普及而徹底發(fā)揮出來。在出現(xiàn)“Killer Application”的領域都有可能出現(xiàn)與之相對應的DPU,諸如傳統(tǒng)數(shù)據(jù)庫應用如OLAP、OLTP, 或新興應用如智能駕駛等。

06中科馭數(shù)的DPU方案:KPU1+KPU2+......=DPU

鑒于以上的認知,中科馭數(shù)在這條賽道上已經(jīng)布局。馭數(shù)采取了以算法加速為核心,以網(wǎng)絡加速為切入點的策略,以清晰的行業(yè)應用為驅(qū)動,做直接面向應用的DPU。先單點打通,再按需擴展的策略。

現(xiàn)有的DPU大體上有兩種類型:1)以通用眾核為基礎的同構(gòu)眾核DPU,類似早期以處理數(shù)據(jù)包為目的的網(wǎng)絡處理器,例如Broadcom的的Stingray架構(gòu),以多核ARM為核心,以眾取勝。得益于通用處理器核(絕大部分都是ARM系列),可編程性比較好,但是應用的針對性不夠,對于特殊算法和應用的支持相對于通用CPU沒有優(yōu)勢。2)以專用核為基礎,構(gòu)建異構(gòu)核陣列。這種結(jié)構(gòu)針對性強,性能最好,但犧牲了部分靈活性。現(xiàn)有的最新的產(chǎn)品趨勢都是二者的折中,而且專用核的比重越來越來大,NVIDIA最新的BlueField2系列DPU的結(jié)構(gòu)就包括4個ARM核再加多個專用加速核區(qū)域,F(xiàn)ungible的DPU包含52個MIPS小型通用核,但還包含6個大類的專用核。

中科馭數(shù)的DPU是以KPU為運算核心,以高速傳輸和存儲總結(jié)為接口,弱通用化控制的數(shù)據(jù)面領域?qū)S锰幚砥鳌?/span>

image.png

馭數(shù)K2系列DPU架構(gòu)

上圖展示了馭數(shù)DPU的頂層結(jié)構(gòu),其核心是四類KPU的異構(gòu)核陣列,分別處理網(wǎng)絡協(xié)議,OLAP\OLTP處理,機器學習和安全加密運算核。不同于Broadcom,F(xiàn)ungible等廠商,我們將重點放在了異構(gòu)核上,即以針對性算法加速為核心,馭數(shù)提出了KPU架構(gòu),來組織異構(gòu)核。在KPU架構(gòu)下,馭數(shù)提出了完善的L2/ L3/L4層的網(wǎng)絡協(xié)議處理,提出了直接面向OLAP、OLTP的數(shù)據(jù)查詢處理核,而沒有采用原來眾核為主的架構(gòu)。這一路線與NVIDIA的技術(shù)路線更接近,但更加側(cè)重異構(gòu)核的使用??此茽奚瞬糠滞ㄓ煤说目删幊绦?,但換來的是更高效的處理效率,更直接的使用接口,更瘦的運行時系統(tǒng)和更佳的虛擬化支持。一個理想的DPU必然不像CPU,才有可能與CPU更好的互補。通用的計算不應該、也不需要卸載到DPU上,而可卸載到DPU上的負載必然也不需要在基礎算子層面來進行運算控制。

image.png

馭數(shù)超低時延NVMeOver TCP Host端加速卡架構(gòu)圖

中科馭數(shù)的DPU頂層架構(gòu)支撐了馭數(shù)其中一條重要產(chǎn)品線:SWIFT系列的網(wǎng)絡加速卡。SWIFT?-2000M是中科馭數(shù)KPU-SWIFT?網(wǎng)絡加速產(chǎn)品系列中一款超低時延NVMe Over TCP網(wǎng)絡端加速卡,基于中科馭數(shù)KPU架構(gòu)和自主研發(fā)的全硬件TCP/IP協(xié)議簇解決方案,它集成了完整的TCP、UDP、ARP、ICMP和IP等協(xié)議處理模塊,配套馭數(shù)的高性能PCIe驅(qū)動和NVMe協(xié)議的軟件接口適配,從而實現(xiàn)NVMe over TCP的網(wǎng)絡 端全功能極速系統(tǒng)。SWIFT?-2000M集成了豐富的系統(tǒng)運行狀態(tài)監(jiān)測功能,擁有硬件處理的TCP包傳輸、數(shù)據(jù)重傳、亂序重排、ping等完備的功能,解決10G/100G高速NVMe-oF場景下網(wǎng)絡協(xié)議處理CPU資源占用過高、解析過慢的痛點,大幅提升系統(tǒng)吞吐,優(yōu)化遠端存儲訪問效率。

中科馭數(shù)首顆芯片于2019年成功流片

07未來展望:構(gòu)建專用處理器系統(tǒng)結(jié)構(gòu)的幾個關(guān)鍵點

專用處理器與通用處理器是處理器發(fā)展的兩個互補的方向,雖然單獨一類專用處理器的市場要遠小于通用處理器,但是多類專用處理器的市場總和將遠遠大于通用處理器的市場。而且,專用處理器的發(fā)展將會在很多增量的應用市場中占有絕對的性能優(yōu)勢,而受到的通用計算的生態(tài)限制更少,有利于專用架構(gòu)逐步擴展去覆蓋更長尾端的應用。

在過去處理器芯片發(fā)展的60年里,前50年都是通用處理器的發(fā)展以絕對優(yōu)勢占據(jù)了處理器芯片的市場份額,相信在接下來的30年,隨著數(shù)據(jù)的爆發(fā)和“端云一體”這種計算范式的繼續(xù)滲透,將形成通用處理器與專用處理器并行的新局面,在2020年7月的COMMUNICATIONS OF THE ACM中,有一篇文章提出了一個新概念:“ASIC Clouds”, 全文標題是“ASICClouds: Specializing the Datacenterfor Planet-Scale Applications”,這里的“ASIC”其實就是各種專用處理器的呈現(xiàn)形式,我們相信專用處理器將迎來空前的增長機遇。

image.png

我們認為構(gòu)建專用處理器系統(tǒng)結(jié)構(gòu)有以下幾個關(guān)鍵點:

▲ 針對“數(shù)據(jù)平面”的計算架構(gòu)

專用計算體系結(jié)構(gòu)和通用計算體系結(jié)構(gòu)的陣地是不同的,專用計算競爭的焦點是數(shù)據(jù)平面,而通用計算競爭的焦點是控制平面。專用計算好比是造賽車,目標就是快,重點是根據(jù)賽道的類型來決定賽車的結(jié)構(gòu);通用計算好比是造民用車,目標更加的多元化,不僅要兼顧不同路況下的可用性,還要考慮性價比、代際兼容性。所以,以通用CPU的標準來看待專用XPU可能并不合適,甚至會制約了專用處理器的發(fā)展。

融合創(chuàng)新技術(shù)

計算架構(gòu)的范疇不僅僅是狹義的處理器芯片,還包括相應的存儲、傳輸、集成工藝等,是一個系統(tǒng)性概念。專用計算由于其“專用”的屬性,對融合新技術(shù)更有優(yōu)勢,例如,引入高速非易失性存儲(NVMe),利用 “NVMe oF”技術(shù)構(gòu)建更高效的分布式存儲系統(tǒng);將主機內(nèi)存直接連接在PCIe設備端,建立更大、更快的遠程直接內(nèi)存訪問(RDMA);集成HBM支持更大的片上數(shù)據(jù)集,更高效的數(shù)據(jù)平面操作;將神經(jīng)網(wǎng)絡計算融入網(wǎng)內(nèi)計算,透明賦能需要推理的場景。

▲面向的領域?qū)S妹枋稣Z言

應用都是可以進行無二意性的語言進行描述的,專用計算也不例外。對應用的描述層是專用計算架構(gòu)的邊界:描述層之上是客戶的實際應用程序,描述層之下都是專用計算系統(tǒng)涉及定制的部分。整個系統(tǒng)的參考邊界由傳統(tǒng)ISA(指令集)上升到了DSL(Domain-specific Language)。例如,P4編程語言是面向SDN的領域?qū)S谜Z言,專門用于定義路由器和交換機如何轉(zhuǎn)發(fā)數(shù)據(jù)包,屬于數(shù)據(jù)平面的編程語言。至于網(wǎng)絡處理器是用ARM還是MIPS,或是X86并不重要?,F(xiàn)在的深度學習框架例如TensorFlow,其實也是提供了一整套定義深度學習模型結(jié)構(gòu)、描述模型訓練方法的DSL;還有面向數(shù)據(jù)庫的SQL,本身就是一種聲明式(Declaritive)的DSL編程語言,有望成為新專用處理器設計的參考邊界。

▲先垂直深耕,再水平擴展

對于專用計算架構(gòu)業(yè)界的一個普遍的共識是“碎片化”問題,挑戰(zhàn)“one-size-fitall”的ASIC商業(yè)模式。傳統(tǒng)上認為碎片化意味著單個產(chǎn)品線難以上量,難以攤薄芯片研發(fā)的巨額一次性投入,即所謂的高昂的NRE成本。一個有商業(yè)價值的技術(shù)必須建立在“技術(shù)閉環(huán)”的基礎上:研發(fā)、使用、反饋、再研發(fā)改進、再擴大使用范圍……。技術(shù)只有投入使用才能體現(xiàn)價值,有使用價值才有可能商業(yè)化,才能完成技術(shù)閉環(huán)到商業(yè)閉環(huán)的進化。技術(shù)閉環(huán)的形成需要集中火力,全鏈條主動出擊才能鋪就。碎片化并不是“專用”障礙,反而應該是專用技術(shù)路線充分利用的優(yōu)勢。(END)



聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    貴安發(fā)展集團攜手華為開創(chuàng)數(shù)字經(jīng)濟新未來

    “十四五”規(guī)劃明確提出,要加快數(shù)字經(jīng)濟發(fā)展,推動人工智能安全技術(shù)創(chuàng)新。在此背景,貴陽貴安緊抓“東數(shù)西”國家戰(zhàn)略機遇,依托全國一體化
    的頭像 發(fā)表于 07-02 14:46 ?351次閱讀

    中科馭數(shù)攜DPU全棧產(chǎn)品亮相福州數(shù)博會,賦能智時代基建

    會”)也拉開帷幕。共有150多家企業(yè)參展,展會吸引了八萬多名觀眾參觀。作為國內(nèi)DPU領域領軍企業(yè),中科馭數(shù)攜三大產(chǎn)品線亮相展會,其創(chuàng)新的DPU技術(shù)方案成為專業(yè)觀眾關(guān)注焦點。據(jù)大會報告的數(shù)據(jù)顯示,我國
    的頭像 發(fā)表于 05-23 11:01 ?221次閱讀
    中科馭數(shù)攜<b class='flag-5'>DPU</b>全棧產(chǎn)品亮相福州數(shù)博會,賦能智<b class='flag-5'>算</b>時代<b class='flag-5'>算</b><b class='flag-5'>力</b>基建

    芯片的生態(tài)突圍與革命

    電子發(fā)燒友網(wǎng)報道(文 / 李彎彎)大芯片,即具備強大計算能力的集成電路芯片,主要應用于高性能計算(HPC)、人工智能(AI)、數(shù)據(jù)中心、自動駕駛等需要海量數(shù)據(jù)并行計算的場景。隨著
    的頭像 發(fā)表于 04-13 00:02 ?1728次閱讀

    DeepSeek對芯片的影響

    DeepSeek模型,尤其是其基于MOE(混合專家)架構(gòu)的DeepSeek-V3,對芯片的要求產(chǎn)生了深遠影響。為了更好地理解這一影響,我們可以從幾個方面進行分析。一.MOE架構(gòu)對
    的頭像 發(fā)表于 02-07 10:02 ?1131次閱讀
    DeepSeek對<b class='flag-5'>芯片</b><b class='flag-5'>算</b><b class='flag-5'>力</b>的影響

    中心的如何衡量?

    作為當下科技發(fā)展的重要基礎設施,其的衡量關(guān)乎其能否高效支撐人工智能、大數(shù)據(jù)分析等智能應用的運行。以下是對智中心算衡量的詳細闡述:一、
    的頭像 發(fā)表于 01-16 14:03 ?2516次閱讀
    <b class='flag-5'>算</b>智<b class='flag-5'>算</b>中心的<b class='flag-5'>算</b><b class='flag-5'>力</b>如何衡量?

    北電數(shù)智前進·AI異構(gòu)計算平臺,繪制國產(chǎn)商業(yè)化落地新藍圖

    在當今的數(shù)字經(jīng)濟時代,人工智能已然成為推動科技進步與社會發(fā)展的核心動力。作為助推AI浪潮與數(shù)字經(jīng)濟發(fā)展的基礎設施,AI芯片和相關(guān)
    的頭像 發(fā)表于 12-24 11:54 ?855次閱讀

    億鑄科技熊大鵬探討AI大芯片的挑戰(zhàn)與解決策略

    在SEMiBAY2024《HBM與存儲器技術(shù)與應用論壇》上,億鑄科技的創(chuàng)始人、董事長兼CEO熊大鵬博士發(fā)表了題為《超越極限:大芯片的技術(shù)挑戰(zhàn)與解決之道》的演講,深入剖析了AI大模型時代
    的頭像 發(fā)表于 10-25 11:52 ?928次閱讀

    【「芯片 | 高性能 CPU/GPU/NPU 微架構(gòu)分析」閱讀體驗】--全書概覽

    本帖最后由 1653149838.791300 于 2024-10-16 22:19 編輯 感謝平臺提供的書籍,厚厚的一本,很有分量,感謝作者的傾力付出成書。 本書主要講芯片CPU
    發(fā)表于 10-15 22:08

    名單公布!【書籍評測活動NO.43】 芯片 | 高性能 CPU/GPU/NPU 微架構(gòu)分析

    試用評測資格! 前言 不知不覺中,我們來到一個計算機科學飛速發(fā)展的時代,手機和計算機中各類便捷的軟件已經(jīng)融入日常生活,在此背景,硬件特別是強勁的
    發(fā)表于 09-02 10:09

    AI驅(qū)動的數(shù)字經(jīng)濟:智能社會基礎設施與革新

    AI驅(qū)動的數(shù)字經(jīng)濟:智能社會基礎設施與革新 隨著數(shù)字經(jīng)濟的迅猛發(fā)展,人工智能(AI)技術(shù)已
    的頭像 發(fā)表于 08-21 16:01 ?637次閱讀
    AI驅(qū)動<b class='flag-5'>下</b>的數(shù)字<b class='flag-5'>經(jīng)濟</b>:智能社會基礎設施與<b class='flag-5'>算</b><b class='flag-5'>力</b>革新

    蘭洋科技與燧原科技深化江蘇地區(qū)智合作 共筑基石

    在數(shù)字經(jīng)濟浪潮席卷全球的今天,正推動著新質(zhì)生產(chǎn)的形成與發(fā)展。作為數(shù)字經(jīng)濟時代的核心驅(qū)動,在
    的頭像 發(fā)表于 08-16 10:53 ?575次閱讀

    中科馭數(shù)分析DPU在云原生網(wǎng)絡與智網(wǎng)絡中的實際應用

    CCF Chip 2024,精彩不能停!7月21日下午,中科馭數(shù)在第二屆中國計算機學會(CCF)芯片大會的“馭數(shù)專屬時刻”仍在繼續(xù),馭數(shù)組織承辦“DPU技術(shù)趨勢和應用——DPU在云原生與智
    的頭像 發(fā)表于 08-02 11:21 ?1170次閱讀

    RISC-V在中國的發(fā)展機遇有哪些場景?

    聯(lián)網(wǎng)市場的重要參與者,擁有龐大的用戶基數(shù)和豐富的應用場景。RISC-V在中國的發(fā)展將受益于這一市場需求的增長。 2. 人工智能(AI) AI需求:隨著人工智能技術(shù)的廣泛應用,對
    發(fā)表于 07-29 17:14

    IaaS+on+DPU(IoD)+下一代高性能底座技術(shù)白皮書

    了可觀的經(jīng)濟效益。這種正向循環(huán)促進了相關(guān)技術(shù)棧的快速迭代與成熟,也幫助他們發(fā)展成為云計算業(yè)務領域的領軍企業(yè)。 隨著眾多芯片廠商投身到 DPU 技術(shù)領域后,業(yè)界對
    發(fā)表于 07-24 15:32