一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

通用計(jì)算仍有差距,RISC-V可靠矢量處理彎道超車

E4Life ? 來(lái)源:電子發(fā)燒友網(wǎng) ? 作者:周凱揚(yáng) ? 2022-10-20 03:17 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

電子發(fā)燒友網(wǎng)報(bào)道(文/周凱揚(yáng))對(duì)于高效的數(shù)據(jù)并行負(fù)載處理來(lái)說(shuō),矢量架構(gòu)的吸引力越來(lái)越大,主流ISA都開始注意到這一點(diǎn)。就拿我們熟悉的前超算王者——日本的富岳來(lái)說(shuō),其處理器富士通A64FX就是基于Arm可伸縮矢量擴(kuò)展(SVE)的。

Arm也在隨后推出的Armv9架構(gòu)中提出了改良版的SVE2,并在其中加入了對(duì)NEON的兼容,SVE2在HPC之外的市場(chǎng)應(yīng)用中做出了指令優(yōu)化,甚至可以用于手機(jī)、汽車等智能設(shè)備中。

正是因?yàn)橛辛薙VE的存在,富岳才得以單靠通用處理器完成高性能的大數(shù)據(jù)運(yùn)算,而不是像其他主流超算一樣,還要靠堆積GPU、FPGAAI加速器等片外加速器才能實(shí)現(xiàn)可觀的性能,我國(guó)的神威太湖之光同樣運(yùn)用了這樣的矢量設(shè)計(jì)思路。但以上這些都是專有架構(gòu),微架構(gòu)不透明的同時(shí)也限制了開源和定制化方案的出現(xiàn),而這些均可以在RISC-V上一一實(shí)現(xiàn)。

RISC-V矢量處理器的吸引力

RISC-V的矢量擴(kuò)展RVV自2015年提出以來(lái),已經(jīng)有了長(zhǎng)足的進(jìn)展,也有了正式的1.0版本規(guī)范。與傳統(tǒng)的SIMD指令相比,RVV提供動(dòng)態(tài)的矢量長(zhǎng)度修改,做到了更高的效率、更小的代碼體積和更簡(jiǎn)單的循環(huán)結(jié)束。我們近期已經(jīng)看到了不少RISC-V處理器被廣泛使用的新聞,比如谷歌選擇在其TPU上加入SiFive的X280處理器,其實(shí)看重的就是它在矢量處理上的優(yōu)勢(shì)。
CleanShot 2022-10-19 at 16.01.37@2x
SiFive矢量處理器 / SiFive
所以我們看到在SiFive的處理器產(chǎn)品中,像Performance P270和Intelligence X280都擁有優(yōu)秀的矢量處理能力,后者更是引入了一個(gè)512位矢量寄存器長(zhǎng)度的架構(gòu),在完全支持矢量擴(kuò)展標(biāo)準(zhǔn)的同時(shí),還支持動(dòng)態(tài)可變矢量長(zhǎng)度的運(yùn)算。SiFive也在其矢量擴(kuò)展上做出了改進(jìn),稱其為SiFive智能擴(kuò)展,與直接基于RV64GCV架構(gòu)的設(shè)計(jì)相比,X280的智能擴(kuò)展在INT8格式下的矩陣乘法運(yùn)算時(shí)可將執(zhí)行速度提高12倍。

而且這不僅僅造福的是數(shù)據(jù)中心,還有受制于功耗卻又需要高吞吐量和單線程性能的邊緣應(yīng)用,比如AR/VR、數(shù)碼相機(jī)等等。SiFive同樣測(cè)試了可用于移動(dòng)端或嵌入式設(shè)備的輕量級(jí)神經(jīng)網(wǎng)絡(luò)MobileNet,相較基于RISC-V標(biāo)量的架構(gòu),SiFive智能擴(kuò)展可以將速度提升144倍。

同樣的還有晶心科技推出的RISC-V矢量處理器NX27V,該處理器采用了5級(jí)流水線的設(shè)計(jì),晶心為其設(shè)計(jì)了強(qiáng)大的矢量處理單元,擁有32個(gè)矢量寄存器,最高支持512位的矢量長(zhǎng)度,為了進(jìn)一步支持AI應(yīng)用,晶心還為其增加了BF16和INT4的數(shù)據(jù)格式支持。據(jù)正在打造可擴(kuò)展的高性能AI超算的初創(chuàng)公司Luminous Computing透露,他們打造的系統(tǒng)用到了數(shù)百個(gè)NX27V VPU核心,極大地提升了該系統(tǒng)的深度學(xué)習(xí)性能。

開源RISC-V矢量處理器

RISC-V作為開源架構(gòu)最棒的一點(diǎn)就在于,總是不缺香山處理器這樣優(yōu)秀的開源方案。比如2019年推出的Ara就是一款高效矢量協(xié)處理器,用于輔助OpenHW的CVA6 RISC-V應(yīng)用處理器Ara,只不過(guò)Ara剛發(fā)布之際還是基于早期的RVV規(guī)范設(shè)計(jì)的。

來(lái)自蘇黎世聯(lián)邦理工學(xué)院(ETH)和華為蘇黎世研究中心的研究員們借助Ara的啟發(fā),基于RVV1.0發(fā)表了一個(gè)開源的高效RISC-V矢量處理器設(shè)計(jì)。他們基于格芯的22FDX工藝進(jìn)行了吞吐量和PPA的驗(yàn)證,整個(gè)系統(tǒng)運(yùn)行頻率為1.34GH,在關(guān)鍵的矩陣乘法內(nèi)核下,F(xiàn)PU的利用率可以達(dá)到98%以上。

相較之下,SiFive的X280和另一個(gè)開源矢量協(xié)處理器Vicuna宣稱的FPU利用率大于90%,伯克利的開源方案Hwacha可以做到95%以上。為了展示從RVV擴(kuò)展這么多年以來(lái)的改進(jìn),他們也與基于RVV 0.5版下的設(shè)計(jì)做了對(duì)比,結(jié)果是在面積占用上有了15%的提升,吞吐量也有了6%的提升,雙精度計(jì)算效率也做到了37.1GFLOPS/W。

結(jié)語(yǔ)

AI時(shí)代下,矢量處理的應(yīng)用場(chǎng)景已經(jīng)遠(yuǎn)超我們的現(xiàn)象,包括深度學(xué)習(xí)、推薦系統(tǒng)、鍵值存儲(chǔ)和HPC等,都已經(jīng)廣泛利用了矢量計(jì)算。但如何做到高效高性能,才是未來(lái)所有ISA的努力方向,而RISC-V作為后來(lái)者,反而能在這上面找到彎道超車的機(jī)會(huì)。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • RISC-V
    +關(guān)注

    關(guān)注

    46

    文章

    2535

    瀏覽量

    48556
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    FPGA與RISC-V淺談

    全球半導(dǎo)體產(chǎn)業(yè)競(jìng)爭(zhēng)格局正在經(jīng)歷深刻變革,物聯(lián)網(wǎng)、邊緣計(jì)算等新興技術(shù)的蓬勃發(fā)展,讓RISC-V憑借其開源、精簡(jiǎn)以及模塊化的靈活優(yōu)勢(shì),日益成為業(yè)界焦點(diǎn),也為全球半導(dǎo)體產(chǎn)業(yè)注入新的活力與挑戰(zhàn)
    發(fā)表于 04-11 13:53 ?334次閱讀
    FPGA與<b class='flag-5'>RISC-V</b>淺談

    關(guān)于RISC-V芯片的應(yīng)用學(xué)習(xí)總結(jié)

    電子、醫(yī)療設(shè)備等領(lǐng)域,對(duì)處理器的可靠性、實(shí)時(shí)性和低功耗有較高要求。RISC-V芯片通過(guò)提供豐富的外設(shè)接口和高效的指令集,滿足了嵌入式系統(tǒng)的多樣化需求。同時(shí),其開源特性降低了開發(fā)成本,加速了產(chǎn)品上市時(shí)間
    發(fā)表于 01-29 08:38

    RISC-V MCU技術(shù)

    的研究團(tuán)隊(duì)弄出來(lái)的,目的就是想搞個(gè)新的、開放的指令集架構(gòu),能跟上現(xiàn)代計(jì)算的需要。到了2015年,專門成立了個(gè)RISC-V基金會(huì),讓這個(gè)架構(gòu)更標(biāo)準(zhǔn),也更好地推廣開了。這幾年啊,這個(gè)RISC-V的生態(tài)系統(tǒng)
    發(fā)表于 01-19 11:50

    RISC-V架構(gòu)及MRS開發(fā)環(huán)境回顧

    Sherwani的預(yù)測(cè),5年后RISC-V指令的處理器就有可能進(jìn)軍服務(wù)器市場(chǎng)。 ③、RISC-V的應(yīng)用之三:存儲(chǔ)市場(chǎng) 硬盤本身并不需要像SSD那樣龐大的計(jì)算資源,但是由于新的磁記錄技
    發(fā)表于 12-16 23:08

    RISC-V能否復(fù)制Linux 的成功?》

    ,創(chuàng)建實(shí)現(xiàn)自有加速器算法的自定義異構(gòu)集群。RISC-V作為一種ISA,我們一開始是在處理器內(nèi)核中采用吸引人的通用構(gòu)建塊,然后在此基礎(chǔ)上進(jìn)行構(gòu)建,同時(shí)還利用最好的商業(yè)工具增強(qiáng)使用者的信心。所以,IP
    發(fā)表于 11-26 20:20

    什么是RISC-V?以及RISC-V和ARM、X86的區(qū)別

    圖紙,處理器就是房子。 RISCRISC-V的區(qū)別 RISC全稱Reduced Instruction Set Computer,即精簡(jiǎn)指令計(jì)算
    發(fā)表于 11-16 16:14

    RISC-V,即將進(jìn)入應(yīng)用的爆發(fā)期

    計(jì)算機(jī)由控制整體的CPU(中央處理器)和加速器兩部分構(gòu)成。在AI計(jì)算中,功耗和效率是兩個(gè)關(guān)鍵因素。RISC-V架構(gòu)通過(guò)其簡(jiǎn)潔的設(shè)計(jì)和定制化的擴(kuò)展,可以實(shí)現(xiàn)高效的能量使用。該架構(gòu)能夠通過(guò)
    發(fā)表于 10-31 16:06

    risc-v在人工智能圖像處理應(yīng)用前景分析

    的兼容性和可靠性,并為其在人工智能圖像處理領(lǐng)域的應(yīng)用提供更有力的保障。 綜上所述,RISC-V在人工智能圖像處理領(lǐng)域具有廣闊的應(yīng)用前景。其開源性、靈活性、低功耗和高性能等特點(diǎn)使得它成為
    發(fā)表于 09-28 11:00

    加入全球 RISC-V Advocate 行列,共筑 RISC-V 的未來(lái) !

    加入RISC-VAdvocate行列!我們正在尋找來(lái)自世界各地的RISC-V愛好者,通過(guò)全球推廣和參與,成為支持RISC-V進(jìn)步的關(guān)鍵參與者。作為一名RISC-VAdvocate,您將
    的頭像 發(fā)表于 09-10 08:08 ?834次閱讀
    加入全球 <b class='flag-5'>RISC-V</b> Advocate 行列,共筑 <b class='flag-5'>RISC-V</b> 的未來(lái) !

    RISC-V Summit China 2024 | 青稞RISC-V+接口PHY,賦能RISC-V高效落地

    獲三份益 青稞RISC-V,更懂下游客戶的MCU內(nèi)核 通用RISC-V架構(gòu)進(jìn)入MCU行業(yè)難免水土不服。沁恒通過(guò)“架構(gòu)級(jí)”創(chuàng)新,解決下游開發(fā)/應(yīng)用過(guò)程中的痛點(diǎn)問(wèn)題,讓青稞RISC-V更接
    發(fā)表于 08-30 17:37

    risc-v的發(fā)展歷史

    了基于RISC-V指令集的服務(wù)器處理器,安謀科技也推出了RISC-V MCU等產(chǎn)品。 學(xué)術(shù)界與開源社區(qū):RISC-V架構(gòu)在學(xué)術(shù)界和開源社區(qū)中也得到了廣泛的研究和應(yīng)用。許多研究機(jī)構(gòu)和開發(fā)
    發(fā)表于 07-29 17:20

    rIsc-v的缺的是什么?

    RISC-V作為一種開源的指令集架構(gòu)(ISA),自其誕生以來(lái)就受到廣泛關(guān)注和應(yīng)用,但它也存在一些不足之處。以下是RISC-V架構(gòu)目前存在的主要缺點(diǎn): 1. 性能問(wèn)題 相對(duì)于專用ISA的性能差距:盡管
    發(fā)表于 07-29 17:18

    RISC-V適合什么樣的應(yīng)用場(chǎng)景

    設(shè)計(jì)使得開發(fā)者可以靈活選擇所需的指令集和模塊,以滿足嵌入式系統(tǒng)的各種性能要求。 3. 人工智能(AI)和機(jī)器學(xué)習(xí)(ML) 高性能計(jì)算RISC-V結(jié)合AI加速器或協(xié)處理器,可以提供高效的人工智能
    發(fā)表于 07-29 17:16

    RISC-V在中國(guó)的發(fā)展機(jī)遇有哪些場(chǎng)景?

    。RISC-V結(jié)合AI加速器,可以在AI領(lǐng)域提供高效的計(jì)算解決方案。 定制化需求:RISC-V允許添加專門的加速器或協(xié)處理器來(lái)處理特定任務(wù),
    發(fā)表于 07-29 17:14

    為什么要有RISC-V

    RISC-V(“RISC five”)的目標(biāo)是成為一個(gè)通用的指令集架構(gòu)(ISA):①、它要能適應(yīng)包括從最袖珍的嵌入式控制器,到最快的高性能計(jì)算機(jī)等各種規(guī)模的
    發(fā)表于 07-27 15:05