一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

使用粗粒度可重構(gòu)陣列加速處理

星星科技指導(dǎo)員 ? 來源:嵌入式計算設(shè)計 ? 作者:Monique DeVoe ? 2022-06-14 10:05 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

隨著性能需求的增加和對低功耗設(shè)計的推動,需要更有效的方法來執(zhí)行處理任務(wù),因為由于功率限制,將更多處理器投入性能問題不再可行。加速器旨在以更快的速度和更低的功耗進行計算,但今天的加速器在功耗和性能方面存在缺陷。

加速器陣容

亞利桑那州立大學(xué)計算、信息學(xué)和決策系統(tǒng)工程學(xué)院副教授 Aviral Shrivastava 正在對可編程加速器進行研究,以增強當(dāng)今的加速技術(shù)。Shrivastava 列出了當(dāng)今使用的三種常見類型的加速器:硬件加速器、FPGAGPU。硬件加速器將特定的計算元素專用于處理計算,而不是在 CPU 上運行它們。它們速度快、功耗低,但不適合當(dāng)今快速變化的技術(shù)迭代,因為它們不可編程。FPGA 是可編程的——開發(fā)人員可以在其上編寫任何邏輯并且它們可以充當(dāng)加速器——但 Shrivastava 說它們通常過于通用并且消耗太多功率。GPU 是當(dāng)今流行的加速器,

粗粒度可重構(gòu)陣列

Shrivastava 正在開發(fā)粗??芍貥?gòu)陣列 (CGRA),它可以加速非并行循環(huán),并在 GPU 的并行循環(huán)優(yōu)勢之上實現(xiàn)更多加速功能。CGRA 由一個由算術(shù)邏輯單元 (ALU) 和寄存器組成的二維網(wǎng)格組成,這些單元接收輸入和指令,計算指令的算術(shù)或邏輯運算,并將輸出發(fā)送給它的四個鄰居以計算下一個步驟(圖 1)。

圖 1:粗粒度可重構(gòu)陣列。

pYYBAGKn7RuAfDpEAATcUI-H07s228.png

CGRA 的潛力來自于他們能夠在消耗很少的電力的情況下執(zhí)行操作。在常規(guī)處理器中執(zhí)行加法運算需要很大的功率:它必須經(jīng)過 20 多個流水線階段。在 CGRA 中,只需要從鄰居那里獲取操作數(shù)并執(zhí)行加法運算。CGRA 可以通過流水線加速——循環(huán)的操作被布置在 CGRA 的 PE 上,數(shù)據(jù)在它們之間流動。

CGRA 本身并不新鮮,但開發(fā)人員對現(xiàn)有的 CGRA 進行編程以僅執(zhí)行一種類型的計算。Shrivastava 說,挑戰(zhàn)在于映射,因為循環(huán)內(nèi)核需要映射到 CGRA,操作映射到節(jié)點,數(shù)據(jù)依賴關(guān)系映射到 CGRA 的路徑。Shrivastava 的目標(biāo)是消除耗時的手動編碼,并使任何類型的循環(huán)或計算能夠通過編譯器映射到 CGRA,這是一種相對較新的方法。他正在開發(fā)一個生成映射代碼的編譯器工具鏈。

Shrivastava 說 CGRA 的研究引起了 IBM 的興趣,IBM 希望將這種方法應(yīng)用于并行循環(huán)輕型服務(wù)器應(yīng)用程序。用于科學(xué)研究和多媒體擴展的圖形和高性能計算也可以從使用 CGRA 中獲益。

解決分支分歧問題

所有現(xiàn)有加速技術(shù)面臨的一個挑戰(zhàn)是“分支分歧”。當(dāng)執(zhí)行具有“if-then-else”結(jié)構(gòu)的循環(huán)時,加速器分配資源以執(zhí)行來自分支的兩條路徑(真路徑和假路徑)的指令,然后丟棄假路徑指令的影響。FPGA 將兩個路徑的功能映射到計算資源上,GPU 執(zhí)行來自兩個分支路徑的指令并丟棄錯誤路徑指令的結(jié)果。加速器必須這樣做,因為在分配分支路徑資源時,分支的結(jié)果在編譯時是未知的(分支的結(jié)果是在運行時計算的,當(dāng)執(zhí)行分支時)。這種冗余執(zhí)行會導(dǎo)致分支花費雙倍的性能時間和執(zhí)行能力。

Shrivastava 和他的團隊提出了通過智能硬件-軟件協(xié)同設(shè)計解決分支分歧問題的方法。不是為真路徑分配一些PE,而為假路徑分配一些PE,而是分配相同的PE來執(zhí)行來自兩條路徑的指令。來自真路徑和來自假路徑的指令都發(fā)給PE。在運行時,PE 只選擇正確的一個來執(zhí)行。

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 處理器
    +關(guān)注

    關(guān)注

    68

    文章

    19890

    瀏覽量

    235118
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    4944

    瀏覽量

    131217
  • 編譯器
    +關(guān)注

    關(guān)注

    1

    文章

    1662

    瀏覽量

    50205
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    AI 智能重構(gòu)測試測量平臺,Moku:Delta集成業(yè)內(nèi)首創(chuàng)“生成式儀器”

    ?;凇败浖x+硬件重構(gòu)”的平臺架構(gòu),LiquidInstruments最新發(fā)布業(yè)內(nèi)首創(chuàng)的“生成式儀器技術(shù)(GenerativeInstrumentation)”集
    的頭像 發(fā)表于 07-15 11:34 ?63次閱讀
    AI 智能<b class='flag-5'>重構(gòu)</b>測試測量平臺,Moku:Delta集成業(yè)內(nèi)首創(chuàng)“生成式儀器”

    清微智能官宣:國產(chǎn)重構(gòu)芯片全球出貨量突破2000萬顆

    近日,由北京智源人工智能研究院主辦的第7屆北京智源大會成功舉辦。作為國產(chǎn)原創(chuàng)重構(gòu)芯片架構(gòu)領(lǐng)導(dǎo)者,清微智能受邀出席,向大眾展示了前沿高階國產(chǎn)算力技術(shù)成果。 在本次大會上,清微智能首次官宣,公司
    的頭像 發(fā)表于 06-12 17:15 ?325次閱讀
    清微智能官宣:國產(chǎn)<b class='flag-5'>可</b><b class='flag-5'>重構(gòu)</b>芯片全球出貨量突破2000萬顆

    ?數(shù)字孿生熱管理:NTC熱敏電阻陣列與熱場重構(gòu)算法的動態(tài)適配

    本文以東莞市平尚電子科技有限公司(平尚科技)的NTC熱敏電阻陣列與熱場重構(gòu)算法為核心,探討其在車載數(shù)字孿生熱管理系統(tǒng)中的動態(tài)適配技術(shù)。通過高精度NTC陣列、多物理場耦合模型及實時反饋控制算法,實現(xiàn)熱
    的頭像 發(fā)表于 06-06 17:59 ?232次閱讀
    ?數(shù)字孿生熱管理:NTC熱敏電阻<b class='flag-5'>陣列</b>與熱場<b class='flag-5'>重構(gòu)</b>算法的動態(tài)適配

    鋁線鍵合強度測試:如何選擇合適的推拉力測試機?

    近期,越來越多的半導(dǎo)體行業(yè)客戶向小編咨詢,關(guān)于鋁線鍵合強度測試的設(shè)備選擇問題。在電子封裝領(lǐng)域,鋁線鍵合技術(shù)是實現(xiàn)芯片與外部電路連接的核心工藝,其鍵合質(zhì)量的高低直接決定了器件的可靠性和性能表現(xiàn)
    的頭像 發(fā)表于 03-21 11:10 ?357次閱讀
    <b class='flag-5'>粗</b>鋁線鍵合強度測試:如何選擇合適的推拉力測試機?

    支持實時物體識別的視覺人工智能微處理器RZ/V2MA數(shù)據(jù)手冊

    DRP-AI 采用了一種由動態(tài)重構(gòu)處理器(DRP)和 AI-MAC組成的人工智能加速器,該加速器可加速
    的頭像 發(fā)表于 03-18 18:12 ?456次閱讀
    支持實時物體識別的視覺人工智能微<b class='flag-5'>處理</b>器RZ/V2MA數(shù)據(jù)手冊

    FRED案例:矩形微透鏡陣列

    介紹 小透鏡陣列可應(yīng)用在很多方面,其中包含光束均勻化。本文演示了一個用于在探測器上創(chuàng)建均勻的非相干照度的成像微透鏡陣列的設(shè)計。輸入光束具有高斯輪廓,半寬度等于微透鏡陣列大小,并且顯示了其功率輪廓被微
    發(fā)表于 03-05 09:41

    粒度控制在結(jié)晶過程中的從小規(guī)模試驗到放大應(yīng)用

    引言 結(jié)晶作為API生產(chǎn)的最后一道工序,除了用于純化外,還可以實現(xiàn)晶型與粒度控制。晶型和粒度影響口服藥物生物利用度。其中,粒度分布(PSD)是一個重要的粉體性質(zhì),它影響晶漿的過濾速率、濾餅的干燥效率
    的頭像 發(fā)表于 02-18 09:45 ?664次閱讀
    <b class='flag-5'>粒度</b>控制在結(jié)晶過程中的從小規(guī)模試驗到放大應(yīng)用

    突破傳統(tǒng)桎梏,富唯重構(gòu)柔性裝配系統(tǒng)引領(lǐng)行業(yè)新變革

    在當(dāng)今競爭激烈的制造業(yè)領(lǐng)域,傳統(tǒng)裝配系統(tǒng)正面臨著諸多難以突破的困境。多層控制器架構(gòu)冗余、產(chǎn)線生產(chǎn)種類單一、對人員要求過高以及標(biāo)準(zhǔn)化程度低等問題,嚴(yán)重制約著企業(yè)的發(fā)展與創(chuàng)新。而富唯智能基于 AI-ICDP 打造的重構(gòu)柔性裝配系統(tǒng),宛如一顆璀璨的新星,為行業(yè)帶來了全新的希望
    的頭像 發(fā)表于 02-13 14:22 ?428次閱讀
    突破傳統(tǒng)桎梏,富唯<b class='flag-5'>可</b><b class='flag-5'>重構(gòu)</b>柔性裝配系統(tǒng)引領(lǐng)行業(yè)新變革

    陣列式位移計生產(chǎn)廠家:什么是陣列式位移計

    ,成為了結(jié)構(gòu)變形監(jiān)測的首選工具。下面是南京陣列式位移計生產(chǎn)廠家給大家介紹的相關(guān)內(nèi)容:陣列式位移計傳感器采用了先進的MEMS加速度計技術(shù),并配備了完善的配套附件,使得其
    的頭像 發(fā)表于 12-12 14:20 ?625次閱讀
    <b class='flag-5'>陣列</b>式位移計生產(chǎn)廠家:什么是<b class='flag-5'>陣列</b>式位移計

    通過微透鏡陣列的傳播

    隨著現(xiàn)代技術(shù)的發(fā)展,微透鏡陣列等專用光學(xué)元件越來越受到人們的重視。特別是在光學(xué)投影系統(tǒng)、材料加工單元、光學(xué)擴散器等領(lǐng)域,微透鏡陣列得到了廣泛的應(yīng)用。在VirtualLab Fusion中,可以
    發(fā)表于 12-11 11:32

    什么是麥克風(fēng)陣列

    什么是麥克風(fēng)陣列?想象一下一個小型音響部隊在你面前,它們站成一排,用不同的麥克風(fēng)捕捉聲音。這就是麥克風(fēng)陣列的基本概念。麥克風(fēng)陣列由多個麥克風(fēng)組成,按照特定的布局排列在一起,用來捕捉和處理
    的頭像 發(fā)表于 11-30 01:08 ?1600次閱讀
    什么是麥克風(fēng)<b class='flag-5'>陣列</b>

    基于相變材料的重構(gòu)超構(gòu)表面用于圖像處理

    光學(xué)超構(gòu)表面(metasurface)實現(xiàn)了在亞波長尺度內(nèi)的模擬計算和圖像處理,并具備更低的功耗、更快的速度。雖然人們已經(jīng)展示了各種圖像處理超構(gòu)表面,但大多數(shù)考慮的器件都是靜態(tài)的,缺乏重構(gòu)
    的頭像 發(fā)表于 11-13 10:24 ?1.1w次閱讀
    基于相變材料的<b class='flag-5'>可</b><b class='flag-5'>重構(gòu)</b>超構(gòu)表面用于圖像<b class='flag-5'>處理</b>

    微流控陣列芯片和普通芯片的區(qū)別

    微流控陣列芯片與普通芯片在設(shè)計與應(yīng)用上存在顯著差異 設(shè)計原理:微流控陣列芯片以微米級通道操控流體,集成多種實驗功能;普通芯片則通?;诰w管,用于電子信號處理。 應(yīng)用領(lǐng)域:微流控陣列
    的頭像 發(fā)表于 10-30 15:10 ?713次閱讀

    FPGA加速深度學(xué)習(xí)模型的案例

    FPGA(現(xiàn)場可編程門陣列加速深度學(xué)習(xí)模型是當(dāng)前硬件加速領(lǐng)域的一個熱門研究方向。以下是一些FPGA加速深度學(xué)習(xí)模型的案例: 一、基于FPGA的AlexNet卷積運算
    的頭像 發(fā)表于 10-25 09:22 ?1221次閱讀

    共模電感漆包線越電流越大嗎

    電子發(fā)燒友網(wǎng)站提供《共模電感漆包線越電流越大嗎.docx》資料免費下載
    發(fā)表于 09-04 11:49 ?0次下載