一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

基于1.35M Instance設(shè)計(jì)的GPU加速實(shí)例

芯行紀(jì) ? 來(lái)源:芯行紀(jì) ? 2025-04-15 16:54 ? 次閱讀

CPU是計(jì)算機(jī)的核心部件,由運(yùn)算器、控制器、寄存器組和內(nèi)部總線等部分組成。常見(jiàn)的x86架構(gòu)CPU核心數(shù)相對(duì)較少,一般在8 - 32核左右,主要是為了解決復(fù)雜的邏輯運(yùn)算和順序執(zhí)行指令的任務(wù)。它在處理單線程任務(wù)時(shí)效率很高,能夠快速執(zhí)行復(fù)雜的指令集,例如進(jìn)行數(shù)學(xué)計(jì)算、程序的流程控制等操作。

GPU最初是為了圖形渲染而設(shè)計(jì)的,其架構(gòu)與CPU有很大不同,采用了大規(guī)模并行架構(gòu)。以英偉達(dá)的CUDA架構(gòu)為例,它擁有成千上萬(wàn)個(gè)CUDA核心,這些核心可以同時(shí)處理多個(gè)任務(wù)。例如,在深度學(xué)習(xí)中,GPU可以加速神經(jīng)網(wǎng)絡(luò)的訓(xùn)練過(guò)程,因?yàn)樯窠?jīng)網(wǎng)絡(luò)的訓(xùn)練涉及大量的矩陣運(yùn)算,這些運(yùn)算可以并行處理,GPU的并行架構(gòu)能夠大大縮短訓(xùn)練時(shí)間。近兩年,GPU也成為EDA(電子設(shè)計(jì)自動(dòng)化)加速的技術(shù)熱點(diǎn)。

在數(shù)字SoC芯片的設(shè)計(jì)和實(shí)現(xiàn)中,為了達(dá)到功能、性能、功耗和面積目標(biāo),芯片設(shè)計(jì)者通常需要進(jìn)行多輪次的迭代和優(yōu)化。數(shù)字后端實(shí)現(xiàn)環(huán)節(jié)由于涉及的數(shù)據(jù)規(guī)模龐大且迭代次數(shù)多,基于CPU的計(jì)算耗時(shí)相當(dāng)長(zhǎng)。一般來(lái)說(shuō),一個(gè)后端設(shè)計(jì)大概需要半年左右的時(shí)間,以一個(gè)10M Instance規(guī)模的模塊設(shè)計(jì)為例,基于常見(jiàn)的x86_64架構(gòu)、16核×128CPU、2.8G主頻的服務(wù)器運(yùn)行數(shù)字后端各項(xiàng)任務(wù),每輪時(shí)長(zhǎng)大約為:布局(Place)75小時(shí)、時(shí)鐘樹綜合(CTS)45小時(shí)、時(shí)鐘優(yōu)化(CTSopt)45小時(shí)、布線(Route)35小時(shí)、布線優(yōu)化(RouteOpt)60小時(shí)。如果能夠有效利用GPU的并行計(jì)算能力,將對(duì)芯片設(shè)計(jì)的加速非常有幫助。

芯行紀(jì)自主研發(fā)的新一代數(shù)字實(shí)現(xiàn)解決方案,通過(guò)適配GPU的環(huán)境,使用GPU為自研布局布線軟件AmazeSys進(jìn)行了加速,并且獲得了可觀的加速效果。以下是一個(gè)基于1.35M Instance設(shè)計(jì)的GPU加速實(shí)例,運(yùn)行方案如下:

僅使用CPU,啟用31個(gè)CPU線程

使用CPU和GPU,啟用31個(gè)CPU線程和1個(gè)GPU (3584 CUDA cores)

a5369560-190a-11f0-9310-92fbcf53809c.png

圖1:機(jī)器配置

從圖2可以看到,通過(guò)啟用1個(gè)GPU,placement各個(gè)主要階段得到了5到20倍不等的加速比。

a5461c74-190a-11f0-9310-92fbcf53809c.png

圖2:Placement過(guò)程中的加速比

從圖3可以看到,使用兩種方案的wire length基本持平, GPU加速時(shí)雖然overflow略有增加,但總體獲得了9.1倍加速的效果。并且,當(dāng)GPU數(shù)量增加、性能增強(qiáng),加速比也將會(huì)繼續(xù)增大。

a54ff0f0-190a-11f0-9310-92fbcf53809c.png

圖3:使用GPU加速的結(jié)果

數(shù)字布局布線涉及的串行計(jì)算相對(duì)較多,但每一個(gè)環(huán)節(jié)只要能夠有并行的可能的情況下,提前考慮算法以及GPU環(huán)境的匹配,是能夠?qū)崿F(xiàn)加速可能性的。GPU加速對(duì)數(shù)字電路的后端設(shè)計(jì)而言,屬于EDA工具研發(fā)中的新挑戰(zhàn)。芯行紀(jì)AmazeSys數(shù)字布局布線軟件適配GPU硬件加速技術(shù),為設(shè)計(jì)者縮短設(shè)計(jì)周期、加速設(shè)計(jì)創(chuàng)新提供了新的途徑。

關(guān)于芯行紀(jì)

芯行紀(jì)科技有限公司匯聚EDA研發(fā)和技術(shù)支持精英,主營(yíng)研發(fā)符合3S理念(Smart、Speedy、Simple)、包含新一代布局布線技術(shù)的數(shù)字實(shí)現(xiàn)EDA平臺(tái),并提供高端數(shù)字芯片設(shè)計(jì)解決方案,助力提升芯片設(shè)計(jì)效率,以科技創(chuàng)新推動(dòng)發(fā)展新質(zhì)生產(chǎn)力。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 控制器
    +關(guān)注

    關(guān)注

    114

    文章

    16838

    瀏覽量

    182248
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    4882

    瀏覽量

    130389
  • 計(jì)算機(jī)
    +關(guān)注

    關(guān)注

    19

    文章

    7607

    瀏覽量

    89821
  • eda
    eda
    +關(guān)注

    關(guān)注

    71

    文章

    2852

    瀏覽量

    175749

原文標(biāo)題:GPU硬件加速在數(shù)字實(shí)現(xiàn)EDA中的應(yīng)用

文章出處:【微信號(hào):gh_2894c3fc5359,微信公眾號(hào):芯行紀(jì)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    《CST Studio Suite 2024 GPU加速計(jì)算指南》

    許可證模型的加速令牌或SIMULIA統(tǒng)一許可證模型的SimUnit令牌或積分授權(quán)。 4. GPU計(jì)算的啟用 - 交互式模擬:通過(guò)加速對(duì)話框啟用,打開(kāi)求解器對(duì)話框,點(diǎn)擊“加速”按鈕,打
    發(fā)表于 12-16 14:25

    GPU加速XenApp/Windows 2016/Office/IE性能會(huì)提高嗎

    Shark來(lái)查看哪些程序/進(jìn)程使用GPU(硬件加速)。它看起來(lái)不像Internet Explorer 11或Office 2016根本不使用GPU。我已經(jīng)驗(yàn)證IE和Office都啟用了硬件
    發(fā)表于 09-12 16:24

    可與NvFBC一起使用的GPU

    我想在一個(gè)項(xiàng)目中使用NvFBC,但我不清楚究竟支持哪些GPU。我們可能會(huì)在生產(chǎn)中使用Quadro M4000,但我的開(kāi)發(fā)機(jī)器中有一臺(tái)GTX 980,我無(wú)法使用它(NvFBC_CreateEx在
    發(fā)表于 09-25 15:04

    GPU加速matlab程序

    最近遇到了一個(gè)加速matlab程序的問(wèn)題,不知道如何利用GPU,以及使用GPU的先決條件,是不是GPU加速必須要用cuda,最重要的是只用G
    發(fā)表于 03-30 11:21

    tengine是如何使用arm的GPU進(jìn)行加速

    【嵌入式AI】多目標(biāo)分類檢測(cè)系統(tǒng)實(shí)戰(zhàn)中,tengine是如何使用arm的GPU進(jìn)行加速的,這個(gè)原理能詳細(xì)說(shuō)明一下嗎?
    發(fā)表于 09-02 14:18

    Javascript如何實(shí)現(xiàn)GPU加速?

    由 Demi 于 星期四, 2018-09-06 16:10 發(fā)表 一、什么是Javascript實(shí)現(xiàn)GPU加速? CPU與GPU設(shè)計(jì)目標(biāo)不同,導(dǎo)致它們之間內(nèi)部結(jié)構(gòu)差異很大。 CPU需要應(yīng)對(duì)通用
    發(fā)表于 09-06 20:21 ?749次閱讀

    算法 | 超Mask RCNN速度4倍,僅在單個(gè)GPU訓(xùn)練的實(shí)時(shí)實(shí)例分割算法

    YOLACT——Real-time Instance Segmentation提出了一種簡(jiǎn)潔的實(shí)時(shí)實(shí)例分割全卷積模型,速度明顯優(yōu)于以往已有的算法,而且就是在一個(gè) GPU 上訓(xùn)練取得的!
    的頭像 發(fā)表于 06-11 10:34 ?7496次閱讀

    首個(gè)采用NVIDIA M2050 GPU實(shí)例 開(kāi)啟GPU云計(jì)算下個(gè)十年

    十年前,AWS(Amazon Web Services)發(fā)布了首個(gè)采用 NVIDIA M2050 GPU實(shí)例。當(dāng)時(shí),基于 CUDA 的應(yīng)用主要專注于加速科學(xué)模擬,AI 和深度學(xué)習(xí)還
    的頭像 發(fā)表于 02-24 12:08 ?1992次閱讀

    使用GPU加速RELION進(jìn)行生物結(jié)構(gòu)解析

    NVIDIA 與智東西公開(kāi)課共同策劃推出「GPU 加速高性能計(jì)算(HPC)經(jīng)典應(yīng)用在線研討會(huì)」。研討會(huì)將聚焦經(jīng)典高性能計(jì)算和科學(xué)計(jì)算應(yīng)用,以及如何在 GPU 平臺(tái)更好的加速這些應(yīng)用。
    的頭像 發(fā)表于 06-22 10:06 ?1799次閱讀

    OrCAD Capture CIS instance和occurrences概念解析

    Capture CIS 中兩個(gè)重要概念:instance 和 occurrences 用 OrCAD 設(shè)計(jì)原理圖必須理解兩個(gè)概念 instance 和 occurrences。對(duì)于元件放置、替換、修改屬性等很多操作都和這兩個(gè)概念有關(guān)。
    的頭像 發(fā)表于 10-11 11:01 ?1.3w次閱讀
    OrCAD Capture CIS <b class='flag-5'>instance</b>和occurrences概念解析

    Oracle 云基礎(chǔ)設(shè)施提供新的 NVIDIA GPU 加速計(jì)算實(shí)例

    也即將在 OCI Compute 上推出。 OCI 上的 NVIDIA? H100 Tensor Core GPU 實(shí)例 OCI Co mpute 裸機(jī)實(shí)例配備了具有? NVIDIA Hopper ? 架構(gòu) 的 NVIDIA
    的頭像 發(fā)表于 09-25 20:40 ?713次閱讀
    Oracle 云基礎(chǔ)設(shè)施提供新的 NVIDIA <b class='flag-5'>GPU</b> <b class='flag-5'>加速</b>計(jì)算<b class='flag-5'>實(shí)例</b>

    GPU虛擬化技術(shù)MIG簡(jiǎn)介和安裝使用教程

    使用多實(shí)例GPU (MIG/Multi-Instance GPU)可以將強(qiáng)大的顯卡分成更小的部分,每個(gè)部分都有自己的工作,這樣單張顯卡可以同時(shí)運(yùn)行不同的任務(wù)。本文將對(duì)其進(jìn)行簡(jiǎn)單介紹并且
    的頭像 發(fā)表于 10-11 14:42 ?1174次閱讀
    <b class='flag-5'>GPU</b>虛擬化技術(shù)MIG簡(jiǎn)介和安裝使用教程

    instance是何時(shí)翻轉(zhuǎn)的?每次有多少instance在翻轉(zhuǎn)?

    在run dynamic vectorless IR時(shí),instance是何時(shí)翻轉(zhuǎn)的?每次有多少instance在翻轉(zhuǎn)?
    的頭像 發(fā)表于 01-26 09:31 ?729次閱讀
    <b class='flag-5'>instance</b>是何時(shí)翻轉(zhuǎn)的?每次有多少<b class='flag-5'>instance</b>在翻轉(zhuǎn)?

    GPU加速計(jì)算平臺(tái)是什么

    GPU加速計(jì)算平臺(tái),簡(jiǎn)而言之,是利用圖形處理器(GPU)的強(qiáng)大并行計(jì)算能力來(lái)加速科學(xué)計(jì)算、數(shù)據(jù)分析、機(jī)器學(xué)習(xí)等復(fù)雜計(jì)算任務(wù)的軟硬件結(jié)合系統(tǒng)。
    的頭像 發(fā)表于 10-25 09:23 ?456次閱讀

    GPU加速云服務(wù)器怎么用的

    GPU加速云服務(wù)器是將GPU硬件與云計(jì)算服務(wù)相結(jié)合,通過(guò)云服務(wù)提供商的平臺(tái),用戶可以根據(jù)需求靈活租用帶有GPU資源的虛擬機(jī)實(shí)例。那么,
    的頭像 發(fā)表于 12-26 11:58 ?304次閱讀