一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

關于深度學習硬件加速器的介紹和應用

西門子EDA ? 來源:djl ? 2019-10-11 14:59 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

Chips&Media 成功采用 Mentor Catapult High-Level Synthesis (HLS) 平臺實現了首個計算機視覺 IP;

Chips&Media 通過 Catapult HLS 將模塊設計/驗證時間縮短了一半,并實現了關鍵的現場可編程門陣列 (FPGA) 演示系統;

Catapult HLS 方法論使探索多種架構并為深度神經網絡加速器尋找最佳實現方案成為了可能。

Mentor, A Siemens Business 宣布 Chips&Media 已成功部署 Mentor Catapult HLS 平臺,將使用深度神經網絡 (DNN) 算法設計和驗證其 c.WAVE 計算機視覺 IP 的實時對象檢測。Chips&Media 是一家面向片上系統 (SoC) 設計高性能、高質量視頻 IP 的領先供應商,其產品廣泛應用于汽車、監(jiān)控和消費電子領域。

Chips&Media 需要通過減少功能驗證時間、時序收斂、自定義和最終優(yōu)化來大幅提高生產力,把更多時間用于機器算法和架構的研發(fā)上,從而為客戶快速提供差異化的機器學習 IP。為實現這些目標,他們棄用了傳統的手工編碼寄存器傳輸級 (RTL) 流程,轉而采用 Catapult HLS 平臺,以使用 C 語言編寫算法和驗證平臺。與同一項目中使用 RTL 流程的團隊相比,HLS 設計和驗證團隊將項目時間縮短了一半。

“要應對以推理為目標的設備帶來的加速挑戰(zhàn),我們認為關鍵在于使用深度神經網絡建立一個專注于功耗、性能和面積 (PPA) 并高度優(yōu)化的硬件架構,”Chips&Media 首席技術官 Mickey Jeon 表示。“HLS 使我們能夠極其高效地完成這項工作。我們的項目取得了突出的成績,我們計劃在接下來的項目中部署應用 Catapult 的 HLS 流程?!?/p>

基于 DNN 的計算機視覺處理的特征,就是乘法/加法/累加的重復計算,同時通過神經網絡層進行大量數據遷移。DNN 是在 Caffe 或 TensorFlow 等框架上開發(fā)的,然后在 C 模型中捕獲其算法。Chips&Media 將此算法 C 模型改進為可綜合的 C 代碼,并使用 Catapult HLS 平臺快速探索各種架構并綜合到 RTL 中,以找到此類設計的最佳解決方案。

“根據我們的觀察,在市場快速變化的多個應用領域,采用 Catapult HLS 是提高生產力來獲得成功的唯一途徑,”Mentor 數字設計和實施解決方案總經理 Badru Agarwala 表示?!拔覀円恢迸c Chips&Media 密切合作,以確保他們平穩(wěn)過渡到 HLS。該平臺可以讓他們專注于算法/架構設計,而不是底層實現和調試等細節(jié),從而更快地把想法變成產品,然后推向市場?!?/p>

借助 Catapult HLS 平臺,設計人員便能利用行業(yè)標準 ANSI C++ 和 SystemC 來描述功能意圖,并將其提高到生產率更高的抽象層次。根據這些高層次的描述,Catapult 即可快速生成產品級的 RTL。Catapult 平臺將綜合與形式 C 屬性檢查功能相結合,以便及早發(fā)現 C++/SystemC 級別的錯誤并在綜合之前全面驗證源代碼。高度交互的 Catapult 工作流程可提供對綜合過程的完全可見性和控制,使設計人員能夠迅速收斂到 PPA 的最佳實現方案。此外,Catapult 的高級功耗優(yōu)化功能也可以自動大幅降低動態(tài)功耗。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯系本站處理。 舉報投訴
  • 計算機視覺
    +關注

    關注

    9

    文章

    1708

    瀏覽量

    46760
  • 深度學習
    +關注

    關注

    73

    文章

    5560

    瀏覽量

    122769
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    大模型推理顯存和計算量估計方法研究

    GPU、FPGA等硬件加速。通過分析硬件加速器的性能參數,可以估算模型在硬件加速下的計算量。 四、實驗與分析 為了驗證上述估計方法的有效性,我們選取了幾個具有代表性的深度
    發(fā)表于 07-03 19:43

    粒子加速器?——?科技前沿的核心裝置

    粒子加速器全稱“荷電粒子加速器”,是一種利用電磁場在高真空環(huán)境中對帶電粒子(如電子、質子、離子)進行加速和控制,使其獲得高能量的特種裝置。粒子加速器技術現已發(fā)展成為集高能物理、核物理、
    的頭像 發(fā)表于 06-19 12:05 ?419次閱讀
    粒子<b class='flag-5'>加速器</b>?——?科技前沿的核心裝置

    TPU處理的特性和工作原理

    張量處理單元(TPU,Tensor Processing Unit)是一種專門為深度學習應用設計的硬件加速器。它的開發(fā)源于對人工智能(AI)和機器學習應用的需求,尤其是
    的頭像 發(fā)表于 04-22 09:41 ?1438次閱讀
    TPU處理<b class='flag-5'>器</b>的特性和工作原理

    數據中心中的FPGA硬件加速器

    ? 再來看一篇FPGA的綜述,我們都知道微軟包括國內的云廠商其實都在數據中心的服務中部署了FPGA,所以這篇論文就以數據中心的視角,來看下FPGA這個硬件加速器。 還是一樣,想要論文原文的可以私信
    的頭像 發(fā)表于 01-14 10:29 ?643次閱讀
    數據中心中的FPGA<b class='flag-5'>硬件加速器</b>

    從版本控制到全流程支持:揭秘Helix Core如何成為您的創(chuàng)意加速器

    加速器
    龍智DevSecOps
    發(fā)布于 :2024年11月26日 13:42:47

    NPU在深度學習中的應用

    設計的硬件加速器,它在深度學習中的應用日益廣泛。 1. NPU的基本概念 NPU是一種專門針對深度學習算法優(yōu)化的處理
    的頭像 發(fā)表于 11-14 15:17 ?1893次閱讀

    基于Xilinx XCKU115的半高PCIe x8 硬件加速

    基于Xilinx XCKU115的半高PCIe x8 硬件加速卡,支持2x72bit(數據位寬64bit+ECC)DDR4存儲,數據傳輸速率 2400Mb/s。DDR4單簇容量4GB,兩組總容量為8GB
    的頭像 發(fā)表于 11-14 11:30 ?784次閱讀
    基于Xilinx XCKU115的半高PCIe x8 <b class='flag-5'>硬件加速</b>卡

    GPU深度學習應用案例

    GPU在深度學習中的應用廣泛且重要,以下是一些GPU深度學習應用案例: 一、圖像識別 圖像識別是深度學習
    的頭像 發(fā)表于 10-27 11:13 ?1330次閱讀

    FPGA加速深度學習模型的案例

    FPGA(現場可編程門陣列)加速深度學習模型是當前硬件加速領域的一個熱門研究方向。以下是一些FPGA加速
    的頭像 發(fā)表于 10-25 09:22 ?1203次閱讀

    深度學習GPU加速效果如何

    圖形處理(GPU)憑借其強大的并行計算能力,成為加速深度學習任務的理想選擇。
    的頭像 發(fā)表于 10-17 10:07 ?604次閱讀

    RISC-V跑AI算法能加速嗎?

    現在好多ARM單片機都帶機器學習加速,RISC-V有這方面的硬件加速嗎?
    發(fā)表于 10-10 22:14

    TDA4VM上的硬件加速運動恢復結構算法

    電子發(fā)燒友網站提供《TDA4VM上的硬件加速運動恢復結構算法.pdf》資料免費下載
    發(fā)表于 09-24 11:39 ?0次下載
    TDA4VM上的<b class='flag-5'>硬件加速</b>運動恢復結構算法

    AM62A SoC通過硬件加速視覺處理改進條形碼讀取

    電子發(fā)燒友網站提供《AM62A SoC通過硬件加速視覺處理改進條形碼讀取.pdf》資料免費下載
    發(fā)表于 09-04 09:52 ?0次下載
    AM62A SoC通過<b class='flag-5'>硬件加速</b>視覺處理改進條形碼讀取<b class='flag-5'>器</b>

    適用于數據中心應用中的硬件加速器的直流/直流轉換解決方案

    電子發(fā)燒友網站提供《適用于數據中心應用中的硬件加速器的直流/直流轉換解決方案.pdf》資料免費下載
    發(fā)表于 08-26 09:38 ?0次下載
    適用于數據中心應用中的<b class='flag-5'>硬件加速器</b>的直流/直流轉換<b class='flag-5'>器</b>解決方案

    圖形圖像硬件加速器卡設計原理圖:270-VC709E 基于FMC接口的Virtex7 XC7VX690T PCIeX8 接口卡

    擴展。軟件支持windows,Linux操作系統。Net FPGA , XC7VX690T板卡 , 軟件無線電處理平臺 , 圖形圖像硬件加速器
    的頭像 發(fā)表于 08-06 10:16 ?947次閱讀
    圖形圖像<b class='flag-5'>硬件加速器</b>卡設計原理圖:270-VC709E 基于FMC接口的Virtex7 XC7VX690T PCIeX8 接口卡