一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

實現(xiàn)異構(gòu)多核十倍嵌入式內(nèi)存性能的三種方法

星星科技指導(dǎo)員 ? 來源:嵌入式計算設(shè)計 ? 作者:Brandon Lewis ? 2022-10-24 15:50 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

從理論上講,異構(gòu)多核設(shè)備可以配備針對給定用例可以拋出的任何類型的操作而優(yōu)化的計算塊。用于視頻處理的 GPU、用于對象識別的神經(jīng)網(wǎng)絡(luò)處理器、運行操作系統(tǒng)CPU 等。與同一級別的同類處理器相比,不同的適合用途的內(nèi)核為 SoC 提供了更大的靈活性,因此在更廣泛的工作負載范圍內(nèi)具有更高的性能和更低的功耗。

但是,當(dāng)您開始考慮基于邊緣的AI,計算機視覺等應(yīng)用程序的要求時,事實是I / O和內(nèi)存變得與原始處理性能一樣嚴格,如果不是更多的話。

“內(nèi)存速度只會上升得這么快,對吧?”,英偉達副總裁兼嵌入式與邊緣計算總經(jīng)理Deepu Talla說?!八鼪]有呈指數(shù)級增長。由于大小的原因,位寬大致相同:它是16位,32位,64位,128位,等等。大多數(shù)嵌入式處理器通常具有32位甚至16位接口,這也是由于成本和尺寸的原因。

“記憶的速度每一代只增長2倍,這通常每三年發(fā)生一次,”他繼續(xù)說道?!暗牵琒oC中的計算要求可能增加了10倍或20倍。

您如何協(xié)調(diào)計算性能的不成比例的提高與內(nèi)存技術(shù)相對較小的進步?特別是隨著處理器演變成獨特的邏輯集合,這些邏輯集合都需要自己訪問內(nèi)存等資源。

根據(jù)塔拉的說法,你把它給他們。以下是嵌入式存儲器架構(gòu)為滿足下一代異構(gòu)多核處理器的需求而不斷發(fā)展的三種方式。

#1.特定于內(nèi)核的靜態(tài)存儲器

“如果你看看很多這樣的嵌入式處理器,它們過去一直都有SRAM,”Talla說?!艾F(xiàn)在,對于每個特定的單元,我們有本地SRAM,它從DRAM獲取數(shù)據(jù),將其存儲在本地并進行處理,然后發(fā)回最終輸出。

特定于內(nèi)核的SRAM具有一些優(yōu)勢,首先是無需將臨時數(shù)據(jù)寫回片外DRAM所帶來的內(nèi)存性能提升。

這種架構(gòu)還具有降低功耗的額外好處,因為極低電壓的SRAM模塊位于SoC中相應(yīng)的邏輯IP附近或附近。

“如果你去DRAM,那可能是一個數(shù)量級的功率,所以你實際上通過使用這些技術(shù)來節(jié)省功率,”Talla解釋說。

#2.增加系統(tǒng)內(nèi)存

如今,嵌入式處理器具有多達 4 MB 至 8 MB 的系統(tǒng)內(nèi)存。此系統(tǒng)內(nèi)存不專用于任何一個特定內(nèi)核,并且可以在 CPU、GPU 和加速器等元素之間共享。

與專用SRAM類似,更多共享系統(tǒng)內(nèi)存的主要好處是更少的DRAM訪問。例如,傳統(tǒng)的視頻編碼序列如下所示:

數(shù)字內(nèi)存 -》 視頻編碼器 -》 數(shù)字內(nèi)存 -》 附加計算 -》 DRAM

增加的系統(tǒng)緩存可實現(xiàn)以下功能:

DRAM -》 視頻編碼器 -》 系統(tǒng)內(nèi)存 -》 附加計算 -》 DRAM

如前所述,不同之處在于單獨的內(nèi)核不必不斷從片外DRAM獲取數(shù)據(jù),因為大型系統(tǒng)內(nèi)存消除了對中間步驟的需求。

#3.增加的緩存大小

最后,隨著較新的處理技術(shù)使更高容量的內(nèi)存更實惠,緩存大小將不可避免地增加。在異構(gòu) SoC 上為 CPU、GPU、DSP 和其他核心架構(gòu)提供更大的緩存也將減少 DRAM 流量。

將增加的緩存大小與前兩項改進相結(jié)合,開始產(chǎn)生一些重大收益。

Talla指出:“更多的SRAM,通用的系統(tǒng)內(nèi)存,以及更多的高容量緩存,可以讓你在未來三到五年內(nèi)將性能提高10倍到100倍,即使內(nèi)存帶寬可能只增加了一倍或四倍。

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 處理器
    +關(guān)注

    關(guān)注

    68

    文章

    19896

    瀏覽量

    235348
  • 嵌入式
    +關(guān)注

    關(guān)注

    5152

    文章

    19676

    瀏覽量

    317699
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    4949

    瀏覽量

    131278
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    Linux嵌入式和單片機嵌入式的區(qū)別?

    Linux嵌入式與單片機嵌入式在多個方面存在顯著的區(qū)別,以下是詳細的比較和歸納: 一、基本概念 1. Linux嵌入式: 定義:將Linux操作系統(tǒng)運行在嵌入式設(shè)備上的一
    發(fā)表于 06-20 09:46

    精選好文!噪聲系數(shù)測量的三種方法

    本文介紹了測量噪聲系數(shù)的三種方法:增益法、Y系數(shù)法和噪聲系數(shù)測試儀法。這三種方法的比較以表格的形式給出。 在無線通信系統(tǒng)中,噪聲系數(shù)(NF)或者相對應(yīng)的噪聲因數(shù)(F)定義了噪聲性能和對接
    發(fā)表于 05-07 10:18

    Linux系統(tǒng)中通過預(yù)留物理內(nèi)存實現(xiàn)ARM與FPGA高效通信的方法

    嵌入式系統(tǒng)開發(fā)中,ARM 和 FPGA 之間的通信可以使用 ARM 側(cè)的 DDR 作為通道。由于 FPGA 也可以直接訪問到 ARM 側(cè) DDR,但 DDR 作為共享通信時,就不能被操作系統(tǒng)的內(nèi)存
    的頭像 發(fā)表于 04-16 13:42 ?687次閱讀
    Linux系統(tǒng)中通過預(yù)留物理<b class='flag-5'>內(nèi)存</b><b class='flag-5'>實現(xiàn)</b>ARM與FPGA高效通信的<b class='flag-5'>方法</b>

    如何提高嵌入式代碼質(zhì)量?

    嵌入式系統(tǒng)的發(fā)展已經(jīng)深刻地影響了我們?nèi)粘I畹姆椒矫婷?,從智能家居到汽車控制系統(tǒng),再到醫(yī)療設(shè)備和工業(yè)自動化等領(lǐng)域,嵌入式系統(tǒng)無處不在。嵌入式軟件的質(zhì)量直接關(guān)系到系統(tǒng)的安全性、穩(wěn)定性和性能
    發(fā)表于 01-15 10:48

    什么是嵌入式人工智能

    嵌入式人工智能的目標是使嵌入式系統(tǒng)具備智能化的感知、分析和響應(yīng)能力,從而實現(xiàn)自主決策、自適應(yīng)學(xué)習(xí)和智能交互等功能,以提高系統(tǒng)的性能、效率和用戶體驗.
    的頭像 發(fā)表于 12-11 09:23 ?1011次閱讀
    什么是<b class='flag-5'>嵌入式</b>人工智能

    三種常見平方根算法的電路設(shè)計及Verilog實現(xiàn)與仿真

    、圖形顯示等領(lǐng)域具有重要的地位,所以如何在硬件上實現(xiàn)該運算可以提高計算單元的性能,加快計算速度。 本文實現(xiàn)的算法包括二分迭代法、牛頓迭代法、逐次逼近法,前兩種方法來源于數(shù)值計算
    的頭像 發(fā)表于 11-26 10:12 ?1410次閱讀
    <b class='flag-5'>三種</b>常見平方根算法的電路設(shè)計及Verilog<b class='flag-5'>實現(xiàn)</b>與仿真

    基于全志T113-i多核異構(gòu)處理器的全國產(chǎn)嵌入式核心板簡介

    嵌入式核心板。ECK30系列核心板可廣泛應(yīng)用于工業(yè)控制、HMI、IoT等領(lǐng)域。 全志公司的T113-i處理器是由雙核ARM Cortex-A7、RISC-V和HiFi4 DSP三種異構(gòu)處理器所組成,能夠為用戶提供高效的計算能力。
    的頭像 發(fā)表于 10-25 13:40 ?1070次閱讀

    S32K1xx EEE如何使用內(nèi)存

    通常有三種方法實現(xiàn) EEPROM功能。
    的頭像 發(fā)表于 10-25 11:49 ?1252次閱讀
    S32K1xx EEE如何使用<b class='flag-5'>內(nèi)存</b>

    【「嵌入式Hypervisor:架構(gòu)、原理與應(yīng)用」閱讀體驗】+ 了解Hypervisor

    個字,由于近些年一直從事嵌入式產(chǎn)品開發(fā),因此才主動申請測評,幸運選中,甚感榮幸。今天才開始研讀,主要想知道這個Hypervisor是什么,和嵌入式有什么關(guān)系,能開發(fā)什么產(chǎn)品。 先看一下封面和目錄結(jié)構(gòu)
    發(fā)表于 10-13 16:47

    Windows管理內(nèi)存三種主要方式

    Windows操作系統(tǒng)提供了多種方式來管理內(nèi)存,以確保系統(tǒng)資源的有效利用和性能的優(yōu)化。以下是關(guān)于Windows管理內(nèi)存三種主要方式的詳細闡述,包括堆
    的頭像 發(fā)表于 10-12 17:09 ?2393次閱讀

    【「嵌入式Hypervisor:架構(gòu)、原理與應(yīng)用」閱讀體驗】+第三四章閱讀報告

    在深入閱讀了《嵌入式Hypervisor:架構(gòu)、原理與應(yīng)用》的第、四章后,我對嵌入式Hypervisor的設(shè)計與實現(xiàn)技術(shù)有了更為詳盡和系統(tǒng)的理解。以下是我對這兩章內(nèi)容的閱讀報告:
    發(fā)表于 10-09 18:29

    嵌入式系統(tǒng)的未來趨勢有哪些?

    智能家居領(lǐng)域,嵌入式系統(tǒng)可以集成語音識別和自然語言處理技術(shù),去實現(xiàn)智能家電的語音控制。 2. 更強大的處理能力 在未來的嵌入式系統(tǒng)將具備更加強大的處理能力,以滿足日益變得復(fù)雜的計算需求。這包括采用
    發(fā)表于 09-12 15:42

    七大嵌入式GUI盤點

    MiniGUI-Standalone三種運行模式運行。它對中文的支持很友好,支持GB2312與BIG5字符集,其他字符集也可以輕松加入。 Qt for MCU 是一個專為嵌入式微控制器(MCU)設(shè)計的圖形框架和工具包,它
    發(fā)表于 09-02 10:58

    學(xué)習(xí)hypervisor嵌入式產(chǎn)品安全設(shè)計

    Hypervisor的設(shè)計與實現(xiàn),涵蓋嵌入式Hypervisor架構(gòu)與核心組件、中斷隔離技術(shù)、內(nèi)存隔離技術(shù)、循環(huán)表調(diào)度器、健康監(jiān)控、分區(qū)間通信技術(shù)、內(nèi)核資源管理模型、系統(tǒng)初始化過程、內(nèi)核服務(wù)
    發(fā)表于 08-25 09:11

    MCUXpresso IDE下在線聯(lián)合調(diào)試雙核MCU工程的三種方法

    大家好,我是痞子衡,是正經(jīng)搞技術(shù)的痞子。今天痞子衡給大家分享的是MCUXpresso IDE下在線聯(lián)合調(diào)試i.MXRT1170雙核工程的三種方法。
    的頭像 發(fā)表于 08-08 15:18 ?1369次閱讀
    MCUXpresso IDE下在線聯(lián)合調(diào)試雙核MCU工程的<b class='flag-5'>三種方法</b>