典型計(jì)算元素特性
現(xiàn)有的計(jì)算元素(或處理器)具有不同的特性,這影響它們處理效率。下圖顯示了不同計(jì)算元素的處理效率與應(yīng)用程序的處理特性(例如順序與并行)的關(guān)系圖。每個(gè)計(jì)算元素都有不同的特征來提高其效率和性能。這些特性從更通用到更特定的解決方案有所不同,由這些不同/可選的特征集定義。
現(xiàn)有處理器的計(jì)算特性
中央處理器(CPU)中央處理器是最流行的存儲(chǔ)程序架構(gòu)的處理器(計(jì)算元素)。程序被描述為一系列指令,所以通常每個(gè)指令會(huì)逐步執(zhí)行操作。由于這種逐步執(zhí)行,CPU通常適用于任何順序操作的組合。另一方面,基本CPU不適合并行操作。為了解決這個(gè)問題,今天的CPU具有幾個(gè)附加的可選功能。
?
單指令多數(shù)據(jù)(SIMD)/向量類型數(shù)據(jù)純CPU不適合數(shù)據(jù)并行,因?yàn)閮?nèi)部數(shù)據(jù)路徑帶寬限制。為了解決這個(gè)限制,一些CPU具有SIMD或向量擴(kuò)展,可以在一個(gè)指令或操作中處理多個(gè)(通常是4到16)數(shù)據(jù)流。此外,隨著長數(shù)據(jù)字交易和更大的寄存器文件,與外部資源(如內(nèi)存)的通信也將得到改善,但在處理大量內(nèi)容時(shí),仍會(huì)出現(xiàn)瓶頸。
? 多核
由于工藝技術(shù)趨勢,在合理的功耗下提高單個(gè)CPU的性能是困難的。多核是解決這個(gè)問題的一種方法。如果應(yīng)用程序具有多個(gè)(分離的)任務(wù),多核將發(fā)揮很好的作用,但是如果它具有緊密耦合的內(nèi)部通信,有時(shí)處理器間通信(IPC)將瓶頸操作。
DSP旨在加速算術(shù)操作(加法、減法、乘法、除法),例如乘積累加操作。
數(shù)據(jù)壓縮/解壓縮、數(shù)字濾波、控制、識(shí)別等都包括在內(nèi),這些算法大量使用乘積累加計(jì)算(MAC),這使得DSP能夠高速管理這些過程。
圖形處理單元通用計(jì)算(GPGPU)
GPGPU是一種將GPU的計(jì)算資源應(yīng)用于圖像處理之外目的的技術(shù)。圖形處理單元(GPU)具有成千上萬的算術(shù)核心(著色器單元),并通過并行重復(fù)簡單的數(shù)值計(jì)算來實(shí)現(xiàn)圖像處理的高速執(zhí)行。利用這一特性,可以以高速執(zhí)行類似圖像處理的處理,其中包括人工智能(AI),如機(jī)器學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)、虛擬貨幣挖礦、科技研究中的數(shù)值計(jì)算和模擬以及流體計(jì)算。
要利用GPGPU,需要不同于通用處理器的編程開發(fā)環(huán)境。為了充分利用它,需要適合該架構(gòu)的編程技術(shù),編程開發(fā)環(huán)境例如NVIDIA的“CUDA”(統(tǒng)一設(shè)備架構(gòu))、Microsoft的“Direct Compute”和Khronos Group的“OpenCL”等。
專用加速器(例如ISP, xNN)
專用加速器基于為特定應(yīng)用定制的體系結(jié)構(gòu)。例如,數(shù)據(jù)流和存儲(chǔ)器遵循專用方案。加速器甚至可以提供定制邏輯,形成高度專業(yè)化的計(jì)算元素。這種專門化極大地增加了計(jì)算效率和性能,但以犧牲通用性為代價(jià)。使用專用加速器可能需要專用和/或?qū)S芯幊?,甚至需要專用工具和框架?/p>
-
處理器
+關(guān)注
關(guān)注
68文章
19890瀏覽量
235119 -
汽車電子
+關(guān)注
關(guān)注
3037文章
8343瀏覽量
170138 -
存儲(chǔ)
+關(guān)注
關(guān)注
13文章
4531瀏覽量
87441 -
自動(dòng)駕駛
+關(guān)注
關(guān)注
789文章
14316瀏覽量
170596
發(fā)布評論請先 登錄
評論