與中央處理單元 (CPU) 相比,圖形處理單元 (GPU) 更適合以更高分辨率和更快的幀速率形成圖像,因為 GPU 具有數(shù)百個可以并行處理數(shù)千個數(shù)據(jù)集的計算單元。并行數(shù)據(jù)結(jié)構(gòu)和高線程數(shù)使 GPU 本質(zhì)上更適合需要大量計算功能的應(yīng)用,例如醫(yī)學(xué)成像和視頻游戲,例如并發(fā)可視化和交互式分割。
容納 CPU 和 GPU 的多核處理器設(shè)計已經(jīng)存在多年。事實上,幾乎每臺筆記本電腦、智能手機和平板電腦現(xiàn)在都擁有多核處理器、集成 GPU 和許多其他加速器,用于音頻、網(wǎng)絡(luò)和其他功能。然而,在這些多核處理器設(shè)計中,GPU 通常不直接訪問應(yīng)用程序內(nèi)存,因此充當 CPU 的從屬設(shè)備。
幾年前,AMD 引入了加速處理器單元 (APU) 的概念,該單元為處理器內(nèi)部的 CPU 和 GPU 結(jié)合了高速緩存一致性內(nèi)存。將兩個處理單元組合在同一條總線上以提高處理器吞吐量的想法最終導(dǎo)致了2012 年異構(gòu)系統(tǒng)架構(gòu) (HSA) 基金會的創(chuàng)建。
HSA 中的一組標準和規(guī)范促進了 CPU、GPU 和其他加速器的公共總線和共享內(nèi)存,以使這些截然不同的架構(gòu)協(xié)同工作。AMD、ARM、聯(lián)發(fā)科和德州儀器等行業(yè)領(lǐng)導(dǎo)者參與了這項工作,這標志著現(xiàn)有多核處理器設(shè)計方法的重大突破。
1. HSA 將現(xiàn)有的異構(gòu)計算提升到一個新的水平。
首先,HSA 1.0 旨在通過自動將計算從 CPU 卸載到 GPU 來釋放 GPU 在嵌入式計算中的潛力,反之亦然。通過使軟件能夠以更低的延遲和顯著降低的開銷有效地將任務(wù)分配給 GPU,HSA 允許 GPU 任務(wù)通過共享虛擬內(nèi)存功能 (SVM) 直接安全地訪問系統(tǒng)內(nèi)存中的數(shù)據(jù),并在應(yīng)用程序進程中遍歷數(shù)據(jù)結(jié)構(gòu)內(nèi)存(ptr-is-ptr)。現(xiàn)在,這一切都可以完成,而無需像以前在傳統(tǒng) GPU 計算 API 中所要求的那樣提供數(shù)據(jù)緩沖區(qū)的主機 CPU 配置。
即將發(fā)布的 HSA 標準將數(shù)字信號處理器 (DSP) 集成到架構(gòu)中,并提高了與系統(tǒng)中非 HSA 啟用的可編程和固定功能加速器的高效互操作性。
接下來,雖然 HSA 是OpenCL等通用 GPU (GPGPU) API 的重要基礎(chǔ),但憑借其細粒度和粗粒度共享虛擬內(nèi)存功能,許多高級語言已被移植和優(yōu)化為原生目標 HSA 平臺,包括 C++ 17、GCC、LLVM/CLANG 和 Python。優(yōu)化 CAFFE、BLAS、CHARM++、FFT、Sparse、FLAME 和 Docker 等軟件框架的工作也在進行中,以使開發(fā)人員更容易直接高效地編程和使用異構(gòu)并行設(shè)備。
這些異構(gòu)計算環(huán)境創(chuàng)造的這種新的處理器效率水平正在重振醫(yī)療和打印成像等行業(yè)。直到最近,需要圖像配準、圖像分割和圖像去噪等計算密集型工作的醫(yī)學(xué)成像產(chǎn)品在很大程度上以犧牲圖像質(zhì)量為代價來犧牲幀速率。
HSA 以其創(chuàng)新的機制為不同的處理核心分配不同的負載,從而實現(xiàn)具有強大可視化和圖像保真度的高效計算?,F(xiàn)在有大量資源可用于幫助開發(fā)人員調(diào)整或創(chuàng)建新應(yīng)用程序以利用異構(gòu)架構(gòu)。其中包括 HSA Foundation GitHub 存儲庫和Radeon 開放計算解決方案 GitHub。后者將 HSA 編程模型擴展到高性能離散 GPU,并包括CodeXL 2.0 中提供的強大的開源調(diào)試和分析工具。
計算密集型醫(yī)療領(lǐng)域可以受益于 GPU 加速,以增強特定于 MRI、PET、超聲和顯微鏡等應(yīng)用的算法的執(zhí)行。
2. GPU 加速提供卓越的速度,可有效滿足醫(yī)學(xué)成像獨特的數(shù)據(jù)吞吐量和后處理需求。
具體來說,教程是異構(gòu)系統(tǒng)架構(gòu)——下一代異構(gòu)計算的基礎(chǔ),以及醫(yī)療和打印成像中的 GPU 計算,而小組的主題是異構(gòu)系統(tǒng)架構(gòu):未來的功率、性能和編程。
-
處理器
+關(guān)注
關(guān)注
68文章
19896瀏覽量
235326 -
gpu
+關(guān)注
關(guān)注
28文章
4949瀏覽量
131271 -
API
+關(guān)注
關(guān)注
2文章
1620瀏覽量
64061
發(fā)布評論請先 登錄
聚徽智控——從嵌入式到邊緣計算:平板工控電腦的技術(shù)進化論
嵌入式開發(fā)入門指南:從零開始學(xué)習(xí)嵌入式
嵌入式適合自學(xué)嗎?
嵌入式主板的概述與發(fā)展

飛凌嵌入式獲批建設(shè)「河北省嵌入式計算機控制系統(tǒng)技術(shù)創(chuàng)新中心」

新手怎么學(xué)嵌入式?
什么是嵌入式人工智能

嵌入式系統(tǒng)開發(fā)與硬件的關(guān)系 嵌入式系統(tǒng)開發(fā)常見問題解決
嵌入式系統(tǒng)與物聯(lián)網(wǎng)的結(jié)合
什么是嵌入式?一文讀懂嵌入式主板
AMD 面向嵌入式系統(tǒng)推出高能效 EPYC 嵌入式 8004 系列
ARMxy嵌入式計算機在機器視覺中的卓越表現(xiàn)

評論