60 多年來(lái)——從早期的大型計(jì)算機(jī)到 1980 年代的 PC 革命,再到今天智能移動(dòng)設(shè)備的爆炸式增長(zhǎng)——處理器技術(shù)一直在發(fā)展以滿足用戶的期望,有時(shí)會(huì)推動(dòng)計(jì)算行業(yè)的不可預(yù)見(jiàn)的創(chuàng)新。鑒于每天上市的新移動(dòng)設(shè)備的多樣性,處理器創(chuàng)新仍然是推動(dòng)變革的強(qiáng)大力量。
隨著主流移動(dòng)計(jì)算的出現(xiàn),處理器架構(gòu)已經(jīng)從傳統(tǒng)的由性能驅(qū)動(dòng)的桌面模型轉(zhuǎn)變,而不管所需的功率如何。需要全天甚至數(shù)天電池壽命的設(shè)備將需要更緊湊的能量包絡(luò),同時(shí)將處理器性能提升到新的水平。
一開始,性能為王
由微處理器驅(qū)動(dòng)的第一臺(tái)消費(fèi)類計(jì)算機(jī)是簡(jiǎn)單、耗電的固定設(shè)備,它們被拴在電源(普通墻上插座)上。這意味著微處理器的設(shè)計(jì)可以只考慮性能,這很快成為開發(fā)人員的“圣杯”。
早期的 PC 包含一個(gè)運(yùn)行單個(gè)應(yīng)用程序的單線程 CPU。很快,這些早期的 8 位微處理器發(fā)展到 16 位,到 1980 年代中期最終發(fā)展為 32 位處理。然后市場(chǎng)開始看到能夠同時(shí)運(yùn)行多個(gè)應(yīng)用程序的 PC。隨著晶體管數(shù)量按照摩爾定律翻倍,性能不斷提高,每一種新的處理器設(shè)計(jì)都提供了開發(fā)新特性和功能的能力,無(wú)論是播放 DVD 還是編輯家庭相冊(cè),這反過(guò)來(lái)又激發(fā)了消費(fèi)者對(duì)更強(qiáng)大功能的需求設(shè)備。
最終,消費(fèi)者對(duì)不同外形尺寸的需求和對(duì)性能改進(jìn)的期望推動(dòng)對(duì)處理器的需求超出了單核的能力。與此同時(shí),對(duì)移動(dòng)設(shè)備的需求開始爆炸式增長(zhǎng),隨著需求的增長(zhǎng),對(duì)更節(jié)能處理的呼聲也越來(lái)越高。
ARM 于 1990 年推出時(shí),其創(chuàng)始人的主要目標(biāo)是為手持設(shè)備創(chuàng)建一種節(jié)能處理器架構(gòu)。采用 RISC CPU 架構(gòu),ARM 的方法簡(jiǎn)化了指令,簡(jiǎn)化了任務(wù)執(zhí)行,并降低了每條指令所需的功率。
一些特性對(duì)于開發(fā)更節(jié)能的微處理器至關(guān)重要,其中最重要的一點(diǎn)是將功耗限制在盡可能低的水平。將功率包絡(luò)保持在盡可能小的占地面積不僅可以延長(zhǎng)電池壽命,還可以限制為設(shè)備供電所需的電池重量,從而減少材料清單并降低總體成本。
多核:移動(dòng)之外的好處
如今,這種高性能、高能效處理架構(gòu)的優(yōu)勢(shì)正在數(shù)字電視和機(jī)頂盒等設(shè)備、打印機(jī)和復(fù)印機(jī)等辦公設(shè)備以及平板電腦、便攜式游戲機(jī)等移動(dòng)設(shè)備中取得成果。智能手機(jī)。
自 2000 年代中期以來(lái),人們普遍認(rèn)為構(gòu)建越來(lái)越大的 CPU 以實(shí)現(xiàn)單線程性能提升不僅變得越來(lái)越困難,而且與移動(dòng)設(shè)備的能效限制背道而馳。這是因?yàn)樾阅苊刻岣邘讉€(gè)百分點(diǎn),就需要成倍增加的能量。
多核解決方案可以在與單核設(shè)計(jì)相當(dāng)?shù)念l率下提供更高的性能,同時(shí)在成本和能效方面顯著節(jié)省。此外,多核解決方案可以利用具有高晶體管數(shù)量的內(nèi)核,并通過(guò)僅在需要時(shí)為其供電來(lái)優(yōu)化系統(tǒng)。本質(zhì)上,這可以被認(rèn)為是智能負(fù)載均衡。系統(tǒng)不僅需要考慮哪種處理器最適合執(zhí)行特定任務(wù),而且還必須考慮該任務(wù)所需的性能,并將其分配給最節(jié)能的可用處理器。
根據(jù)需要使用核心,同時(shí)讓其他核心保持空閑,這有助于盡可能降低能耗,同時(shí)對(duì)性能的影響有限。由于任務(wù)分布在多個(gè)處理器內(nèi)核上,單個(gè)處理器可能無(wú)法滿負(fù)荷運(yùn)行,從而降低了多核處理器的電壓和頻率。這可以顯著節(jié)省與系統(tǒng)總體性能相關(guān)的功耗。
為了用一個(gè)常見(jiàn)的用例來(lái)說(shuō)明這個(gè)想法,請(qǐng)考慮當(dāng)今的智能手機(jī),它必須足夠強(qiáng)大,才能呈現(xiàn)復(fù)雜的網(wǎng)頁(yè)和玩游戲應(yīng)用程序,通常與基本的電子郵件同步和電話管理功能并行。憑借僅在需要時(shí)為內(nèi)核供電的能力,多核智能手機(jī)與單核、全油門的前代產(chǎn)品相比可以提供更長(zhǎng)的電池壽命。市場(chǎng)對(duì)可擴(kuò)展性能的需求導(dǎo)致當(dāng)前大多數(shù)智能手機(jī)都包含多核 CPU,以及當(dāng)今許多領(lǐng)先的移動(dòng)視頻和游戲設(shè)備中的多核 GPU。
多核處理的“多核”方法需要在許多較小的處理器(例如 Cortex-A5)之間共享性能負(fù)載,而不是在單核處理器上共享多個(gè)單線程工作負(fù)載。設(shè)計(jì)人員越來(lái)越多地部署旨在協(xié)同工作的處理器集群,在緩存或同一處理器的多個(gè)實(shí)例之間共享數(shù)據(jù)和任務(wù)。
與處理相同工作負(fù)載的大型處理器相比,較小的處理器協(xié)同工作以提供更低功耗的綜合性能水平,許多內(nèi)核變得更加有趣。如前所述,與提高單線程性能相關(guān)的成本是指數(shù)級(jí)的。然而,隨著多核處理,成本在規(guī)模上變得更加線性。設(shè)計(jì)人員正在使用許多內(nèi)核來(lái)顯著降低總體系統(tǒng)成本。
隨著硬件設(shè)計(jì)人員開始實(shí)施這些多核系統(tǒng),軟件開發(fā)人員將需要生成能夠使用多核處理解決方案的代碼。在此之前,設(shè)備必須具備執(zhí)行高性能任務(wù)的能力。一個(gè)同時(shí)包含高單線程性能多核和更高功率效率的系統(tǒng)的一個(gè)示例是當(dāng)前部署的 CPU 和 GPU,其中多核 GPU 可以使用比多核 CPU 更少的功率提供圖形計(jì)算。由于 GPU 與 CPU 保持一致并共享其緩存,因此可以降低對(duì) CPU 的外部?jī)?nèi)存帶寬和性能需求。OpenCL 和 CUDA 等語(yǔ)言正在努力為更通用的應(yīng)用程序解決這些問(wèn)題。
優(yōu)化未來(lái)性能
我們的行業(yè)正處于平衡性能和功率的十字路口。通過(guò)利用特定領(lǐng)域的處理器和異構(gòu)通用計(jì)算,設(shè)計(jì)人員可以優(yōu)化有限的硬件資源和占用空間。跨所有類型的多核片上系統(tǒng) (SoC) 優(yōu)化設(shè)計(jì)和設(shè)計(jì)過(guò)程也可以實(shí)現(xiàn)這些收益。
雖然優(yōu)化可能不像多核處理那樣受到關(guān)注,但它同樣重要,尤其是在具有更大一致性挑戰(zhàn)的小尺寸應(yīng)用程序中。緩存一致性是多核計(jì)算應(yīng)用程序的關(guān)鍵,可確保正確維護(hù)存儲(chǔ)在共享資源中的數(shù)據(jù)。諸如 AMBA 4 總線之類的標(biāo)準(zhǔn)和規(guī)范正在朝著跨多核處理器集群提供系統(tǒng)級(jí)緩存支持以及在復(fù)雜 SoC 中保持最佳性能和能效方面邁出令人鼓舞的一步。
未來(lái)的設(shè)備將繼續(xù)需要更強(qiáng)大的處理性能,很可能是在越來(lái)越嚴(yán)格的功率限制下。通過(guò)在整個(gè)設(shè)計(jì)過(guò)程中開發(fā)更有針對(duì)性的處理、優(yōu)化和差異化,開發(fā)人員可以將不僅支持多核概念,而且還包含軟件支持的系統(tǒng)推向市場(chǎng)。
審核編輯:郭婷
-
處理器
+關(guān)注
關(guān)注
68文章
19885瀏覽量
235086 -
cpu
+關(guān)注
關(guān)注
68文章
11076瀏覽量
217008 -
soc
+關(guān)注
關(guān)注
38文章
4386瀏覽量
222692
發(fā)布評(píng)論請(qǐng)先 登錄
直流負(fù)載箱的主要功能有哪些?
優(yōu)化電機(jī)控制以提高能效
英特爾推出全新至強(qiáng)6性能核處理器
飛騰主板——滿足高能效和安全可信需求
RK3399處理器:高性能多核異構(gòu)計(jì)算平臺(tái)
IGBT模塊在頗具挑戰(zhàn)性的逆變器應(yīng)用中提供更高能效
在電氣安裝中通過(guò)負(fù)載箱實(shí)現(xiàn)最大效率和安全性
多通道負(fù)載測(cè)試和性能評(píng)估?
旋智多核心處理器助力電機(jī)控制應(yīng)用

如何提高云計(jì)算的性能和效率
AMD 面向嵌入式系統(tǒng)推出高能效 EPYC 嵌入式 8004 系列
使用TPS2116實(shí)現(xiàn)建筑自動(dòng)化應(yīng)用的高能效

如何實(shí)現(xiàn)比較器以提高工業(yè)驅(qū)動(dòng)應(yīng)用中旋轉(zhuǎn)編碼器的性能

評(píng)論