一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

芯片設(shè)計(jì)階段時關(guān)于PPA的考慮

454398 ? 來源:EDN ? 作者:aresxue ? 2021-02-20 15:42 ? 次閱讀

談到芯片,首先想到的一定是性能,功耗,價格,成熟度,生態(tài)圈兼容性等。但是只針對芯片本身的話,是看芯片內(nèi)部有什么運(yùn)算能力,比如處理器,浮點(diǎn)器,編解碼器,數(shù)字信號處理器,圖形加速器,網(wǎng)絡(luò)加速器等,還要看提供了什么接口,比如閃存,內(nèi)存,PCIe,USBSATA,以太網(wǎng)等,還有看里面自帶了多少內(nèi)存可供使用,以及功耗如何。

性能,對CPU來說就是基準(zhǔn)測試程序能跑多少分,比如Dhrystone,Coremark,SPEC2000/2006等。針對不同的應(yīng)用,比如手機(jī),還會看圖形處理器的跑分,而對網(wǎng)絡(luò)處理器,會看包轉(zhuǎn)發(fā)率。當(dāng)然,還需要跑一些特定的應(yīng)用程序,來得到更準(zhǔn)確的性能評估。

功耗,從high level來看,也分動態(tài)功耗和靜態(tài)功耗。動態(tài)功耗,就是在跑某個程序的時候,芯片的功率是多少瓦。通常,這時候處理器會跑在最高頻率,但這并不意味著所有的晶體管都在工作,由于power gating和clock gating的存在,有些沒有被用到的邏輯和片上內(nèi)存塊并沒在耗電。芯片公司給出的處理器功耗,通常都是在跑Dhrystone。這個程序有個特點(diǎn),它只在一級緩存之上運(yùn)行,不會訪問二級緩存,更不會訪問內(nèi)存。這樣得出的功耗,其實(shí)并不是包含了內(nèi)存訪問的真實(shí)功耗,也不是最大功耗。為得到處理器最大功耗,需要運(yùn)行于一級緩存之上的向量和浮點(diǎn)指令,其結(jié)果通常是Dhrystone功耗的2-3倍。但是從實(shí)際經(jīng)驗(yàn)看,普通的應(yīng)用程序并不能讓處理器消耗更高的能量,所以用Dhrysone測量也沒什么問題。當(dāng)然,要準(zhǔn)確衡量整體的芯片功耗,還得考慮各種加速器,總線和接口,并不僅僅是處理器。

在芯片設(shè)計(jì)階段,最重要的就是PPA,它轉(zhuǎn)化為設(shè)計(jì),就是功能,性能,功耗,直接影響價格。其中,性能有兩層含義。在前端設(shè)計(jì)上,它表示的是每赫茲能夠跑多少標(biāo)準(zhǔn)測試程序分。通常來說,流水線級數(shù)越多,芯片能跑到的最高頻率越高??墒遣⒉皇穷l率越高,性能就越高。這和處理器構(gòu)架有很大關(guān)系。典型的反例就是Intel的奔騰4,30多級流水,最高頻率高達(dá)3G赫茲,可是由于流水線太長,一旦指令預(yù)測錯誤,重新抓取的指令要重走這幾十級流水線,代價是很大的。而它的指令又非常依賴于編譯器來優(yōu)化,當(dāng)時編譯器又沒跟上,導(dǎo)致總體性能低下。而MIPS或者PowerPC的處理器頻率都不高,但是每赫茲性能相對來說還不錯,總體性能就會提高一些。所以性能要看總體跑分,而不是每赫茲跑分。

性能的另外一個含義就是指最高頻率,這是從Backend設(shè)計(jì)角度來說的。Backend的人只看芯片能跑到多少頻率,頻率越高,對實(shí)現(xiàn)的時候的timing, noise等要求不一樣。頻率越高,在每赫茲跑分一定的情況下,總體性能就越高。請注意對于那些跑在一級緩存的程序,處理器每赫茲跑分不會隨著頻率的變化而變化。而如果考慮到多級緩存,總線和外圍接口,那肯定就不是隨處理器頻率線性增加了。

從后端角度考慮,影響頻率的因素有很多,比如:

首先,受工藝的影響。每一種制程(例如14nm)下面還有很多小的工藝節(jié)點(diǎn),例如LP,HP等。他們之間的最高頻率,漏電,成本等會有一些區(qū)別,適合不同的芯片,比如手機(jī)芯片喜歡漏電低,成本低的,服務(wù)器喜歡頻率高的,不一而足。

其次,受后端庫的影響。Foundry會把工藝中晶體管的參數(shù)抽象出來,做成一個物理層開發(fā)包(可以認(rèn)為叫DK),提供給工具廠商,IP廠商和芯片廠商。而這些廠商的后端工程師,就會拿著這個物理層開發(fā)包,做自己的物理庫。物理庫一般包含邏輯和內(nèi)存兩大塊。根據(jù)晶體管參數(shù)的不同,會有不同特性,適合于不同的用途。而怎么把這些不同特性的的庫,合理的用到各個前端設(shè)計(jì)模塊,就是一門大學(xué)問。一般來說,源極和漏極通道越短,電子漂移距離越短,能跑的頻率就越高??墒?,頻率越高,動態(tài)功耗就越大,并且可能是按指數(shù)級上升。除此之外,還會有Track這種說法,指的是的標(biāo)準(zhǔn)單元的寬度。常見的有6.75T,9T等。寬度越大,電流越大,越容易做到高頻,面積也越大。還有一個可調(diào)的參數(shù)就是閾值電壓,決定了柵極的電壓門限,門限越低,頻率能沖的越高,靜態(tài)功耗也越大,按對數(shù)級上升。比如需要低功耗(更多使用HVT的晶體管)或者高性能(更多使用LVT,ULVT)的晶體管。

接下來,受布局和布線的影響。芯片里面和主板一樣,也是需要多層布線的,每一層都有個利用率??傮w面積越小,利用率越高,布線就越困難。而層數(shù)越多,利用率越低,成本就越高。在給出一些初始和限制條件后,EDA軟件會自己去不停的計(jì)算,最后給出一個可行的頻率和面積。就好像下圖,Metal Stack表明,整個芯片是9層Stack。

pIYBAGAwvHWAT_UiAAHrXusTp1E889.png

再次,受前后端協(xié)同設(shè)計(jì)的影響。處理器的關(guān)鍵路徑直接決定了最高頻率。這一部分,還沒體會,先放著,不懂。

從功耗角度,同樣是前后端協(xié)同設(shè)計(jì),某個訪問片上內(nèi)存的操作,如果知道處理器會花多少時間,用哪些資源,就可以讓內(nèi)存的空閑塊關(guān)閉,從而達(dá)到省電的目的。比如Clock Gating,Power Gating等都是用來干這事的。

對于移動產(chǎn)品,靜態(tài)功耗也是很有用的一個指標(biāo)。靜態(tài)就是晶體管漏電造成的,大小和芯片工藝,晶體管數(shù),電壓相關(guān)。控制靜態(tài)功耗的方法是power gating,關(guān)掉電源,那么靜態(tài)和動態(tài)功耗都沒了。

另外,就是動態(tài)功耗。動態(tài)是開關(guān)切換造成的,所以和晶體管數(shù),頻率,電壓相關(guān)。動態(tài)調(diào)頻調(diào)壓(DVFS)的控制方法是clock gating,頻率變小,自然動態(tài)功耗就小,降低電壓,那么動態(tài)功耗和靜態(tài)功耗自然都小??墒请妷翰荒軣o限降低,否則電子沒法漂移,晶體管就不工作了。并且,晶體管跑在不同的頻率,所需要的電壓是不一樣的,拿16納米來說,往下可以從0.9V變成0.72V,往上可以變成1V或者更高。別小看了這一點(diǎn)點(diǎn)的電壓變化,動態(tài)功耗的變化,是和電壓成2次方關(guān)系,和頻率成線性關(guān)系的。而頻率的上升,同樣是依賴于電壓提升的。所以,1.05V和0.72V,電壓差了45%,動態(tài)功耗可以差3倍。

再往上,就是軟件電源管理了,也就是芯片的Low Power管理策略。把每個大模塊的clock gating和power gating進(jìn)行組合,形成不同的休眠狀態(tài),軟件可以根據(jù)溫度和運(yùn)行的任務(wù),動態(tài)的告訴處理器每個模塊進(jìn)入不同的休眠狀態(tài),從而在任務(wù)不忙的時候降低功耗。這里就需要PVT Sensor。在每個芯片里面都有很多PVT Sensor。

頻率和面積其實(shí)也是互相影響的。給定一個目標(biāo)頻率,選用了不同的物理庫,不同的track(也就是不同的溝道寬度),不同的利用率,形成的芯片面積就會不一樣。通常來說,越是需要跑高頻的芯片,所需的面積越大。頻率差一倍,面積可能有百分之幾十的差別。對晶體管來說,面積就是成本,晶圓的總面積一定,價錢一定,那單顆芯片的面積越小,成本越低,并且此時良率也越高。

從上面我們看到,設(shè)計(jì)芯片很大程度上就是在平衡。影響因素,或者說坑,來自于方方面面,IP提供商,工廠,市場定義,工程團(tuán)隊(duì)。水很深,坑很大,沒有完美的芯片,只有完美的平衡。在這點(diǎn)上,蘋果是一個很典型的例子。蘋果A10的CPU頻率不很高,但是Geekbench單核跑分卻比 A73高了整整75%,接近Intel桌面處理器的性能。為什么?因?yàn)樘O果用了大量的面積換取性能和功耗。首先,它使用了六發(fā)射,而A73只有雙發(fā)射,流水線寬了整整三倍。當(dāng)然,三倍的發(fā)射寬度并不表示性能就是三倍,由于數(shù)據(jù)相關(guān)性的存在,發(fā)射寬度的效益是遞減的。再一點(diǎn),蘋果使用了整整6MB的緩存,而這個數(shù)字在別的手機(jī)芯片上通常是2MB。對一些標(biāo)準(zhǔn)跑分,比如SpecInt2000/2006,128KB到256KB二級緩存帶來的性能提升僅僅是7%左右,而256KB到1MB帶來的提升更小,緩存面積卻是4倍。第三,除了一二三級緩存之外,蘋果大量增加處理器在各個環(huán)節(jié)的緩沖,比如指令預(yù)測器等。當(dāng)然,面積的提升同樣帶來了靜態(tài)功耗的增加,不過相對于提升頻率,造成動態(tài)功耗增加來說,還是小的。再次,蘋果引入的復(fù)雜的電源,電壓和時鐘控制,雖然增加了面積,但由于系統(tǒng)軟件都是自己的,可以從軟件層面就進(jìn)行很精細(xì)的優(yōu)化,將整體功耗控制的非常好。舉個例子,Wiki上面可以得知,A10上的大核Hurricane面積在TSMC的16nm上是4.18平方毫米,而ARM的Enyo去掉二級緩存差不多是2.4平方毫米,在2.4Ghz時,SPECINT2000跑分接近,面積差了70%。

但是,也只有蘋果能這么做,一般芯片公司絕對不會走蘋果這樣用大量面積換性能和功耗的路線,那樣的話毛利就太低了。這也是為什么現(xiàn)在越來越多的整機(jī)廠家,愿意來自研芯片或者定制芯片的一個主要原因。
編輯:hfy

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 處理器
    +關(guān)注

    關(guān)注

    68

    文章

    19740

    瀏覽量

    232919
  • 電源管理
    +關(guān)注

    關(guān)注

    116

    文章

    6346

    瀏覽量

    145654
  • cpu
    cpu
    +關(guān)注

    關(guān)注

    68

    文章

    11011

    瀏覽量

    215246
  • PowerPC
    +關(guān)注

    關(guān)注

    2

    文章

    39

    瀏覽量

    30317
  • 網(wǎng)絡(luò)處理器

    關(guān)注

    0

    文章

    49

    瀏覽量

    14162
收藏 人收藏

    評論

    相關(guān)推薦

    概倫電子層次化SoC設(shè)計(jì)規(guī)劃方案NavisPro介紹

    NavisPro可提供整體性設(shè)計(jì)規(guī)劃解決方案,支持在RTL設(shè)計(jì)階段完成芯片評估和布局規(guī)劃,幫助芯片設(shè)計(jì)師在布局規(guī)劃早期階段預(yù)測并預(yù)防物理實(shí)現(xiàn)問題。
    的頭像 發(fā)表于 04-22 10:13 ?110次閱讀
    概倫電子層次化SoC設(shè)計(jì)規(guī)劃方案NavisPro介紹

    Adams多體動力學(xué)仿真解決方案全面解析

    Adams/Controls機(jī)電液控系統(tǒng)聯(lián)合仿真機(jī)器人、航空航天 Adams/Flex柔性體動力學(xué)分析輕量化結(jié)構(gòu)設(shè)計(jì) Adams/View參數(shù)化建模與可視化前處理概念設(shè)計(jì)階段驗(yàn)證 三、關(guān)鍵技術(shù)
    發(fā)表于 04-17 17:24

    【「芯片通識課:一本書讀懂芯片技術(shù)」閱讀體驗(yàn)】芯片如何設(shè)計(jì)

    和基于物理描述并經(jīng)過工藝驗(yàn)證的IP硬核,如下圖所示。 從IP復(fù)用角度來看,IP軟核在行為級設(shè)計(jì)階段合入芯片設(shè)計(jì),IP固核在結(jié)構(gòu)級設(shè)計(jì)階段合入,IP硬核在物理級階段合入,如下圖所示。 M
    發(fā)表于 03-29 20:57

    EDA2俠客島難題挑戰(zhàn)·2025已正式開啟

    、物理、機(jī)械等各種加工過程,每個環(huán)節(jié)都可能引入制造缺陷,使晶體管短路或斷路進(jìn)而導(dǎo)致不能正常工作。DFT 設(shè)計(jì),就是在滿足芯片正常功能的基礎(chǔ)上,在芯片設(shè)計(jì)階段通過增加電路,提高故障覆蓋率,使定位問題點(diǎn)變得更
    發(fā)表于 03-05 21:30

    設(shè)計(jì)早期對EMC的考慮

    要求。在設(shè)計(jì)達(dá)到較高頻率從而在測試中導(dǎo)致失敗時,這些電磁兼容設(shè)計(jì)規(guī)則有不少變得陳舊過時。在設(shè)計(jì)階段之后,設(shè)計(jì)師制造原型并對其進(jìn)行電磁兼容性測試。當(dāng)設(shè)計(jì)中考慮電磁兼容性太晚時這一過程往往會出現(xiàn)種種EMC
    發(fā)表于 03-04 14:21

    OpenAI自研AI芯片即將進(jìn)入試生產(chǎn)階段

    據(jù)最新報(bào)道,OpenAI正加速推進(jìn)其減少對英偉達(dá)芯片依賴的戰(zhàn)略計(jì)劃,并即將迎來重大突破——其首款自研人工智能芯片已完成設(shè)計(jì)工作,即將進(jìn)入試生產(chǎn)階段。 據(jù)悉,OpenAI已決定將這款自研芯片
    的頭像 發(fā)表于 02-11 11:04 ?461次閱讀

    Arm計(jì)劃大幅提升芯片設(shè)計(jì)授權(quán)費(fèi)并考慮自研芯片

    近日,據(jù)路透社報(bào)道,全球知名芯片設(shè)計(jì)公司Arm正醞釀一項(xiàng)長期戰(zhàn)略調(diào)整,計(jì)劃大幅提升其芯片設(shè)計(jì)授權(quán)費(fèi)用,漲幅可能高達(dá)300%。同時,Arm還在考慮自主研發(fā)芯片,以與其最大的客戶展開直接競
    的頭像 發(fā)表于 01-14 13:51 ?343次閱讀

    DFM在實(shí)際應(yīng)用中的關(guān)鍵考慮和策略

    作為一種高效、精確的電子組裝方法,為電子產(chǎn)品的小型化和高性能提供了有力支持。然而,SMT貼片加工的成功與否很大程度上取決于設(shè)計(jì)階段的DFM(Design for Manufacturing,可制造性
    的頭像 發(fā)表于 10-29 09:28 ?569次閱讀

    一文了解芯片測試的重要性

    集成電路測試卡位產(chǎn)業(yè)鏈關(guān)鍵節(jié)點(diǎn),貫穿設(shè)計(jì)、制造、封裝以及應(yīng)用的全過程。從整個制造流程上來看,集成電路測試具體包括設(shè)計(jì)階段的設(shè)計(jì)驗(yàn)證、晶圓制造階段的過程工藝檢測、封裝前的晶圓測試以及封裝后的成品測試
    的頭像 發(fā)表于 08-06 08:28 ?1674次閱讀
    一文了解<b class='flag-5'>芯片</b>測試的重要性

    Marvell宣布Teralynx 1芯片進(jìn)入量產(chǎn)及客戶部署階段

    7月26日Marvell宣布Teralynx 10(51.2T以太網(wǎng)交換芯片),已經(jīng)進(jìn)入量產(chǎn)及客戶部署階段。Teralynx 10芯片基于針對數(shù)據(jù)中心及AI網(wǎng)絡(luò)的全新交換架構(gòu)設(shè)計(jì),能夠同時滿足大帶寬,超低延時,低功耗,512端口
    的頭像 發(fā)表于 07-30 16:32 ?958次閱讀

    谷歌Tensor G5芯片進(jìn)入流片階段

    近日,科技巨頭Google宣布其自主研發(fā)的Tensor G5芯片已成功邁入Tape-out(流片)階段,這標(biāo)志著即將應(yīng)用于Pixel 10系列智能手機(jī)的全新芯片已接近量產(chǎn)。Tensor G5不僅是Google首款完全擺脫外部平臺
    的頭像 發(fā)表于 07-02 09:45 ?732次閱讀

    綜合電磁兼容性設(shè)計(jì)與測試方法及案例分析

    案例分析與EMC設(shè)計(jì)產(chǎn)品問題通常在后期出現(xiàn),即使在設(shè)計(jì)階段考慮了電磁兼容性(EMC),仍然不能完全解決所有問題。某些理論在實(shí)際應(yīng)用中可能存在局限性,需要采取更多方法和措施來有效地改進(jìn)和整改產(chǎn)品,以
    的頭像 發(fā)表于 06-29 08:17 ?571次閱讀
    綜合電磁兼容性設(shè)計(jì)與測試方法及案例分析

    字節(jié)跳動與博通合作開發(fā)AI芯片傳聞不實(shí)

    ,并由全球知名的半導(dǎo)體代工廠臺積電負(fù)責(zé)制造。然而,令人關(guān)注的是,盡管設(shè)計(jì)工作進(jìn)展順利,但標(biāo)志著設(shè)計(jì)階段結(jié)束和制造開始的“流片”環(huán)節(jié)尚未啟動。
    的頭像 發(fā)表于 06-25 17:42 ?949次閱讀

    具備“制造意識“的超構(gòu)透鏡設(shè)計(jì)或可減少設(shè)計(jì)階段到生產(chǎn)階段轉(zhuǎn)換時間

    ? 融入“制造意識”(Manufacturing Awareness)的設(shè)計(jì)是一種設(shè)計(jì)哲學(xué),它強(qiáng)調(diào)在產(chǎn)品設(shè)計(jì)和開發(fā)過程中對制造過程的理解和考慮。這種設(shè)計(jì)方法的目的是減少設(shè)計(jì)階段到生產(chǎn)階段的轉(zhuǎn)換時間
    的頭像 發(fā)表于 06-18 16:51 ?1337次閱讀
    具備“制造意識“的超構(gòu)透鏡設(shè)計(jì)或可減少<b class='flag-5'>設(shè)計(jì)階段</b>到生產(chǎn)<b class='flag-5'>階段</b>轉(zhuǎn)換時間

    新思科技:精密光學(xué)與機(jī)器視覺應(yīng)用大會分享超透鏡設(shè)計(jì)制造技術(shù)

     新思科技推出的全自動設(shè)計(jì)工具M(jìn)etaOptic Designer在會上引發(fā)熱烈反響。該工具與新思科技OPC工具協(xié)同運(yùn)作,使得設(shè)計(jì)人員在設(shè)計(jì)階段即可考慮制造影響,極大提高了設(shè)計(jì)效率與精度。
    的頭像 發(fā)表于 05-07 16:37 ?700次閱讀