一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

搭載 PowerVR GPU IP 芯片的新功能介紹

Dbwd_Imgtec ? 來源:Imagination Tech ? 作者:Imagination Tech ? 2022-10-17 14:57 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

日前,游戲和VR應(yīng)用性能優(yōu)化平臺(tái) UWA 宣布新的 GPU Counter 功能更新:增加了對(duì) PowerVR 品牌 GPU 芯片的支持。針對(duì) PowerVR GPUCounter,UWA提供了 GPU 負(fù)載、GPU 著色、GPU 帶寬、GPU 圖元 4 個(gè)模塊的分析。 最新的 UWA SDK 2.4.4 已發(fā)布,下載最新版 SDK,并使用搭載 PowerVR GPU IP 芯片的設(shè)備進(jìn)行測試,即可在GOT Online Overview的GPU模塊下查看到對(duì)應(yīng)的數(shù)據(jù),掌握GPU壓力和性能消耗情況。

以下針對(duì)PowerVR GPU Counter,圍繞UWA所提供的GPU 負(fù)載、GPU著色、GPU帶寬、GPU圖元4個(gè)模塊的分析進(jìn)行詳細(xì)說明。

1、GPU負(fù)載

GPU Counter下的GPU負(fù)載包含Non Fragment Utilization和Fragment Utilization兩個(gè)性能指標(biāo),分別代表非片段處理占整體GPU處理耗時(shí)百分比和片段處理開銷占整體GPU處理開銷百分比。

91e6c744-4dc6-11ed-a3b6-dac502259ad0.png

在GPU上運(yùn)行的工作負(fù)載由作業(yè)管理器統(tǒng)一協(xié)調(diào),該任務(wù)管理器負(fù)責(zé)將工作負(fù)載調(diào)度到GPU內(nèi)部的各個(gè)處理單元上,它將兩個(gè)FIFO工作隊(duì)列,稱為作業(yè)插槽。其中,一個(gè)插槽用于非片段工作負(fù)載,另一個(gè)插槽則用于片段著色工作負(fù)載。 當(dāng)出現(xiàn)GPU瓶頸時(shí),正常情況下Non Fragment Utilization和Fragment Utilization至少有一個(gè)是接近100%,如果兩者都低于100%,則有可能是Non Fragment和Fragment之間存在數(shù)據(jù)依賴關(guān)系。

當(dāng)Non Fragment Utilization過高時(shí),開發(fā)者可以從頂點(diǎn)數(shù)、復(fù)雜的Compute Shader的使用情況以及Geometry Shader、Tessellation Shader等角度著手進(jìn)行優(yōu)化。當(dāng)Fragment Utilization過高時(shí),則可以考慮項(xiàng)目中是否存在是否存在片段數(shù)目過多、片段Shader過于復(fù)雜。

2、GPU著色

包含Overdraw和Cycles/Pixel兩個(gè)指標(biāo)。

921a7ec2-4dc6-11ed-a3b6-dac502259ad0.png

Overdraw(過度繪制)

該項(xiàng)表示項(xiàng)目運(yùn)行過程中,單幀中整個(gè)屏幕被填充的倍數(shù)。倍數(shù)越高,則GPU的壓力越大。在游戲運(yùn)行過程中,場景中半透明物體的重合會(huì)使得同一個(gè)像素點(diǎn)在一幀中會(huì)被繪制多次,造成Overdraw過高的情況。如下圖所示,UI和粒子特效層疊導(dǎo)致容易出現(xiàn)Overdraw。 92493866-4dc6-11ed-a3b6-dac502259ad0.png

Cycles/Pixel

表示平均每個(gè)像素耗費(fèi)的GPU時(shí)鐘周期。一般來說,Shader復(fù)雜度會(huì)極大地影響GPUCycles占用的情況。當(dāng)畫面的Shader復(fù)雜度過高時(shí),GPU需要消耗大量的時(shí)鐘周期對(duì)Shader進(jìn)行運(yùn)算,容易造成GPU耗時(shí)變高,造成卡頓。

因此,通過查看GPU著色模塊,就可以快速定位高Overdraw和高Cycles的場景,判斷這個(gè)場景的GPU壓力較高是Overdraw還是Shader復(fù)雜度過高造成的,進(jìn)行有針對(duì)性的優(yōu)化。

3、GPU帶寬

CPU一樣,GPU帶寬也是芯片耗電的重要指標(biāo)。當(dāng)GPU持續(xù)進(jìn)行高負(fù)載外部讀寫時(shí),掉電就會(huì)過快。

UWA的GPU帶寬模塊統(tǒng)計(jì)了測試過程中單幀的讀寫帶寬總量,通過查看GPU帶寬模塊,可以快速定位測試過程中帶寬較高的場景和原因,并進(jìn)行進(jìn)一步測試優(yōu)化。 93496c0e-4dc6-11ed-a3b6-dac502259ad0.png

4、GPU圖元處理 渲染面是產(chǎn)生GPU壓力的重要因素之一,我們可以通過 Overview 模式里的 Triangle 指標(biāo)來查看和分析哪些畫面的渲染面較多。

9361d974-4dc6-11ed-a3b6-dac502259ad0.png

渲染面過多,一方面可能是模型過于復(fù)雜,一般可以通過 LOD、HLOD 等常用技術(shù)來簡化遠(yuǎn)距離的模型,在不影響畫質(zhì)的情況下顯著降低渲染面;另一方面,可能是地形、大建筑物等大面積模型沒有進(jìn)行適當(dāng)?shù)牟鸱?,?dǎo)致進(jìn)入視域體的面片可能不多,但提交GPU的渲染面依然很多。 對(duì)于第二種情況,我們可以通過新功能“GPU圖元”來進(jìn)行初步的判斷。

939e87fc-4dc6-11ed-a3b6-dac502259ad0.png

總圖元數(shù):提交到GPU端的圖元總數(shù),該數(shù)值基本等同于引擎端統(tǒng)計(jì)的渲染面片總數(shù)。 可見圖元數(shù):在GPU端通過各種裁剪之后,留下的參與渲染的三角面。 可見圖元不包括:因?yàn)樵谝曈蝮w外而被裁剪的三角面,因?yàn)槌蚨徊眉舻娜敲?。因此,?D場景中,比較理想的情況下,可見圖元的數(shù)量應(yīng)該接近或高于 50%(對(duì)于大部分模型,有一半三角面會(huì)因?yàn)槌虮徊眉簦?。如果某些角度下,可見圖元的比例非常低,則很可能存在上文提到的第二種情況,從而可以針對(duì)性地檢查和優(yōu)化場景中,這個(gè)角度下,被提交到GPU的大面積模型。

93baad4c-4dc6-11ed-a3b6-dac502259ad0.png

GPU圖元處理數(shù)量過多會(huì)對(duì)設(shè)備的帶寬和能耗造成較大的影響,應(yīng)盡量在程序端完成剔除,并減小送往GPU的圖元數(shù)。

需要注意的是,基于架構(gòu)不同,同一參數(shù)在不同品牌芯片上的推薦值也會(huì)存在差異,不同設(shè)備間橫向?qū)Ρ鹊囊饬x不大,更推薦大家在相同的設(shè)備上進(jìn)行縱向?qū)Ρ?。同時(shí),由于同品牌芯片的架構(gòu)之間也會(huì)存在差異,UWA目前僅支持部分芯片的GPU Counter數(shù)據(jù)采集,具體支持設(shè)備列表可通過下圖或登錄UWA官網(wǎng)對(duì)“Mali/Power VR/Adreno GPUCounter支持設(shè)備”列表進(jìn)行查詢:

93e76d64-4dc6-11ed-a3b6-dac502259ad0.png ? 以上就是這次關(guān)于搭載 PowerVR GPU IP 芯片的新功能介紹了,希望會(huì)對(duì)開發(fā)者們?cè)?GPU 優(yōu)化上和項(xiàng)目的整體性能監(jiān)控上有所幫助。  

審核編輯:彭靜
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 芯片
    +關(guān)注

    關(guān)注

    459

    文章

    52451

    瀏覽量

    439926
  • 模塊
    +關(guān)注

    關(guān)注

    7

    文章

    2787

    瀏覽量

    50237
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    4937

    瀏覽量

    131133
  • SDK
    SDK
    +關(guān)注

    關(guān)注

    3

    文章

    1076

    瀏覽量

    48972

原文標(biāo)題:UWA平臺(tái)支持PowerVR芯片,新增四大GPU模塊分析

文章出處:【微信號(hào):Imgtec,微信公眾號(hào):Imagination Tech】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    【VisionFive 2單板計(jì)算機(jī)試用體驗(yàn)】1、開箱初體驗(yàn)(刷系統(tǒng)+靜態(tài)IP設(shè)置+GPU跑分測評(píng))

    文件:注意:balenaEtcher這個(gè)軟件表面上可以選擇bz2文件,但是在軟件內(nèi)解壓的話會(huì)卡在73%的進(jìn)度。所以,bz2文件要先解壓,再用balenaEtcher燒錄鏡像到TF卡。 開機(jī)設(shè)置靜態(tài)IP
    發(fā)表于 07-09 21:50

    MT6765_MTK6765安卓核心板_Helio P35處理器簡介/芯片功能資料

    MT6765是一款兼具高效能與多功能的智能芯片,采用主頻高達(dá)2.3GHz的八核ARM Cortex-A53處理器,結(jié)合臺(tái)積電12納米FinFET制程工藝,提供出色的性能和低能耗表現(xiàn)。芯片內(nèi)置頻率達(dá)
    的頭像 發(fā)表于 07-01 20:17 ?217次閱讀
    MT6765_MTK6765安卓核心板_Helio P35處理器簡介/<b class='flag-5'>芯片</b><b class='flag-5'>功能</b>資料

    【HarmonyOS 5】應(yīng)用更新功能詳解

    與迭代需求的優(yōu)選方案。這類彈窗主要用于向用戶推送新版本更新通知,而在引導(dǎo)用戶完成更新操作的實(shí)現(xiàn)層面,HarmonyOS 提供了完善的應(yīng)用市場能力支撐,例如本文所介紹的 updateManager(更新功能
    發(fā)表于 06-22 18:44

    【「算力芯片 | 高性能 CPU/GPU/NPU 微架構(gòu)分析」閱讀體驗(yàn)】+NVlink技術(shù)從應(yīng)用到原理

    前言 【「算力芯片 | 高性能 CPU/GPU/NPU 微架構(gòu)分析」書中的芯片知識(shí)是比較接近當(dāng)前的頂尖芯片水平的,同時(shí)包含了芯片架構(gòu)的基礎(chǔ)知
    發(fā)表于 06-18 19:31

    IP6825+IP5306充電寶:重新定義便攜電源的無線充電體驗(yàn)

    本文主要介紹了兩種充電寶方案:IP6825和IP5306。IP6825是創(chuàng)新解決方案,通過高效充放電和磁吸無線充電將充電寶的便捷性和功能性提
    的頭像 發(fā)表于 05-19 08:56 ?352次閱讀
    <b class='flag-5'>IP6825+IP</b>5306充電寶:重新定義便攜電源的無線充電體驗(yàn)

    如何理解芯片設(shè)計(jì)中的IP

    本文主要介紹如何理解芯片設(shè)計(jì)中的IP芯片設(shè)計(jì)中,IP(知識(shí)產(chǎn)權(quán)核心,Intellectual Property Core)是指在
    的頭像 發(fā)表于 02-08 10:43 ?986次閱讀

    ASIC和GPU的原理和優(yōu)勢

    ? 本文介紹了ASIC和GPU兩種能夠用于AI計(jì)算的半導(dǎo)體芯片各自的原理和優(yōu)勢。 ASIC和GPU是什么 ASIC和GPU,都是用于計(jì)算
    的頭像 發(fā)表于 01-06 13:58 ?1659次閱讀
    ASIC和<b class='flag-5'>GPU</b>的原理和優(yōu)勢

    芯原發(fā)布新一代Vitality架構(gòu)GPU IP系列

    芯原股份近日宣布,正式推出全新Vitality架構(gòu)的圖形處理器(GPU)IP系列。這一新一代GPU架構(gòu)以其卓越的計(jì)算性能和廣泛的應(yīng)用領(lǐng)域,吸引了業(yè)界的廣泛關(guān)注。 Vitality GPU
    的頭像 發(fā)表于 12-24 10:55 ?903次閱讀

    Amazon Q Business新功能發(fā)布,助力企業(yè)提效

    近日,在備受矚目的2024年亞馬遜云科技re:Invent全球大會(huì)上,一款旨在提升企業(yè)內(nèi)部工作效率的強(qiáng)大工具——Amazon Q Business,迎來了全新功能的發(fā)布。 Amazon Q
    的頭像 發(fā)表于 12-24 10:42 ?493次閱讀

    《CST Studio Suite 2024 GPU加速計(jì)算指南》

    。 2. 操作系統(tǒng)支持:CST Studio Suite在不同操作系統(tǒng)上持續(xù)測試,可在支持的操作系統(tǒng)上使用GPU計(jì)算,具體參考相關(guān)文檔。 3. 許可證:GPU計(jì)算功能通過CST Studio Suite
    發(fā)表于 12-16 14:25

    【「算力芯片 | 高性能 CPU/GPU/NPU 微架構(gòu)分析」閱讀體驗(yàn)】--了解算力芯片GPU

    著色器(Pixel shader)是圖形流水線中算力相當(dāng)強(qiáng)大的功能單元,因?yàn)樗梢詾槊總€(gè)片段執(zhí)行復(fù)雜的計(jì)算,從而為最終渲染的圖像添加細(xì)節(jié)和視覺效果。 DirectX API推動(dòng) GPU 演進(jìn)
    發(fā)表于 11-03 12:55

    基于GPU器件行為的創(chuàng)新分布式功能安全機(jī)制為智能駕駛保駕護(hù)航

    在鎖步和重復(fù)校驗(yàn)兩種常見的功能安全機(jī)制之外,全球領(lǐng)先的GPU IP廠商Imagination帶來一種全新的、高性價(jià)比的分布式功能安全機(jī)制。
    的頭像 發(fā)表于 10-11 13:14 ?608次閱讀
    基于<b class='flag-5'>GPU</b>器件行為的創(chuàng)新分布式<b class='flag-5'>功能</b>安全機(jī)制為智能駕駛保駕護(hù)航

    Zigbee 3.0的新功能

    電子發(fā)燒友網(wǎng)站提供《Zigbee 3.0的新功能.pdf》資料免費(fèi)下載
    發(fā)表于 09-26 10:45 ?3次下載
    Zigbee 3.0的<b class='flag-5'>新功能</b>

    名單公布!【書籍評(píng)測活動(dòng)NO.43】 算力芯片 | 高性能 CPU/GPU/NPU 微架構(gòu)分析

    社會(huì)資源和資本力量關(guān)注算力芯片的發(fā)展,希望我們的國家能夠更獨(dú)立自主地設(shè)計(jì)制造高性能算力芯片。 內(nèi)容簡介: 本書介紹了超級(jí)計(jì)算機(jī)算力和AI算力的異同,從CPU流水線開始,描述主要的眾核處理器架構(gòu)和
    發(fā)表于 09-02 10:09

    HSW-IP5356功能介紹

    英集芯的IP5356M是一款功能強(qiáng)大的移動(dòng)電源SOC,它集成了多種快充協(xié)議和電源管理功能,展現(xiàn)了卓越的兼容性和高效性。IP5356M支持高壓SCP、雙向PD3.0等快充協(xié)議,能為各種移
    發(fā)表于 08-09 14:48 ?1次下載