一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

UWA推出全新GPU性能測評(píng)工具,支持多款PowerVR芯片優(yōu)化

穎脈Imgtec ? 2023-08-14 10:13 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

移動(dòng)設(shè)備GPU 性能優(yōu)化對(duì)玩家游戲體驗(yàn)至關(guān)重要。侑虎科技 UWA 一直專注于游戲和 VR 應(yīng)用的性能優(yōu)化,移動(dòng)設(shè)備 GPU 優(yōu)化是其關(guān)注的重點(diǎn),為了更好地滿足開發(fā)者針對(duì)不同 GPU 芯片的性能測評(píng)與優(yōu)化,日前他們?cè)谌律?jí)的UWA SDK 2.4.8版本中,推出了 GPU 性能測評(píng)工具—UWA GOT Online GPU 模式。這也是 UWA 繼去年GPU Counter 功能更新增加Imagination PowerVR GPU 芯片支持后的一次重要升級(jí)。

全新的UWA GOT Online GPU 模式帶來了更全面的GPU 性能優(yōu)化方案。在 UWA 官方公開的 GOT Online 支持設(shè)備列表中,可以看到對(duì)多款I(lǐng)magination PowerVR GPU的支持:GE8100、GE8200、GE8300、GE8310、GE8430、GE8320、GE8325、GE8340 等,并且會(huì)持續(xù)刷新支持Imagination PowerVR GPU的型號(hào),表中還列出了GPU耗時(shí)均值、GPU著色、GPU帶寬、GPU圖元處理、GPU負(fù)載等多個(gè)評(píng)測優(yōu)化維度。Imagination 將與 UWA 持續(xù)合作幫助開發(fā)者對(duì)GPU 進(jìn)行更好地優(yōu)化。

30d3fd9a-3a48-11ee-bbcf-dac502259ad0.png

現(xiàn)在,讓我們一一介紹這些重要功能。

  • 性能簡報(bào):該頁面可以快速地幫助開發(fā)者把控項(xiàng)目的GPU性能壓力情況

  • GPU分析:分別從渲染和帶寬兩個(gè)角度,對(duì)GPU性能壓力進(jìn)行分析

  • 渲染資源分析:開啟紋理和網(wǎng)格資源分析功能,定位這些資源的具體使用情況

  • Overdraw快照:更便捷地定位Overdraw壓力來源

GPU溫度:快速判斷設(shè)備發(fā)熱的原因是否主要來自GPU


性能簡報(bào)

如下圖,UWA列出了測試時(shí)的FPS、GPU Clocks數(shù)據(jù),并用淺紅色背景標(biāo)注了GPU Bound幀。GPU Bound表示GPU性能高壓區(qū)間,此時(shí)GPU計(jì)算耗費(fèi)的時(shí)鐘周期數(shù)過高,可能無法支持滿幀運(yùn)作。

3104379e-3a48-11ee-bbcf-dac502259ad0.png

同時(shí),UWA也在圖表下列出了GPU性能、渲染統(tǒng)計(jì)、紋理資源分析和網(wǎng)格資源分析4個(gè)模塊的參數(shù)情況和對(duì)應(yīng)的優(yōu)化任務(wù)隊(duì)列。

311ba4c4-3a48-11ee-bbcf-dac502259ad0.png

312901dc-3a48-11ee-bbcf-dac502259ad0.png

314aab7a-3a48-11ee-bbcf-dac502259ad0.png

簡報(bào)的目的是幫助大家在茫茫多的性能指標(biāo)中,快速篩選出高優(yōu)先級(jí)的優(yōu)化任務(wù)。如需要針對(duì)某些指標(biāo)做更為深層的下探,就可以使用下文中的各個(gè)功能進(jìn)行分析。


GPU分析

在指標(biāo)匯總下,展示了測試過程中獲取到的各項(xiàng)GPU參數(shù)。同時(shí),UWA也根據(jù)這些指標(biāo)間的關(guān)聯(lián),分別從渲染和帶寬兩個(gè)角度,幫助開發(fā)者對(duì)GPU性能壓力進(jìn)行具體分析。

1. 指標(biāo)匯總

GPU TimeGPU Time即每幀的GPU耗時(shí)。GPU耗時(shí)的推薦值和CPU耗時(shí)一樣,當(dāng)項(xiàng)目需要維持在30幀時(shí),GPU耗時(shí)應(yīng)低于33ms(UWA推薦控制在28ms更佳)。同時(shí),UWA也列出了渲染耗時(shí)Fragment Time和頂點(diǎn)處理耗時(shí)Non-Fragment Time數(shù)據(jù)作為補(bǔ)充。

3164c5b4-3a48-11ee-bbcf-dac502259ad0.png


Clocks

GPU Clocks表示渲染一幀耗費(fèi)的GPU時(shí)鐘周期數(shù),和GPU Times一樣,也是用于衡量GPU性能的主要指標(biāo)。通過GPU Clocks,開發(fā)者可以快速定位項(xiàng)目的GPU壓力主要來自哪些場景,并結(jié)合其他GPU參數(shù)對(duì)GPU壓力情況進(jìn)行具體分析。

318471de-3a48-11ee-bbcf-dac502259ad0.png


GPU Utilization

Fragment Utilization和Non Fragment Utilization分別表示圖元處理和非圖元處理任務(wù)處于活動(dòng)狀態(tài)的時(shí)間百分比。

31a409a4-3a48-11ee-bbcf-dac502259ad0.png

當(dāng)Non Fragment Utilization高時(shí),開發(fā)者可以從面片數(shù)、面剔除、模型復(fù)雜度等角度著手進(jìn)行優(yōu)化;而當(dāng)Fragment Utilization高時(shí),則考慮項(xiàng)目中是否存在Overdraw過高、Fragment Shader過于復(fù)雜等問題。


GPU Shaded

在GPU Shaded下,可以獲取到相關(guān)的Fragment shaded、Vertices shaded、Cycles/Pixel指標(biāo)數(shù)據(jù)。

31c88b4e-3a48-11ee-bbcf-dac502259ad0.png

其中Cycles/Pixel表示平均每個(gè)像素耗費(fèi)的GPU時(shí)鐘周期。當(dāng)畫面的Shader復(fù)雜度過高/或者Overdraw過高時(shí),GPU需要消耗大量的時(shí)鐘周期對(duì)Shader進(jìn)行運(yùn)算,容易造成GPU耗時(shí)變高,造成卡頓。通過Cycles/Pixel,即可快速定位高Cycles的場景,需要進(jìn)一步判斷場景的GPU壓力是否是由于Shader復(fù)雜度過高還是Overdraw過高造成,進(jìn)行有針對(duì)性的優(yōu)化。

31eb6326-3a48-11ee-bbcf-dac502259ad0.png

Fragment shaded表示每幀F(xiàn)ragment shader執(zhí)行了多少次,用Fragment shaded數(shù)除以設(shè)備分辨率,可以側(cè)面反映項(xiàng)目的Overdraw情況。

當(dāng)Overdraw較高時(shí),容易引起發(fā)熱和能耗方面的問題。我們可以通過降低半透明粒子特效的粒子數(shù)量、使用不規(guī)則面片代替矩形面片渲染粒子特效或UI等方式,減少項(xiàng)目的Overdraw層數(shù),降低GPU壓力。

31f12108-3a48-11ee-bbcf-dac502259ad0.png

而Vertices shaded則表示每幀Vertex shader執(zhí)行了多少次。使用Vertices shaded除以輸入圖元數(shù),即可得到平均每個(gè)圖元進(jìn)行了多少次Vertices shaded。UWA推薦平均每個(gè)圖元執(zhí)行次數(shù)應(yīng)控制在1.5次以下。

3207e47e-3a48-11ee-bbcf-dac502259ad0.png


GPU Bandwidth

和CPU一樣,GPU Bandwidth也是芯片耗電的重要指標(biāo)。當(dāng)GPU持續(xù)進(jìn)行高負(fù)載外部讀寫時(shí),掉電就會(huì)過快。UWA的GPU Bandwidth模塊統(tǒng)計(jì)了測試過程中單幀的讀寫帶寬總量,通過查看GPU Bandwidth模塊,可以快速定位測試過程中帶寬較高的場景和原因,并進(jìn)行進(jìn)一步測試優(yōu)化。

32228806-3a48-11ee-bbcf-dac502259ad0.png


GPU Memory Bus Utilization

GPU Memory Bus Utilization,即每幀GPU內(nèi)存總線負(fù)載。它表示當(dāng)前GPU帶寬消耗占總可用帶寬的百分比。當(dāng)GPU Memory Bus Utilization持續(xù)較高時(shí),說明GPU訪問內(nèi)存的頻率過于頻繁,可以通過減少紋理資源與網(wǎng)格資源的大小和數(shù)量控制GPU緩存的占比。

324644f8-3a48-11ee-bbcf-dac502259ad0.png


GPU Primitive

渲染面是產(chǎn)生GPU壓力的重要因素之一,渲染面過多可能是模型過于復(fù)雜;也可能是地形、大建筑物等大面積模型沒有進(jìn)行適當(dāng)?shù)牟鸱郑瑢?dǎo)致進(jìn)入視域體的面片可能不多,但提交GPU的渲染面依然很多。

對(duì)于這種情況,我們可以通過GPU Primitive下的各項(xiàng)參數(shù)來進(jìn)行初步判斷。

3267ca42-3a48-11ee-bbcf-dac502259ad0.png

Input Primitives:提交到GPU端的圖元總數(shù),該數(shù)值基本等同于引擎端統(tǒng)計(jì)的渲染面片總數(shù)。

Visible Primitives:在GPU端通過各種裁剪之后,留下的參與渲染的三角面。

Culled Primitives:因?yàn)樵谝曈蝮w外而被裁剪的三角面,因?yàn)槌蚨徊眉舻娜敲妗?/p>

GPU圖元處理數(shù)量過多會(huì)對(duì)設(shè)備的帶寬和能耗造成較大的影響,應(yīng)盡量在程序端完成剔除,并減小送往GPU的圖元數(shù)。在3D場景中,比較理想的情況下,可見圖元的數(shù)量應(yīng)該接近或高于 50%(對(duì)于大部分模型,有一半三角面會(huì)因?yàn)槌虮徊眉簦?。如果某些角度下,可見圖元的比例非常低,則很可能存在上文提到的第二種情況,從而可以針對(duì)性地檢查和優(yōu)化場景中,這個(gè)角度下,被提交到GPU的大面積模型。

32874d68-3a48-11ee-bbcf-dac502259ad0.png

2. GPU渲染分析

GPU Clocks是衡量GPU性能的主要指標(biāo),結(jié)合該曲線,開發(fā)者可以快速判斷各個(gè)場景中的GPU壓力。

32a22584-3a48-11ee-bbcf-dac502259ad0.png

同時(shí),UWA也展示出了GPU Shaded、GPU Primitive指標(biāo)的均值和性能走勢(shì)。當(dāng)某個(gè)場景中的GPU Clocks較高時(shí),通過這些指標(biāo)的推薦值和性能曲線,開發(fā)者就可以快速判斷是哪些參數(shù)造成的GPU渲染計(jì)算壓力,并采取相應(yīng)的優(yōu)化方案。

32b5b4c8-3a48-11ee-bbcf-dac502259ad0.png


3. GPU帶寬分析

由于GPU讀、寫帶寬較高時(shí)都會(huì)造成大量的發(fā)熱和耗電,需要開發(fā)者重點(diǎn)關(guān)注。

在相關(guān)參數(shù)中,也展示了GPU Memory Bus Utilization、GPU Primitive參數(shù)。比如當(dāng)GPU Primitives較高時(shí),就說明提交到GPU端的圖元總數(shù)較多,可能引起較高的帶寬壓力。

32dacb32-3a48-11ee-bbcf-dac502259ad0.png32f66784-3a48-11ee-bbcf-dac502259ad0.png


渲染資源分析

當(dāng)參與渲染的紋理和網(wǎng)格資源越多、采樣越多時(shí),資源內(nèi)存會(huì)變高,GPU帶寬和GPU Clocks也會(huì)相應(yīng)上漲。為了保證讓參與渲染計(jì)算的資源物盡其用,開發(fā)者可以手動(dòng)開啟紋理和網(wǎng)格資源分析功能,定位這些資源的具體使用情況。

3323d69c-3a48-11ee-bbcf-dac502259ad0.png

紋理資源分析

在紋理資源分析頁,除了紋理資源的內(nèi)存、數(shù)量、尺寸等參數(shù)外,我們還可以查看紋理渲染利用率、是否開啟Mipmap和Mipmap采樣率等數(shù)據(jù)。

33f87fe6-3a48-11ee-bbcf-dac502259ad0.png

34277332-3a48-11ee-bbcf-dac502259ad0.png

通過紋理渲染利用率,開發(fā)者即可快速定位到一直在內(nèi)存中但從未參與過渲染的紋理資源,以此排查是否存在場景中不可見的渲染物體、不合理的打包和加載策略等可能造成此種浪費(fèi)的因素。

344f6f18-3a48-11ee-bbcf-dac502259ad0.png

347f65ba-3a48-11ee-bbcf-dac502259ad0.png

而通過Mipmap 0層采樣率是否較低(低于20%),則可以判斷哪些紋理資源的尺寸過大,開發(fā)者就可以通過降低這些紋理資源分辨率緩解內(nèi)存和GPU壓力,同時(shí)也不會(huì)影響畫面效果。

網(wǎng)格資源分析

在網(wǎng)格資源分析頁,除了和紋理資源相似的資源渲染利用率外,我們也可以查看網(wǎng)格的最大屏占比和最小渲染密度數(shù)據(jù)。渲染利用率為0的網(wǎng)格資源和紋理資源優(yōu)化方式相似,而網(wǎng)格最大屏占比和最小渲染密度則可以用于排查網(wǎng)格資源的精度是否合理。

3499167c-3a48-11ee-bbcf-dac502259ad0.png

當(dāng)網(wǎng)格的最大屏占比小于0.02%時(shí),說明網(wǎng)格在手機(jī)屏幕中只占很小的一部分,可見性較低。如果同時(shí)網(wǎng)格的復(fù)雜度較高,就說明網(wǎng)格的精度過高,開發(fā)者可以考慮使用更低精度的模型進(jìn)行替換。

34bf2a7e-3a48-11ee-bbcf-dac502259ad0.png

34d2a342-3a48-11ee-bbcf-dac502259ad0.png

渲染密度則表示在平均每一萬像素中網(wǎng)格的頂點(diǎn)數(shù),如果該值大于1000,則說明我們?cè)诤苄〉漠嬅嬷欣L制了過于復(fù)雜的網(wǎng)格。因此,當(dāng)此網(wǎng)格的渲染密度最小時(shí),該數(shù)值仍然高于1000,那么此網(wǎng)格的頂點(diǎn)數(shù)大概率是過高的,開發(fā)者可以考慮對(duì)這些網(wǎng)格資源進(jìn)行減面操作,或使用LOD分級(jí)處理。


Overdraw快照

Overdraw表示項(xiàng)目運(yùn)行過程中單幀中整個(gè)屏幕被填充的倍數(shù)。在游戲運(yùn)行過程中,場景中半透明物體的重合會(huì)使得同一個(gè)像素點(diǎn)在一幀中會(huì)被繪制多次,容易造成Overdraw過高,引起設(shè)備發(fā)熱。

在Overdraw快照模塊,UWA通過Fragment Shaded(渲染像素總數(shù))與設(shè)備渲染分辨率,換算得到了Overdraw的計(jì)算值,以幫助開發(fā)者對(duì)項(xiàng)目的Overdraw情況進(jìn)行排查。

34e9c144-3a48-11ee-bbcf-dac502259ad0.png

在測試GPU模式時(shí),開發(fā)者可以手動(dòng)Dump采集場景中具體的Overdraw情況。

350535c8-3a48-11ee-bbcf-dac502259ad0.png

在Overdraw快照模塊,即可查看Dump幀各個(gè)相機(jī)的Overdraw情況。其中Overlay-UI(UWA)相機(jī)展示的是UGUI中Overlay部分的Overdraw信息,即所有沒有掛在任何相機(jī)下UI的Overdraw信息。

35385264-3a48-11ee-bbcf-dac502259ad0.png

在柱狀圖下方,還可以查看所選柱狀圖的Overdraw熱力圖,其中顏色越紅,表示該處像素在當(dāng)前幀中被填充的次數(shù)較多,Overdraw較高,GPU的壓力就越大。

355204e8-3a48-11ee-bbcf-dac502259ad0.png

開發(fā)者可以結(jié)合報(bào)告截圖和Overdraw熱力圖,更便捷地定位項(xiàng)目的Overdraw壓力來源。


GPU溫度

GPU壓力較高時(shí)容易引起設(shè)備發(fā)熱。UWA統(tǒng)計(jì)了設(shè)備的GPU、CPU、電池溫度,以便開發(fā)者判斷設(shè)備發(fā)熱的原因是否主要來自GPU。

3573bf5c-3a48-11ee-bbcf-dac502259ad0.png

若確認(rèn)是由于GPU壓力導(dǎo)致發(fā)熱,接下來可以進(jìn)一步排查與GPU溫度情況有關(guān)的參數(shù),譬如FPS、GPU Clocks、GPU bandwidth。而功率則會(huì)和GPU溫度相互影響,也是反應(yīng)能耗和發(fā)熱問題的重要參數(shù)。

358c657a-3a48-11ee-bbcf-dac502259ad0.png

這里特別建議大家:由于CPU和GPU芯片位置較近,當(dāng)CPU壓力較大產(chǎn)生發(fā)熱時(shí),也可能帶動(dòng)GPU一起發(fā)熱。所以在優(yōu)化GPU發(fā)熱問題時(shí),也要適當(dāng)結(jié)合CPU壓力情況進(jìn)行排查分析??偟膩碚f,當(dāng)項(xiàng)目存在耗電快、溫度高的現(xiàn)象時(shí),開發(fā)者可以從GPU性能壓力、GPU帶寬、CPU主線程、CPU子線程等方面著手,優(yōu)化發(fā)熱問題。

UWA提供的性能測評(píng)工具更進(jìn)一步地拆分和細(xì)化了項(xiàng)目的GPU壓力成因,為您帶來前所未有的優(yōu)化體驗(yàn)。UWA的目標(biāo)是讓您更便捷、高效地定位項(xiàng)目的GPU壓力來源,告別盲目猜測,擁抱精準(zhǔn)優(yōu)化。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 芯片
    +關(guān)注

    關(guān)注

    460

    文章

    52520

    瀏覽量

    441093
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    4948

    瀏覽量

    131265
  • vr
    vr
    +關(guān)注

    關(guān)注

    34

    文章

    9675

    瀏覽量

    152729
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    【「算力芯片 | 高性能 CPU/GPU/NPU 微架構(gòu)分析」閱讀體驗(yàn)】+NVlink技術(shù)從應(yīng)用到原理

    前言 【「算力芯片 | 高性能 CPU/GPU/NPU 微架構(gòu)分析」書中的芯片知識(shí)是比較接近當(dāng)前的頂尖芯片水平的,同時(shí)包含了
    發(fā)表于 06-18 19:31

    英諾達(dá)推出RTL功耗優(yōu)化工具

    英諾達(dá)(成都)電子科技有限公司隆重推出芯片設(shè)計(jì)早期RTL級(jí)功耗優(yōu)化工具—EnFortius RTL Power Explorer(ERPE),該工具可以高效、全面地在RTL設(shè)計(jì)階段進(jìn)行
    的頭像 發(fā)表于 03-20 17:06 ?568次閱讀

    Flexus X 實(shí)例性能測評(píng)

    潛在性能瓶頸,確保在高并發(fā)和海量數(shù)據(jù)處理等極端情況下系統(tǒng)的穩(wěn)定性有重要意義。 測評(píng)的結(jié)果還幫助企業(yè)對(duì)優(yōu)化?IT 支出,避免性能不足導(dǎo)致的業(yè)務(wù)中斷有決策作用。因此,
    的頭像 發(fā)表于 12-24 12:18 ?513次閱讀
    Flexus X 實(shí)例<b class='flag-5'>性能</b><b class='flag-5'>測評(píng)</b>

    芯原推出新一代高性能Vitality架構(gòu)GPU IP系列

    芯原股份(芯原,股票代碼:688521.SH)今日宣布推出全新Vitality架構(gòu)的圖形處理器(GPU)IP系列,具備高性能計(jì)算能力,廣泛適用于云游戲、AI PC、獨(dú)立顯卡和集成顯卡等
    的頭像 發(fā)表于 12-19 15:55 ?498次閱讀

    《CST Studio Suite 2024 GPU加速計(jì)算指南》

    問題,但會(huì)降低舊GPU硬件性能,可通過NVIDIA控制面板或命令行工具nvidia - smi管理。 - TCC模式(Windows only):某些GPU計(jì)算需要啟用,可通過命令行
    發(fā)表于 12-16 14:25

    南方測繪多款實(shí)景三維軟件產(chǎn)品通過官方測評(píng)

    為推進(jìn)地理信息產(chǎn)業(yè)高質(zhì)量發(fā)展,助力數(shù)字中國建設(shè),為相關(guān)行業(yè)或重大工程提供成熟、合格的地理信息軟件產(chǎn)品,根據(jù)市場、用戶、相關(guān)部門、行業(yè)的需求,中國地理信息產(chǎn)業(yè)協(xié)會(huì)開展了地理信息相關(guān)軟件測評(píng)工作,結(jié)果于近期公示。
    的頭像 發(fā)表于 12-13 10:35 ?1225次閱讀

    Cincoze德承推出兩款全新GPU嵌入式工控機(jī)

    ,高性能GPU全長卡可擴(kuò)展型工業(yè)工控機(jī)GP-3100系列,搭載了全新的第14代Intel? Core?處理器(Raptor Lake-S Refresh),并支持最多兩張250W全長
    的頭像 發(fā)表于 12-11 14:47 ?1366次閱讀

    英諾達(dá)推出兩款全新靜態(tài)驗(yàn)證EDA工具

    (2024年12月5日,四川成都)英諾達(dá)(成都)電子科技有限公司隆重推出兩款全新的靜態(tài)驗(yàn)證EDA工具:EnAltiusCDC跨域檢查工具和Lint RTL代碼檢查
    的頭像 發(fā)表于 12-05 10:13 ?1093次閱讀
    英諾達(dá)<b class='flag-5'>推出</b>兩款<b class='flag-5'>全新</b>靜態(tài)驗(yàn)證EDA<b class='flag-5'>工具</b>

    國科微亮相2024 UWA聯(lián)盟會(huì)員大會(huì)

    近日,2024 UWA SUMMIT暨世界超高清視頻產(chǎn)業(yè)聯(lián)盟會(huì)員大會(huì)在深圳開幕,超高清產(chǎn)業(yè)生態(tài)體驗(yàn)展同期舉辦。作為UWA聯(lián)盟會(huì)員單位、超高清視頻賽道領(lǐng)先企業(yè),國科微重磅展出4K/8K超高清解碼芯片系列與4K/8K超高清顯示
    的頭像 發(fā)表于 11-30 09:35 ?799次閱讀

    英特爾12月或發(fā)布Battlemage GPU芯片

    近日,有關(guān)英特爾即將在12月發(fā)布全新Battlemage GPU芯片的傳聞再次被證實(shí)。據(jù)硬件挖掘者和泄密者Tomasz Gawrońsk分享的預(yù)告圖顯示,英特爾極有可能在AMD RDNA 4和英偉達(dá)Blackwell之前,率先
    的頭像 發(fā)表于 11-19 17:37 ?828次閱讀

    天璣9400技術(shù)詳解:如何蟬聯(lián)GPU性能、能效雙冠軍

    全新高度,引發(fā)了廣泛好評(píng)。 天璣9400搭載全新頂級(jí)12核GPU G925,相較上代擁有超過41%的峰值性能飛躍,在保持與上一代相同的峰值性能
    的頭像 發(fā)表于 11-07 14:00 ?826次閱讀
    天璣9400技術(shù)詳解:如何蟬聯(lián)<b class='flag-5'>GPU</b><b class='flag-5'>性能</b>、能效雙冠軍

    如何構(gòu)建及優(yōu)化GPU云網(wǎng)絡(luò)

    并從計(jì)算節(jié)點(diǎn)成本優(yōu)化、集群網(wǎng)絡(luò)與拓?fù)涞倪x擇等方面論述如何構(gòu)建及優(yōu)化GPU云網(wǎng)絡(luò)。
    的頭像 發(fā)表于 11-06 16:03 ?1032次閱讀
    如何構(gòu)建及<b class='flag-5'>優(yōu)化</b><b class='flag-5'>GPU</b>云網(wǎng)絡(luò)

    如何優(yōu)化SOC芯片性能

    優(yōu)化SOC(System on Chip,系統(tǒng)級(jí)芯片芯片性能是一個(gè)復(fù)雜而多維的任務(wù),涉及多個(gè)方面的優(yōu)化策略。以下是一些關(guān)鍵的
    的頭像 發(fā)表于 10-31 15:50 ?1752次閱讀

    使用Arthas火焰圖工具的Java應(yīng)用性能分析和優(yōu)化經(jīng)驗(yàn)

    分享作者在使用Arthas火焰圖工具進(jìn)行Java應(yīng)用性能分析和優(yōu)化的經(jīng)驗(yàn)。
    的頭像 發(fā)表于 10-28 09:27 ?1298次閱讀
    使用Arthas火焰圖<b class='flag-5'>工具</b>的Java應(yīng)用<b class='flag-5'>性能</b>分析和<b class='flag-5'>優(yōu)化</b>經(jīng)驗(yàn)

    名單公布!【書籍評(píng)測活動(dòng)NO.43】 算力芯片 | 高性能 CPU/GPU/NPU 微架構(gòu)分析

    。本書對(duì)華為等廠商推出的NPU芯片設(shè)計(jì)也做了架構(gòu)描述,中國也擁有獨(dú)立自主知識(shí)產(chǎn)權(quán)的高算力芯片,并且支持芯片、高帶寬互連。本書也回顧了近20
    發(fā)表于 09-02 10:09