NVIDIA Nsight Compute 是一款用于 CUDA 應(yīng)用程序的交互式內(nèi)核分析器。它通過用戶界面和命令行工具提供詳細(xì)的性能指標(biāo)和 API 調(diào)試。 Nsight Compute 2022.2 包含擴(kuò)展支持的環(huán)境和工作流程的功能,用于 CUDA 內(nèi)核評測和優(yōu)化。
NVIDIA OptiX 加速結(jié)構(gòu)查看器
使用新的 NVIDIA OptiX acceleration structure viewer ,用戶可以在啟動(dòng)光線跟蹤管道之前檢查他們構(gòu)建的結(jié)構(gòu)。加速結(jié)構(gòu)描述渲染場景的幾何體,用于光線跟蹤交點(diǎn)計(jì)算。用戶創(chuàng)建這些加速結(jié)構(gòu), OptiX 將其轉(zhuǎn)換為內(nèi)部數(shù)據(jù)結(jié)構(gòu)。有時(shí),用戶創(chuàng)建的描述很容易出錯(cuò),很難理解渲染結(jié)果為什么不符合預(yù)期,或者是什么限制了性能。
有了這個(gè)新功能,用戶可以在三維可視化工具中瀏覽它們,并查看創(chuàng)建過程中使用的參數(shù),如構(gòu)建標(biāo)志、三角形網(wǎng)格頂點(diǎn)和 AABB 坐標(biāo)。此查看器可用于識別重疊或低效的層次結(jié)構(gòu),從而產(chǎn)生亞像素光線跟蹤性能。
圖 1 帶 3D 場景導(dǎo)航的 Nsight Compute acceleration structure viewer
每個(gè)內(nèi)核的問題檢測
最新版本在摘要頁面中添加了一個(gè)新的“檢測到的問題”列,用戶可以根據(jù)檢測到的性能問題的數(shù)量對所有分析的內(nèi)核進(jìn)行排序。這為用戶提供了在多個(gè)結(jié)果(內(nèi)核配置文件)中集中精力的指導(dǎo)。如果用戶不確定要將優(yōu)化工作集中在哪個(gè)內(nèi)核上,那么一個(gè)長時(shí)間運(yùn)行且檢測到大量問題的內(nèi)核是一個(gè)很好的起點(diǎn)。
圖 2 摘要頁面中的“檢測到的問題”列標(biāo)識性能問題最多的內(nèi)核
其他改進(jìn)
源頁面上的度量分組和選擇選項(xiàng)有改進(jìn),使其更易于使用。此外,此版本還增加了對在基于 ARM SBSA 和 L4T 的平臺上運(yùn)行 Nsight Compute 用戶界面的支持,用戶無需遠(yuǎn)程連接或單獨(dú)的主機(jī)即可進(jìn)行配置。
關(guān)于作者
Jackson Marusarz 是 NVIDIA 計(jì)算開發(fā)工具的產(chǎn)品經(jīng)理。他關(guān)注如何使用工具使所有開發(fā)人員能夠輕松高效地評測、調(diào)試和優(yōu)化 CUDA 代碼。杰克遜擁有 Boulder 科羅拉多大學(xué)計(jì)算機(jī)工程碩士學(xué)位。
審核編輯:郭婷
-
NVIDIA
+關(guān)注
關(guān)注
14文章
5309瀏覽量
106472 -
CUDA
+關(guān)注
關(guān)注
0文章
123瀏覽量
14132
發(fā)布評論請先 登錄
如何使用協(xié)議分析儀進(jìn)行數(shù)據(jù)分析與可視化
工業(yè)設(shè)備可視化管理系統(tǒng)是什么

VirtualLab Fusion應(yīng)用:3D系統(tǒng)可視化
可視化組態(tài)物聯(lián)網(wǎng)平臺是什么

VirtualLab Fusion中的可視化設(shè)置
VirtualLab Fusion應(yīng)用:光波導(dǎo)k域布局可視化(“神奇的圓環(huán)”)
七款經(jīng)久不衰的數(shù)據(jù)可視化工具!
光學(xué)系統(tǒng)的3D可視化
什么是大屏數(shù)據(jù)可視化?特點(diǎn)有哪些?
如何找到適合的大屏數(shù)據(jù)可視化系統(tǒng)
智慧能源可視化監(jiān)管平臺——助力可視化能源數(shù)據(jù)管理

評論