實時光線追蹤提升了電子游戲中的光照藝術(shù)效果,但該過程需要消耗大量算力。為了減少消耗,NVIDIA 開發(fā)了一款顯存實用程序,它將規(guī)整和二次分配技術(shù)相結(jié)合,可優(yōu)化和減少加速結(jié)構(gòu)的顯存消耗。我們已將此解決方案變?yōu)槊?RTXMU 的 SDK,并在今天將其作為開源版本提供。它專為支持各種 DXR 或 Vulkan 光線追蹤應(yīng)用程序而構(gòu)建。
通過利用 RTXMU 規(guī)整加速結(jié)構(gòu),可消除初始構(gòu)建操作中浪費的顯存。對于使用 RTXMU 的應(yīng)用程序,NVIDIA RTX 顯卡的顯存占用量減少了大約 50%。此外,利用 RTXMU 二次分配加速結(jié)構(gòu)緩沖區(qū)可防止出現(xiàn)碎片和浪費的空間。包含數(shù)千個不同的小 BLAS 的場景將從二次分配中受益匪淺。
RTXMU 如何立即提供幫助?
RTXMU 易于集成,可立即帶來好處。
二次分配和規(guī)整顯存管理器需要花費大量工程時間進行驗證。RTXMU 可縮短開發(fā)者將規(guī)整和二次分配技術(shù)集成到 RTX 游戲中所需的時間。
RTXMU 還會抽象化 BLAS 的顯存和規(guī)整狀態(tài)管理,并管理規(guī)整尺寸回讀和規(guī)整副本所需的所有屏障。
更深入地說,RTXMU 使用 BLAS 數(shù)據(jù)結(jié)構(gòu)的句柄間接層來防止錯誤管理 CPU 內(nèi)存(包括訪問已取消分配或不存在的 BLAS)。此外,二次分配通過將更多 BLAS 裝入 64 KB 或 4 MB 頁面中,帶來了提高 TLB(頁表緩存)命中率的好處。
簡而言之,RTXMU 讓開發(fā)者毫不費力地就能讓實時光線追蹤游戲和應(yīng)用程序更快速地運行。
關(guān)于作者
Ethan Einhorn 是一位有21年游戲行業(yè)經(jīng)驗的資深人士,曾擔(dān)任編輯、營銷、制作和創(chuàng)意指導(dǎo)等職位。目前,他是 NVIDIA 的高級產(chǎn)品營銷經(jīng)理。
審核編輯:郭婷
-
NVIDIA
+關(guān)注
關(guān)注
14文章
5309瀏覽量
106437 -
應(yīng)用程序
+關(guān)注
關(guān)注
38文章
3337瀏覽量
59043
發(fā)布評論請先 登錄
大模型推理顯存和計算量估計方法研究
超150款游戲現(xiàn)已支持NVIDIA Reflex
全球各大品牌利用NVIDIA AI技術(shù)提升運營效率
借助NVIDIA技術(shù)加速半導(dǎo)體芯片制造
利用NVIDIA技術(shù)構(gòu)建從數(shù)據(jù)中心到邊緣的智慧醫(yī)院解決方案
云電競服務(wù)器 工作原理

NVIDIA實現(xiàn)神經(jīng)網(wǎng)絡(luò)渲染技術(shù)的突破性增強功能
NVIDIA發(fā)布DLSS 4技術(shù):多幀生成技術(shù)革新游戲體驗
NVIDIA宣布NVIDIA Isaac重要更新
$1999 的 RTX 5090 來了

評論