一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

利用NVIDIA RTXMU改進游戲顯存分配

星星科技指導(dǎo)員 ? 來源:NVIDIA ? 作者:Ethan Einhorn ? 2022-04-22 10:32 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

實時光線追蹤提升了電子游戲中的光照藝術(shù)效果,但該過程需要消耗大量算力。為了減少消耗,NVIDIA 開發(fā)了一款顯存實用程序,它將規(guī)整和二次分配技術(shù)相結(jié)合,可優(yōu)化和減少加速結(jié)構(gòu)的顯存消耗。我們已將此解決方案變?yōu)槊?RTXMU 的 SDK,并在今天將其作為開源版本提供。它專為支持各種 DXR 或 Vulkan 光線追蹤應(yīng)用程序而構(gòu)建。

通過利用 RTXMU 規(guī)整加速結(jié)構(gòu),可消除初始構(gòu)建操作中浪費的顯存。對于使用 RTXMU 的應(yīng)用程序,NVIDIA RTX 顯卡的顯存占用量減少了大約 50%。此外,利用 RTXMU 二次分配加速結(jié)構(gòu)緩沖區(qū)可防止出現(xiàn)碎片和浪費的空間。包含數(shù)千個不同的小 BLAS 的場景將從二次分配中受益匪淺。

RTXMU 如何立即提供幫助?

RTXMU 易于集成,可立即帶來好處。

二次分配和規(guī)整顯存管理器需要花費大量工程時間進行驗證。RTXMU 可縮短開發(fā)者將規(guī)整和二次分配技術(shù)集成到 RTX 游戲中所需的時間。

RTXMU 還會抽象化 BLAS 的顯存和規(guī)整狀態(tài)管理,并管理規(guī)整尺寸回讀和規(guī)整副本所需的所有屏障。

更深入地說,RTXMU 使用 BLAS 數(shù)據(jù)結(jié)構(gòu)的句柄間接層來防止錯誤管理 CPU 內(nèi)存(包括訪問已取消分配或不存在的 BLAS)。此外,二次分配通過將更多 BLAS 裝入 64 KB 或 4 MB 頁面中,帶來了提高 TLB(頁表緩存)命中率的好處。

簡而言之,RTXMU 讓開發(fā)者毫不費力地就能讓實時光線追蹤游戲和應(yīng)用程序更快速地運行。

關(guān)于作者

Ethan Einhorn 是一位有21年游戲行業(yè)經(jīng)驗的資深人士,曾擔(dān)任編輯、營銷、制作和創(chuàng)意指導(dǎo)等職位。目前,他是 NVIDIA 的高級產(chǎn)品營銷經(jīng)理。

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5309

    瀏覽量

    106437
  • 應(yīng)用程序
    +關(guān)注

    關(guān)注

    38

    文章

    3337

    瀏覽量

    59043
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    大模型推理顯存和計算量估計方法研究

    隨著人工智能技術(shù)的飛速發(fā)展,深度學(xué)習(xí)大模型在各個領(lǐng)域得到了廣泛應(yīng)用。然而,大模型的推理過程對顯存和計算資源的需求較高,給實際應(yīng)用帶來了挑戰(zhàn)。為了解決這一問題,本文將探討大模型推理顯存和計算量的估計
    發(fā)表于 07-03 19:43

    超150款游戲現(xiàn)已支持NVIDIA Reflex

    NVIDIA Reflex 是一項顛覆性技術(shù),可降低 GeForce 顯卡、臺式電腦和筆記本電腦的 PC 延遲,讓玩家更迅速地作出反應(yīng),使其在多人游戲中更具競爭力,并且該技術(shù)能夠讓單人游戲擁有更快的響應(yīng)速度、更加爽快的體驗。
    的頭像 發(fā)表于 06-26 09:29 ?370次閱讀

    全球各大品牌利用NVIDIA AI技術(shù)提升運營效率

    歐萊雅、LVMH 集團和雀巢利用 NVIDIA 加速的智能體 AI 和物理 AI,大幅提升產(chǎn)品設(shè)計、營銷及物流等方面的運營效率。
    的頭像 發(fā)表于 06-19 14:36 ?489次閱讀

    借助NVIDIA技術(shù)加速半導(dǎo)體芯片制造

    NVIDIA Blackwell GPU、NVIDIA Grace CPU、高速 NVIDIA NVLink 網(wǎng)絡(luò)架構(gòu)和交換機,以及諸如 NVIDIA cuDSS 和
    的頭像 發(fā)表于 05-27 13:59 ?441次閱讀

    利用NVIDIA技術(shù)構(gòu)建從數(shù)據(jù)中心到邊緣的智慧醫(yī)院解決方案

    全球領(lǐng)先的電子制造商正在利用 NVIDIA 技術(shù),構(gòu)建從數(shù)據(jù)中心到邊緣的智慧醫(yī)院解決方案。
    的頭像 發(fā)表于 05-22 09:50 ?349次閱讀

    云電競服務(wù)器 工作原理

    實例,實現(xiàn)硬件資源的按需分配與隔離運行。 資源池化?:CPU、GPU、內(nèi)存等硬件資源整合為統(tǒng)一資源池,支持多租戶并行使用 彈性調(diào)度?:根據(jù)游戲負載自動調(diào)整資源配比(如《賽博朋克2077》運行時自動分配更高GPU
    的頭像 發(fā)表于 05-14 07:44 ?205次閱讀
    云電競服務(wù)器 工作原理

    NVIDIA實現(xiàn)神經(jīng)網(wǎng)絡(luò)渲染技術(shù)的突破性增強功能

    發(fā)者能使用 NVIDIA GeForce RTX GPU 中的 AI Tensor Cores,在游戲的圖形渲染管線內(nèi)加速神經(jīng)網(wǎng)絡(luò)渲染。
    的頭像 發(fā)表于 04-07 11:33 ?447次閱讀

    NVIDIA發(fā)布DLSS 4技術(shù):多幀生成技術(shù)革新游戲體驗

    在1月23日,NVIDIA隨著RTX 50系列顯卡的問世,同步推出了全新的DLSS 4技術(shù)。這一技術(shù)憑借先進的多幀生成(MFG)功能,顯著提升了游戲的幀率,為玩家?guī)砹烁鼮榱鲿车?b class='flag-5'>游戲體驗。
    的頭像 發(fā)表于 01-24 15:29 ?737次閱讀

    NVIDIA宣布NVIDIA Isaac重要更新

    ,更為全球開發(fā)者提供了更加強大、高效的工具,以加速AI機器人的開發(fā)進程。 NVIDIA Isaac是一個綜合性的平臺,它集成了加速庫、應(yīng)用框架和AI模型等多種資源。這些組件協(xié)同工作,為開發(fā)者提供了一個從底層算法到上層應(yīng)用的全方位支持環(huán)境。通過利用
    的頭像 發(fā)表于 01-17 14:45 ?542次閱讀

    $1999 的 RTX 5090 來了

    和最具挑戰(zhàn)性的創(chuàng)意工作負載。使用全光線追蹤和最低延遲進行游戲。GeForce RTX 5090 采用 NVIDIA Blackwell 架構(gòu),配備 32GB 超高速 GDDR7 顯存,讓您無所不能。 Spec GPU 引擎規(guī)格
    的頭像 發(fā)表于 01-13 10:03 ?1379次閱讀
    $1999 的 RTX 5090 來了

    機械革命與NVIDIA聯(lián)手首發(fā)RTX 50系列游戲

    近日,在萬眾矚目的CES 2025國際消費電子展上,軟通動力旗下知名PC品牌機械革命攜手NVIDIA,全球同步首發(fā)了一系列搭載全新GeForce RTX 50系列筆記本電腦GPU的游戲本。這一
    的頭像 發(fā)表于 01-08 15:46 ?802次閱讀

    AMD與NVIDIA GPU優(yōu)缺點

    NVIDIA的RTX系列顯卡以其強大的光線追蹤和DLSS技術(shù)領(lǐng)先于市場。例如,NVIDIA的RTX 3080在4K分辨率下提供了卓越的游戲體驗,而AMD的Radeon RX 6800 XT雖然在某些
    的頭像 發(fā)表于 10-27 11:15 ?2548次閱讀

    微軟推出DirectSR接口,集成FSR 3.1等SR技術(shù)提升游戲體驗

    微軟近期宣布,開發(fā)人員現(xiàn)在可以通過DirectSR通用接口,充分利用FSR 3.1以及其他超分辨率(SR)技術(shù),包括Intel XeSS和NVIDIA DLSS,以確保在各種硬件配置下都能提供卓越
    的頭像 發(fā)表于 10-27 10:08 ?731次閱讀

    Foxconn利用NVIDIA AI和Omniverse訓(xùn)練機器人

    全球最大電子制造商 Foxconn 正準備制造 NVIDIA 最復(fù)雜的產(chǎn)品之一,并開始使用 NVIDIA Omniverse 和 Isaac 平臺驅(qū)動的數(shù)字孿生。
    的頭像 發(fā)表于 10-10 09:40 ?868次閱讀

    顯存技術(shù)不斷升級,AI計算中如何選擇合適的顯存

    電子發(fā)燒友網(wǎng)報道(文/李彎彎)顯存,是顯卡上用于存儲圖像數(shù)據(jù)、紋理、幀緩沖區(qū)等的內(nèi)存。它的大小直接決定了顯卡能夠同時處理的數(shù)據(jù)量。 ? 在AI計算中,顯存的大小對處理大規(guī)模數(shù)據(jù)集、深度學(xué)習(xí)模型的訓(xùn)練
    的頭像 發(fā)表于 09-11 00:11 ?4792次閱讀