網格著色器是最近添加到編程管道中的一種,旨在克服經典幾何管道使用的固定布局的瓶頸。本文介紹了 DirectX 和 Vulkan 開發(fā)人員的最佳實踐。
圖 1 網格著色器替代幾何體管道
推薦:
分割數(shù)據(jù)時,使用 64 個唯一頂點和 126 個三角形基本體的值,中間甜點為 40 和 84 。這里的重點是組織實現(xiàn),以便直接使用不同的分段進行實驗。
盡可能減少放大和網格著色器中的有效負載大?。?/p>
使用位壓縮和量化表示
用重心替換屬性,并允許像素著色器獲取和插值屬性
網格和放大著色器階段為 LoD 選擇和進一步剔除策略提供了機會。這些可在不同粒度下實現(xiàn),例如:
在 AS 階段:剔除簇或進行管道 LoD 決策
在 MS 階段:剔除單個原語
如果很簡單,可以提前做出決策,并使用應用程序中可用的推斷數(shù)據(jù)。這樣可以節(jié)省大量的工作。請記住,不需要模擬更復雜的剔除方案,默認情況下,硬件會有效地模擬這些方案。
在處理程序實例化時,依賴放大著色器和網格著色器,例如頭發(fā)或植被、 iso 曲面(流體模擬、醫(yī)學成像中的體素數(shù)據(jù))、從 3D 掃描獲得的資源、 LOD 以及 CAD 應用程序中經常遇到的一般詳細模型。
考慮特殊網格的拓撲連通性。與顯示稀疏拓撲的網格(如粒子)相比,我有單獨的實現(xiàn)來處理密集拓撲。
請注意,放大著色器階段會增加開銷,盡管通常這可以忽略不計。
Vulkan:
與 DX 相比,VK_NV_mesh_shader中的網格著色器允許對網格輸出進行任意讀寫訪問,這些輸出是預先分配的。您可以通過直接使用或重新調整這些輸出的用途來獲得性能,并避免額外的共享內存分配。
不推薦:
避免放大著色器的大輸出,因為這會導致嚴重的性能損失。通常,我們鼓勵靈活的實現(xiàn),允許微調??紤]到這一點,有許多通用因素會影響性能:
有效載荷的大小。 AS 有效負載最好保持在 108 / 236 字節(jié)以下。
放大著色器的調用次數(shù)。
由相應放大著色器發(fā)射的網格著色器數(shù)(放大率)。
不要嘗試使用放大和網格著色器模擬固定函數(shù)管道,因為這可能會增加冗余。
避免在每一幀的新網格中分割,并考慮脫機烘焙這些數(shù)據(jù),這允許在空間或頂點重用中優(yōu)化網格。
關于作者
wnger:
Ana Mihut 是 NVIDIA 的圖形開發(fā)工程師,她專注于游戲引擎中新渲染技術的優(yōu)化和集成。在 NVIDIA 之前,她在 Foundry 擔任渲染軟件工程師,致力于電影 VFX 渲染。安娜擁有博士學位。紐卡斯爾大學計算機科學專業(yè)
Christoph Kubisch 是 NVIDIA 公司的高級開發(fā)技術工程師,專注于 OpenGL 和 Vulkan 實時渲染技術,適用于 CAD / DCC 和科學應用。他與外部合作伙伴和 NVIDIA 的內部團隊合作,優(yōu)化當前和未來的渲染算法。在加入 NVIDIA 之前, Christoph 是馬格德堡 Otto von Guericke 大學醫(yī)學數(shù)據(jù)集硬件加速可視化技術的研究人員。此外,他還作為技術藝術家創(chuàng)作游戲藝術、技術和 DCC 插件開發(fā)。
Manuel Kraemer 目前在 NVIDIA 擔任圖形軟件工程師,專注于高性能幾何圖形處理。在此之前,他曾在皮克斯、迪士尼動畫、雙底片和英國廣播公司擔任多個電影、動畫和電視項目的技術總監(jiān)。
審核編輯:郭婷
-
NVIDIA
+關注
關注
14文章
5309瀏覽量
106413
發(fā)布評論請先 登錄
Linux網絡管理的關鍵技術和最佳實踐
天馬榮獲新財富雜志“2024 ESG最佳實踐獎”
兆芯最佳實踐應用場景解決方案發(fā)布
立訊精密入選2024可持續(xù)發(fā)展最佳實踐案例
利用自適應網格細化功能自動生成最佳網格

MES系統(tǒng)的最佳實踐案例
邊緣計算架構設計最佳實踐
云計算平臺的最佳實踐
TMCS110x 布局挑戰(zhàn)和最佳實踐

衰減 AMC3301 系列輻射發(fā)射 EMI 的最佳實踐

評論