TensorRT 支持不同的數(shù)據(jù)格式。有兩個(gè)方面需要考慮:數(shù)據(jù)類型和布局。
數(shù)據(jù)類型格式
數(shù)據(jù)類型是每個(gè)單獨(dú)值的表示。它的大小決定了取值范圍和表示的精度,分別是FP32(32位浮點(diǎn),或單精度),F(xiàn)P16(16位浮點(diǎn)或半精度),INT32(32位整數(shù)表示),和 INT8(8 位表示)。
布局格式
布局格式確定存儲(chǔ)值的順序。通常,batch 維度是最左邊的維度,其他維度指的是每個(gè)數(shù)據(jù)項(xiàng)的方面,例如圖像中的C是通道, H是高度, W是寬度。忽略總是在這些之前的批量大小, C 、 H和W通常被排序?yàn)镃HW (參見圖 1 )或HWC (參見圖 2 )。
圖1. CHW的布局格式:圖像分為HxW矩陣,每個(gè)通道一個(gè),矩陣按順序存儲(chǔ);通道的所有值都是連續(xù)存儲(chǔ)的。
圖2. HWC的布局格式:圖像存儲(chǔ)為單個(gè)HxW矩陣,其值實(shí)際上是 C 元組,每個(gè)通道都有一個(gè)值;一個(gè)點(diǎn)(像素)的所有值都是連續(xù)存儲(chǔ)的。
為了實(shí)現(xiàn)更快的計(jì)算,定義了更多格式以將通道值打包在一起并使用降低的精度。因此,TensorRT 還支持NC / 2HW2和NHWC8等格式。
在NC / 2HW2 ( TensorFormat::kCHW2 ) 中,通道值對(duì)在每個(gè)HxW矩陣中打包在一起(在奇數(shù)通道的情況下為空值)。結(jié)果是一種格式,其中? C/2 ? HxW矩陣的值是兩個(gè)連續(xù)通道的值對(duì)(參見圖 3 );請(qǐng)注意,如果它們?cè)谕粚?duì)中,則此排序?qū)⒕S度交錯(cuò)為具有步長1的通道的值,否則將步長為 2xHxW 。
圖 3. 一對(duì)通道值在每個(gè)HxW矩陣中打包在一起。結(jié)果是一種格式,其中[C/2] HxW矩陣的值是兩個(gè)連續(xù)通道的值對(duì)
在NHWC8 ( TensorFormat::kHWC8 ) 中, HxW矩陣的條目包括所有通道的值。此外,這些值被打包在? C/8 ? 8 元組中,并且C向上舍入到最接近的 8 倍數(shù)。
在這種NHWC8格式中, HxW矩陣的條目包括所有通道的值。
其他TensorFormat遵循與前面提到的TensorFormat::kCHW2和TensorFormat::kHWC8類似的規(guī)則。
關(guān)于作者
Ken He 是 NVIDIA 企業(yè)級(jí)開發(fā)者社區(qū)經(jīng)理 & 高級(jí)講師,擁有多年的 GPU 和人工智能開發(fā)經(jīng)驗(yàn)。自 2017 年加入 NVIDIA 開發(fā)者社區(qū)以來,完成過上百場(chǎng)培訓(xùn),幫助上萬個(gè)開發(fā)者了解人工智能和 GPU 編程開發(fā)。在計(jì)算機(jī)視覺,高性能計(jì)算領(lǐng)域完成過多個(gè)獨(dú)立項(xiàng)目。并且,在機(jī)器人和無人機(jī)領(lǐng)域,有過豐富的研發(fā)經(jīng)驗(yàn)。對(duì)于圖像識(shí)別,目標(biāo)的檢測(cè)與跟蹤完成過多種解決方案。曾經(jīng)參與 GPU 版氣象模式GRAPES,是其主要研發(fā)者。
審核編輯:郭婷
-
機(jī)器人
+關(guān)注
關(guān)注
213文章
29735瀏覽量
212855 -
NVIDIA
+關(guān)注
關(guān)注
14文章
5309瀏覽量
106373 -
人工智能
+關(guān)注
關(guān)注
1806文章
49014瀏覽量
249415
發(fā)布評(píng)論請(qǐng)先 登錄
使用NVIDIA Triton和TensorRT-LLM部署TTS應(yīng)用的最佳實(shí)踐

LPC55S28修改音頻數(shù)據(jù)格式后USB Aduio類異常的原因?
使用RDATAC指令后,ADS131E04傳送的數(shù)據(jù)格式以及內(nèi)容是怎樣的?
在NVIDIA TensorRT-LLM中啟用ReDrafter的一些變化

解鎖NVIDIA TensorRT-LLM的卓越性能
NVIDIA TensorRT-LLM Roadmap現(xiàn)已在GitHub上公開發(fā)布

FP8數(shù)據(jù)格式在大型模型訓(xùn)練中的應(yīng)用

ADC3561轉(zhuǎn)換成什么數(shù)據(jù)格式便于高速實(shí)時(shí)通過WIFI發(fā)送?
PCM2707的S/PDIF輸出的數(shù)據(jù)格式是什么?
請(qǐng)問AIC3106怎么設(shè)置成單聲道32位數(shù)據(jù)格式?
SRC4192能否支持輸入TDM格式音頻數(shù)據(jù),輸出I2S,進(jìn)行數(shù)據(jù)格式轉(zhuǎn)換?
請(qǐng)問TLV320AIC3268的ADC轉(zhuǎn)換后的數(shù)據(jù)格式是什么樣的?
NVIDIA Nemotron-4 340B模型幫助開發(fā)者生成合成訓(xùn)練數(shù)據(jù)

評(píng)論