一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

圖靈設(shè)計(jì)NVENC單元的性能和質(zhì)量

星星科技指導(dǎo)員 ? 來源:NVIDIA ? 作者:Roman Arzumanyan ? 2022-04-28 15:43 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

從開普勒開始的所有 NVIDIA GPUs 都支持完全加速的硬件視頻編碼; GPUs 從費(fèi)米開始支持完全加速的硬件視頻解碼。最近發(fā)布的圖靈硬件提供了張量核心和更好的機(jī)器學(xué)習(xí)性能,但新的 GPU 還加入了新的多媒體功能,如改進(jìn)的 NVENC 單元,以在視頻編解碼器中提供更好的壓縮和圖像質(zhì)量。

讓我們更仔細(xì)地看一看圖靈設(shè)計(jì)的新的 NVENC 單元的性能和質(zhì)量。

NVENC 性能測試設(shè)置

H.264 出現(xiàn)于 15 年前,已經(jīng)成為一種無處不在的視頻編碼標(biāo)準(zhǔn)。它已經(jīng)成為業(yè)界最重要和最廣泛的編解碼器。這些測試展示了 Tesla T4 與著名的開源編碼器 libx264 在兩種情況下的性能:

高質(zhì)量模式,代表最常見的編碼方案與 VBR 控制和 B 幀啟用。

低延遲快速模式,適用于對延遲敏感的應(yīng)用程序,如遠(yuǎn)程游戲或視頻會(huì)議。

為此,測試計(jì)算機(jī)的配置如表 1 所示:

poYBAGJqRkWAMOQBAABkGfjAF4w897.png

我們使用了各種輸入視頻進(jìn)行 RD 估計(jì),如 basketball _ drive 、 bq _ terrace 、仙人掌、 crowd _ run 、 ducks _ take _ off 、 jokey 、和服,以及更多分辨率為 1280 × 720 、 1920 × 1080 和 3840 × 2160 的視頻。

績效和質(zhì)量結(jié)果

平衡序列

圖 1 到圖 4 顯示, Tesla T4 在高質(zhì)量模式下為 libx264 提供相同或稍好的視覺質(zhì)量,如 Kimono、 BQ Terrace 和 Park Scene 。

poYBAGJqReqAeGu1AADRnbCAPGs298.png

pYYBAGJqRfOAJWLxAADBfsd4PzE341.png

與 libx264 相比, T4 顯示了更好的預(yù)測和過濾。

紅皮艇和仙人掌序列分別包含顯著的混沌運(yùn)動(dòng)和圓周運(yùn)動(dòng)。與 libx264 相比, NVENC 在這些包含復(fù)雜內(nèi)部預(yù)測的場景中顯示出明顯的優(yōu)勢。

Tesla T4 NVENC 在低延遲模式下的性能很容易超過 libx264 。請注意 Tesla T4 如何在高分辨率下更有效,在相同的比特率下提供 1db 更好的視覺質(zhì)量。

poYBAGJqRieAaoeBAADFobyJrNk315.png

圖靈 GPUs 配備了功能強(qiáng)大的 NVENC 視頻編碼單元,與 libx264 等復(fù)雜的軟件編碼器相比,它提供了更高的視頻壓縮效率,因?yàn)樗Y(jié)合了更高的性能和更低的能耗。理想的代碼轉(zhuǎn)換解決方案需要具有成本效益(美元/流)和節(jié)能(瓦/流)。讓我們看看在多個(gè)測試序列中平均的性能和功耗結(jié)果,如圖 13 和 14 所示。

poYBAGJqRbWAWNgLAAAr-zX6VSQ870.png

圖 13 。在高質(zhì)量模式下以每秒 30 幀同時(shí)編碼的流數(shù)

poYBAGJqRbeAFAGrAAAsdAzr5H8030.png

圖 14 。在低延遲模式下以每秒 30 幀同時(shí)編碼的流數(shù)。

T4 以高質(zhì)量模式同時(shí)編碼 22 個(gè) 720p 流。 GPU 還可以平均處理 10 個(gè) 1080p 的流和 2 到 3 個(gè)超高清( 2160p )分辨率的流。這相當(dāng)于在相同的視覺質(zhì)量級別上幾乎是 libx264 的兩倍。

在低延遲模式下運(yùn)行顯示出 T4 更大的優(yōu)勢。它可以編碼 37 個(gè) 720p 分辨率的流, 17-18 個(gè) 1080p , 4-5 個(gè)超高清,性能比 libx264 高 2-2.7 倍,具有更高的視覺質(zhì)量。您可以在圖 15 和圖 16 中看到每個(gè)流的瓦特?cái)?shù)。

pYYBAGJqRb6AMc3bAAAvq-wAxCA408.png

圖 15 。高質(zhì)量模式下平均每流功耗瓦特

poYBAGJqRcGAZk8xAAAvASLNIxE444.png

圖 16 。低延遲模式下平均每流功耗瓦特

Tesla 還顯示出很高的功率效率,在高質(zhì)量模式下優(yōu)于 libx264 2-4x ,在低延遲模式下高達(dá) 5 倍,同時(shí)保持低負(fù)載。

結(jié)論

與前幾代相比, NVIDIA 的 Tesla T4 的編碼能力有了很大的提高。與 libx264 這樣的軟件編碼器相比,它在高質(zhì)量模式下顯示出相同或更好的視覺質(zhì)量,而在低延遲模式下則優(yōu)于它們。這相當(dāng)于在功耗降低 2-5 倍時(shí)性能提高了一倍。

關(guān)于作者

Roman Arzumanyan擁有俄羅斯南部羅曼大學(xué)( Rostov-on-Don , 2012 )和羅曼大學(xué)應(yīng)用數(shù)學(xué)碩士學(xué)位。之后,他在俄羅斯三星研發(fā)院( 2012-2015 )、英特爾公司( 2015-2017 )工作。目前,他在莫斯科擔(dān)任開發(fā)技術(shù)工程師。他的研究興趣包括視頻編碼、高性能和 GPGPU 。

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5309

    瀏覽量

    106346
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    4943

    瀏覽量

    131209
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    NVMe高速傳輸之?dāng)[脫XDMA設(shè)計(jì)之六:性能監(jiān)測單元設(shè)計(jì)

    性能監(jiān)測單元負(fù)責(zé)監(jiān)測 NVMe over PCIe 邏輯加速引擎的運(yùn)行狀態(tài)和統(tǒng)計(jì)信息, 包括復(fù)位后 運(yùn)行時(shí)間信息、 NVMe 指令數(shù)量統(tǒng)計(jì)信息、 數(shù)據(jù)操作數(shù)量統(tǒng)計(jì)信息、 IOPS 性能統(tǒng)計(jì) 信息
    發(fā)表于 07-02 19:51

    NVMe IP高速傳輸卻不依賴XDMA設(shè)計(jì)之六:性能監(jiān)測單元設(shè)計(jì)

    性能監(jiān)測單元負(fù)責(zé)監(jiān)測 NVMe over PCIe 邏輯加速引擎的運(yùn)行狀態(tài)和統(tǒng)計(jì)信息, 包括復(fù)位后 運(yùn)行時(shí)間信息、 NVMe 指令數(shù)量統(tǒng)計(jì)信息、 數(shù)據(jù)操作數(shù)量統(tǒng)計(jì)信息、 IOPS 性能統(tǒng)計(jì) 信息、 指令延遲統(tǒng)計(jì)信息等。
    的頭像 發(fā)表于 07-02 19:49 ?143次閱讀
    NVMe IP高速傳輸卻不依賴XDMA設(shè)計(jì)之六:<b class='flag-5'>性能</b>監(jiān)測<b class='flag-5'>單元</b>設(shè)計(jì)

    如何評估CAN總線信號質(zhì)量

    CAN總線網(wǎng)絡(luò)的性能在很大程度上取決于其信號質(zhì)量。信號質(zhì)量差可能導(dǎo)致通信錯(cuò)誤,進(jìn)而引發(fā)系統(tǒng)故障、效率降低甚至安全隱患。因此,評估和確保CAN總線信號質(zhì)量是維護(hù)系統(tǒng)健康和可靠性的關(guān)鍵。
    發(fā)表于 06-07 08:46

    小鵬圖靈AI芯片深度解讀

    和飛行汽車三大領(lǐng)域,成為小鵬AI生態(tài)的硬件基石。這一布局體現(xiàn)了小鵬從單一智能汽車制造商向“AI出行生態(tài)平臺”轉(zhuǎn)型的戰(zhàn)略野心,通過芯片級自研打破對英偉達(dá)等供應(yīng)商的依賴,降低成本并提升技術(shù)自主性。 二、核心技術(shù)參數(shù)與架構(gòu)創(chuàng)新 算力性能 圖靈芯片采
    的頭像 發(fā)表于 03-12 12:14 ?3362次閱讀
    小鵬<b class='flag-5'>圖靈</b>AI芯片深度解讀

    如何提高嵌入式代碼質(zhì)量?

    嵌入式系統(tǒng)的發(fā)展已經(jīng)深刻地影響了我們?nèi)粘I畹姆椒矫婷?,從智能家居到汽車控制系統(tǒng),再到醫(yī)療設(shè)備和工業(yè)自動(dòng)化等領(lǐng)域,嵌入式系統(tǒng)無處不在。嵌入式軟件的質(zhì)量直接關(guān)系到系統(tǒng)的安全性、穩(wěn)定性和性能。因此,提高
    發(fā)表于 01-15 10:48

    SMT來料質(zhì)檢:確保電子生產(chǎn)質(zhì)量的關(guān)鍵

    質(zhì)量直接決定了最終產(chǎn)品的功能性和可靠性。 通過嚴(yán)格的來料檢驗(yàn),可以評估 元器件的電性能參數(shù)及其焊接端頭和引腳的可焊性,同時(shí)檢查PCB板的設(shè)計(jì)合理性和焊盤的可焊性 。這樣的前置質(zhì)量管理措施有助于在早期發(fā)現(xiàn)
    發(fā)表于 01-07 16:16

    圓柱電池測試設(shè)備:確保電池性能質(zhì)量的關(guān)鍵

    在新能源產(chǎn)業(yè)的快速發(fā)展背景下,圓柱電池作為重要的能量儲(chǔ)存裝置,其性能質(zhì)量直接關(guān)系到電動(dòng)汽車、儲(chǔ)能系統(tǒng)以及各種便攜式電子設(shè)備的性能表現(xiàn)和使用壽命。為了確保圓柱電池能夠在實(shí)際應(yīng)用中發(fā)揮最佳效能,圓柱
    的頭像 發(fā)表于 01-06 17:22 ?466次閱讀

    小鵬汽車:未來AI汽車將搭載至少3顆圖靈芯片

    近日,在2024小鵬AI科技日上,小鵬汽車宣布了其自主研發(fā)的圖靈AI芯片取得了重要進(jìn)展。這款芯片擁有40核處理器,能夠本地運(yùn)行高達(dá)30B參數(shù)的大模型,并集成了2個(gè)NPU以及面向神經(jīng)網(wǎng)絡(luò)的特定領(lǐng)域架構(gòu),性能卓越。
    的頭像 發(fā)表于 11-12 18:05 ?962次閱讀

    小鵬汽車圖靈芯片及L4自動(dòng)駕駛新進(jìn)展

    小鵬汽車CEO何小鵬近日介紹了公司自主研發(fā)的圖靈芯片。這款專為AI而生的芯片,配備了強(qiáng)大的40核處理器,能夠本地運(yùn)行高達(dá)30B參數(shù)的大模型。此外,圖靈芯片還集成了2個(gè)NPU,并采用了面向神經(jīng)網(wǎng)絡(luò)
    的頭像 發(fā)表于 11-08 11:01 ?1601次閱讀

    小鵬汽車2024 AI科技日:圖靈AI芯片進(jìn)展公布,預(yù)計(jì)AI汽車市場將迎來巨變

    在11月6日下午的2024小鵬AI科技日上,小鵬汽車揭曉了其圖靈AI芯片的最新研發(fā)成果。小鵬汽車強(qiáng)調(diào),這款圖靈芯片是專為AI應(yīng)用而生,配備了40核處理器,能夠本地運(yùn)行參數(shù)高達(dá)30B的大模型,同時(shí)集成了2個(gè)NPU以及針對神經(jīng)網(wǎng)絡(luò)優(yōu)化的特定領(lǐng)域架構(gòu)。
    的頭像 發(fā)表于 11-07 14:56 ?1520次閱讀

    小鵬汽車發(fā)布自主研發(fā)的“圖靈”AI智能駕駛輔助系統(tǒng)

    模型構(gòu)建、AI算法優(yōu)化到AI芯片設(shè)計(jì)的全過程。這一全面自主的研發(fā)模式,確保了“圖靈”系統(tǒng)能夠在各個(gè)層面實(shí)現(xiàn)最佳的協(xié)同與性能發(fā)揮。 小鵬汽車首席執(zhí)行官何小鵬透露,預(yù)計(jì)到2025年,小鵬汽車的云端計(jì)算能力將達(dá)到驚人的10Eflops,
    的頭像 發(fā)表于 11-07 10:55 ?1270次閱讀

    圖靈測試的內(nèi)容是什么_圖靈測試的作用

    圖靈測試(Turing Test)是由英國數(shù)學(xué)家和計(jì)算機(jī)科學(xué)家艾倫·麥席森·圖靈(Alan Turing)在1950年提出的一種測試方法,用以判斷機(jī)器是否具有人類智能。圖靈測試的核心內(nèi)容可以歸納為以下幾點(diǎn):
    的頭像 發(fā)表于 09-16 16:11 ?4960次閱讀

    圖靈測試什么意思_圖靈測試是干嘛的

    圖靈測試是由英國數(shù)學(xué)家、密碼專家和數(shù)字計(jì)算機(jī)的奠基人艾倫·麥席森·圖靈提出的一種檢驗(yàn)?zāi)硞€(gè)對象(通常是機(jī)器或人工智能系統(tǒng))是否具有智能的測試方法。其核心思想在于,如果一臺機(jī)器在與人類的對話過程中,能夠使得測試者無法區(qū)分其是人還是機(jī)器,那么就可以認(rèn)為這臺機(jī)器具備了智能。
    的頭像 發(fā)表于 09-16 16:09 ?4504次閱讀

    小鵬自研圖靈芯片震撼登場:流片成功性能超越行業(yè)旗艦

    8月27日最新資訊,小鵬汽車在昨日舉辦的“小鵬10年熱愛之夜暨小鵬MONA M03上市發(fā)布會(huì)”上,由董事長何小鵬宣布了一項(xiàng)重要里程碑:小鵬自研的圖靈芯片已于8月23日成功完成流片測試。這款專為L4級
    的頭像 發(fā)表于 08-28 16:49 ?2077次閱讀

    IBM助力圖靈新智算構(gòu)建全能AI平臺

    近日,圖靈新智算(廣州)科技有限公司(以下簡稱為“圖靈新智算”)宣布采用 IBM 新一代 AI 與數(shù)據(jù)平臺 watsonx 的三大功能組件 watsonx.data、watsonx.ai
    的頭像 發(fā)表于 08-02 14:53 ?1049次閱讀