一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

NVIDIA JetPack 6.2引入Super模式

NVIDIA英偉達企業(yè)解決方案 ? 來源:NVIDIA英偉達企業(yè)解決方案 ? 2025-02-12 09:32 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

NVIDIA Jetson Orin Nano Super 開發(fā)者套件的推出開創(chuàng)了小型邊緣設(shè)備生成式 AI 的新時代。全新的 Super 模式為生成式 AI 性能帶來了空前的提升,最多可提升至 1.7 倍,使其成為高性價比的生成式 AI 超級計算機。

JetPack 6.2 現(xiàn)已支持 Jetson Orin NanoJetson Orin NX 生產(chǎn)模組通過 Super 模式實現(xiàn)性能升級,最多可將生成式 AI 性能提升至 2 倍?,F(xiàn)在,您可以為新的和現(xiàn)有的機器人和邊緣 AI 應(yīng)用釋放更多價值并降低總體擁有成本。

本文將詳細介紹 Super 模式的詳細信息,包括新的功率模式、Jetson Orin Nano 和 Orin NX 模組上常用生成式 AI 模型的基準性能、文檔更新情況以及支持 Super 開發(fā)者套件的 NPN 合作伙伴。

Jetson Orin Nano 和Jetson Orin NX 系列的新參考功率模式

JetPack 6.2 通過在 GPU、DLA 內(nèi)存和 CPU 時鐘上解鎖更高的頻率,提升 Jetson Orin Nano 和 Jetson Orin NX 系列的功耗。

9342a476-e85d-11ef-9310-92fbcf53809c.png

表 1. Jetson Orin Nano 和 Jetson Orin NX 模組的新參考功率模式

Jetson Orin Nano 模組現(xiàn)在有 25W 模式和無功率上限的全新 MAXN SUPER 模式。同樣,Jetson Orin NX 模組現(xiàn)在可以使用新的 40W 參考功率模式以及無功率上限的 MAXN SUPER 模式。

MAXN SUPER 是一種無功率上限的功率模式,所支持的 CPU、GPU、DLA、PVA 和 SOC 引擎核數(shù)量和時鐘頻率最高。在該模式下,如果模組總功率超過熱設(shè)計功率(TDP)上限,系統(tǒng)會將模組調(diào)低頻率,通過降低性能將功率控制在熱上限內(nèi)。

我們強烈建議您建立自己的自定義功率模式,以便在功耗或熱穩(wěn)定性與性能之間找到適合您的應(yīng)用和需求的合適平衡點。

表 2 比較了 Jetson Orin Nano 4GB 和 8GB 以及 Jetson Orin NX 8GB 和 16GB 在原始模式和 Super 模式下的詳細規(guī)格。

934d71f8-e85d-11ef-9310-92fbcf53809c.png

表 2. Jetson Orin Nano 和 Jetson Orin NX 在原始模式和 Super 模式下的規(guī)格

在使用新的功率模式時,請確保產(chǎn)品當前或新的熱設(shè)計能夠適應(yīng)功率模式的新規(guī)格。

最新功耗估算器工具

功耗估算器工具是 NVIDIA 提供的一個功能強大的工具,它可通過修改系統(tǒng)參數(shù)(例如 GPU、CPU、DLA 等的核數(shù)、最高頻率和負載水平)創(chuàng)建自定義功耗配置文件和 nvpmodel 配置文件。該工具能夠估算各種設(shè)置下的功耗,在需要平衡性能和功耗時可用于創(chuàng)建滿足需求的最佳參數(shù)設(shè)置。

我們已在功耗估算器工具中增加了 Super 模式。我們強烈建議您在部署高性能應(yīng)用之前使用功耗估算器工具并進行實際驗證。

常用生成式 AI 模型的性能提升情況

在通過 JetPack 6.2 引入 Super 模式后,Jetson Orin Nano 和 Jetson Orin NX 模組的推理性能最多可提升至 2 倍。我們對最常用的大語言模型(LLM)、視覺語言模型(VLM)和視覺轉(zhuǎn)換器(ViT)進行了基準測試。

大語言模型

下圖和表格顯示了 Llama3.1 8B、Qwen2.5 7B 和 Gemma2 2B 等常用 LLM 在 Super 模式下的性能基準。

9361fcae-e85d-11ef-9310-92fbcf53809c.png

圖 1. 使用 Super 模式時的 LLM 性能提升情況

DNR 表示模組內(nèi)存不足以運行特定模型。模型性能會受到節(jié)流行為的影響。

下表中的 LLM 生成性能(每秒 token 數(shù))使用 MLC API 進行 INT4 量化后測量得出。

表 3 顯示了JetPack 6.2 為 Jetson Orin Nano 4GB 上的 LLM 所帶來的性能提升。

936caef6-e85d-11ef-9310-92fbcf53809c.png

表 3. Jetson Orin Nano 4GB 上常用 LLM 的基準性能(token/秒)

表 4 顯示了 JetPack 6.2 為 Jetson Orin Nano 8GB 上的 LLM 所帶來的性能提升。

9377a0b8-e85d-11ef-9310-92fbcf53809c.png

表 4. Jetson Orin Nano 8GB 上常用 LLM 的基準性能(token/秒)

表 5 顯示了 JetPack 6.2 為 Jetson Orin NX 8GB 上的 LLM 所帶來的性能提升。

9381999c-e85d-11ef-9310-92fbcf53809c.png

表 5. Jetson Orin NX 8GB 上常用 LLM 的基準性能(token/秒)

表 6 顯示了 JetPack 6.2 為 Jetson Orin NX 16GB 上的 LLM 所帶來的性能提升。

938c1a84-e85d-11ef-9310-92fbcf53809c.png

表 6. Jetson Orin NX 16GB 上常用 LLM 的基準性能(token/秒)

視覺語言模型

下圖和表格顯示了 VILA1.5 8B、LLAVA1.6 7B 和 Qwen2 VL 2B 等常用 VLM 在 Super 模式下的性能基準。

9396d488-e85d-11ef-9310-92fbcf53809c.png

圖 2. 使用 Super 模式運行時的 VLM 性能提升情況

DNR 表示模組內(nèi)存不足以運行特定模型。模型性能會受到節(jié)流行為的影響。

表 7 顯示了 JetPack 6.2 為 Jetson Orin Nano 4GB 上的 VLM 所帶來的性能提升。

939faaf4-e85d-11ef-9310-92fbcf53809c.png

表 7. Jetson Orin Nano 4GB 上常用 VLM 的基準性能(token/秒)

表 8 顯示了 JetPack 6.2 為 Jetson Orin Nano 8GB 上的 VLM 所帶來的性能提升。

93a95d6a-e85d-11ef-9310-92fbcf53809c.png

表 8. Jetson Orin Nano 8GB 上常用 VLM 的基準性能(token/秒)

表 9 顯示了 JetPack 6.2 為 Jetson Orin NX 8GB 上的VLM所帶來的性能提升。

93b43faa-e85d-11ef-9310-92fbcf53809c.png

表 9. Jetson Orin NX 8GB 上常用 VLM 的基準性能(token/秒)

表 10 顯示了 JetPack 6.2 為 Jetson Orin NX 16GB 上的 VLM 所帶來的性能提升。

93be7c04-e85d-11ef-9310-92fbcf53809c.png

表 10. Jetson Orin NX 16 GB 上常用 VLM 的基準性能(token/秒)

所有 VILA 和 LLAVA 模型均使用 MLC 以 INT4 精度運行,其余模型使用 Hugging Face Transformer 以 FP4 精度運行。

視覺 Transformer

下圖和表格顯示了 CLIP、DINO 和 SAM2 等常用 ViT 在 Super 模式下的性能基準。

93c7c82c-e85d-11ef-9310-92fbcf53809c.png

圖 3. 使用 Super 模式運行時的 ViT 性能提升情況

DNR 表示模組上的內(nèi)存不足以運行特定模型。模型性能會受到節(jié)流行為的影響。

表 11 顯示了 JetPack 6.2 為 Jetson Orin Nano 4GB 上的 ViT 所帶來的性能提升。

93cfd210-e85d-11ef-9310-92fbcf53809c.png

表 11. Jetson Orin Nano 4GB 上常用 ViT 的基準性能(token/秒)

表 12 顯示了 JetPack 6.2 為 Jetson Orin Nano 8GB 上的 ViT 所帶來的性能提升。

93d8523c-e85d-11ef-9310-92fbcf53809c.png

表 12. Jetson Orin Nano 8GB 上常用 ViT 的基準性能(token/秒)

表 13 顯示了 JetPack 6.2 為 Jetson Orin NX 8GB 上的 ViT 所帶來的性能提升。

93e23b76-e85d-11ef-9310-92fbcf53809c.png

表 13. Jetson Orin NX 8GB 上常用 ViT 的基準性能(token/秒)

表 14 顯示了 JetPack 6.2 為 Jetson Orin NX 16GB 上的 ViT 所帶來的性能提升。

93eccba4-e85d-11ef-9310-92fbcf53809c.png

表 14. Jetson Orin NX 16GB 上常用 ViT 的基準性能(token/秒)

所有 ViT 模型均使用 NVIDIA TensorRT 以 FP16 精度運行,測量單位為 FPS。

開始使用搭載 JetPack 6.2 的NVIDIA Jetson Orin Nano和 Jetson Orin NX

NVIDIA Jetson 生態(tài)系統(tǒng)提供了多種使用 JetPack 鏡像刷寫開發(fā)者套件和生產(chǎn)模組的方式。

可使用以下任何一種方法在 Jetson Orin Nano 開發(fā)者套件或模組上安裝 JetPack 6.2:

從 JetPack SDK 頁面獲得 SD 卡鏡像:

https://developer.nvidia.com/embedded/jetpack

根據(jù)下載和安裝說明,對 SDK Manager 進行刷寫:

https://developer.nvidia.com/sdk-manager

根據(jù)刷寫支持,刷寫 bootloader、kernel 和 root file system 的腳本:

https://docs.nvidia.com/jetson/archives/r36.4.3/DeveloperGuide/SD/FlashingSupport.html#flashing-support

新的刷寫配置

新功率模式僅適用于新的刷寫配置。默認刷寫配置沒有改變。如要啟用新功率模式,您必須在刷寫時使用新的刷寫配置。

下面是進行刷寫時使用的新的刷寫配置:

jetson-orin-nano-devkit-super.conf

刷寫或更新到 JetPack 6.2 后,運行以下命令以啟動新提供的 Super 模式。

在 Jetson Orin Nano 模組上啟動 MAXN SUPER 模式:

sudo nvpmodel -m 2

在 Jetson Orin NX 模組上啟動 MAXN SUPER 模式:

sudo nvpmodel -m 0

您還可以從頁面右上角的功率模式菜單中選擇 MAXN SUPER 和其他功率模式。

93f43c72-e85d-11ef-9310-92fbcf53809c.png

圖 4. 功率模式選擇菜單

Jetson AI Lab

Jetson AI 實驗室是 NVIDIA 探索和試驗針對邊緣設(shè)備優(yōu)化的生成式 AI 技術(shù)的中心。它為開發(fā)者提供支持并為合作社區(qū)提供近 50 種教程、預(yù)構(gòu)建容器和資源,幫助社區(qū)使用經(jīng)過優(yōu)化的推理基礎(chǔ)設(shè)施部署設(shè)備端 LLM、SLM、VLM、擴散策略和語音模型。

通過簡化前沿 AI 工具的訪問途徑,該實驗室使各級別的開發(fā)者都能在本地進行創(chuàng)新和部署生成式 AI,從而推動開源邊緣 AI 和機器人學習的發(fā)展。

Jetson 生態(tài)系統(tǒng)合作伙伴為 Super 模式做好準備

為了幫助客戶進行部署,Jetson 生態(tài)系統(tǒng)合作伙伴已通過增強自己的解決方案,支持這一輪性能提升。

9401ba64-e85d-11ef-9310-92fbcf53809c.png

NVIDIA Jetson Orin生命周期和路線圖

由于客戶對 Jetson Orin 的需求不斷增長,NVIDIA 最近宣布將 Jetson Orin 的產(chǎn)品生命周期延長至 2032 年。經(jīng)過這次的性能提升,Jetson Orin Nano 和 Orin NX 系列已成為當前和未來模型的理想平臺。

即將發(fā)布的 JetPack 5.1.5 也將支持 Jetson Orin NX 和 Jetson Orin Nano 模組的 Super 模式。使用 JetPack 5 進行開發(fā)的開發(fā)者和客戶將從性能提升中受益。

940c9894-e85d-11ef-9310-92fbcf53809c.png

圖 5.JetPack 軟件路線圖

使用 JetPack 6.2提升應(yīng)用性能

JetPack 6.2 是一個突破性的版本,它可在現(xiàn)有 Jetson 模組上實現(xiàn)驚人的 2 倍推理性能提升,且不會增加任何成本。對于希望提升應(yīng)用性能的 Jetson 開發(fā)者和客戶而言,此次升級必不可少。現(xiàn)在就升級到 JetPack 6.2,充分釋放 Jetson 平臺的潛力。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 機器人
    +關(guān)注

    關(guān)注

    213

    文章

    29748

    瀏覽量

    212914
  • cpu
    cpu
    +關(guān)注

    關(guān)注

    68

    文章

    11080

    瀏覽量

    217113
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5309

    瀏覽量

    106422
  • AI
    AI
    +關(guān)注

    關(guān)注

    88

    文章

    35164

    瀏覽量

    280006

原文標題:JetPack 6.2 為 Jetson Orin Nano 和 Jetson Orin NX 模組引入“Super”模式

文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    使用AD16488A時,通過DIO4引入外部時鐘,時鐘頻率為100Hz,會對最終傳感器的輸出有什么影響?

    請問在使用16488A時,通過DIO4引入外部時鐘,時鐘頻率為100Hz,會對最終傳感器的輸出有什么影響?對數(shù)據(jù)就緒信號DRY有什么影響呢? 手冊中看到了可能會造成角度變化的寄存器值溢出,但我用不到這個量。謝謝了!
    發(fā)表于 12-29 06:19

    NVIDIA Jetson的相關(guān)資料分享

    Jetson概述爆炸式增長的AI模型的復雜性專為自主機器開發(fā)人員設(shè)計的AI計算板加快AI處理的SDK“JetPack”概述NVIDIA Jetson是NVIDIA公司嵌入式單板計算機的一系列
    發(fā)表于 11-09 08:26

    NVIDIA將于7月2日發(fā)布Super顯卡

    今兒就是6月21日了,可外媒小規(guī)模流傳的NVIDIA 6月21日發(fā)布Super系列顯卡的消息可謂不攻自破,現(xiàn)在看來整個6月都不可能。
    發(fā)表于 06-22 10:06 ?1299次閱讀

    Super”或取代“Ti”成為NVIDIA顯卡新的增強版型號后綴

    消息稱,NVIDIA正密謀兩款顯卡新品,分別是GTX 1660 Super和GTX 1650 Super
    的頭像 發(fā)表于 09-12 16:27 ?1.2w次閱讀

    NVIDIA推出GTX 1660 Super顯卡的消息確認

    NVIDIA即將推出GTX 1660 Super顯卡早已是板上釘釘?shù)氖虑?,但具體時間、規(guī)格一直沒有得到完全確認。
    的頭像 發(fā)表于 10-14 14:53 ?4033次閱讀

    消息稱NVIDIA欲復活RTX 2060 Super產(chǎn)品線

    明明已經(jīng)發(fā)布了RTX 3060 Ti/3060,后者也將在2月底上市發(fā)貨。可最新消息稱,NVIDIA欲重新復活RTX 2060和RTX 2060 Super產(chǎn)品線。據(jù)稱NVIDIA已經(jīng)開始向AIC
    的頭像 發(fā)表于 01-21 16:23 ?1890次閱讀
    消息稱<b class='flag-5'>NVIDIA</b>欲復活RTX 2060 <b class='flag-5'>Super</b>產(chǎn)品線

    NVIDIA JetPack SDK AI應(yīng)用程序指南

    NVIDIA JetPack SDKis是構(gòu)建AI應(yīng)用程序的最全面的解決方案。使用JetPackinstaller為您的Jetson開發(fā)人員工具包閃存最新的操作系統(tǒng)映像,為主機PC和開發(fā)人員工具包安裝開發(fā)人員工具,并安裝啟動開發(fā)環(huán)境所需的庫和api、示例和文檔。
    發(fā)表于 04-06 16:09 ?0次下載
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>JetPack</b> SDK AI應(yīng)用程序指南

    jetpack FreeBSD應(yīng)用容器

    ./oschina_soft/jetpack.zip
    發(fā)表于 05-11 09:17 ?1次下載
    <b class='flag-5'>jetpack</b> FreeBSD應(yīng)用容器

    NVIDIA JetPack SDK的主要功能

    NVIDIA JetPack SDK是構(gòu)建 AI 應(yīng)用的全面解決方案,支持所有 Jetson 模塊和開發(fā)者套件。
    的頭像 發(fā)表于 10-17 12:05 ?3418次閱讀

    使用 NVIDIA DeepStream SDK 6.2 順利開發(fā)視覺 AI 應(yīng)用

    NVIDIA 宣布用于構(gòu)建高性能視頻分析和流式傳輸應(yīng)用的人工智能(AI)分析工具套件? NVIDIADeepStream SDK 6.2 全面上市。此次更新增加了新的功能,包括改進后的多對象追蹤器
    的頭像 發(fā)表于 02-11 10:25 ?1315次閱讀

    C++17引入的一個新特性void_t簡析

    void_t是C++17引入的一個新特性,它的定義很簡單(有些編譯器的實現(xiàn)可能不是這樣,但也大體類似)
    的頭像 發(fā)表于 03-06 09:37 ?1495次閱讀

    RTX 4070 Ti SUPER詳細評測

    2024年1月9日,NVIDIA發(fā)布了GeForce RTX 40 SUPER系列顯卡,包括RTX 4070 SUPER、RTX 4070 Ti SUPER和RTX 4080
    發(fā)表于 01-29 10:31 ?5643次閱讀
    RTX 4070 Ti <b class='flag-5'>SUPER</b>詳細評測

    使用NVIDIA JetPack 6.0和YOLOv8構(gòu)建智能交通應(yīng)用

    本文將介紹如何使用 NVIDIA JetPack 6.0 中的全新 Jetson 平臺服務(wù),來構(gòu)建一個適用于邊緣的端到端交通分析解決方案。該系統(tǒng)集成了多個功能:使用視頻存儲工具包 (VST) 服務(wù)
    的頭像 發(fā)表于 08-23 16:49 ?1016次閱讀
    使用<b class='flag-5'>NVIDIA</b> <b class='flag-5'>JetPack</b> 6.0和YOLOv8構(gòu)建智能交通應(yīng)用

    NVIDIA JetPack 6.0版本的關(guān)鍵功能

    NVIDIA JetPack SDK 支持 NVIDIA Jetson 模塊,為構(gòu)建端到端加速 AI 應(yīng)用提供全面的解決方案。JetPack 6 通過微服務(wù)和一系列新功能,擴展了 Je
    的頭像 發(fā)表于 09-09 10:18 ?1092次閱讀
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>JetPack</b> 6.0版本的關(guān)鍵功能

    解析NVIDIA JetPack 6.1的新功能

    NVIDIA JetPack一直在不斷發(fā)展,通過提供量身定制的先進軟件滿足邊緣 AI 和機器人開發(fā)者日益增長的需求。每次發(fā)布的 JetPack 新版本都會升級性能、加入新功能與優(yōu)化現(xiàn)有工具,以便為
    的頭像 發(fā)表于 11-28 10:41 ?1062次閱讀
    解析<b class='flag-5'>NVIDIA</b> <b class='flag-5'>JetPack</b> 6.1的新功能