一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

用于工業(yè)AI的Jetson AGX Xavier模塊

星星科技指導(dǎo)員 ? 來(lái)源:嵌入式計(jì)算設(shè)計(jì) ? 作者:Simon Holt ? 2022-06-08 14:22 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

工業(yè)物聯(lián)網(wǎng)架構(gòu)師花了數(shù)年時(shí)間才得出結(jié)論,邊緣需要數(shù)據(jù)中心級(jí)的性能,以實(shí)現(xiàn)高效分析、提高安全性和降低網(wǎng)絡(luò)成本。在人工智能機(jī)器學(xué)習(xí)領(lǐng)域,傳感器設(shè)備內(nèi)部或附近對(duì)高端處理能力的需求從一開(kāi)始就很明顯。

考慮到即使是簡(jiǎn)單的自主機(jī)器(我知道這是矛盾的說(shuō)法)也需要大量的計(jì)算能力來(lái)運(yùn)行神經(jīng)網(wǎng)絡(luò)來(lái)執(zhí)行障礙物檢測(cè)、識(shí)別和避免等功能。例如,京東和菜鳥(niǎo)等公司生產(chǎn)的自動(dòng)送貨車(chē)需要大約每秒 30 兆次運(yùn)算 (TOPS) 的處理性能,而雅馬哈正在開(kāi)發(fā)的自動(dòng)駕駛檢查無(wú)人機(jī)需要大約 20 兆次運(yùn)算 (TOPS) 的處理性能。

當(dāng)然,這對(duì)嵌入式和工業(yè)工程師提出了一個(gè)經(jīng)典的設(shè)計(jì)挑戰(zhàn):平衡每瓦性能。性能太低,應(yīng)用程序失敗。功耗太大,自主機(jī)器必須連接到持續(xù)的電源。

隨著NVIDIA 的 Jetson AGX Xavier 模塊的發(fā)布,這種情況正在改變。

服務(wù)器級(jí)性能,嵌入式功耗

Jetson AGX Xavier 核心的 Xavier SoC 包含大量異構(gòu)處理性能,適用于人工智能驅(qū)動(dòng)的機(jī)器人應(yīng)用程序,包括:

512 核 Volta GPU,帶有 64 個(gè) TensorCore

八核、64 位基于 Arm 的 Carmel CPU

雙 NVDLA(NVIDIA 深度學(xué)習(xí)加速器)引擎

雙 7 路 VLIW 視覺(jué)加速器引擎

這代表 Jetson AGX 模塊的性能高達(dá) 32 TOPS,尺寸為 87 mm x 100 mm。如上圖所示,該芯片還包括一個(gè) 256 位 LPDDR4X 接口,能夠以 137 GBps 的速度將數(shù)據(jù)傳輸?shù)侥K上的 16 GB DRAM,用于與 AI 工作負(fù)載相關(guān)的頻繁讀寫(xiě)。

基本上,Jetson AGX Xavier 以嵌入式模塊形式提供服務(wù)器級(jí)性能。然而,同樣重要的是,該模塊的功耗僅為 10W,或與臺(tái)式風(fēng)扇差不多。用戶可將操作模式配置為 10W、15W 或 30W,NVIDIA 報(bào)告稱每瓦性能 (PPW) 的最佳點(diǎn)在 15W 左右。即使在那個(gè)水平(大約相當(dāng)于藍(lán)光播放器的功耗),Jetson AGX Xavier 在推理性能和能源效率方面也大大超過(guò)了其前身 Jetson TX2 和 Intel Core i7 + GTX 1070 顯卡。

pYYBAGKgQDeAcKYxAADtibAg8G4288.png

Jetson AGX Xavier:引擎蓋下

Jetson AGX Xavier 的多項(xiàng)功能可實(shí)現(xiàn)這種類型的每瓦性能,從基礎(chǔ)芯片架構(gòu)開(kāi)始。雖然 SoC 上的每個(gè)內(nèi)核都有自己的內(nèi)存,但內(nèi)存是離散 SoC 模塊之間的零內(nèi)存復(fù)制。雖然 AGX Xavier 模塊確實(shí)通過(guò)外部 16 GB LPDDR4X DRAM 提供共享內(nèi)存,但片上數(shù)據(jù)只是通過(guò)管道傳遞到必要的處理核心。

架構(gòu)的異構(gòu)性也提高了效率,因?yàn)楣ぷ髫?fù)載可以在最適合任務(wù)的架構(gòu)上執(zhí)行。這方面的一個(gè)例子是片上加速引擎,它可以卸載 Volta GPU,以便它可以專注于更復(fù)雜或用戶定義的任務(wù)。例如,在以 8 位分辨率推斷固定功能卷積神經(jīng)網(wǎng)絡(luò) (CNN) 時(shí),NVDLA 引擎可提供高達(dá) 5 TOPS 的性能,以 16 位分辨率推斷 2.5 TFLOPS 時(shí),功耗在 0.5W 和 1.5W 之間。

poYBAGKgQECARpmYAAFR4BDwBMw371.png

同時(shí),Carmel CPU 內(nèi)核可以保留用于通用計(jì)算任務(wù)。

JetPack 簡(jiǎn)化了深度學(xué)習(xí)編程的復(fù)雜性

Jetson AGX 系列運(yùn)行 Linux,這在工業(yè)嵌入式系統(tǒng)中變得越來(lái)越普遍。許多希望利用 Jetson AGX Xavier 性能的工業(yè)和嵌入式開(kāi)發(fā)人員可能不太熟悉的是對(duì) GPU 和/或深度學(xué)習(xí)加速器進(jìn)行編程。幸運(yùn)的是,NVIDIA JetPack 4.1.1 軟件開(kāi)發(fā)套件 (SDK)在CUDA Toolkit中提供了一攬子 API、嵌入式庫(kù)以及與常用語(yǔ)言的集成,因此您無(wú)需了解如何編程 GPU對(duì) GPU 進(jìn)行編程。

最新JetPack版本中的一些軟件工具包括:

Linux For Tegra R31.0.1 (K4.9)

CUDA 工具包 10.0

cuDNN 7.3

張量RT 5.0 GA

OpenCV 3.3.1

OpenGL 4.6 / GLES 3.2

伏爾甘 1.1

多媒體 API R31.1

阿格斯 0.97 相機(jī) API

TensorRT 5.0 包中提供的 API 也簡(jiǎn)化了對(duì) DLA 進(jìn)行編程以執(zhí)行神經(jīng)網(wǎng)絡(luò)工作負(fù)載。例如,_setDeviceType() 和 setDefaultDeviceType() 命令可用于在 GPU 或任一 DLA 上執(zhí)行特定的神經(jīng)網(wǎng)絡(luò)層或?qū)?,而?_allowGPUFallback() 這樣的命令可讓工作負(fù)載在 DLA 不支持的情況下恢復(fù)到 GPU 。

此外,DeepStream 3.0 SDK 支持 Jetson AGX Xavier,該 SDK 利用 TensorRT、CUDA、多媒體和成像 API 來(lái)加速視頻分析應(yīng)用程序的開(kāi)發(fā)。

當(dāng)然,低級(jí) CUDA 編程是另一種選擇。

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 神經(jīng)網(wǎng)絡(luò)

    關(guān)注

    42

    文章

    4814

    瀏覽量

    103429
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5299

    瀏覽量

    106256
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    4937

    瀏覽量

    131133
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    從25G PHY到AI平臺(tái):差分晶振FCO-PG系列關(guān)鍵應(yīng)用全解讀

    :200~800 MHz,適配 Xilinx Kintex UltraScale+ · AI邊緣計(jì)算模塊:156.25 MHz,搭配 NVIDIA Jetson AGX Orin ·
    發(fā)表于 05-16 14:46

    Made with KiCad(126):Antmicro OV5640 雙攝像頭子板

    Jetson Nano、Jetson TX2 NX、Jetson Xavier NX 系統(tǒng)模塊Je
    發(fā)表于 05-12 18:13

    邊緣AI MPU深度盤(pán)點(diǎn):品牌、型號(hào)與技術(shù)特性全解析

    三個(gè)維度,結(jié)合典型應(yīng)用場(chǎng)景,對(duì)主流邊緣AI MPU進(jìn)行全面盤(pán)點(diǎn)。 一、國(guó)際品牌:技術(shù)領(lǐng)先,場(chǎng)景覆蓋全面 NVIDIA(英偉達(dá)) 代表型號(hào) :Jetson系列(Orin Nano/NX/AGX
    的頭像 發(fā)表于 04-30 17:27 ?2173次閱讀

    市場(chǎng)上主流的端側(cè)AI MPU 大全

    ? ? NVIDIA ? ? Jetson系列 ?:面向邊緣AI的高性能MPU Jetson Orin Nano/NX/AGX(基于Ampere架構(gòu),4-64 TOPS算力)
    的頭像 發(fā)表于 04-02 17:44 ?1801次閱讀

    用于數(shù)據(jù)中心和AI時(shí)代的800G網(wǎng)絡(luò)

    ,成為新一代AI數(shù)據(jù)中心的核心驅(qū)動(dòng)力。 AI時(shí)代的兩大數(shù)據(jù)中心:AI工廠與AIAI時(shí)代催生了兩類數(shù)據(jù)中心架構(gòu):
    發(fā)表于 03-25 17:35

    Banana Pi 發(fā)布 BPI-AI2N & BPI-AI2N Carrier,助力 AI 計(jì)算與嵌入式開(kāi)發(fā)

    聯(lián)網(wǎng)提供無(wú)縫連接能力。 堅(jiān)固耐用,適應(yīng)工業(yè)環(huán)境 BPI-AI2N采用 SO-DIMM 260PIN 設(shè)計(jì),尺寸僅 45x69.5mm,支持定制載板,適用于空間受限的嵌入式應(yīng)用。支持 -40℃ 至 85
    發(fā)表于 03-19 17:54

    研華NVIDIA Jetson Orin Nano系統(tǒng)支持Super Mode

    提升生成式AI性能1.7倍 2025年春季— 研華科技,作為全球工業(yè)嵌入式 AI 解決方案供應(yīng)商,宣布推出搭載NVIDIA Jetson Orin Nano 8GB系統(tǒng)
    發(fā)表于 03-10 14:07 ?373次閱讀
    研華NVIDIA <b class='flag-5'>Jetson</b> Orin Nano系統(tǒng)支持Super Mode

    研華發(fā)布全系列車(chē)載AI控制器,引領(lǐng)智能軌道交通新時(shí)代

    。 ITA-560AGX Orin基于NVIDIA Jetson AGX Orin芯片打造,憑借其卓越的算力性能和豐富的I/O接口,為軌道列車(chē)車(chē)載應(yīng)用提供了專業(yè)、可靠的解決方案。該控制器不僅能夠高效處理復(fù)雜的
    的頭像 發(fā)表于 01-23 14:21 ?492次閱讀

    NVIDIA發(fā)布小巧高性價(jià)比的Jetson Orin Nano Super開(kāi)發(fā)者套件

    NVIDIA近期推出了一款全新的生成式AI超級(jí)計(jì)算機(jī)——Jetson Orin Nano Super開(kāi)發(fā)者套件。這款開(kāi)發(fā)者套件以其小巧的尺寸和高性價(jià)比吸引了廣泛關(guān)注。 Jetson Orin
    的頭像 發(fā)表于 12-19 11:28 ?1065次閱讀

    初創(chuàng)公司借助NVIDIA Metropolis和Jetson提高生產(chǎn)線效率

    初創(chuàng)公司使用 NVIDIA Metropolis 視覺(jué) AIJetson 邊緣 AI 平臺(tái)提高生產(chǎn)線效率。
    的頭像 發(fā)表于 11-19 14:39 ?688次閱讀

    使用NVIDIA Jetson打造機(jī)器人導(dǎo)盲犬

    Selin Alara Ornek 是一名富有遠(yuǎn)見(jiàn)的高中生。她使用機(jī)器學(xué)習(xí)和 NVIDIA Jetson邊緣 AI 和機(jī)器人平臺(tái),為視障人士打造了機(jī)器人導(dǎo)盲犬。
    的頭像 發(fā)表于 11-09 13:51 ?739次閱讀

    用于工業(yè)以太網(wǎng)PHY的AM2x評(píng)估模塊附加板用戶指南

    電子發(fā)燒友網(wǎng)站提供《用于工業(yè)以太網(wǎng)PHY的AM2x評(píng)估模塊附加板用戶指南.pdf》資料免費(fèi)下載
    發(fā)表于 11-05 09:20 ?0次下載
    <b class='flag-5'>用于</b><b class='flag-5'>工業(yè)</b>以太網(wǎng)PHY的AM2x評(píng)估<b class='flag-5'>模塊</b>附加板用戶指南

    GPU計(jì)算主板學(xué)習(xí)資料第735篇:基于3U VPX的AGX Xavier GPU計(jì)算主板 信號(hào)計(jì)算主板 視頻處理 相機(jī)信號(hào)

    GPU計(jì)算主板學(xué)習(xí)資料第735篇:基于3U VPX的AGX Xavier GPU計(jì)算主板 信號(hào)計(jì)算主板 視頻處理 相機(jī)信號(hào)
    的頭像 發(fā)表于 10-23 10:09 ?629次閱讀
    GPU計(jì)算主板學(xué)習(xí)資料第735篇:基于3U VPX的<b class='flag-5'>AGX</b> <b class='flag-5'>Xavier</b> GPU計(jì)算主板 信號(hào)計(jì)算主板 視頻處理 相機(jī)信號(hào)

    fx3系列的硬件主要由什么組成

    FX3系列是索尼(Sony)推出的一款高性能計(jì)算平臺(tái),它基于NVIDIA的Jetson AGX Xavier模塊,專為需要高性能計(jì)算、機(jī)器學(xué)習(xí)、計(jì)算機(jī)視覺(jué)和實(shí)時(shí)數(shù)據(jù)處理的嵌入式系統(tǒng)設(shè)計(jì)
    的頭像 發(fā)表于 09-18 11:14 ?1330次閱讀

    瑞薩電子推出Reality AI Explorer Tier,用于開(kāi)發(fā)AI與TinyML解決方案

    全球半導(dǎo)體解決方案供應(yīng)商瑞薩電子(TSE:6723)宣布推出Reality AI Explorer Tier——作為Reality AI Tools軟件的免費(fèi)版本,可用于開(kāi)發(fā)工業(yè)、汽車(chē)
    的頭像 發(fā)表于 07-19 10:03 ?727次閱讀