一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

MLPerf V2.0推理結果放榜,NVIDIA表現搶眼

荷葉塘 ? 來源:電子發(fā)燒友 ? 作者:程文智 ? 2022-04-15 22:12 ? 次閱讀

(文/程文智)不久前,AI性能基準評測平臺MLPerf公布了2022年首次推理(Inference v2.0)測試成績,NVIDIA的AI平臺表現依然搶眼。

據MLPerf官方介紹,它是由來自學術界、研究實驗室和相關行業(yè)的 AI 領導者組成的聯盟,旨在“構建公平和有用的基準測試”,在規(guī)定的條件下,針對硬件、軟件和服務的訓練和推理性能提供公平的評估。每年組織AI推理和AI訓練測試各兩次,以對迅速增長的AI計算需求與性能進行及時的跟蹤測評。MLPerf比賽通常分為固定任務(Closed)和開放優(yōu)化(Open)兩類任務,開放優(yōu)化能力著重考察參測廠商的AI技術創(chuàng)新力,固定任務則因更公平地考察參測廠商的硬件系統和軟件優(yōu)化的能力,成為更具參考價值的AI性能基準測試。因此,目前MLPerf被看作是AI領域的風向標,誰能夠在這個測試中取得更多的領先,誰的AI能力就越突出。


在最新一期的榜單中,浪潮、NVIDIA、英特爾高通、阿里巴巴、戴爾、Deci.ai、Azure、富士通、技嘉、聯想、寧暢、美超微、華碩、浙江實驗室、及新華三等廠商參與了競賽。評測以最新MLPerf Inference V2.0為基準,涵蓋了圖像分類、目標檢測、醫(yī)療圖像分割、自然語言處理、語音轉文字和推薦系統6類AI應用場景,分為數據中心和邊緣兩類處理場景,每類場景都包含固定任務(Closed)和開放優(yōu)化(Open)兩類性能競賽。其中,在最新的V2.0規(guī)范中,在邊緣運算環(huán)境導入多資料流(Multi Stream)測試項目,測量邊緣運算設備在多攝影機、多傳感器場景的性能表現,以得到更貼近真實使用情況的數據。


據統計,本輪測試一共展示了超過3900 次性能測試和 2200 次功耗測試,分別是上一輪的2倍和6倍。根據公開的數據顯示,本次測試中除了戴爾科技、富士通、技嘉、浪潮、聯想、寧暢和美超微等外,華碩和新華三本次測試中首次使用了NVIDIA AI平臺提交MLPerf結果。

Jetson AGX Orin提升邊緣AI性能,取得不俗成績

值得一提的是基于NVIDIA Ampere架構的低功耗系統級芯片NVIDIA Orin首次參加MLPerf基準測試,就取得了不俗的成績。在邊緣AI領域,NVIDIA Orin預生產版本在六項性能測試中的五項處于領先地位,其運行速度比上一代Jetson AGX Xavier快了5倍,能效平均提高了2倍。


根據NVIDIA官網的介紹,Jetson AGX Orin 系列有32GB和64GB兩個版本,該系列具有高達275TOPS的AI性能,由 Ampere GPU深度學習加速器 (DLA) 提供支持。CPU配備了多達12個Arm Cortex A78AE內核。

Orin配備了其第三代Tensor Cores,可提高性能并支持稀疏矩陣?;贜VIDIA為 Xavier 所做的多處理器構建,它不僅具有 GPU 和CPU,還具有其他處理器,可以幫助從GPU和CPU卸載應用程序的某些部分。它包括一個專用于 AI 應用的深度學習加速器、一個用于計算機視覺應用和ISP的視覺加速器,以及一個視頻解碼和視頻編碼引擎。與 Xavier 相比,NVIDIA還為 Orin 帶來了 LPDDR5 以提高帶寬,傳輸速度可達204.8GB/s。 Orin 還具備豐富的IO連接,比如其具有多達22個PCIe4.0通道、4個千兆以太網、16個MIPI CSI通道,以及各種其他傳感器接口等。


根據測試,Jetson AGX Orin提供了8倍于Jetson AGX Xavier的性能,Jetson AGX Orin是能夠運行所有六項MLPerf基準測試的邊緣加速器。憑借JetPack SDK,Orin可以運行整個NVIDIA AI平臺,這個軟件堆棧已經在數據中心和云端得到了驗證,并且獲得了NVIDIA Jetson平臺100萬名開發(fā)者的支持。


在應用方面,目前,Orin主要關注三大領域,分別為:工業(yè)、自動駕駛和醫(yī)療。Orin現已加入到用于機器人和自動化系統的NVIDIA Jetson AGX Orin開發(fā)者套件。包括亞馬遜網絡服務、約翰迪爾、小松、美敦力和微軟Azure在內的6000多家客戶使用NVIDIA Jetson平臺進行AI推理或其他任務。

Orin也是NVIDIA Hyperion自動駕駛汽車平臺的關鍵組成部分。據NVIDIA介紹,Orin可處理在自動駕駛汽車和機器人中同時運行的大量應用和深度神經網絡,并且達到了ISO 26262 ASIL-D 等系統安全標準。而且,比亞迪近期已經宣布,他們將在其新一代自動駕駛電動汽車中使用內置Orin的DRIVE Hyperion架構。

Orin同樣也是NVIDIA Clara Holoscan醫(yī)療設備平臺的關鍵組成部分,且該平臺可供系統制造商和研究人員用來開發(fā)新一代AI儀器。

NVIDIA其他AI成果

除了Orin之外,本輪MLPerf,驗證了NVIDIA的多項成果,包括多實例GPU(MIG)、TensorRT等。比如MIG可提升每個 NVIDIA A100 Tensor 核心 GPU 的性能和價值。MIG可將 A100 GPU 劃分為多達七個實例,每個實例均與各自的高帶寬顯存、緩存和計算核心完全隔離。管理員可以支持從大到小的各項工作負載,為每項工作提供規(guī)模適當的 GPU,而且服務質量 (QoS) 穩(wěn)定可靠,從而優(yōu)化利用率,讓每位用戶都能享用加速計算資源。


而根據實際測試結果,在使用7個實例時的性能為僅用一個實例的98%,這也意味著MIG可以充分利用GPU,避免了算力的浪費。


軟件是性能提升的關鍵驅動因素,NVIDIA在AI推理方面的軟件包括了用于優(yōu)化 AI 模型的 NVIDIA TensorRT 和用于有效部署它們的 NVIDIA Triton開源推理服務軟件。NVIDIA AI 推理和云高級產品經理David Salvator在媒體發(fā)布會上介紹了NVIDIA的Triton開源推理服務軟件。


目前TensorRT廣泛的優(yōu)化GPU內核庫已支持Jetson Orin,MLPerf中使用的插件已全部移植到Orin并添加到 TensorRT 8.4。Triton則Kubernetes緊密集成,可以管理GPU以及x86和Arm CPU上的AI推理工作,NVIDIA宣布,Triton現在可以只在CPU上運行,而無需GPU。

而也正是因為NVIDIA的跨平臺管理能力,使A100在Arm和x86-64平臺上的性能幾乎相同。并且,通過NVIDIA的軟件優(yōu)化,AI性能在過去一年中就增長了高達50%。

結語

這幾年,NVIDIA在AI領域一路狂奔,不僅僅在數據中心方面優(yōu)勢明顯,在汽車、邊緣計算方面也正推出優(yōu)勢產品,另外在他們還在準備推出工業(yè)級的AI產品,進入傳統工業(yè)領域。AI正在不斷滲透到人們生活的各個方面。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯系本站處理。 舉報投訴
  • NVIDIA
    +關注

    關注

    14

    文章

    5188

    瀏覽量

    105445
  • AI
    AI
    +關注

    關注

    87

    文章

    33554

    瀏覽量

    274264
  • 人工智能
    +關注

    關注

    1804

    文章

    48449

    瀏覽量

    245069
  • 推理
    +關注

    關注

    0

    文章

    8

    瀏覽量

    7318
  • MLPerf
    +關注

    關注

    0

    文章

    36

    瀏覽量

    747
收藏 人收藏

    評論

    相關推薦

    使用MicroPython部署中的ocrrec_image.py推理得到的輸出結果很差,如何解決呢?

    使用在線平臺訓練OCR識別任務,測試結果表現很好。 期待結果和實際結果 實際的推理結果很差,
    發(fā)表于 04-29 06:54

    1.9倍性能提升!英特爾至強6在MLPerf基準測試中表現卓越

    與第五代至強處理器相比,英特爾至強6性能核的性能平均提高了1.9倍。 今日,MLCommons公布了最新的MLPerf推理v5.0基準測試結果,其中,英特爾??至強??6性能核處理器在
    的頭像 發(fā)表于 04-07 10:58 ?140次閱讀

    英偉達GTC25亮點:NVIDIA Blackwell Ultra 開啟 AI 推理新時代

    英偉達GTC25亮點:NVIDIA Blackwell Ultra 開啟 AI 推理新時代
    的頭像 發(fā)表于 03-20 15:35 ?524次閱讀

    英偉達GTC25亮點:NVIDIA Dynamo開源庫加速并擴展AI推理模型

    NVIDIA Dynamo 提高了推理性能,同時降低了擴展測試時計算 (Scaling Test-Time Compute) 的成本;在 NVIDIA Blackwell 上的推理優(yōu)化
    的頭像 發(fā)表于 03-20 15:03 ?507次閱讀

    Oracle 與 NVIDIA 合作助力企業(yè)加速代理式 AI 推理

    ——Oracle 和 NVIDIA 今日宣布,NVIDIA 加速計算和推理軟件與 Oracle 的 AI 基礎設施以及生成式 AI 服務首次實現集成,以幫助全球企業(yè)組織加速創(chuàng)建代理式 AI 應用。 ? 此次
    發(fā)表于 03-19 15:24 ?282次閱讀
    Oracle 與 <b class='flag-5'>NVIDIA</b> 合作助力企業(yè)加速代理式 AI <b class='flag-5'>推理</b>

    使用NVIDIA推理平臺提高AI推理性能

    NVIDIA推理平臺提高了 AI 推理性能,為零售、電信等行業(yè)節(jié)省了數百萬美元。
    的頭像 發(fā)表于 02-08 09:59 ?531次閱讀
    使用<b class='flag-5'>NVIDIA</b><b class='flag-5'>推理</b>平臺提高AI<b class='flag-5'>推理</b>性能

    WTS-100(V2.0 GNSS) 無線定位系統(GNSS) 彩頁

    產品概述:WTS-100(V2.0 GNSS)是一款采用國產新興窄帶高并發(fā)TurMass物聯網通訊技術回傳信息的無線定位系統,系統通過GNSS定位終端接收來自多顆衛(wèi)星的信號來確定目標位置,具備定位
    發(fā)表于 01-17 10:59 ?0次下載

    ANSVG-G-A混合動態(tài)濾波補償裝置使用說明書 V2.0

    電子發(fā)燒友網站提供《ANSVG-G-A混合動態(tài)濾波補償裝置使用說明書 V2.0 .pdf》資料免費下載
    發(fā)表于 12-16 14:08 ?0次下載

    從TMS320TCI648x DSP的EDMA v2.0遷移到EDMA v3.0

    電子發(fā)燒友網站提供《從TMS320TCI648x DSP的EDMA v2.0遷移到EDMA v3.0.pdf》資料免費下載
    發(fā)表于 10-16 11:33 ?0次下載
    從TMS320TCI648x DSP的EDMA <b class='flag-5'>v2.0</b>遷移到EDMA <b class='flag-5'>v</b>3.0

    從EDMA v2.0遷移到TMS320DM644X DMSoC的EDMA v3.0

    電子發(fā)燒友網站提供《從EDMA v2.0遷移到TMS320DM644X DMSoC的EDMA v3.0.pdf》資料免費下載
    發(fā)表于 10-16 10:55 ?0次下載
    從EDMA <b class='flag-5'>v2.0</b>遷移到TMS320DM644X DMSoC的EDMA <b class='flag-5'>v</b>3.0

    從EDMA v2.0遷移到EDMA v3.0 TMS320C64X DSP

    電子發(fā)燒友網站提供《從EDMA v2.0遷移到EDMA v3.0 TMS320C64X DSP.pdf》資料免費下載
    發(fā)表于 10-15 10:12 ?0次下載
    從EDMA <b class='flag-5'>v2.0</b>遷移到EDMA <b class='flag-5'>v</b>3.0 TMS320C64X DSP

    阿童木二代Atom XL數字模擬對講手機用戶手冊V2.0

    阿童木二代Atom XL數字模擬對講手機用戶手冊V2.0 0119
    發(fā)表于 10-14 14:03 ?0次下載

    浪潮信息AS13000G7榮獲MLPerf? AI存儲基準測試五項性能全球第一

    北京2024年9月27日?/美通社/ -- 9月25日,MLCommons協會發(fā)布最新MLPerf? Storage v1.0 AI存儲基準測試成績。浪潮信息分布式存儲平臺AS13000G7表現
    的頭像 發(fā)表于 09-28 16:46 ?338次閱讀
    浪潮信息AS13000G7榮獲<b class='flag-5'>MLPerf</b>? AI存儲基準測試五項性能全球第一

    高鴻信安與百敖軟件完成產品兼容互認證

    近日,大唐高鴻信安與百敖軟件開展了產品兼容適配工作,高鴻信安自主研發(fā)的可信支撐模塊軟件V2.0、操作系統可信增強系統V2.0、可信管理平臺V2.0、可信代理軟件 V2.0等多款可信計算
    的頭像 發(fā)表于 09-19 15:06 ?575次閱讀

    英偉達推出全新NVIDIA AI Foundry服務和NVIDIA NIM推理微服務

    NVIDIA 宣布推出全新 NVIDIA AI Foundry 服務和 NVIDIA NIM 推理微服務,與同樣剛推出的 Llama 3.1 系列開源模型一起,為全球企業(yè)的生成式 AI
    的頭像 發(fā)表于 07-25 09:48 ?930次閱讀