一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

AMD將于今年秋季在部分RDNA 3 GPU上添加ROCm的支持

AMD中國(guó) ? 來源:AMD中國(guó) ? 2023-07-25 15:40 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

AMD將于今年秋季在部分RDNA 3 GPU上添加ROCm的支持

人工智能是塑造下一代計(jì)算的決定性技術(shù)。近幾個(gè)月來,我們都看到了生成式人工智能和大語言模型的爆炸式增長(zhǎng)正在徹底改變我們與技術(shù)交互的方式,并推動(dòng)以GPU為中心的數(shù)據(jù)中心對(duì)高性能計(jì)算的需求顯著增加。

ROCm是一個(gè)開放軟件平臺(tái),允許研究人員利用AMD Instinct加速器的強(qiáng)大功能,促進(jìn)HPC和AI創(chuàng)新跨平臺(tái)的可移植性。ROCm 5具有針對(duì)AI和HPC工作負(fù)載的全面優(yōu)化套件。其中包括針對(duì)大型語言模型精細(xì)調(diào)整的內(nèi)核、對(duì)新數(shù)據(jù)類型的支持以及對(duì)像OpenAI Triton類編程語言等新技術(shù)的支持。

ROCm驗(yàn)證現(xiàn)在包括每晚進(jìn)行數(shù)十萬次框架測(cè)試,以及跨數(shù)千個(gè)模型和運(yùn)算符的驗(yàn)證。這包括對(duì)PyTorch、TensorFlow、ONNX和JAX等領(lǐng)先框架的支持,為基于這些框架構(gòu)建的所有AI模型提供更佳的開箱即用的開發(fā)者體驗(yàn)。

我很高興地宣布ROCm 5.6的最新版本。

ROCm 5.6通過針對(duì)大語言(和其他)模型的新型AI軟件附加組件增強(qiáng)了功能,包括跨ROCm 庫(kù)組合的許多性能優(yōu)化。它還反映了支持人工智能社區(qū)的持續(xù)改進(jìn),包括:

- 將Hugging Face單元測(cè)試套件集成到ROCm QA中

- 在PyTorch 2.0感應(yīng)器模式下對(duì)OpenAI Triton的增量支持

- 通過ROCm對(duì)PyTorch、TensorFlow和JAX啟用OpenXLA支持,從而支持更廣泛的社區(qū)

ROCm 5.6還引入了對(duì)FFT、BLAS和求解器等多個(gè)數(shù)學(xué)庫(kù)的改進(jìn),這些數(shù)學(xué)庫(kù)構(gòu)成了HPC應(yīng)用程序的基礎(chǔ),并增強(qiáng)了ROCm開發(fā)和部署工具,包括安裝、ROCgdb(CPU-GPU集成調(diào)試器)、ROCm分析器和文檔。

隨著行業(yè)朝著支持廣泛加速器的開放生態(tài)系統(tǒng)發(fā)展,我們將繼續(xù)努力進(jìn)一步優(yōu)化框架和后端編譯器,以實(shí)現(xiàn)更佳性能,包括MLIR基礎(chǔ)設(shè)施改進(jìn),鞏固AMD對(duì)OpenAI Triton和OpenXLA編譯器的支持。我們還將繼續(xù)在Hugging Face的AMD hub中添加針對(duì)AMD解決方案優(yōu)化的其他開源AI模型。

對(duì)于HPC用戶,我們最近在AMD Infinity Hub上發(fā)布了許多發(fā)布方法,使客戶能夠構(gòu)建HPC應(yīng)用程序容器,未來的ROCm版本將增加AMD Instinct解決方案支持的HPC應(yīng)用程序數(shù)量。

我們還看到開發(fā)人員對(duì)在Radeon消費(fèi)級(jí)和 Radeon Pro工作站級(jí)GPU上運(yùn)行用于AI和ML的ROCm開放軟件平臺(tái)表現(xiàn)出了極大的興趣,并聽到了社區(qū)對(duì)不受支持的GPU上的特定驅(qū)動(dòng)程序問題提出的挑戰(zhàn)。我可以很高興地說,我們已經(jīng)修復(fù)了ROCm 5.6中報(bào)告的問題,并且我們致力于今后擴(kuò)大我們的支持。

我們計(jì)劃將ROCm支持從當(dāng)前支持的AMD RDNA 2工作站GPU:Radeon Pro v620和w6800 擴(kuò)展到特定的AMD RDNA 3工作站和消費(fèi)級(jí)GPU。Linux上對(duì)基于RDNA 3的GPU的正式支持計(jì)劃于今年秋季開始推出,首先是48GB Radeon PRO W7900和24GB Radeon RX 7900 XTX,隨著時(shí)間的推移,還會(huì)發(fā)布更多卡和擴(kuò)展功能。

責(zé)任編輯:彭菁

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • amd
    amd
    +關(guān)注

    關(guān)注

    25

    文章

    5589

    瀏覽量

    136412
  • 人工智能
    +關(guān)注

    關(guān)注

    1807

    文章

    49035

    瀏覽量

    249776
  • RDNA
    +關(guān)注

    關(guān)注

    0

    文章

    22

    瀏覽量

    2091

原文標(biāo)題:新的ROCm? 5.6版本為AI和HPC工作負(fù)載帶來增強(qiáng)和優(yōu)化

文章出處:【微信號(hào):AMD中國(guó),微信公眾號(hào):AMD中國(guó)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    ROCm 6.2.4 成功移植至 SG2044: 大模型部署速率飆升,RISC-V + AI 新紀(jì)元!代碼已經(jīng)開源,一起來試試!

    。AMD7900xtxonSOPHGOSG2044PCLT團(tuán)隊(duì)傾注心血,精心完成了將ROCm軟件棧適配到SG2044獨(dú)特架構(gòu)的復(fù)雜工作。這包括:內(nèi)核級(jí)適配:確保ROCm驅(qū)動(dòng)程序和底層組件能夠與SG
    的頭像 發(fā)表于 07-14 17:04 ?447次閱讀
    <b class='flag-5'>ROCm</b> 6.2.4 成功移植至 SG2044: 大模型部署速率飆升,RISC-V + AI 新紀(jì)元!代碼已經(jīng)開源,一起來試試!

    英偉達(dá)擬再推中國(guó)特供GPU,今年6月量產(chǎn)!

    。 ??????????????????????????????????????????????????? 最新消息顯示,英偉達(dá)擬新推出一款專門面向中國(guó)市場(chǎng)的人工智能芯片,且最早將于今年6月開始量產(chǎn)。這款芯片屬于英偉達(dá)最新一代基于Blackwell架構(gòu)的人工智能處理器,但其
    發(fā)表于 05-27 00:03 ?4395次閱讀

    如何通過SFL為設(shè)備添加Flash編程支持

    SEGGER Flash Loader(SFL)是J-Link設(shè)備支持套件(DSK)的一部分,通過SFL,用戶可以為自己的新設(shè)備添加Flash編程支持
    的頭像 發(fā)表于 05-19 16:35 ?575次閱讀
    如何通過SFL為設(shè)備<b class='flag-5'>添加</b>Flash編程<b class='flag-5'>支持</b>

    摩爾線程GPU率先支持Qwen3全系列模型

    近日,阿里云正式發(fā)布Qwen3系列的8款開源混合推理模型。摩爾線程團(tuán)隊(duì)模型發(fā)布當(dāng)天,率先完成了Qwen3全系列模型全功能GPU
    的頭像 發(fā)表于 05-07 15:24 ?488次閱讀

    專訪AMD王啟尚 從RDNA 4到FSR 4,AMD GPU技術(shù)創(chuàng)新引領(lǐng)行業(yè)新發(fā)展

    近日于珠海舉辦的AMD新一代Radeon RX 9070系列顯卡發(fā)布會(huì)后,AMD GPU技術(shù)與工程研發(fā)副總裁王啟尚接受了我們的專訪。本次
    的頭像 發(fā)表于 03-06 11:19 ?412次閱讀
    專訪<b class='flag-5'>AMD</b>王啟尚 從<b class='flag-5'>RDNA</b> 4到FSR 4,<b class='flag-5'>AMD</b> <b class='flag-5'>GPU</b>技術(shù)創(chuàng)新引領(lǐng)行業(yè)新發(fā)展

    無法GPU運(yùn)行ONNX模型的Benchmark_app怎么解決?

    CPU 和 GPU 運(yùn)行OpenVINO? 2023.0 Benchmark_app推斷的 ONNX 模型。 CPU 推理成功
    發(fā)表于 03-06 08:02

    AMD將DeepSeek-V3模型集成至Instinct MI300X GPU

    AMD近日宣布了一項(xiàng)重要進(jìn)展,成功將全新的DeepSeek-V3模型集成到其Instinct MI300X GPU。這一舉措標(biāo)志著AMD
    的頭像 發(fā)表于 02-06 09:41 ?577次閱讀

    AMD集成DeepSeek-V3模型至Instinct MI300X GPU

    AMD近日宣布了一項(xiàng)重要的技術(shù)進(jìn)展,即將全新的DeepSeek-V3模型成功集成到其旗艦級(jí)GPU產(chǎn)品——Instinct MI300X。這一舉措標(biāo)志著
    的頭像 發(fā)表于 02-05 13:58 ?540次閱讀

    RDNA 4顯卡定在3月發(fā)售 AMD解釋原因

    CES 2025,AMD展示了“RDNA 4”架構(gòu)的Radeon RX 9000系列顯卡,但發(fā)售時(shí)間定在今年
    的頭像 發(fā)表于 01-23 17:48 ?823次閱讀

    《CST Studio Suite 2024 GPU加速計(jì)算指南》

    。 2. 操作系統(tǒng)支持:CST Studio Suite不同操作系統(tǒng)持續(xù)測(cè)試,可在支持的操作系統(tǒng)使用
    發(fā)表于 12-16 14:25

    英特爾12月或發(fā)布Battlemage GPU芯片

    近日,有關(guān)英特爾即將在12月發(fā)布全新Battlemage GPU芯片的傳聞再次被證實(shí)。據(jù)硬件挖掘者和泄密者Tomasz Gawrońsk分享的預(yù)告圖顯示,英特爾極有可能在AMD RDNA 4和英偉達(dá)Blackwell之前,率先推
    的頭像 發(fā)表于 11-19 17:37 ?833次閱讀

    【「算力芯片 | 高性能 CPU/GPU/NPU 微架構(gòu)分析」閱讀體驗(yàn)】--了解算力芯片GPU

    應(yīng)用上具有獨(dú)特優(yōu)勢(shì)和技術(shù)特點(diǎn),英偉達(dá)GPU具有技術(shù)引領(lǐng)優(yōu)勢(shì)。這部分也是比較理論框架化些,通過閱讀可以對(duì)GPU有些整體了解與熟悉。
    發(fā)表于 11-03 12:55

    AMD確認(rèn)2025年推出RDNA 4顯卡,光追與AI性能大幅提升

    10月30日,AMD2024年第三季度財(cái)報(bào)電話會(huì)議宣布了一個(gè)關(guān)于GPU的重要信息:其下一代RDNA 4顯卡計(jì)劃于2025年初發(fā)布。
    的頭像 發(fā)表于 10-30 16:50 ?1674次閱讀

    蘋果將于今晚發(fā)布MacBook Pro系列新品

    10月30日訊,蘋果公司連續(xù)兩天內(nèi)分別推出了搭載M4系列芯片的iMac和Mac mini新品,并預(yù)計(jì)將于今晚發(fā)布MacBook Pro系列新品。   據(jù)相關(guān)報(bào)道分析,新發(fā)布的Mac mini為我們揭示了關(guān)于即將登場(chǎng)的MacBook Pro的兩條重要線索。
    的頭像 發(fā)表于 10-30 15:32 ?1069次閱讀

    AMD與NVIDIA GPU優(yōu)缺點(diǎn)

    ,NVIDIA的RTX系列顯卡以其強(qiáng)大的光線追蹤和DLSS技術(shù)領(lǐng)先于市場(chǎng)。例如,NVIDIA的RTX 30804K分辨率下提供了卓越的游戲體驗(yàn),而AMD的Radeon RX 6800 XT雖然某些游戲中表現(xiàn)接近,但在光線追蹤
    的頭像 發(fā)表于 10-27 11:15 ?2573次閱讀