一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

PyTorch 1.8正式官宣發(fā)布還支持AMD GPU!

新機(jī)器視覺 ? 來源:量子位(QbitAI) ? 作者:夢晨 ? 2021-03-12 11:06 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

導(dǎo)讀

Pytorch1.8來啦!1.8版本中,官方終于加入了對AMD ROCm的支持,可以方便的在原生環(huán)境下運(yùn)行,不用去配置Docker了。 1.8版本中,官方終于加入了對AMD ROCm的支持,可以方便的在原生環(huán)境下運(yùn)行,不用去配置Docker了。

AMD ROCm只支持Linux操作系統(tǒng)

1.8版本集合了自2020年10月1.7發(fā)布以來的超過3000次GitHub提交。此外,本次更新還有諸多亮點(diǎn):

優(yōu)化代碼,更新編譯器

Python內(nèi)函數(shù)轉(zhuǎn)換

增強(qiáng)分布式訓(xùn)練

新的移動端教程與演示

新的性能檢測工具

相關(guān)的庫TorchCSPRNG, TorchVision, TorchText和TorchAudio也會隨之更新。要注意的是,自1.6起,Pytorch新特性將分為Stable、Beta、Prototype三種版本。其中Prototype不會包含到穩(wěn)定發(fā)行版中,需要從Nightly版本自行編譯。

Python to Python函數(shù)轉(zhuǎn)換

新增的Beta特性torch.fx可以實(shí)現(xiàn)Python到Python的函數(shù)轉(zhuǎn)換,可以方便的加入任何工作流程。新的API,向NumPy學(xué)習(xí)!

1.7版本中增加的Beta特性torch.fft已成為正式特性。實(shí)現(xiàn)了與Numpy中的np.fft類似的快速傅立葉變換,還增加了硬件加速支持與自動求導(dǎo),以更好的支持科學(xué)計算。還增加了Beta版NumPy風(fēng)格的線性代數(shù)模塊torch.linalg,支持Cholesky分解、行列式、特征值等功能。

增強(qiáng)分布式訓(xùn)練

增加了穩(wěn)定的異步錯誤與超時處理,增加NCCL的可靠性。增加了Beta版的流水線并行功能*(Pipeline Parallelism)*,可將數(shù)據(jù)拆解成更小的塊以提高并行計算效率。

Pipeline Parallelism使用4個GPU時的工作示意圖

增加Beta版的DDP通訊鉤子,用于控制如何在workers之間同步梯度。

另外還有一些Prototype版的分布式訓(xùn)練新特性。

ZeroRedundancyOptimizer:用于減少所有參與進(jìn)程的內(nèi)存占用。

Process Group NCCL Send/Recv:讓用戶可在Python而不是C++上進(jìn)行集合運(yùn)算。

CUDA-support in RPC using TensorPipe:增加對N卡多卡運(yùn)算的效率。

Remote Module:讓用戶像操作本地模塊一樣操作遠(yuǎn)程模塊。

移動端新教程

隨本次更新發(fā)布了圖像分割模型DeepLabV3在安卓和IOS上的詳細(xì)教程。以及圖像分割、目標(biāo)檢測、神經(jīng)機(jī)器翻譯等在安卓和IOS上的演示程序,方便大家更快上手。 另外還有PyTorch Mobile Lite Interpreter解釋器,可以減少運(yùn)行時文件的大小。

性能檢測工具

增加Beta版的Benchmark utils,用戶可以進(jìn)行精確的性能測試。以及Prototype版的FX Graph Mode Quantization,實(shí)現(xiàn)了量化過程的自動化。更多新版本詳情,見下方鏈接。

編輯:jq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    4944

    瀏覽量

    131215
  • NVIDIA技術(shù)
    +關(guān)注

    關(guān)注

    0

    文章

    17

    瀏覽量

    6446
  • python
    +關(guān)注

    關(guān)注

    56

    文章

    4827

    瀏覽量

    86707
  • pytorch
    +關(guān)注

    關(guān)注

    2

    文章

    809

    瀏覽量

    13951

原文標(biāo)題:PyTorch 1.8來了!正式支持AMD GPU,煉丹不必NVIDIA

文章出處:【微信號:vision263com,微信公眾號:新機(jī)器視覺】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    摩爾線程發(fā)布Torch-MUSA v2.0.0版本 支持原生FP8和PyTorch 2.5.0

    , 支持原生FP8數(shù)據(jù)類型,支持PyTorch 2.5.0 ,并通過多項針對MUSA計算平臺的性能優(yōu)化,進(jìn)一步提升了對AI模型和大規(guī)模數(shù)據(jù)處理的支持能力。 FP8原生
    的頭像 發(fā)表于 05-11 16:41 ?689次閱讀

    專訪AMD王啟尚 從RDNA 4到FSR 4,AMD GPU技術(shù)創(chuàng)新引領(lǐng)行業(yè)新發(fā)展

    在近日于珠海舉辦的AMD新一代Radeon RX 9070系列顯卡發(fā)布會后,AMD GPU技術(shù)與工程研發(fā)副總裁王啟尚接受了我們的專訪。在本次交談中,他詳細(xì)分享了RDNA 4架構(gòu)的設(shè)計理
    的頭像 發(fā)表于 03-06 11:19 ?406次閱讀
    專訪<b class='flag-5'>AMD</b>王啟尚 從RDNA 4到FSR 4,<b class='flag-5'>AMD</b> <b class='flag-5'>GPU</b>技術(shù)創(chuàng)新引領(lǐng)行業(yè)新發(fā)展

    操作指南:pytorch云服務(wù)器怎么設(shè)置?

    設(shè)置PyTorch云服務(wù)器需選擇云平臺,創(chuàng)建合適的GPU實(shí)例,安裝操作系統(tǒng)、Python及Anaconda,創(chuàng)建虛擬環(huán)境,根據(jù)CUDA版本安裝PyTorch,配置環(huán)境變量,最后驗(yàn)證安裝。過程中需考慮
    的頭像 發(fā)表于 02-08 10:33 ?352次閱讀

    GPU-Z迎來2.62 版本的更新發(fā)布

    近日,GPU-Z 迎來了 2.62 版本的更新發(fā)布。此次更新,主要是為了適配英偉達(dá)最新推出的 RTX 50 系列顯卡,為用戶提供更全面、準(zhǔn)確的硬件信息。 在新發(fā)布的 2.62 版本中,GPU
    的頭像 發(fā)表于 02-05 15:33 ?661次閱讀

    《CST Studio Suite 2024 GPU加速計算指南》

    的各個方面,包括硬件支持、操作系統(tǒng)支持、許可證、GPU計算的啟用、NVIDIA和AMD GPU的詳細(xì)信息以及相關(guān)的使用指南和故障排除等內(nèi)容。
    發(fā)表于 12-16 14:25

    AMD發(fā)布Ryzen Master軟件2.14.1.3286版本

    AMD最近發(fā)布了Ryzen Master軟件的2.14.1.3286版本,該版本在內(nèi)存超頻和CPU參數(shù)調(diào)整方面進(jìn)行了顯著改進(jìn)。其中最引人注目的新功能是支持即時動態(tài)超頻的AMD EXPO
    的頭像 發(fā)表于 12-13 16:14 ?1023次閱讀

    PyTorch 2.5.1: Bugs修復(fù)版發(fā)布

    ? 一,前言 在深度學(xué)習(xí)框架的不斷迭代中,PyTorch 社區(qū)始終致力于提供更穩(wěn)定、更高效的工具。最近,PyTorch 2.5.1 版本正式發(fā)布,這個版本主要針對 2.5.0 中發(fā)現(xiàn)的問題進(jìn)行了修復(fù)
    的頭像 發(fā)表于 12-03 16:11 ?1616次閱讀
    <b class='flag-5'>PyTorch</b> 2.5.1: Bugs修復(fù)版<b class='flag-5'>發(fā)布</b>

    英特爾12月或發(fā)布Battlemage GPU芯片

    近日,有關(guān)英特爾即將在12月發(fā)布全新Battlemage GPU芯片的傳聞再次被證實(shí)。據(jù)硬件挖掘者和泄密者Tomasz Gawrońsk分享的預(yù)告圖顯示,英特爾極有可能在AMD RDNA 4和英偉達(dá)Blackwell之前,率先推
    的頭像 發(fā)表于 11-19 17:37 ?817次閱讀

    PyTorch GPU 加速訓(xùn)練模型方法

    在深度學(xué)習(xí)領(lǐng)域,GPU加速訓(xùn)練模型已經(jīng)成為提高訓(xùn)練效率和縮短訓(xùn)練時間的重要手段。PyTorch作為一個流行的深度學(xué)習(xí)框架,提供了豐富的工具和方法來利用GPU進(jìn)行模型訓(xùn)練。 1. 了解GPU
    的頭像 發(fā)表于 11-05 17:43 ?1399次閱讀

    SpaceX星鏈衛(wèi)星終端用上AMD芯片,竟然集成了Arm核心?

    2024Q3財報中透露,SpaceX最新一代星鏈寬帶終端,采用了AMD的Versal AI Core系列自適應(yīng)SoC。而從AMD網(wǎng)了解到,Versal AI Core系列是AMD V
    的頭像 發(fā)表于 11-01 00:11 ?8749次閱讀

    AMD確認(rèn)2025年推出RDNA 4顯卡,光追與AI性能大幅提升

    10月30日,AMD在2024年第三季度財報電話會議上宣布了一個關(guān)于GPU的重要信息:其下一代RDNA 4顯卡計劃于2025年初發(fā)布。AMD首席執(zhí)行
    的頭像 發(fā)表于 10-30 16:50 ?1628次閱讀

    AMD與NVIDIA GPU優(yōu)缺點(diǎn)

    在圖形處理單元(GPU)市場,AMD和NVIDIA是兩大主要的競爭者,它們各自推出的產(chǎn)品在性能、功耗、價格等方面都有著不同的特點(diǎn)和優(yōu)勢。 一、性能 GPU的性能是用戶最關(guān)心的指標(biāo)之一。在高端市場
    的頭像 發(fā)表于 10-27 11:15 ?2481次閱讀

    AMD發(fā)布新一代AI芯片MI325X

    在舊金山舉辦的Advancing AI 2024大會上,AMD正式推出了其新一代AI芯片——GPU AMD Instinct MI325X。這款芯片的發(fā)布標(biāo)志著
    的頭像 發(fā)表于 10-11 15:55 ?913次閱讀

    新手小白怎么通過云服務(wù)器跑pytorch?

    安裝PyTorch的步驟可以根據(jù)不同的操作系統(tǒng)和需求有所差異,通過云服務(wù)器運(yùn)行PyTorch的過程主要包括選擇GPU云服務(wù)器平臺、配置服務(wù)器環(huán)境、部署和運(yùn)行PyTorch模型、優(yōu)化性能
    的頭像 發(fā)表于 09-25 11:35 ?561次閱讀

    英國公司實(shí)現(xiàn)英偉達(dá)CUDA軟件在AMD GPU上的無縫運(yùn)行

    7月18日最新資訊,英國創(chuàng)新科技企業(yè)Spectral Compute震撼發(fā)布了其革命性GPGPU編程工具包——“SCALE”,該工具包實(shí)現(xiàn)了英偉達(dá)CUDA軟件在AMD GPU上的無縫遷移與運(yùn)行,標(biāo)志著在
    的頭像 發(fā)表于 07-18 14:40 ?1097次閱讀