AMD開(kāi)源的高性能機(jī)器學(xué)習(xí)庫(kù)MIOpen分析
推薦 + 挑錯(cuò) + 收藏(0) + 用戶評(píng)論(0)
MIOpen是AMD開(kāi)源的高性能機(jī)器學(xué)習(xí)庫(kù),目前只支持兩種編程模式:
1. OpenCL
2. HIP
安裝準(zhǔn)備
安裝ROCm
基礎(chǔ)軟件棧,其中包括
OpenCL - OpenCL 庫(kù)和頭文件
HIP -
HIP 和 HCC庫(kù)和頭文件
clang-ocl– 必需
MIOpen依靠miopengemm庫(kù)來(lái)啟用
ROCm cmake模塊可以從這里安裝:https://github.com/RadeonOpenCompute/rocm-cmake
對(duì)應(yīng)的安裝說(shuō)明可在下載的庫(kù)中查詢。
cmake配置
第一步:創(chuàng)建目錄:
第二步:配置cmake。MIOpen 的首選后端可以使用-DMIOPEN_BACKEND cmake 變量來(lái)設(shè)置。
For OpenCL, run:
以上步驟均假設(shè) OpenCL 安裝在某個(gè)標(biāo)準(zhǔn)位置。如果沒(méi)有,則手動(dòng)設(shè)置這兩個(gè) cmake 變量:
For HIP, run:
cmake 步驟示例:
默認(rèn)安裝位置設(shè)置為 “/opt/rocm”, 可使用 CMAKE_INSTALL_PREFIX設(shè)置:
此外, 網(wǎng)絡(luò)配置的數(shù)據(jù)庫(kù)路徑可由 MIOPEN_DB_PATH 變量設(shè)置。默認(rèn)為數(shù)據(jù)庫(kù)文件的安裝位置。出于開(kāi)發(fā)便捷性, 設(shè)置 BUILD_DEV 將改變存儲(chǔ)在源目錄中的數(shù)據(jù)庫(kù)文件的路徑:
使用 ccmake 運(yùn)行 cmake 后,可以更改配置:
ccmake 程序在 不兼容windows平臺(tái)。
構(gòu)建庫(kù)
可以使用“Release”配置在build目錄構(gòu)建庫(kù)。
用 “install”命令進(jìn)行目標(biāo)安裝:
此時(shí)的安裝路徑為已設(shè)置的CMAKE_INSTALL_PREFIX。
驅(qū)動(dòng)生成
MIOpen 提供了一個(gè)應(yīng)用驅(qū)動(dòng)程序,可用于單獨(dú)執(zhí)行任何一個(gè)特定的層,并測(cè)量和驗(yàn)證庫(kù)的性能。
可以使用 MIOpenDriver 目標(biāo)構(gòu)建驅(qū)動(dòng)程序:
有關(guān)如何運(yùn)行驅(qū)動(dòng)程序的文檔在這里:https://github.com/ROCmSoftwarePlatform/MIOpen/blob/master/driver/README.md
運(yùn)行測(cè)試
可以使用 target check 運(yùn)行測(cè)試:
通過(guò)執(zhí)行以下操作, 可以生成和運(yùn)行單個(gè)測(cè)試:
生成文檔
HTML和PDF文檔生成命令:
這將在。/MIOpen/doc/html 文件夾建立一個(gè)本地可搜索網(wǎng)站, 并在。/MIOpen/doc/pdf 文件夾創(chuàng)建一個(gè) PDF 文檔。
文檔是使用Doxygen生成的, 應(yīng)單獨(dú)安裝。
HTML和PDF通過(guò)Sphinx和Breathe以及ReadTheDocs theme生成。
可以在MIOpen / doc文件夾中填寫Sphinx,Breathe和ReadTheDocs theme的要求:
由于設(shè)置不同,有可能需要執(zhí)行sudo才能安裝pip 。
代碼格式化
代碼格式化使用 clang-format。格式化一個(gè)文件,使用:
此外,可以安裝githook來(lái)格式化per-commit代碼
非常好我支持^.^
(0) 0%
不好我反對(duì)
(0) 0%
下載地址
AMD開(kāi)源的高性能機(jī)器學(xué)習(xí)庫(kù)MIOpen分析下載
相關(guān)電子資料下載
- 臺(tái)積電7nm以下工藝漲價(jià)6%,漲價(jià)已計(jì)劃通知客戶 459
- AMD推出銳龍 Threadripper 7000系列處理器 171
- 傳AMD、諾基亞等多家大廠相繼裁員,行業(yè)春天何時(shí)到來(lái)? 1261
- 科通技術(shù)攜AMD解碼現(xiàn)代專業(yè)音視頻及工業(yè)醫(yī)療圖像新趨勢(shì) 211
- CPRI的數(shù)據(jù)幀結(jié)構(gòu)與初始化流程 65
- 中國(guó)半導(dǎo)體廠商數(shù)字飛騰(Phytium)發(fā)展超強(qiáng)服務(wù)器處理器,挑戰(zhàn)美國(guó)制裁| 百能 323
- 報(bào)名開(kāi)啟丨AMD邀您共享自適應(yīng)和嵌入式技術(shù)盛會(huì) 55
- FSR3性能畫(huà)質(zhì)雙超DLSS3!AMD RX 6750 GRE首發(fā)評(píng)測(cè):遠(yuǎn)強(qiáng)于RTX 4060 424
- 美芯片禁令再次擴(kuò)大,波及英偉達(dá)、AMD以及intel等科技公司 166
- AMD將AI技術(shù)引入筆記本電腦 為用戶開(kāi)啟更廣闊的數(shù)字世界 501