一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

AMD ROCm 6.1升級MIPOpen 3.1,引入AI參數(shù)預(yù)測模型

微云疏影 ? 來源:綜合整理 ? 作者:綜合整理 ? 2024-02-29 14:33 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

據(jù)最新消息,自 AMD 去年 12 月份公布 ROCm 6.0 以來,已經(jīng)開始積極籌備 6.1 版的發(fā)布,以提高與英偉達(NVIDIA)CUDA 競爭的核心實力。

在此期間,AMD 頻繁向GitHub公共倉庫推送有關(guān) ROCm 6.1 的最新開發(fā)進展,透露出不久后有可能正式上線新版本的意圖。

據(jù)悉,此次 ROCm 6.1 主要的突破在于其升級至全新版本的 MIPOpen 3.1;新增了使用AI進行參數(shù)預(yù)測的 conv_hip_igemm_group_fwd_xdlops 求解器;解決了當前版本的眾多 BUG,以及引入了新的求解器算法。

此外,該系列還努力提升了系統(tǒng)性能,尤其是優(yōu)化了MIGraphX功能,包含但不限于加入對FP8精度的支持,以及增加更多運算符等,同時更新了針對 Whisper / Llama-2 / Stable Diffusion 2.1 的文檔示例,以及提供新的ONNX示例,以便更好地適應(yīng) GEMM 的BLAS自動調(diào)整。

更重要的是,為了改善在Microsoft Windows 環(huán)境下運行 MIGraphX的效率,AMD特別推出了全新的“hipother”資源庫。

值得一提的是,HIP 技術(shù)是AMD專有的C++運行時API和內(nèi)核語言,適配可移植的AMD/NVIDIA GPU應(yīng)用程序,而HIPIFY 工具則能協(xié)助將CUDA源碼便捷地轉(zhuǎn)化成HIP腳本。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • amd
    amd
    +關(guān)注

    關(guān)注

    25

    文章

    5589

    瀏覽量

    136362
  • 英偉達
    +關(guān)注

    關(guān)注

    22

    文章

    3953

    瀏覽量

    93783
  • 求解器
    +關(guān)注

    關(guān)注

    0

    文章

    81

    瀏覽量

    4757
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    ROCm 6.2.4 成功移植至 SG2044: 大模型部署速率飆升,RISC-V + AI 新紀元!代碼已經(jīng)開源,一起來試試!

    AMD7900xtxonSOPHGOSG2044PCLT團隊傾注心血,精心完成了將ROCm軟件棧適配到SG2044獨特架構(gòu)的復(fù)雜工作。這包括:內(nèi)核適配:確保ROCm驅(qū)動程序和底層組
    的頭像 發(fā)表于 07-14 17:04 ?415次閱讀
    <b class='flag-5'>ROCm</b> 6.2.4 成功移植至 SG2044: 大<b class='flag-5'>模型</b>部署速率飆升,RISC-V + <b class='flag-5'>AI</b> 新紀元!代碼已經(jīng)開源,一起來試試!

    首創(chuàng)開源架構(gòu),天璣AI開發(fā)套件讓端側(cè)AI模型接入得心應(yīng)手

    ,聯(lián)發(fā)科帶來了全面升級的天璣AI開發(fā)套件2.0,在模型庫規(guī)模、架構(gòu)開放程度、前沿端側(cè)AI技術(shù)支持和端側(cè)LoRA訓練落地等方面均迎來全面躍遷,為開發(fā)者提供了更全面、更開放、更強大的端側(cè)
    發(fā)表于 04-13 19:52

    6.12.1升級到6.13老是閃退是什么原因?qū)е碌模?/a>

    6.12.1升級到6.13老是閃退,回到6.12.1又正常,問一下大家是什么原因?qū)е?,有什么解決辦法?
    發(fā)表于 03-11 08:13

    FPGA+AI王炸組合如何重塑未來世界:看看DeepSeek東方神秘力量如何預(yù)測......

    ”“大模型圈的大黑馬”“硅谷震驚了”“來自中國的學霸AI”…… 從智能手機到自動駕駛,從數(shù)據(jù)中心到物聯(lián)網(wǎng),F(xiàn)PGA 正悄然改變著我們的生活。未來,F(xiàn)PGA 又將如何塑造世界?DeepSeek 帶你一起
    發(fā)表于 03-03 11:21

    AI賦能邊緣網(wǎng)關(guān):開啟智能時代的新藍海

    引入徹底改變了這一局面。通過在邊緣網(wǎng)關(guān)集成AI芯片和算法模型,使其具備了實時數(shù)據(jù)分析、智能決策和自主控制能力。在工業(yè)質(zhì)檢場景中,搭載AI算法的邊緣網(wǎng)關(guān)能夠?qū)崟r識別產(chǎn)品缺陷,將檢測效率
    發(fā)表于 02-15 11:41

    淵亭KGAG升級引入“高級策略推理”

    為了突破現(xiàn)有AI技術(shù)在決策推理方面的局限,淵亭科技對其知識圖譜分析平臺KGAG進行了最新升級,創(chuàng)新性地引入了“高級策略推理”模式。這一模式的引入,實現(xiàn)了“大
    的頭像 發(fā)表于 02-14 15:07 ?534次閱讀

    IBM在watsonx.ai平臺推出DeepSeek R1蒸餾模型

    IBM近日宣布了一項重要更新,為其企業(yè)AI開發(fā)平臺watsonx.ai引入了DeepSeek R1的Llama 3.1 8B和Llama
    的頭像 發(fā)表于 02-14 10:21 ?528次閱讀

    AI模型部署邊緣設(shè)備的奇妙之旅:目標檢測模型

    ,PReLU仍然能夠在正輸入?yún)^(qū)域促進稀疏激活,這對模型的學習是有利的。 缺點 增加模型復(fù)雜度:由于引入了額外的可學習參數(shù) α,這增加了模型
    發(fā)表于 12-19 14:33

    AMD發(fā)布10億參數(shù)開源AI模型OLMo

    AMD公司近日宣布了一項重大進展,推出了首個完全開放的10億參數(shù)語言模型系列——AMD OLMo。這一舉措為開發(fā)者和研究人員提供了強大的AI
    的頭像 發(fā)表于 11-12 18:08 ?787次閱讀

    解鎖新玩法 | 迅為龍芯3A5000升級UEFI,全面支持銀河麒麟系統(tǒng)

    解鎖新玩法 | 迅為龍芯3A5000升級UEFI,全面支持銀河麒麟系統(tǒng)
    的頭像 發(fā)表于 10-21 11:23 ?924次閱讀
    解鎖新玩法 | 迅為龍芯3A5000<b class='flag-5'>升級</b>UEFI,全面支持銀河麒麟系統(tǒng)

    從ADS7813升級到ADS8513

    電子發(fā)燒友網(wǎng)站提供《從ADS7813升級到ADS8513.pdf》資料免費下載
    發(fā)表于 10-21 09:59 ?0次下載
    從ADS7813<b class='flag-5'>升級</b>到ADS8513

    英偉達發(fā)布AI模型 Llama-3.1-Nemotron-51B AI模型

    英偉達公司宣布推出 Llama-3.1-Nemotron-51B AI 模型,這個AI模型是源自 Meta 公司的 Llama-
    的頭像 發(fā)表于 09-26 17:30 ?922次閱讀

    Meta Llama 3.1系列模型可在Google Cloud上使用

    我們很高興宣布,Llama 3.1 系列模型已添加到 Vertex AI Model Garden,這包括全新的 405B,即 Meta 迄今為止功能最強大、用途最廣泛的模型。這些
    的頭像 發(fā)表于 08-02 15:42 ?737次閱讀

    Meta發(fā)布全新開源大模型Llama 3.1

    科技巨頭Meta近期震撼發(fā)布了其最新的開源人工智能(AI模型——Llama 3.1,這一舉措標志著Meta在AI領(lǐng)域的又一重大突破。Meta創(chuàng)始人馬克·扎克伯格親自站臺,盛贊Llam
    的頭像 發(fā)表于 07-24 18:25 ?1784次閱讀

    NVIDIA AI Foundry 為全球企業(yè)打造自定義 Llama 3.1 生成式 AI 模型

    借助 NVIDIA AI Foundry,企業(yè)和各國現(xiàn)在能夠使用自有數(shù)據(jù)與 Llama 3.1 405B 和 NVIDIA Nemotron 模型配對,來構(gòu)建“超級模型” NVIDIA
    發(fā)表于 07-24 09:39 ?919次閱讀
    NVIDIA <b class='flag-5'>AI</b> Foundry 為全球企業(yè)打造自定義 Llama <b class='flag-5'>3.1</b> 生成式 <b class='flag-5'>AI</b> <b class='flag-5'>模型</b>