AMD近日宣布了一項(xiàng)重要進(jìn)展,成功將全新的DeepSeek-V3模型集成到其Instinct MI300X GPU上。這一舉措標(biāo)志著AMD在AI推理優(yōu)化方面邁出了重要一步。
據(jù)了解,DeepSeek-V3模型經(jīng)過(guò)了SGLang的強(qiáng)化,專門針對(duì)AI推理進(jìn)行了深度優(yōu)化。這意味著,當(dāng)該模型運(yùn)行在Instinct MI300X GPU上時(shí),將能夠提供更高效、更快速的AI推理能力。這對(duì)于需要高性能AI計(jì)算的應(yīng)用場(chǎng)景來(lái)說(shuō),無(wú)疑是一個(gè)巨大的福音。
值得一提的是,AMD早在去年12月26日就已經(jīng)在Github上公布了支持DeepSeek-V3模型的SGLang v0.4.1版本。這一提前的布局顯示了AMD在技術(shù)研發(fā)上的前瞻性和執(zhí)行力。通過(guò)不斷地更新和優(yōu)化,AMD成功地將這一先進(jìn)技術(shù)集成到了其最新的GPU產(chǎn)品中。
此次DeepSeek-V3模型與Instinct MI300X GPU的結(jié)合,不僅提升了AMD在AI計(jì)算領(lǐng)域的競(jìng)爭(zhēng)力,也為用戶帶來(lái)了更加出色的使用體驗(yàn)。未來(lái),隨著AI技術(shù)的不斷發(fā)展,AMD有望在這一領(lǐng)域取得更多的突破和創(chuàng)新。
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。
舉報(bào)投訴
相關(guān)推薦
架構(gòu)和全功能GPU的強(qiáng)大技術(shù)實(shí)力,摩爾線程迅速響應(yīng)并完成了對(duì)DeepSeek-V3的無(wú)縫升級(jí),實(shí)現(xiàn)了零報(bào)錯(cuò)、零兼容性問(wèn)題的光速部署,充分展現(xiàn)了摩爾線程在AI大模型領(lǐng)域的領(lǐng)先優(yōu)勢(shì)。
發(fā)表于 03-31 11:34
?404次閱讀
/completions;
點(diǎn)擊Body將model修改為deepseek-chat(對(duì)應(yīng)DeepSeek-V3)或者deepseek-reasoner(對(duì)應(yīng)
發(fā)表于 03-07 14:56
DeepSeek-V3滿血版在國(guó)產(chǎn)GPU平臺(tái)的高效全棧式訓(xùn)練與推理,實(shí)現(xiàn)國(guó)產(chǎn)大模型與國(guó)產(chǎn)GPU的深度融合優(yōu)化,開(kāi)啟國(guó)產(chǎn)算力新篇章。
發(fā)表于 03-04 14:01
?668次閱讀
DeepSeek-V3 和 DeepSeek-R1 是深度求索公司(DeepSeek)推出的兩個(gè)不同定位的大模型,其核心差異主要體現(xiàn)在目標(biāo)場(chǎng)景、能力側(cè)重和技術(shù)優(yōu)化方向上。以下是二者的實(shí)
發(fā)表于 02-14 02:08
即日起,企業(yè)客戶和開(kāi)發(fā)者可在商湯大裝置萬(wàn)象平臺(tái)中,快速部署DeepSeek-V3、DeepSeek-R1等模型,可享受3個(gè)月內(nèi)1000萬(wàn)tokens免費(fèi)使用權(quán)益。
發(fā)表于 02-10 10:16
?431次閱讀
近日,據(jù)外媒 videocardz 報(bào)道,參考 AMD 最新推出的 AMD - GFX 補(bǔ)丁程序,其中暗示 AMD 旗下的 Instinct MI
發(fā)表于 02-05 15:07
?665次閱讀
AMD近日宣布了一項(xiàng)重要的技術(shù)進(jìn)展,即將全新的DeepSeek-V3模型成功集成到其旗艦級(jí)GPU產(chǎn)品——
發(fā)表于 02-05 13:58
?386次閱讀
力不從心。 Semianalysis的報(bào)告詳細(xì)闡述了AMD所面臨的問(wèn)題。報(bào)告指出,由于AMD的軟件存在顯著缺陷,若未經(jīng)過(guò)大量的調(diào)試和優(yōu)化,使用MI300X進(jìn)行AI模型的訓(xùn)練幾乎是不可能
發(fā)表于 12-25 10:57
?618次閱讀
近日,據(jù)外媒最新報(bào)道,國(guó)際商業(yè)機(jī)器公司(IBM)與超威半導(dǎo)體公司(AMD)已正式宣布達(dá)成一項(xiàng)重要合作。雙方將攜手在IBM Cloud上部署AMD的Instinct
發(fā)表于 11-21 11:07
?590次閱讀
IBM與AMD近期宣布了一項(xiàng)重要合作協(xié)議,根據(jù)協(xié)議,IBM將在其云平臺(tái)上部署AMD Instinct MI300X加速器。這一舉措旨在提升企業(yè)客戶在生成式AI
發(fā)表于 11-19 16:24
?443次閱讀
近日,全球領(lǐng)先的科技企業(yè)IBM與AMD共同宣布了一項(xiàng)重要合作。雙方計(jì)劃在IBM云上部署AMD的Instinct MI300X加速器服務(wù),以滿足企業(yè)客戶對(duì)于高性能和高效能AI
發(fā)表于 11-19 11:03
?699次閱讀
:新版Instinct MI325X、第五代EPYC服務(wù)器處理器以及最新的第三代DPU Pensando系列。
發(fā)表于 10-12 16:54
?1048次閱讀
在舊金山舉辦的Advancing AI 2024大會(huì)上,AMD正式推出了其新一代AI芯片——GPU AMD Instinct MI325X。
發(fā)表于 10-11 15:55
?716次閱讀
三星電子近日斥資約270億韓元(約合1.42億元人民幣),購(gòu)買了AMD Instinct MI300X加速器。這一舉措標(biāo)志著三星電子首次引入非英偉達(dá)品牌的AI GPU,以應(yīng)對(duì)企業(yè)內(nèi)部算
發(fā)表于 10-10 17:15
?776次閱讀
在近日舉行的COMPUTEX臺(tái)北國(guó)際電腦展上,AMD董事長(zhǎng)兼CEO蘇姿豐發(fā)表了精彩演講,并正式發(fā)布了一款備受矚目的AI芯片——Instinct MI325X。這款芯片預(yù)計(jì)將于2024年第四季度正式上市,將為AI領(lǐng)域帶來(lái)全新的性能
發(fā)表于 06-04 14:49
?1291次閱讀
評(píng)論