一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

異構(gòu)混訓(xùn)整合不同架構(gòu)芯片資源,提高算力利用率

Carol Li ? 來源:電子發(fā)燒友 ? 作者:李彎彎 ? 2024-07-18 00:11 ? 次閱讀

電子發(fā)燒友網(wǎng)報(bào)道(文/李彎彎)隨著AI技術(shù)的飛速發(fā)展,大模型的訓(xùn)練和推理任務(wù)對算力的需求日益增長。然而,單一品牌的芯片往往難以滿足所有需求,且可能存在供應(yīng)鏈風(fēng)險(xiǎn)。因此,異構(gòu)芯片混訓(xùn)成為了一種重要的解決方案。通過混合使用多種異構(gòu)芯片,可以充分利用不同芯片的優(yōu)勢,提高算力利用率,降低算力成本,并推動(dòng)AI技術(shù)的廣泛應(yīng)用。

異構(gòu)混訓(xùn)能夠整合不同架構(gòu)芯片資源

在2024年世界人工智能大會(huì)AI基礎(chǔ)設(shè)施論壇上,無問芯穹聯(lián)合創(chuàng)始人兼CEO夏立雪發(fā)布了全球首個(gè)千卡規(guī)模異構(gòu)芯片混訓(xùn)平臺(tái),千卡異構(gòu)混合訓(xùn)練集群算力利用率最高達(dá)到了97.6%。

同時(shí),無問芯穹Infini-AI云平臺(tái)已集成大模型異構(gòu)千卡混訓(xùn)能力,是全球首個(gè)可進(jìn)行單任務(wù)千卡規(guī)模異構(gòu)芯片混合訓(xùn)練的平臺(tái),具備萬卡擴(kuò)展性,支持包括AMD、華為昇騰、天數(shù)智芯、沐曦、摩爾線程、NVIDIA六種異構(gòu)芯片在內(nèi)的大模型混合訓(xùn)練。通過Infini-AI云平臺(tái),用戶可以在異構(gòu)算力資源上實(shí)現(xiàn)高效的模型訓(xùn)練和推理,從而加速AI應(yīng)用的開發(fā)和部署。

據(jù)稱,已有智譜AI、月之暗面、生數(shù)科技等大模型公司客戶在Infini-AI上穩(wěn)定使用異構(gòu)算力,還有20余家AI Native應(yīng)用創(chuàng)業(yè)公司在Infini-AI上持續(xù)調(diào)用各種預(yù)置模型。

異構(gòu)混訓(xùn)平臺(tái)具有多樣化算力資源、高效算力分配、靈活性與可擴(kuò)展性、降低總體擁有成本(TCO)、推動(dòng)技術(shù)創(chuàng)新和生態(tài)整合等特點(diǎn)。

具體來看,異構(gòu)混訓(xùn)平臺(tái)能夠整合來自不同廠商、不同架構(gòu)的芯片資源,這些芯片在各自擅長的領(lǐng)域具有不同的性能優(yōu)勢。通過智能的調(diào)度算法和任務(wù)分發(fā)機(jī)制,異構(gòu)混訓(xùn)平臺(tái)能夠根據(jù)任務(wù)的特性和需求,將最適合的算力資源分配給相應(yīng)的芯片,從而實(shí)現(xiàn)算力資源的最大化利用。

異構(gòu)混訓(xùn)平臺(tái)支持多種芯片和算法的組合使用,能夠靈活應(yīng)對不同規(guī)模、不同復(fù)雜度的訓(xùn)練任務(wù)。同時(shí),它也具備較高的可擴(kuò)展性,能夠根據(jù)實(shí)際需求進(jìn)行算力資源的動(dòng)態(tài)擴(kuò)展。通過整合不同架構(gòu)的芯片資源,避免對單一硬件平臺(tái)的過度依賴,異構(gòu)混訓(xùn)平臺(tái)能夠降低供應(yīng)鏈風(fēng)險(xiǎn),并通過提高算力利用率和訓(xùn)練效率來降低總體擁有成本。

異構(gòu)混訓(xùn)平臺(tái)為AI技術(shù)創(chuàng)新提供了更加廣闊的舞臺(tái),通過整合不同芯片和算法的優(yōu)勢資源,可以激發(fā)更多的創(chuàng)新靈感和技術(shù)突破。同時(shí),它也有助于打破不同硬件生態(tài)系統(tǒng)之間的壁壘,促進(jìn)生態(tài)整合與協(xié)同發(fā)展。

異構(gòu)混訓(xùn)在AI領(lǐng)域的需求日益凸顯

近年來,隨著人工智能技術(shù)的不斷發(fā)展,大模型的參數(shù)量急劇增加,從十億、百億到千億甚至萬億級(jí)別。以ChatGPT、LLama等為代表的大模型技術(shù)正持續(xù)推動(dòng)社會(huì)變革,引發(fā)新一輪人工智能熱潮。這些大模型具有數(shù)千億甚至上萬億參數(shù)規(guī)模,單個(gè)計(jì)算節(jié)點(diǎn)無法滿足訓(xùn)練需求,訓(xùn)練過程耗時(shí)巨大。

面對如此龐大的模型,傳統(tǒng)的同構(gòu)算力集群已經(jīng)無法滿足訓(xùn)練需求。即使采用分布式訓(xùn)練框架,也需要充分整合可調(diào)動(dòng)的算力資源進(jìn)行分布式并行加速。然而,由于不同廠商的智算芯片之間存在計(jì)算架構(gòu)、緩存資源、互聯(lián)方式等諸多差異,以及AI計(jì)算框架與各廠商基礎(chǔ)軟件棧深度綁定,導(dǎo)致多種智算芯片難以協(xié)同工作,限制了算力資源的充分利用。

異構(gòu)芯片混訓(xùn)成了解決算力限制的重要方式,目前已經(jīng)有諸多應(yīng)用案例。如,醫(yī)療機(jī)構(gòu)采用異構(gòu)芯片混訓(xùn)平臺(tái),將NVIDIA GPU、Intel CPU以及華為昇騰AI處理器等多種芯片混合使用。通過平臺(tái)的高效調(diào)度和算力分配,實(shí)現(xiàn)了對醫(yī)學(xué)影像數(shù)據(jù)的快速處理和分析。

異構(gòu)芯片混訓(xùn)平臺(tái)能夠顯著提高了醫(yī)療影像分析系統(tǒng)的處理速度和精度,為醫(yī)生提供了更加準(zhǔn)確和及時(shí)的診斷支持。

自動(dòng)駕駛汽車研發(fā)公司采用異構(gòu)芯片混訓(xùn)平臺(tái),將AMD GPU、NVIDIA GPU以及專用AI加速器等多種芯片混合使用。通過平臺(tái)的異構(gòu)并行訓(xùn)練能力,實(shí)現(xiàn)了對自動(dòng)駕駛算法模型的高效訓(xùn)練和優(yōu)化。

異構(gòu)芯片混訓(xùn)平臺(tái)能顯著提高自動(dòng)駕駛算法模型的訓(xùn)練速度和精度,為自動(dòng)駕駛汽車的研發(fā)提供了有力支持。同時(shí),通過降低算力成本和提高資源利用率,也可以幫助公司加快自動(dòng)駕駛技術(shù)的商業(yè)化進(jìn)程。

寫在最后

當(dāng)然,在異構(gòu)芯片混訓(xùn)過程中,可能會(huì)面臨一些技術(shù)挑戰(zhàn),如不同芯片間的通信問題、性能差異等。為了解決這些問題,可以采取相應(yīng)的措施,如建立通用的集合通信庫,實(shí)現(xiàn)不同種芯片的高效通信,兼容多種硬件;提出基于流水線并行的非均勻拆分方案,解決不同硬件效率不一樣的問題,針對自身情況分配最適合的任務(wù)等。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    33554

    瀏覽量

    274196
  • 算力
    +關(guān)注

    關(guān)注

    1

    文章

    1103

    瀏覽量

    15354
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    2941

    瀏覽量

    3683
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    DeepSeek MoE架構(gòu)下的網(wǎng)絡(luò)負(fù)載如何優(yōu)化?解鎖90%網(wǎng)絡(luò)利用率的關(guān)鍵策略

    、All-to-All等),網(wǎng)絡(luò)面臨高并發(fā)、低延遲、無損傳輸?shù)膰?yán)苛需求。然而,傳統(tǒng)以太網(wǎng)的網(wǎng)絡(luò)利用率長期徘徊在35%~40%,成為制約AI釋放的關(guān)鍵瓶頸。
    的頭像 發(fā)表于 04-28 12:04 ?161次閱讀
    DeepSeek MoE<b class='flag-5'>架構(gòu)</b>下的網(wǎng)絡(luò)負(fù)載如何優(yōu)化?解鎖90%網(wǎng)絡(luò)<b class='flag-5'>利用率</b>的關(guān)鍵策略

    梯度科技助力客戶破解調(diào)度難題

    在數(shù)字經(jīng)濟(jì)與人工智能深度融合的新階段,已成為支撐人工智能發(fā)展的核心生產(chǎn)。梯度科技基于云原生技術(shù)架構(gòu)研發(fā)的
    的頭像 發(fā)表于 04-27 16:32 ?189次閱讀

    RAKsmart智能架構(gòu)異構(gòu)計(jì)算+低時(shí)延網(wǎng)絡(luò)驅(qū)動(dòng)企業(yè)AI訓(xùn)練范式升級(jí)

    在AI大模型參數(shù)量突破萬億、多模態(tài)應(yīng)用爆發(fā)的今天,企業(yè)AI訓(xùn)練正面臨效率與成本的雙重挑戰(zhàn)。RAKsmart推出的智能架構(gòu),以
    的頭像 發(fā)表于 04-17 09:29 ?160次閱讀

    DeepSeek驅(qū)動(dòng)AI市場升溫,智中心利用率望提升

    。 盡管目前這一需求尚未對供給造成直接影響,但卡價(jià)格已經(jīng)呈現(xiàn)出上漲趨勢。這一變化反映出市場對AI的強(qiáng)烈需求,以及DeepSeek等技術(shù)推動(dòng)下的
    的頭像 發(fā)表于 02-19 14:00 ?344次閱讀

    DeepSeek對芯片的影響

    DeepSeek模型,尤其是其基于MOE(混合專家)架構(gòu)的DeepSeek-V3,對芯片的要求產(chǎn)生了深遠(yuǎn)影響。為了更好地理解這一影響,我們可以從幾個(gè)方面進(jìn)行分析。一.MOE
    的頭像 發(fā)表于 02-07 10:02 ?887次閱讀
    DeepSeek對<b class='flag-5'>芯片</b><b class='flag-5'>算</b><b class='flag-5'>力</b>的影響

    壁仞科技聯(lián)合中國電信等合作伙伴共同發(fā)布智異構(gòu)四芯訓(xùn)解決方案

    工智能實(shí)驗(yàn)室等發(fā)布了“智異構(gòu)四芯訓(xùn)解決方案”,打造、網(wǎng)絡(luò)、平臺(tái)、通信庫、框架全棧
    的頭像 發(fā)表于 12-07 17:56 ?2122次閱讀

    華納云:什么是負(fù)載均衡?優(yōu)化資源利用率的策略

    負(fù)載均衡是現(xiàn)代計(jì)算機(jī)網(wǎng)絡(luò)架構(gòu)中不可或缺的一部分,它通過智能分配請求和任務(wù),確保系統(tǒng)資源的高效利用。本文將探討負(fù)載均衡的概念、工作原理、優(yōu)化資源利用率
    的頭像 發(fā)表于 10-28 16:07 ?469次閱讀

    芯片 高性能 CPU/GPU/NPU 微架構(gòu)分析》第1-4章閱讀心得——之巔:從基準(zhǔn)測試到CPU微架構(gòu)的深度探索

    學(xué)習(xí)。不過我相信學(xué)習(xí)之路,I am not alone!在此,我首先分享我計(jì)劃第一部分(本書1-4章)的閱讀心得。 1 從TOP500到MLPerf:芯片的宏觀格局 《
    發(fā)表于 10-19 01:21

    交換機(jī)內(nèi)存利用率過高會(huì)是什么問題

    在現(xiàn)代網(wǎng)絡(luò)架構(gòu)中,交換機(jī)扮演著至關(guān)重要的角色,負(fù)責(zé)在網(wǎng)絡(luò)設(shè)備之間高效地轉(zhuǎn)發(fā)數(shù)據(jù)包。然而,隨著網(wǎng)絡(luò)規(guī)模的擴(kuò)大和數(shù)據(jù)流量的增加,交換機(jī)的內(nèi)存資源可能會(huì)變得緊張,導(dǎo)致內(nèi)存利用率過高。這種情況如果不加
    的頭像 發(fā)表于 10-18 09:53 ?1676次閱讀

    【「芯片 | 高性能 CPU/GPU/NPU 微架構(gòu)分析」閱讀體驗(yàn)】--全書概覽

    、GPU、NPU,給我們剖析了芯片的微架構(gòu)。書中有對芯片方案商處理器的講解,理論聯(lián)系實(shí)際,使讀者能更好理解
    發(fā)表于 10-15 22:08

    中國智能汽車騰飛,為什么異構(gòu)是第一生產(chǎn)?

    智能時(shí)代的“世紀(jì)之車”,異構(gòu)是第一驅(qū)動(dòng)力
    的頭像 發(fā)表于 09-14 10:32 ?4117次閱讀
    中國智能汽車騰飛,為什么<b class='flag-5'>異構(gòu)</b><b class='flag-5'>算</b><b class='flag-5'>力</b>是第一生產(chǎn)<b class='flag-5'>力</b>?

    名單公布!【書籍評(píng)測活動(dòng)NO.43】 芯片 | 高性能 CPU/GPU/NPU 微架構(gòu)分析

    社會(huì)資源和資本力量關(guān)注芯片的發(fā)展,希望我們的國家能夠更獨(dú)立自主地設(shè)計(jì)制造高性能
    發(fā)表于 09-02 10:09

    安謀科技異構(gòu)組合,破局生成式AI挑戰(zhàn)

    近日,此芯科技集團(tuán)有限公司(以下簡稱“此芯科技”)AI PC戰(zhàn)略暨首款芯片發(fā)布會(huì)在上海舉行,正式推出了其首款專為AI PC打造的異構(gòu)高能效芯片產(chǎn)品——“此芯P1”。作為國產(chǎn)新一代AI PC
    的頭像 發(fā)表于 08-13 09:12 ?767次閱讀

    神州鯤泰亮相北京數(shù)字安全大會(huì),以智能構(gòu)筑數(shù)據(jù)安全的堅(jiān)實(shí)底座

    正成為賦能各行各業(yè)數(shù)字化轉(zhuǎn)型的基礎(chǔ)技術(shù)要素,神州鯤泰面對智時(shí)代多云、異構(gòu)、綠色計(jì)算等現(xiàn)實(shí)需求,智集群間以及集群內(nèi)復(fù)雜
    的頭像 發(fā)表于 07-18 16:06 ?580次閱讀
    神州鯤泰亮相北京數(shù)字安全大會(huì),以智能<b class='flag-5'>算</b><b class='flag-5'>力</b>構(gòu)筑數(shù)據(jù)安全的堅(jiān)實(shí)底座

    鯤泰新聞|神州鯤泰創(chuàng)新智之旅北京站開幕,發(fā)布全新智架構(gòu)和液冷整機(jī)柜產(chǎn)品應(yīng)對 “多云、異構(gòu)、綠色

    加速平臺(tái)HICA以及一體化交付的神州鯤泰全液冷整機(jī)柜產(chǎn)品。幫助企業(yè)客戶在整個(gè)異構(gòu)資源池中匹配更優(yōu)
    的頭像 發(fā)表于 05-22 10:56 ?518次閱讀
    鯤泰新聞|神州鯤泰創(chuàng)新智<b class='flag-5'>算</b>之旅北京站開幕,發(fā)布全新智<b class='flag-5'>算</b><b class='flag-5'>架構(gòu)</b>和液冷整機(jī)柜產(chǎn)品應(yīng)對 “多云、<b class='flag-5'>異構(gòu)</b>、綠色