一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

GPU如何克服負(fù)載計(jì)算工作量提升帶來的挑戰(zhàn)

lPCU_elecfans ? 來源:電子發(fā)燒友網(wǎng) ? 作者:電子發(fā)燒友網(wǎng) ? 2022-10-09 09:30 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

電子發(fā)燒友網(wǎng)報(bào)道(文/周凱揚(yáng))在AI和大數(shù)據(jù)時(shí)代到來之后,GPU單兵作戰(zhàn)就變成了奢望,以現(xiàn)在的數(shù)據(jù)中心和超算為例,動(dòng)輒就是成千上萬張GPU,龐大的GPU網(wǎng)絡(luò)在交換機(jī)和光模塊的支持下代表了這個(gè)計(jì)算時(shí)代下最高的算力。但并非只有數(shù)據(jù)中心和超算里的GPU才需要這樣的擴(kuò)展性,嵌入式GPU和專業(yè)GPU同樣如此。

物理限制的嵌入式GPU隨著各種傳感器的性能持續(xù)走高,譬如多線激光雷達(dá)、高分辨率的圖像傳感器等,我們對邊緣計(jì)算單元尤其是GPU的需求也在持續(xù)增加。但在實(shí)現(xiàn)的過程中,我們還有一些物理限制沒法消除,像是尺寸、重量和功耗等。

為了解決這一系列問題,美國政府和行業(yè)方案提供商們成立了SOSA聯(lián)盟,以求開發(fā)開放的標(biāo)準(zhǔn)和最好的方案來實(shí)現(xiàn)高性價(jià)比、互操作性強(qiáng)的傳感器系統(tǒng)。如何克服這些負(fù)載計(jì)算工作量提升帶來的挑戰(zhàn),又能不增加寶貴的物理資源呢?答案自然還是將GPU、DPU等技術(shù)集成到嵌入式結(jié)構(gòu)中去。

這類嵌入式GPU并非用來單獨(dú)售賣,而是交給合作伙伴整合到不同的邊緣計(jì)算系統(tǒng)中,比如研華、凌華、EIZO、Mercury Systems等,然后交付給美國空軍、洛克希德·馬丁這類軍事、航空、工業(yè)客戶。

即便選擇了嵌入式結(jié)構(gòu),也還有著不少的路線,比如GPU、FPGAASIC等等。SOSA聯(lián)盟主席,來自美國空軍的Ilya Lipkin表示,如果想要更快的運(yùn)行速度,快速部署軟件,自然是選擇GPU最好。但他們也面臨著空間的問題,因?yàn)榍度胧紾PU往往會(huì)被塞到3U或者6U的服務(wù)器里,他們想要做到更小的體積,甚至是手掌大小,可這樣一來就不得不犧牲帶寬、容量。

所以,雖然嵌入式GPU仍然在這些嵌入式傳感系統(tǒng)中可以保持領(lǐng)先地位,但他們并沒有像獲得數(shù)據(jù)中心那樣不算嚴(yán)格的空間要求。目前的MXM嵌入式GPU可以做到PCIe GPU五分之一的尺寸,但這對于嵌入式GPU的擴(kuò)展性來說還不算完美。在邊緣計(jì)算上,反倒是一些FPGA和ASIC方案在能耗比和擴(kuò)展性上占優(yōu),如果嵌入式GPU不能做到更強(qiáng)大的擴(kuò)展性,很有可能會(huì)被后來者顛覆。

顯卡交火時(shí)代的結(jié)束不管是最新發(fā)布的RTX4090消費(fèi)級顯卡,還是RTX 6000這樣的專業(yè)顯卡,都象征了英偉達(dá)在新架構(gòu)GPU上的又一次創(chuàng)新。在臺(tái)積電4N工藝的加持下,無論是晶體管數(shù)目還是CUDA核心都做到了極致。

然而,原本變成了專屬英偉達(dá)高端消費(fèi)顯卡和專業(yè)顯卡的交火技術(shù)NVLink,在RTX4090和RTX 6000上卻無處可尋,難不成英偉達(dá)徹底放棄顯卡交火技術(shù),也就此放棄NVLink了?根據(jù)英偉達(dá)CEO黃仁勛的說法,他們省下了NVLink連接器的空間,釋放了更多的空間來處理更多的AI計(jì)算。

在上一代顯卡的NVLink中,通過連接兩塊英偉達(dá)顯卡,使用高端顯卡和專業(yè)顯卡的專業(yè)系統(tǒng)能夠獲得更高的帶寬和雙倍的顯存容量。這樣的提升對于個(gè)人或?qū)I(yè)用戶來說是極大的提升,那么為何英偉達(dá)會(huì)放棄NVLink呢?筆者也在英偉達(dá)GTC的一次分享會(huì)議上提出了這一問題。

英偉達(dá)方面表示,就RTX 6000這類專業(yè)顯卡而言,他們?nèi)∠鸑VLink后省下了足夠的空間,塞入了更多的計(jì)算單元來提升單卡的性能。與此同時(shí),雖然這些專業(yè)顯卡的NVLink支持被取消,不代表英偉達(dá)放棄了這一技術(shù)。英偉達(dá)決心將NVLink的重心放在數(shù)據(jù)中心產(chǎn)品上,比如Grace CPU、Hopper GPU,他們通過NVLink Die to Die和Chip to Chip的互聯(lián)可以實(shí)現(xiàn)更好的擴(kuò)展性。

但這確實(shí)象征著一個(gè)時(shí)代的結(jié)束,過去AMD的交火和英偉達(dá)的SLI也是兩家競爭最火熱的一項(xiàng)技術(shù),可隨著AMD放棄了交火支持,英偉達(dá)的SLI在換成NVLink后如今也迎來了終結(jié)。

但顯卡交火的落幕也情有可原,且不說這種互聯(lián)方式的受眾群體一再變少,要想享受到顯卡交火的性能也需要軟件追加更新支持?;蛟S專業(yè)顯卡的目標(biāo)還是追求單卡性能就好,多卡互聯(lián)的支持還是讓給數(shù)據(jù)中心吧。

審核編輯:彭靜
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 傳感器
    +關(guān)注

    關(guān)注

    2565

    文章

    53005

    瀏覽量

    767404
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    4946

    瀏覽量

    131236
  • 顯卡
    +關(guān)注

    關(guān)注

    16

    文章

    2505

    瀏覽量

    69535
  • AI
    AI
    +關(guān)注

    關(guān)注

    88

    文章

    35148

    瀏覽量

    279835

原文標(biāo)題:GPU在不同形態(tài)下的擴(kuò)展性問題

文章出處:【微信號:elecfans,微信公眾號:電子發(fā)燒友網(wǎng)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    別讓 GPU 故障拖后腿,捷智算GPU維修室來救場!

    在AI浪潮洶涌的當(dāng)下,GPU已然成為眾多企業(yè)與科研機(jī)構(gòu)的核心生產(chǎn)力。從深度學(xué)習(xí)模型訓(xùn)練,到影視渲染、復(fù)雜科學(xué)計(jì)算,GPU憑借強(qiáng)大并行計(jì)算能力,極大
    的頭像 發(fā)表于 07-17 18:56 ?37次閱讀
    別讓 <b class='flag-5'>GPU</b> 故障拖后腿,捷智算<b class='flag-5'>GPU</b>維修室來救場!

    大模型推理顯存和計(jì)算估計(jì)方法研究

    隨著人工智能技術(shù)的飛速發(fā)展,深度學(xué)習(xí)大模型在各個(gè)領(lǐng)域得到了廣泛應(yīng)用。然而,大模型的推理過程對顯存和計(jì)算資源的需求較高,給實(shí)際應(yīng)用帶來挑戰(zhàn)。為了解決這一問題,本文將探討大模型推理顯存和計(jì)算
    發(fā)表于 07-03 19:43

    提升AI訓(xùn)練性能:GPU資源優(yōu)化的12個(gè)實(shí)戰(zhàn)技巧

    在人工智能與機(jī)器學(xué)習(xí)技術(shù)迅速發(fā)展的背景下,GPU計(jì)算資源的高效利用已成為關(guān)鍵技術(shù)指標(biāo)。優(yōu)化的GPU資源分配不僅能顯著提升模型訓(xùn)練速度,還能實(shí)現(xiàn)計(jì)算
    的頭像 發(fā)表于 05-06 11:17 ?514次閱讀
    <b class='flag-5'>提升</b>AI訓(xùn)練性能:<b class='flag-5'>GPU</b>資源優(yōu)化的12個(gè)實(shí)戰(zhàn)技巧

    Ampere如何引領(lǐng)并塑造下一代人工智能計(jì)算系統(tǒng)

    現(xiàn)代人工智能計(jì)算工作負(fù)載給傳統(tǒng)處理器架構(gòu)帶來了前所未有的挑戰(zhàn),已將其推向了極限。
    的頭像 發(fā)表于 04-07 10:15 ?564次閱讀

    GPU領(lǐng)域再迎重大創(chuàng)新——全新Imagination DXTP GPU將功效提升20%

    功效比超高的DXTPGPUIP將為圖形計(jì)算與邊緣AI應(yīng)用SoC的創(chuàng)新提供巨大的幫助Imagination于不久前正式發(fā)布了DXTPGPUIP,這款新產(chǎn)品的亮點(diǎn)在于,在標(biāo)準(zhǔn)圖形工作負(fù)載下,其能效比
    的頭像 發(fā)表于 03-19 11:39 ?715次閱讀
    <b class='flag-5'>GPU</b>領(lǐng)域再迎重大創(chuàng)新——全新Imagination DXTP <b class='flag-5'>GPU</b>將功效<b class='flag-5'>提升</b>20%

    GPU加速計(jì)算平臺(tái)的優(yōu)勢

    傳統(tǒng)的CPU雖然在日常計(jì)算任務(wù)中表現(xiàn)出色,但在面對大規(guī)模并行計(jì)算需求時(shí),其性能往往捉襟見肘。而GPU加速計(jì)算平臺(tái)憑借其獨(dú)特的優(yōu)勢,吸引了行業(yè)內(nèi)人士的廣泛關(guān)注和應(yīng)用。下面,AI部落小編為
    的頭像 發(fā)表于 02-23 16:16 ?431次閱讀

    2024年GPU出貨增長顯著,超越CPU

    6%的同比增長,總量超過2.51億顆,這一數(shù)據(jù)不僅彰顯了GPU市場的繁榮,也反映了當(dāng)前市場對于圖形處理能力的巨大需求。 尤為值得一提的是,與同樣作為計(jì)算機(jī)核心部件的CPU相比,GPU在2024年的出貨
    的頭像 發(fā)表于 01-17 14:12 ?525次閱讀

    解鎖新應(yīng)用:探索GPU擴(kuò)展是如何提升渲染農(nóng)場的工作效率

    聯(lián)瑞GPU擴(kuò)展方案在渲染農(nóng)場的應(yīng)用,是在原有計(jì)算機(jī)設(shè)備的基礎(chǔ)上增加GPU的數(shù)量,不用額外購買GPU服務(wù)器,有效的幫助企業(yè)降本增效.
    的頭像 發(fā)表于 01-09 17:13 ?413次閱讀
    解鎖新應(yīng)用:探索<b class='flag-5'>GPU</b>擴(kuò)展是如何<b class='flag-5'>提升</b>渲染農(nóng)場的<b class='flag-5'>工作</b>效率

    借助NVIDIA GPU提升魯班系統(tǒng)CAE軟件計(jì)算效率

    本案例中魯班系統(tǒng)高性能 CAE 軟件利用 NVIDIA 高性能 GPU,實(shí)現(xiàn)復(fù)雜產(chǎn)品的快速仿真,加速產(chǎn)品開發(fā)和設(shè)計(jì)迭代,縮短開發(fā)周期,提升產(chǎn)品競爭力。
    的頭像 發(fā)表于 12-27 16:24 ?676次閱讀

    《CST Studio Suite 2024 GPU加速計(jì)算指南》

    GPU Computing Guide》是由Dassault Systèmes Deutschland GmbH發(fā)布的有關(guān)CST Studio Suite 2024的GPU計(jì)算指南。涵蓋GP
    發(fā)表于 12-16 14:25

    深度學(xué)習(xí)工作負(fù)載GPU與LPU的主要差異

    ,一個(gè)新的競爭力量——LPU(Language Processing Unit,語言處理單元)已悄然登場,LPU專注于解決自然語言處理(NLP)任務(wù)中的順序性問題,是構(gòu)建AI應(yīng)用不可或缺的一環(huán)。 本文旨在探討深度學(xué)習(xí)工作負(fù)載GPU
    的頭像 發(fā)表于 12-09 11:01 ?3364次閱讀
    深度學(xué)習(xí)<b class='flag-5'>工作</b><b class='flag-5'>負(fù)載</b>中<b class='flag-5'>GPU</b>與LPU的主要差異

    GPU加速計(jì)算平臺(tái)是什么

    GPU加速計(jì)算平臺(tái),簡而言之,是利用圖形處理器(GPU)的強(qiáng)大并行計(jì)算能力來加速科學(xué)計(jì)算、數(shù)據(jù)分析、機(jī)器學(xué)習(xí)等復(fù)雜
    的頭像 發(fā)表于 10-25 09:23 ?597次閱讀

    基于FPA的軟件工作量綜合評估研究與實(shí)踐

    在軟件工程監(jiān)理項(xiàng)目中如何對軟件開發(fā)系統(tǒng)進(jìn)行工作量評估,如何在實(shí)施過程中對承建單位已完成的工作量進(jìn)行審核是實(shí)施信息化項(xiàng)目的難題。本文在分析專家經(jīng)驗(yàn)評估法、FPA功能點(diǎn)分析法等方法的基礎(chǔ)上,給出了一種
    發(fā)表于 10-15 10:45 ?0次下載

    降壓轉(zhuǎn)換器電容器集成可減少滿足CISPR 25 5類標(biāo)準(zhǔn)所需的工作量

    電子發(fā)燒友網(wǎng)站提供《降壓轉(zhuǎn)換器電容器集成可減少滿足CISPR 25 5類標(biāo)準(zhǔn)所需的工作量.pdf》資料免費(fèi)下載
    發(fā)表于 08-27 10:41 ?0次下載
    降壓轉(zhuǎn)換器電容器集成可減少滿足CISPR 25 5類標(biāo)準(zhǔn)所需的<b class='flag-5'>工作量</b>

    大模型發(fā)展下,國產(chǎn)GPU的機(jī)會(huì)和挑戰(zhàn)

    電子發(fā)燒友網(wǎng)站提供《大模型發(fā)展下,國產(chǎn)GPU的機(jī)會(huì)和挑戰(zhàn).pdf》資料免費(fèi)下載
    發(fā)表于 07-18 15:44 ?15次下載
    大模型發(fā)展下,國產(chǎn)<b class='flag-5'>GPU</b>的機(jī)會(huì)和<b class='flag-5'>挑戰(zhàn)</b>