一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

GPU在不同形態(tài)下的擴(kuò)展性問題

E4Life ? 來源:電子發(fā)燒友網(wǎng) ? 作者:周凱揚(yáng) ? 2022-09-28 07:23 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

AI和大數(shù)據(jù)時(shí)代到來之后,GPU單兵作戰(zhàn)就變成了奢望,以現(xiàn)在的數(shù)據(jù)中心和超算為例,動(dòng)輒就是成千上萬張GPU,龐大的GPU網(wǎng)絡(luò)在交換機(jī)和光模塊的支持下代表了這個(gè)計(jì)算時(shí)代下最高的算力。但并非只有數(shù)據(jù)中心和超算里的GPU才需要這樣的擴(kuò)展性,嵌入式GPU和專業(yè)GPU同樣如此。

物理限制的嵌入式GPU

隨著各種傳感器的性能持續(xù)走高,譬如多線激光雷達(dá)、高分辨率的圖像傳感器等,我們對(duì)邊緣計(jì)算單元尤其是GPU的需求也在持續(xù)增加。但在實(shí)現(xiàn)的過程中,我們還有一些物理限制沒法消除,像是尺寸、重量和功耗等。

為了解決這一系列問題,美國政府和行業(yè)方案提供商們成立了SOSA聯(lián)盟,以求開發(fā)開放的標(biāo)準(zhǔn)和最好的方案來實(shí)現(xiàn)高性價(jià)比、互操作性強(qiáng)的傳感器系統(tǒng)。如何克服這些負(fù)載計(jì)算工作量提升帶來的挑戰(zhàn),又能不增加寶貴的物理資源呢?答案自然還是將GPU、DPU等技術(shù)集成到嵌入式結(jié)構(gòu)中去。

這類嵌入式GPU并非用來單獨(dú)售賣,而是交給合作伙伴整合到不同的邊緣計(jì)算系統(tǒng)中,比如研華、凌華、EIZO、Mercury Systems等,然后交付給美國空軍、洛克希德·馬丁這類軍事、航空、工業(yè)客戶。
poYBAGMyz06AQTcGAATW0aCjh0Y676.png
MXM嵌入式GPU模塊 / 凌華科技

即便選擇了嵌入式結(jié)構(gòu),也還有著不少的路線,比如GPU、FPGAASIC等等。SOSA聯(lián)盟主席,來自美國空軍的Ilya Lipkin表示,如果想要更快的運(yùn)行速度,快速部署軟件,自然是選擇GPU最好。但他們也面臨著空間的問題,因?yàn)榍度胧紾PU往往會(huì)被塞到3U或者6U的服務(wù)器里,他們想要做到更小的體積,甚至是手掌大小,可這樣一來就不得不犧牲帶寬、容量。

所以,雖然嵌入式GPU仍然在這些嵌入式傳感系統(tǒng)中可以保持領(lǐng)先地位,但他們并沒有像獲得數(shù)據(jù)中心那樣不算嚴(yán)格的空間要求。目前的MXM嵌入式GPU可以做到PCIe GPU五分之一的尺寸,但這對(duì)于嵌入式GPU的擴(kuò)展性來說還不算完美。在邊緣計(jì)算上,反倒是一些FPGA和ASIC方案在能耗比和擴(kuò)展性上占優(yōu),如果嵌入式GPU不能做到更強(qiáng)大的擴(kuò)展性,很有可能會(huì)被后來者顛覆。

顯卡交火時(shí)代的結(jié)束

不管是最新發(fā)布的RTX4090消費(fèi)級(jí)顯卡,還是RTX 6000這樣的專業(yè)顯卡,都象征了英偉達(dá)在新架構(gòu)GPU上的又一次創(chuàng)新。在臺(tái)積電4N工藝的加持下,無論是晶體管數(shù)目還是CUDA核心都做到了極致。

然而,原本變成了專屬英偉達(dá)高端消費(fèi)顯卡和專業(yè)顯卡的交火技術(shù)NVLink,在RTX4090和RTX 6000上卻無處可尋,難不成英偉達(dá)徹底放棄顯卡交火技術(shù),也就此放棄NVLink了?根據(jù)英偉達(dá)CEO黃仁勛的說法,他們省下了NVLink連接器的空間,釋放了更多的空間來處理更多的AI計(jì)算。

在上一代顯卡的NVLink中,通過連接兩塊英偉達(dá)顯卡,使用高端顯卡和專業(yè)顯卡的專業(yè)系統(tǒng)能夠獲得更高的帶寬和雙倍的顯存容量。這樣的提升對(duì)于個(gè)人或?qū)I(yè)用戶來說是極大的提升,那么為何英偉達(dá)會(huì)放棄NVLink呢?筆者也在英偉達(dá)GTC的一次分享會(huì)議上提出了這一問題。

pYYBAGMyz1mAbmUdABHfZT5_49Y177.png
RTX6000 / 英偉達(dá)
英偉達(dá)方面表示,就RTX 6000這類專業(yè)顯卡而言,他們?nèi)∠鸑VLink后省下了足夠的空間,塞入了更多的計(jì)算單元來提升單卡的性能。與此同時(shí),雖然這些專業(yè)顯卡的NVLink支持被取消,不代表英偉達(dá)放棄了這一技術(shù)。英偉達(dá)決心將NVLink的重心放在數(shù)據(jù)中心產(chǎn)品上,比如Grace CPU、Hopper GPU,他們通過NVLink Die to Die和Chip to Chip的互聯(lián)可以實(shí)現(xiàn)更好的擴(kuò)展性。

但這確實(shí)象征著一個(gè)時(shí)代的結(jié)束,過去AMD的交火和英偉達(dá)的SLI也是兩家競爭最火熱的一項(xiàng)技術(shù),可隨著AMD放棄了交火支持,英偉達(dá)的SLI在換成NVLink后如今也迎來了終結(jié)。

但顯卡交火的落幕也情有可原,且不說這種互聯(lián)方式的受眾群體一再變少,要想享受到顯卡交火的性能也需要軟件追加更新支持。或許專業(yè)顯卡的目標(biāo)還是追求單卡性能就好,多卡互聯(lián)的支持還是讓給數(shù)據(jù)中心吧。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    4937

    瀏覽量

    131176
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    瑞薩電子RA系列微控制器的可擴(kuò)展性強(qiáng)的配置軟件包 (FSP)安裝下載與使用指南

    瑞薩電子RA系列微控制器的可擴(kuò)展性強(qiáng)的配置軟件包 (FSP)安裝下載與使用指南
    的頭像 發(fā)表于 06-11 17:21 ?570次閱讀

    聚徽分享高性能工控機(jī)選購指南:穩(wěn)定性、擴(kuò)展性、抗干擾能力如何平衡?

    協(xié)調(diào)的重任。而在選購高性能工控機(jī)時(shí),穩(wěn)定性、擴(kuò)展性與抗干擾能力成為了至關(guān)重要的考量因素,如何在這三者之間找到完美的平衡,成為了眾多企業(yè)面臨的關(guān)鍵難題。 穩(wěn)定性:工業(yè)運(yùn)行的基石 1. 硬件質(zhì)量與可靠性 工業(yè)級(jí)元器件的
    的頭像 發(fā)表于 05-29 15:35 ?131次閱讀

    瑞芯微RK3288解決方案:高性能、高擴(kuò)展性的嵌入式系統(tǒng)設(shè)計(jì)理念與應(yīng)用分析

    。本文將深入剖析基于RK3288的處理方案,重點(diǎn)闡述其硬件架構(gòu)、軟件平臺(tái)、擴(kuò)展性設(shè)計(jì)以及應(yīng)用場景等方面的優(yōu)勢(shì),并探討其所蘊(yùn)含的嵌入式系統(tǒng)設(shè)計(jì)理念。一、RK328
    的頭像 發(fā)表于 05-08 15:39 ?456次閱讀
    瑞芯微RK3288解決方案:高性能、高<b class='flag-5'>擴(kuò)展性</b>的嵌入式系統(tǒng)設(shè)計(jì)理念與應(yīng)用分析

    IAR推動(dòng)嵌入式開發(fā):云就緒、可擴(kuò)展的CI/CD和可持續(xù)自動(dòng)化

    IAR正式發(fā)布全新云就緒平臺(tái),為嵌入式開發(fā)團(tuán)隊(duì)提供企業(yè)級(jí)的可擴(kuò)展性、安全性和自動(dòng)化能力。
    的頭像 發(fā)表于 04-07 11:21 ?230次閱讀

    從圖形處理到AI加速,一文看懂Imagination D系列GPU

    Imagination的D系列于2022年首次發(fā)布,見證了生成式AI從云端到智能手機(jī)等消費(fèi)設(shè)備中普及。云端,由于GPU的可編程性、可擴(kuò)展性和快速處理AI工作負(fù)載的能力,GPU已成為高
    的頭像 發(fā)表于 02-27 08:33 ?476次閱讀
    從圖形處理到AI加速,一文看懂Imagination D系列<b class='flag-5'>GPU</b>

    解鎖新應(yīng)用:探索GPU擴(kuò)展是如何提升渲染農(nóng)場的工作效率

    聯(lián)瑞GPU擴(kuò)展方案渲染農(nóng)場的應(yīng)用,是原有計(jì)算機(jī)設(shè)備的基礎(chǔ)上增加GPU的數(shù)量,不用額外購買GPU
    的頭像 發(fā)表于 01-09 17:13 ?404次閱讀
    解鎖新應(yīng)用:探索<b class='flag-5'>GPU</b><b class='flag-5'>擴(kuò)展</b>是如何提升渲染農(nóng)場的工作效率

    FPGA+GPU+CPU國產(chǎn)化人工智能平臺(tái)

    平臺(tái)采用國產(chǎn)化FPGA+GPU+CPU構(gòu)建嵌入式多核異構(gòu)智算終端,可形成FPGA+GPU、FPGA+CPU、CPU+FPGA等組合模式,形成低功耗、高可擴(kuò)展性的硬件系統(tǒng),結(jié)合使用場景靈活搭配,已有
    的頭像 發(fā)表于 01-07 16:42 ?1074次閱讀
    FPGA+<b class='flag-5'>GPU</b>+CPU國產(chǎn)化人工智能平臺(tái)

    眾核場景EXT4該如何應(yīng)對(duì)才能發(fā)揮性能

    一、背景和問題 1. EXT4日志的問題 隨著計(jì)算機(jī)系統(tǒng)加載數(shù)百個(gè)CPU內(nèi)核,文件系統(tǒng)的可擴(kuò)展性得到進(jìn)一步強(qiáng)調(diào)。因此本文主要定位服務(wù)器中廣泛使用的Ext4文件系統(tǒng)在做日志記錄時(shí)的可擴(kuò)展性問題
    的頭像 發(fā)表于 12-30 11:35 ?503次閱讀
    <b class='flag-5'>在</b>眾核場景<b class='flag-5'>下</b>EXT4該如何應(yīng)對(duì)才能發(fā)揮性能

    訓(xùn)練AI大模型需要什么樣的gpu

    訓(xùn)練AI大模型需要選擇具有強(qiáng)大計(jì)算能力、足夠顯存、高效帶寬、良好散熱和能效比以及良好兼容性和擴(kuò)展性GPU。選擇時(shí),需要根據(jù)具體需求進(jìn)行權(quán)衡和選擇。
    的頭像 發(fā)表于 12-03 10:10 ?642次閱讀

    Perforce Helix Core通過ISO 26262認(rèn)證!為汽車軟件開發(fā)團(tuán)隊(duì)提供無限可擴(kuò)展性、細(xì)粒度安全性、文件快速訪問等

    News!Helix Core通過ISO 26262認(rèn)證,符合汽車系統(tǒng)開發(fā)所需的安全和可靠性標(biāo)準(zhǔn),助力汽車軟件安全合規(guī)!具備無限可擴(kuò)展性、細(xì)粒度安全性、文件快速訪問...是眾多汽車OEM和供應(yīng)商的首選版本控制工具。
    的頭像 發(fā)表于 11-12 14:41 ?1230次閱讀
    Perforce Helix Core通過ISO 26262認(rèn)證!為汽車軟件開發(fā)團(tuán)隊(duì)提供無限可<b class='flag-5'>擴(kuò)展性</b>、細(xì)粒度安全性、文件快速訪問等

    GPU算力租用平臺(tái)怎么樣

    GPU算力租用平臺(tái)以其成本效益、靈活性與可擴(kuò)展性、簡化運(yùn)維以及即時(shí)訪問等優(yōu)勢(shì),深度學(xué)習(xí)、科學(xué)計(jì)算、圖形渲染等多個(gè)領(lǐng)域發(fā)揮著重要作用。
    的頭像 發(fā)表于 10-17 10:03 ?532次閱讀

    Cincoze高階效能&amp;PCIe擴(kuò)展型工控機(jī)

    應(yīng)用于如機(jī)器視覺、AI運(yùn)算等要求高度運(yùn)算效能與實(shí)時(shí)GPU圖像辨識(shí)速度的應(yīng)用場景。DS?系列不僅具備強(qiáng)大的處理能力,還支持多種擴(kuò)展模塊,以及多元的認(rèn)證標(biāo)準(zhǔn),確保苛刻的環(huán)境持續(xù)穩(wěn)定運(yùn)行
    的頭像 發(fā)表于 10-15 14:49 ?398次閱讀
    Cincoze高階效能&amp;PCIe<b class='flag-5'>擴(kuò)展</b>型工控機(jī)

    Imagination DXS GPU:重塑汽車智能與交互的未來

    增長。在此背景,Imagination公司最新推出的DXS GPU IP產(chǎn)品,以其可擴(kuò)展性、靈活性和強(qiáng)大的計(jì)算能力,為車載智能與交互系統(tǒng)注入了新的活力。
    的頭像 發(fā)表于 09-23 13:06 ?1294次閱讀

    使用低成本MSPM0 MCU無線電動(dòng)工具和園藝工具中實(shí)現(xiàn)可擴(kuò)展性

    電子發(fā)燒友網(wǎng)站提供《使用低成本MSPM0 MCU無線電動(dòng)工具和園藝工具中實(shí)現(xiàn)可擴(kuò)展性.pdf》資料免費(fèi)下載
    發(fā)表于 09-02 11:47 ?2次下載
    使用低成本MSPM0 MCU<b class='flag-5'>在</b>無線電動(dòng)工具和園藝工具中實(shí)現(xiàn)可<b class='flag-5'>擴(kuò)展性</b>

    國產(chǎn)NVMe SSD擴(kuò)展卡:驅(qū)動(dòng)存儲(chǔ)新紀(jì)元

    NVMe技術(shù)的標(biāo)準(zhǔn)化接口使得不同廠商的設(shè)備能夠更好地兼容和互操作,提升了存儲(chǔ)系統(tǒng)的靈活性和擴(kuò)展性。
    的頭像 發(fā)表于 08-17 14:59 ?1753次閱讀
    國產(chǎn)NVMe SSD<b class='flag-5'>擴(kuò)展</b>卡:驅(qū)動(dòng)存儲(chǔ)新紀(jì)元