一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

FPGA和GPU計(jì)算存儲(chǔ)加速有啥不一樣

是德科技KEYSIGHT ? 來源:Xilinx賽靈思官微 ? 作者:Xilinx賽靈思官微 ? 2021-08-09 11:00 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

為了提升計(jì)算基礎(chǔ)設(shè)施的性能,并緊跟數(shù)據(jù)分析與 AI 不斷攀升的需求,眾多企業(yè)將硬件加速視為主要的解決方案。在大多數(shù)情況下,先進(jìn)的可編程硬件(主要是指 GPUFPGA)是加速的主要方式。通過使用這種先進(jìn)的硬件,企業(yè)正在贏得計(jì)算優(yōu)勢(shì);然而,對(duì)于編程難度,他們?nèi)匀淮嬖诤侠淼膿?dān)憂。

硬件制造商正在將加速方法應(yīng)用于計(jì)算存儲(chǔ),這是專門設(shè)計(jì)用于包含內(nèi)嵌計(jì)算元素的存儲(chǔ)。這種方法已經(jīng)被證明可以為分析和 AI 應(yīng)用提供優(yōu)異的性能(圖 1)。使用或者不使用機(jī)器學(xué)習(xí)輔助的分析以及驗(yàn)證,都可以借助計(jì)算存儲(chǔ)器件進(jìn)行加速。這些器件提供了一個(gè)關(guān)鍵的優(yōu)勢(shì),使得成本高昂的計(jì)算被卸載到存儲(chǔ)器件上,而不必在服務(wù)器 CPU 上完成。與標(biāo)準(zhǔn)的存儲(chǔ)/CPU 方法相比,通過計(jì)算存儲(chǔ)獲得的優(yōu)勢(shì)包括:

1

借助應(yīng)用專用編程定制可編程硬件,獲得更高性能

2

將計(jì)算任務(wù)從服務(wù)器卸載到存儲(chǔ)器件,釋放 CPU 資源

3

數(shù)據(jù)與計(jì)算共址,降低數(shù)據(jù)傳輸需求

這種新穎的方法前景光明。不過,您應(yīng)根據(jù)具體用例評(píng)估這種方法,考量性能、成本、功耗和易用性。性價(jià)比和單位功耗性能在選擇加速硬件評(píng)估時(shí),占據(jù)主要比率。在本文中,我們將研討單位功耗性能。

計(jì)算存儲(chǔ)功耗比較

在這個(gè)場(chǎng)景中,我們將比較以 CSV 數(shù)據(jù)讀取用例為主的三種工具:英偉達(dá) GPUDirect 存儲(chǔ) 和RAPIDS存儲(chǔ),以及基于賽靈思技術(shù)的三星 SmartSSD 存儲(chǔ)。CSV 讀取在計(jì)算密集型流水線中起著重要的作用(參見圖 1)。

在下文中,我們將性能定義成 CSV 的處理速率,或處理“帶寬”。我們先快速回顧一下三種系統(tǒng)的運(yùn)行方式。

英偉達(dá) GPUDirect 存儲(chǔ)

端到端滿足分析和 AI 需求

將 GPU 用作計(jì)算單元,緊貼基于 NVMe 的存儲(chǔ)器件布局 (GPUDirect)

使用 CUDA 進(jìn)行編程 (RAPIDS)

英偉達(dá)用其 CSV 數(shù)據(jù)讀取技術(shù)衡量相對(duì)于標(biāo)準(zhǔn) SSD 的性能提升。結(jié)果如圖 1 所示。使用 1 到 8 個(gè)加速器時(shí),對(duì)應(yīng)的吞吐量是 4 到 23GB/s。

三星 SmartSSD 驅(qū)動(dòng)器

將賽靈思 FPGA 用作計(jì)算單元

與存儲(chǔ)邏輯內(nèi)嵌駐留在同一個(gè)內(nèi)部 PCIe 互聯(lián)上

通過編程在存儲(chǔ)平臺(tái)上開展運(yùn)算

賽靈思數(shù)據(jù)分析解決方案合作伙伴 Bigstream 與三星合作,為 Apache Spark 設(shè)計(jì)加速器,包括用于 CSV 和 Parquet 處理的 IP。SmartSSD 的測(cè)試使用單機(jī)模式的 CSV 解析引擎,以便開展比較。結(jié)果如圖 2 所示,使用 1 到 12 個(gè)加速器時(shí),對(duì)應(yīng)的吞吐量是 4 到 23GB/s,同時(shí)也給出英偉達(dá)的結(jié)果(使用 1 到 8 個(gè)加速器)。請(qǐng)注意,本討論中的所有結(jié)果都按 x 軸上的加速器數(shù)量進(jìn)行參數(shù)化。

這些結(jié)果令人振奮,但在選擇您的解決方案時(shí),請(qǐng)務(wù)必將功耗情況納入考慮。

單位功耗性能比較

圖 3 顯示了將功耗考慮在內(nèi)后的分析結(jié)果。它們代表單位功耗達(dá)到的性能水平,根據(jù)上述討論中引用的相關(guān)材料,給出了以下假設(shè):

Tesla V100 GPU:最大功耗 200 瓦

SmartSSD 驅(qū)動(dòng)器 FPGA:最大功耗 30 瓦

在這個(gè)場(chǎng)景下,計(jì)算表明,在全部使用 8 個(gè)加速器的情況下,SmartSSD 的單位功耗性能比 GPUDirect Storage 高 25 倍。

最 終 思 考

計(jì)算存儲(chǔ)的優(yōu)勢(shì)在于能增強(qiáng)數(shù)據(jù)分析和 AI 應(yīng)用的性能。然而,要讓這種方法具備可實(shí)際部署的能力和實(shí)用性,就必須在評(píng)估時(shí)將功耗納入考慮。

針對(duì)用于 CSV 數(shù)據(jù)解析的兩種不同的計(jì)算存儲(chǔ)方法,我們已經(jīng)提出按功耗參數(shù)化的吞吐量性能曲線。結(jié)果顯示,在使用相似數(shù)量的加速器進(jìn)行比較時(shí),SmartSSD 驅(qū)動(dòng)器的單位功耗性能優(yōu)于 GPUDirect存儲(chǔ)方法。

GPUDirect 是英偉達(dá)通過 NVIDIA DGX-2 應(yīng)用平臺(tái)提供的研究系統(tǒng)。

三星 SmartSSD 驅(qū)動(dòng)器是一種可部署的量產(chǎn)型 PCIe 可插拔平臺(tái),現(xiàn)在已經(jīng)通過賽靈思及分銷商供貨。

如需了解更多信息,請(qǐng)查看:

? 有關(guān) Bigstream 與 SmartSSD 計(jì)算存儲(chǔ)器件結(jié)合使用,加速大數(shù)據(jù)和數(shù)據(jù)分析的電子書。

? Bigstream 硬件加速 Apache Spark解決方案。

編輯:jq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • cpu
    cpu
    +關(guān)注

    關(guān)注

    68

    文章

    11073

    瀏覽量

    216828
  • SSD
    SSD
    +關(guān)注

    關(guān)注

    21

    文章

    2977

    瀏覽量

    119470
  • AI
    AI
    +關(guān)注

    關(guān)注

    88

    文章

    35008

    瀏覽量

    278726
  • csv
    csv
    +關(guān)注

    關(guān)注

    0

    文章

    39

    瀏覽量

    6029

原文標(biāo)題:FPGA 與 GPU 計(jì)算存儲(chǔ)加速對(duì)比

文章出處:【微信號(hào):是德科技KEYSIGHT,微信公眾號(hào):是德科技KEYSIGHT】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    衰減器如果兩邊阻抗不一樣怎么計(jì)算呢?

    上次,RF計(jì)算軟件供大家下載時(shí),有的朋友在后臺(tái)或者留言區(qū)提出,如果兩邊阻抗不一樣,怎么算?是不是能加上,衰減器上每個(gè)電阻消耗的功率的計(jì)算。
    的頭像 發(fā)表于 12-30 11:01 ?3708次閱讀
    衰減器如果兩邊阻抗<b class='flag-5'>不一樣</b>怎么<b class='flag-5'>計(jì)算</b>呢?

    請(qǐng)問pad和pin什么不一樣?

    pad 和 pin 什么不一樣
    發(fā)表于 06-25 06:08

    2003和245什么不一樣的地方

    2003和245什么不一樣的地方啊啊 ?????
    發(fā)表于 10-11 23:11

    labview的調(diào)試程序和執(zhí)行程序在與串口通信時(shí),不一樣?

    本帖最后由 seven619329959 于 2015-10-21 15:04 編輯 如題:labview的調(diào)試程序和執(zhí)行程序在與串口通信時(shí),不一樣?求大神賜教。。。我現(xiàn)在遇到
    發(fā)表于 10-21 10:22

    線損校準(zhǔn),為啥不一樣

    線損校準(zhǔn),為啥不一樣,今天測(cè)試時(shí)發(fā)現(xiàn),校準(zhǔn)是,信號(hào)源頻率不一樣,線損差別很大,1dB 多!?。?/div>
    發(fā)表于 06-05 13:58

    伺服電機(jī)控制器對(duì)比步進(jìn)電機(jī)控制器不一樣?

    伺服電機(jī)控制器與步進(jìn)電機(jī)控制器不一樣?
    發(fā)表于 02-25 07:42

    CPU并行編程和GPU哪里不一樣?主要有3點(diǎn)

    CPU并行編程與GPU都是高性能計(jì)算中的知識(shí),他們到底不一樣。主要有三個(gè)區(qū)別,區(qū)別:緩存管
    發(fā)表于 12-24 11:41 ?1368次閱讀

    在車輛自燃方面,電動(dòng)汽車和燃油汽車什么不一樣

    說起車輛的自燃問題,無論是純電動(dòng)汽車還是燃油車,都會(huì)有自燃的事件出現(xiàn),對(duì)于同樣是自燃,電動(dòng)汽車和燃油車汽車哪些不一樣
    發(fā)表于 10-28 09:00 ?1418次閱讀

    NFC與RFID什么不一樣?資料下載

    電子發(fā)燒友網(wǎng)為你提供NFC與RFID什么不一樣?資料下載的電子資料下載,更有其他相關(guān)的電路圖、源代碼、課件教程、中文資料、英文資料、參考設(shè)計(jì)、用戶指南、解決方案等資料,希望可以幫助到廣大的電子工程師們。
    發(fā)表于 04-22 08:53 ?11次下載
    NFC與RFID<b class='flag-5'>有</b>什么<b class='flag-5'>不一樣</b>?資料下載

    氣密性測(cè)試與氣壓測(cè)試什么不一樣的呢?

    氣密性測(cè)試與氣壓測(cè)試什么不一樣的呢?
    發(fā)表于 12-27 15:38 ?4930次閱讀

    C++中不一樣的重載是什么

    這里想分享C++中個(gè)不一樣的重載,即const重載。
    的頭像 發(fā)表于 02-21 14:02 ?1068次閱讀
    C++中<b class='flag-5'>不一樣</b>的重載是什么

    電容容量一樣大小不一樣能用嗎

    有時(shí)候家里面電器中的電容損壞,很多人很難找到一模一樣的來更換,能找到容量致的電容器就不容易了,電容容量一樣大小不一樣能用嗎?
    的頭像 發(fā)表于 09-21 09:54 ?3307次閱讀

    電容容量一樣大小不一樣能用嗎?

    電容容量一樣大小不一樣能用嗎? 電容器(Capacitor)是種用來存儲(chǔ)電荷能量的電子元件。它是由兩個(gè)導(dǎo)體板(般是金屬)和兩個(gè)絕緣介質(zhì)(
    的頭像 發(fā)表于 09-22 16:30 ?9703次閱讀

    不同芯片的DMA(Direct Memory Access)是不一樣

    不同芯片的DMA(Direct Memory Access)是不一樣
    的頭像 發(fā)表于 10-16 09:14 ?2012次閱讀

    拼接屏白底顏色不一樣怎么解決?

    在拼接屏使用過程中,有時(shí)會(huì)遇到白底顏色不一樣的問題,這可能會(huì)影響到整個(gè)顯示畫面的質(zhì)量和效果。
    的頭像 發(fā)表于 11-24 10:22 ?1253次閱讀