一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

NVIDIA RAPIDS加速器v21.08的功能應用

星星科技指導員 ? 來源:NVIDIA ? 作者:Eric Rife ? 2022-04-20 14:58 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

介紹

用于Apache Spark 的 RAPIDS 加速器 8 月版( 21.08 )現(xiàn)已發(fā)布。自 NVIDIA GTC 2020 首次發(fā)布以來,已經(jīng)有很長時間了。我們在許多方面都有所改進,特別是在易用性方面, Apache Spark 應用程序的代碼更改很少甚至沒有。去年,該團隊一直專注于添加功能和持續(xù)改進性能。為了證明這一點,我們使用 NVIDIA 數(shù)據(jù)科學( NDS )基準測試了定期測量在 3000 ( 3 TB 未壓縮)的比例因子下的性能和功能。在此版本中,除了添加新功能外,我們非常自豪地在提高所有通過查詢的端到端速度和降低 NVIDIA EGX 服務器的總體擁有成本方面取得了進展。

基準更新

NVIDIA 決策支持( NDS )是我們對 Apache Spark 社區(qū)常用的行業(yè)標準數(shù)據(jù)科學基準的改編。 NDS 包含與行業(yè)標準基準測試 TPC-DS 相同的 105 個 SQL 查詢,但修改了數(shù)據(jù)集生成和執(zhí)行腳本的部分。在 GTC 2021 更新中,有 95 個查詢通過。在 21.08 版本中,通過核心外分組方式、窗口排名和密集排名等新功能,我們已經(jīng)能夠在 GPU 上運行所有 105 個查詢。

基準設置

比例因子 -3K (帶浮點數(shù)的 3TB 數(shù)據(jù)集)

Systems: 4x NVIDIA 認證 EGX 服務器

EGX 服務器硬件規(guī)格: 4-node Dell R740xd, each with (2) 24-core CPUs, 512GB RAM, HDFS on NVMe, (1) CX-6 Dx 25/100Gb NIC, 2x NVIDIA A30 GPU

CPU 硬件規(guī)格: 4-node dell r740xd , each with ( 2 ) 24-core CPU s , 512GB ram , hdfs on nvme ,( 1 ) cx-6 dx 25 / 100gb nic

軟件: RAPIDS 加速器 v21.08.0 、 cuDF 21.08.0 、 Apache Spark 3.1.1 、 UCX 1.10.1

pYYBAGJfrzaARpzXAAChsgig6dI213.png

圖 1 : EGX 服務器上的 NDS 查詢速度: GPU vs CPU 。

基于此版本,我們很高興地向大家展示,所有 105 個查詢現(xiàn)在都可以在 GPU 上運行,而無需任何代碼更改。

用于這些基準測試的基準服務器對于四臺沒有 GPU s 的服務器的成本略低于 170000 美元,而在每臺服務器中包含一臺 NVIDIA A100 GPU 的成本則低于 220000 美元。

簡單來說,基準 GPU 服務器的成本是 CPU 服務器的 1.29 倍。

如上圖所示(圖 1 ),超過 95 個查詢現(xiàn)在比 GPU 快 1.29 倍,因此運行起來更便宜。

GPU 上一些速度較慢的查詢目前正在解決中,我們正在不懈地努力改進這些查詢并提高總體速度。

用戶可以很容易地推斷出 GPU 的加速從 1x 到 18x 不等,因此建議用戶確認 GPU 的正確用例。

如果用戶不確定 GPU 的正確用例,鑒定工具將是一個方便的資產(chǎn)。有關鑒定工具的更多信息,請參閱以下章節(jié)。

分析和鑒定工具

分析與鑒定工具于 21.06 發(fā)布,獲得了用戶社區(qū)的積極反饋以及對新功能的要求。在 21.08 中,鑒定工具現(xiàn)在能夠處理 Apache Spark 2.x 版本生成的事件日志。該工具還將支持 AWS EMR 6.3.0 、 Google Dataproc 2. 0 、 Microsoft Azure Synapse 以及 DataRicks 7.3 和 8.2 運行時生成的事件日志。鑒定工具不再需要 Spark 運行時。用戶現(xiàn)在只需在機器上使用 Apache Spark 3.x JAR 即可使用鑒定工具。最新版本還具有選擇事件日志的新過濾功能。該工具還查找插件不支持的讀取數(shù)據(jù)格式和類型,并從分數(shù)中刪除這些格式和類型(基于 SQL Dataframe 操作中的總任務時間)。輸出將以簡潔的格式報告在終端上,對每個已處理事件日志的詳細分析將存儲為 csv 輸出。

新功能

此版本為數(shù)組和結構添加了更多功能。我們現(xiàn)在可以對多層結構數(shù)據(jù)類型進行聯(lián)合,也可以以拼花格式編寫數(shù)組數(shù)據(jù)類型。我們在現(xiàn)有的超前、滯后和行號功能中添加了秩和密集秩窗口功能。有了這一新增功能, RAPIDS 加速器現(xiàn)在可以支持 SQL 中最常用的窗口運算符。對于時間戳操作符,我們添加了對遺留時間戳的支持。使用此功能,用戶可以讀取 Spark 2.0 中支持的傳統(tǒng)時間戳格式。對于 Databricks 用戶,我們添加了在 GPU 中緩存數(shù)據(jù)的功能(所有其他平臺都支持這種功能)。

我們通過處理 GPU 內(nèi)存溢出的數(shù)據(jù)集以進行分組和窗口操作,繼續(xù)改善用戶體驗。這一改進將節(jié)省用戶創(chuàng)建分區(qū)的時間,以避免 GPU 上出現(xiàn)內(nèi)存不足錯誤。類似地, UCX 1.11 的采用改進了 RAPIDS Spark 加速洗牌管理器的錯誤處理。

關于作者

Eric Rife 是 NVDIA 數(shù)據(jù)科學公司的技術營銷經(jīng)理。他是一名高級專業(yè)人員,擁有 25 年的管理和工程經(jīng)驗,設計和管理全天候關鍵任務企業(yè)系統(tǒng),包括 Unix / Linux / Windows 服務器、應用程序服務器和多 PB 存儲解決方案。他目前領導 NVIDIA 的工作,幫助基礎設施經(jīng)理和數(shù)據(jù)科學家重新思考如何加快 AI 在企業(yè)業(yè)務應用中的應用。

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 服務器
    +關注

    關注

    13

    文章

    9791

    瀏覽量

    87920
  • WINDOWS
    +關注

    關注

    4

    文章

    3613

    瀏覽量

    91385
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    高壓放大器在粒子加速器研究中的應用

    粒子加速器是現(xiàn)代科學研究中不可或缺的大型實驗裝置,廣泛應用于物理學、化學、材料科學、生物學等多個領域。其核心原理是利用電場和磁場對帶電粒子進行加速和約束,使粒子達到極高的能量,從而為研究微觀世界
    的頭像 發(fā)表于 06-19 17:09 ?195次閱讀
    高壓放大器在粒子<b class='flag-5'>加速器</b>研究中的應用

    粒子加速器?——?科技前沿的核心裝置

    粒子加速器全稱“荷電粒子加速器”,是一種利用電磁場在高真空環(huán)境中對帶電粒子(如電子、質(zhì)子、離子)進行加速和控制,使其獲得高能量的特種裝置。粒子加速器技術現(xiàn)已發(fā)展成為集高能物理、核物理、
    的頭像 發(fā)表于 06-19 12:05 ?474次閱讀
    粒子<b class='flag-5'>加速器</b>?——?科技前沿的核心裝置

    第三期 “亞馬遜云科技創(chuàng)業(yè)加速器” 正式啟動

    新 助力生成式 AI 初創(chuàng)企業(yè)釋放潛能,加速全球化進程 ? 北京 ——2025 年 4 月 18 日 亞馬遜云科技今日宣布,第三期 "亞馬遜云科技創(chuàng)業(yè)加速器" 正式啟動。亞馬遜云科技將聯(lián)合包括啟明創(chuàng)
    發(fā)表于 04-18 10:46 ?171次閱讀

    小型加速器中子源監(jiān)測系統(tǒng)解決方案

    小型加速器中子源是一種基于先進加速器技術的中子產(chǎn)生裝置,憑借體積小、成本低、安全性高的優(yōu)勢,在醫(yī)學、工業(yè)、科研、安全、能源等多個領域展現(xiàn)出巨大的應用潛力和價值。無論是用于醫(yī)學領域的精準放療,還是工業(yè)
    的頭像 發(fā)表于 03-13 11:19 ?646次閱讀
    小型<b class='flag-5'>加速器</b>中子源監(jiān)測系統(tǒng)解決方案

    Sapphire Rapids與OpenVINO?工具套件是否兼容?

    無法確定 Sapphire Rapids 與 OpenVINO? 工具套件的兼容性
    發(fā)表于 03-05 06:55

    NVIDIA助力FinCatch開發(fā)智能投資輔助系統(tǒng)

    本案例中通過 NVIDIA GPU 和 RAPIDS 加速平臺,F(xiàn)inCatch 實現(xiàn)了投資研究流程的全面智能化,提升數(shù)據(jù)分析速度和準確性,幫助投資者快速獲取可操作的投資洞察。
    的頭像 發(fā)表于 01-07 09:23 ?506次閱讀

    從版本控制到全流程支持:揭秘Helix Core如何成為您的創(chuàng)意加速器

    加速器
    龍智DevSecOps
    發(fā)布于 :2024年11月26日 13:42:47

    NVIDIA加速計算引入Polars

    Polars 近日發(fā)布了一款由 RAPIDS cuDF 驅(qū)動的全新 GPU 引擎,該引擎可將 NVIDIA GPU 上的 Polars 工作流速度最高提速 13 倍,使數(shù)據(jù)科學家僅在一臺機器上就能實現(xiàn)在數(shù)秒內(nèi)處理數(shù)億行數(shù)據(jù)。
    的頭像 發(fā)表于 11-20 10:03 ?729次閱讀
    將<b class='flag-5'>NVIDIA</b><b class='flag-5'>加速</b>計算引入Polars

    RAPIDS cuDF將pandas提速近150倍

    NVIDIA GTC 2024 上,NVIDIA 宣布,RAPIDS cuDF 當前已能夠為 950 萬 pandas 用戶帶來 GPU 加速,且無需修改代碼。
    的頭像 發(fā)表于 11-20 09:52 ?656次閱讀
    <b class='flag-5'>RAPIDS</b> cuDF將pandas提速近150倍

    AMD Alveo V80計算加速器網(wǎng)絡研討會

    歡迎參加本次網(wǎng)絡研討會,我們將深入探討 AMD Alveo V80 計算加速器如何幫助您處理高性能計算、數(shù)據(jù)分析、金融科技、網(wǎng)絡安全、存儲加速、AI 計算等領域的內(nèi)存密集型工作負載。Alveo
    的頭像 發(fā)表于 11-08 09:35 ?625次閱讀

    貿(mào)澤開售適用于高性能計算應用的AMD Alveo V80加速器

    2024 年 9 月 25 日 – 專注于引入新品的全球電子元器件和工業(yè)自動化產(chǎn)品授權代理商貿(mào)澤電子 (Mouser Electronics) 即日起供應AMD的Alveo? V80計算加速器卡。該
    發(fā)表于 09-27 14:59 ?371次閱讀

    NVIDIA Parabricks v4.3.1版本的新功能

    會(ESHG)上發(fā)布,其加入了新的體細胞數(shù)據(jù)變異檢測功能,并將業(yè)內(nèi)領先的工具升級到最新版本。這個版本是繼在 NVIDIA GTC 2024 大會上發(fā)布 Parabricks v4.3 之后推出的新版本。
    的頭像 發(fā)表于 09-10 10:22 ?808次閱讀
    <b class='flag-5'>NVIDIA</b> Parabricks <b class='flag-5'>v</b>4.3.1版本的新<b class='flag-5'>功能</b>

    利用NVIDIA RAPIDS加速DolphinDB Shark平臺提升計算性能

    DolphinDB 是一家高性能數(shù)據(jù)庫研發(fā)企業(yè),也是 NVIDIA 初創(chuàng)加速計劃成員,其開發(fā)的產(chǎn)品基于高性能分布式時序數(shù)據(jù)庫,是支持復雜計算和流數(shù)據(jù)分析的實時計算平臺,適用于金融、電力、物聯(lián)網(wǎng)和零售等行業(yè)。
    的頭像 發(fā)表于 09-09 09:57 ?891次閱讀
    利用<b class='flag-5'>NVIDIA</b> <b class='flag-5'>RAPIDS</b><b class='flag-5'>加速</b>DolphinDB Shark平臺提升計算性能

    具有邊沿速率加速器的TXB和TXS電壓電平轉(zhuǎn)換的注意事項

    電子發(fā)燒友網(wǎng)站提供《具有邊沿速率加速器的TXB和TXS電壓電平轉(zhuǎn)換的注意事項.pdf》資料免費下載
    發(fā)表于 09-04 09:52 ?0次下載
    具有邊沿速率<b class='flag-5'>加速器</b>的TXB和TXS電壓電平轉(zhuǎn)換<b class='flag-5'>器</b>的注意事項

    利用邊沿速率加速器和自動感應電平轉(zhuǎn)換

    電子發(fā)燒友網(wǎng)站提供《利用邊沿速率加速器和自動感應電平轉(zhuǎn)換.pdf》資料免費下載
    發(fā)表于 09-02 11:58 ?1次下載
    利用邊沿速率<b class='flag-5'>加速器</b>和自動感應電平轉(zhuǎn)換<b class='flag-5'>器</b>