HPE、IBM、Oracle、開源社區(qū)、創(chuàng)業(yè)公司采用RAPIDS,顯著提升端到端預(yù)測數(shù)據(jù)分析能力。
NVIDIA今日發(fā)布了一款針對數(shù)據(jù)科學(xué)和機器學(xué)習(xí)的GPU加速平臺,該平臺已為多個行業(yè)領(lǐng)先者所采用,并能幫助超大規(guī)模公司以前所未有的速度分析海量數(shù)據(jù)并進行精準的業(yè)務(wù)預(yù)測。
RAPIDS? 開源軟件幫助數(shù)據(jù)科學(xué)家顯著地提高了工作績效,對于這些數(shù)據(jù)科學(xué)家來說,種種業(yè)務(wù)挑戰(zhàn)應(yīng)接不暇,其中包括預(yù)估信用卡詐騙、預(yù)測零售存貨及理解顧客購買行為等等。眾多公司——無論是Databricks和Anaconda等開源社區(qū)先驅(qū)還是Hewlett Packard Enterprise、IBM和Oracle等技術(shù)領(lǐng)袖——在GPU對數(shù)據(jù)分析的重要性方面日益達成共識,并對RAPIDS表現(xiàn)出越來越多的支持。
據(jù)分析師估計,面向數(shù)據(jù)科學(xué)和機器學(xué)習(xí)的服務(wù)器市場每年價值約為200億美元,加上科學(xué)分析和深度學(xué)習(xí)市場,高性能計算市場總價值大約為360億美元。
“數(shù)據(jù)分析和機器學(xué)習(xí)是高性能計算市場中最大的細分市場,不過目前尚未實現(xiàn)加速,”NVIDIA創(chuàng)始人兼首席執(zhí)行官黃仁勛在GPU技術(shù)大會主旨演講中發(fā)布RAPIDS時表示,“全球最大的行業(yè)均在海量服務(wù)器上運行機器學(xué)習(xí)算法,目的在于了解所在市場和環(huán)境中的復(fù)雜模式,同時迅速、精準地做出將直接影響其基礎(chǔ)的預(yù)測 。”
黃仁勛表示,“得益于CUDA及其全球生態(tài)系統(tǒng)以及與開源社區(qū)緊密合作,我們已創(chuàng)建了RAPIDS GPU加速平臺。該平臺已與全球最流行的數(shù)據(jù)科學(xué)庫及工作流無縫整合,可加速機器學(xué)習(xí)。如同深度學(xué)習(xí)一樣,我們正在不斷地為機器學(xué)習(xí)提速?!?/p>
RAPIDS已為GPU加速分析和機器學(xué)習(xí)提供了一整套開源庫,數(shù)據(jù)可視化即將是下一個目標。RAPIDS由NVIDIA工程師與主要的開源貢獻者在過去兩年的合作成果。
RAPIDS第一次為數(shù)據(jù)科學(xué)家提供了他們需要用來在GPU上運行整個數(shù)據(jù)科學(xué)管線的工具。最初的RAPIDS基準分析利用了XGBoost機器學(xué)習(xí)算法在NVIDIA DGX-2? 系統(tǒng)上進行訓(xùn)練,結(jié)果表明,與僅有CPU的系統(tǒng)相比,其速度能加快50倍。這可幫助數(shù)據(jù)科學(xué)家將典型訓(xùn)練時間從數(shù)天減少到數(shù)小時,或者從數(shù)小時減少到數(shù)分鐘,具體取決于其數(shù)據(jù)集的規(guī)模。
與開源社區(qū)開展緊密合作
RAPIDS構(gòu)建于Apache Arrow、pandas和scikit-learn等流行的開源項目之上,為最流行的Python數(shù)據(jù)科學(xué)工具鏈帶來了GPU提速。為了將更多的機器學(xué)習(xí)庫和功能引入RAPIDS,NVIDIA廣泛地與開源生態(tài)系統(tǒng)貢獻者展開合作 ,其中包括Anaconda、BlazingDB、Databricks、Quansight、scikit-learn、Ursa Labs 負責(zé)人兼Apache Arrow締造者Wes McKinney以及迅速增長的Python數(shù)據(jù)科學(xué)庫pandas等等。
McKinney表示,“作為GPU加速的數(shù)據(jù)科學(xué)平臺,RAPIDS是由Apache Arrow驅(qū)動的新一代的計算生態(tài)系統(tǒng)。NVIDIA與Ursa Labs的合作將加速Arrow核心數(shù)據(jù)庫的創(chuàng)新步伐,并有助于大幅提升分析及特征工程的績效。”
為了推動RAPIDS的廣泛應(yīng)用,NVIDIA正努力將RAPIDS與Apache Spark進行整合,后者是分析及數(shù)據(jù)科學(xué)方面領(lǐng)先的開源框架。
Databricks聯(lián)合創(chuàng)始人、首席技術(shù)官兼Apache Spark 創(chuàng)始人Matei Zaharia表示,“在Databricks公司中,我們對RAPIDS在加速Apache Spark工作量方面的潛力感到非常興奮。我們目前開展的多個項目都意在將Spark更好地與本地加速器進行整合,其中包括借助Project Hydrogen實現(xiàn)的Apache Arrow的支持以及GPU調(diào)度。我們相信,就擴大我們客戶數(shù)據(jù)科學(xué)及AI工作量來說,RAPIDS將是全新的、振奮人心的機會?!?/p>
廣泛的生態(tài)系統(tǒng)支持及應(yīng)用
各個行業(yè)技術(shù)領(lǐng)先的企業(yè)均是NVIDIA GPU加速平臺及RAPIDS的率先應(yīng)用者。
沃爾瑪執(zhí)行副總裁兼首席技術(shù)官Jeremy King表示,“NVIDIA的GPU加速平臺及RAPIDS軟件極大改進了我們使用數(shù)據(jù)的方式,幫助我們實現(xiàn)了復(fù)雜模式大規(guī)模地運行,同時進行更加精準的預(yù)測。RAPIDS的應(yīng)用得益于NVIDIA和沃爾瑪工程師之間的深度合作,我們準備繼續(xù)推進這種合作關(guān)系?!?/p>
此外,一些全球領(lǐng)先的技術(shù)公司也力圖通過全新的系統(tǒng)、數(shù)據(jù)科學(xué)平臺和軟件解決方案支持RAPIDS:
“HPE致力于改進客戶生活和工作的方式。人工智能、分析和機器學(xué)習(xí)技術(shù)能在揭示洞察方面扮演關(guān)鍵的角色,這有助于幫助客戶實現(xiàn)突破性的成果,同時改善我們所生存的世界。HPE提供全面的人工智能和數(shù)據(jù)分析解決方案并在市場中保持獨一無二的優(yōu)勢,其中既包括戰(zhàn)略咨詢,也包括專為特定需求開發(fā)的GPU加速器技術(shù)、運行支持以及強大的伙伴生態(tài)系統(tǒng);我們旨在為每位客戶定制合適的解決方案。我們對與NVIDIA在RAPIDS方面的合作感到非常興奮,此舉能加快數(shù)據(jù)科學(xué)和機器學(xué)習(xí)的應(yīng)用,推動我們的客戶更快地實現(xiàn)更具洞察力的成果?!薄萜掌髽I(yè)首席執(zhí)行官Antonio Neri
“IBM已為企業(yè)人工智能構(gòu)建了全球領(lǐng)先的、在任何部署模式上均能運行的平臺。我們期望能拓展與NVIDIA已有的成功合作,利用RAPIDS來為客戶提供全新的機器學(xué)習(xí)工具?!薄狧ybrid Cloud高級副總裁兼IBM Research董事 Arvind Krishna
“當(dāng)今的計算領(lǐng)域要要強大的處理能力,以便應(yīng)對數(shù)據(jù)科學(xué)和分析智能等紛繁復(fù)雜的工作,而這正是NVIDIA GPU的優(yōu)勢。RAPIDS正在不斷加速處理和機器學(xué)習(xí)培訓(xùn)的速度。能在Oracle Cloud Infrastructure上支持這套全新的開源軟件讓我們感到非常興奮,我們也希望能與NVIDIA繼續(xù)合作,以在我們的Oracle Data Science Cloud等各種平臺上支持RAPIDS,并進一步加速客戶端到端數(shù)據(jù)科學(xué)工作流。RAPIDS軟件在Oracle Cloud上無縫運行,這使客戶得以支持各種高性能計算、人工智能和數(shù)據(jù)科學(xué)需求,同時利用Oracle Cloud Infrastructure 上可獲得的GPU實例組合。”——Oracle Cloud Infrastructure軟件開發(fā)部門高級副總裁Clay Magouyrk
本新聞稿得到包括Cisco、DELL EMC、聯(lián)想、NERSC, NetApp, Pure Storage, SAP和SAS等其它領(lǐng)先創(chuàng)新者以及諸多數(shù)據(jù)科學(xué)先驅(qū)的支持。
供貨
全套RAPIDS開源庫現(xiàn)在即可在http://www.rapids.ai上獲得,代碼經(jīng)Apache許可公布。容器化RAPIDS版本本周內(nèi)可在NVIDIA GPU Cloud container registry (https://www.nvidia.com/en-us/gpu-cloud/)上獲得。
-
NVIDIA
+關(guān)注
關(guān)注
14文章
5309瀏覽量
106348 -
機器學(xué)習(xí)
+關(guān)注
關(guān)注
66文章
8502瀏覽量
134584
原文標題:GTC Europe | NVIDIA針對大規(guī)模數(shù)據(jù)分析和機器學(xué)習(xí)推出RAPIDS開源GPU加速平臺
文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
NVIDIA技術(shù)助力歐洲廠商推出機器人系統(tǒng)與平臺
NVIDIA Isaac 是英偉達推出的綜合性機器人開發(fā)平臺
使用NVIDIA RTX PRO Blackwell系列GPU加速AI開發(fā)
GPU加速計算平臺的優(yōu)勢
利用NVIDIA DPF引領(lǐng)DPU加速云計算的未來

NVIDIA發(fā)布Cosmos平臺,加速物理AI開發(fā)
NVIDIA Cosmos世界基礎(chǔ)模型平臺發(fā)布
NVIDIA助力FinCatch開發(fā)智能投資輔助系統(tǒng)
《CST Studio Suite 2024 GPU加速計算指南》
將NVIDIA加速計算引入Polars

RAPIDS cuDF將pandas提速近150倍

AMD與NVIDIA GPU優(yōu)缺點
GPU加速計算平臺是什么
利用NVIDIA RAPIDS加速DolphinDB Shark平臺提升計算性能

NVIDIA全面轉(zhuǎn)向開源GPU內(nèi)核模塊

評論