一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

如何使用PyCaret + RAPIDS簡(jiǎn)化模型構(gòu)建

星星科技指導(dǎo)員 ? 來(lái)源:NVIDIA ? 作者:Sofia Sayyah ? 2022-04-19 16:32 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

PyCaret是一個(gè)低代碼 Python 機(jī)器學(xué)習(xí)庫(kù),基于流行的 R Caret 庫(kù)。它自動(dòng)化了從數(shù)據(jù)預(yù)處理到 i NSight 的數(shù)據(jù)科學(xué)過(guò)程,因此短代碼行可以用最少的人工完成每個(gè)步驟。此外,使用簡(jiǎn)單的命令比較和調(diào)整許多模型的能力可以簡(jiǎn)化效率和生產(chǎn)效率,同時(shí)減少創(chuàng)建有用模型的時(shí)間。

PyCaret 團(tuán)隊(duì)在 2 . 2 版中添加了 NVIDIA GPU 支持,包括RAPIDS中所有最新和最偉大的版本。使用 GPU 加速, PyCaret 建模時(shí)間可以快 2 到 200 倍,具體取決于工作負(fù)載。

這篇文章將介紹如何在 GPU 上使用 PyCaret 以節(jié)省大量的開(kāi)發(fā)和計(jì)算成本。

所有基準(zhǔn)測(cè)試都是在一臺(tái) 32 核 CPU 和四個(gè) NVIDIA Tesla T4 的機(jī)器上運(yùn)行的,代碼幾乎相同。為簡(jiǎn)單起見(jiàn), GPU 代碼編寫(xiě)為在單個(gè) GPU 上運(yùn)行。

PyCaret 入門(mén)

使用 PyCaret 與導(dǎo)入庫(kù)和執(zhí)行 setup 語(yǔ)句一樣簡(jiǎn)單。setup()功能創(chuàng)建環(huán)境,并提供一系列預(yù)處理功能,一氣呵成。

from pycaret.regression import * exp_reg = setup(data = df, target = ‘Year’, session_id = 123, normalize = True)

在一個(gè)簡(jiǎn)單的設(shè)置之后,數(shù)據(jù)科學(xué)家可以開(kāi)發(fā)其管道的其余部分,包括數(shù)據(jù)預(yù)處理/準(zhǔn)備、模型訓(xùn)練、集成、分析和部署。在準(zhǔn)備好數(shù)據(jù)后,最好從比較模型開(kāi)始。

與 PyCaret 的簡(jiǎn)約精神一樣,我們可以通過(guò)一行代碼來(lái)比較一系列標(biāo)準(zhǔn)模型,看看哪些模型最適合我們的數(shù)據(jù)。 compare _ models 命令使用默認(rèn)超參數(shù)訓(xùn)練 PyCaret 模型庫(kù)中的所有模型,并使用交叉驗(yàn)證評(píng)估性能指標(biāo)。然后,數(shù)據(jù)科學(xué)家可以根據(jù)這些信息選擇他們想要使用的模型、調(diào)整和集成。

top3 = compare_models(exclude = [‘ransac’], n_select=3)

比較模型

pYYBAGJec6KAEuJVAAJfAB5I3Mw802.png

圖 1 : PyCaret 中 compare _ models 命令的輸出。

**模型從最佳到最差排序, PyCaret 突出顯示了每個(gè)度量類別中的最佳結(jié)果,以便于使用。

用 RAPIDS cuML 加速 PyCaret

PyCaret 對(duì)于任何數(shù)據(jù)科學(xué)家來(lái)說(shuō)都是一個(gè)很好的工具,因?yàn)樗?jiǎn)化了模型構(gòu)建并使運(yùn)行許多模型變得簡(jiǎn)單。使用 GPU s , PyCaret 可以做得更好。由于 PyCaret 在幕后做了大量工作,因此看似簡(jiǎn)單的命令可能需要很長(zhǎng)時(shí)間。例如,我們?cè)谝粋€(gè)具有大約 50 萬(wàn)個(gè)實(shí)例和 90 多個(gè)屬性(加州大學(xué)歐文分校的年度預(yù)測(cè) MSD 數(shù)據(jù)集)的數(shù)據(jù)集上運(yùn)行了前面的命令。在 CPU 上,花費(fèi)了 3 個(gè)多小時(shí)。在 GPU 上,只花了不到一半的時(shí)間。

在過(guò)去,在 GPU 上使用 PyCaret 需要許多手動(dòng)編碼,但謝天謝地, PyCaret 團(tuán)隊(duì)集成了 RAPIDS 機(jī)器學(xué)習(xí)庫(kù)( cuML ),這意味著您可以使用使 PyCaret 如此有效的相同簡(jiǎn)單 API ,同時(shí)還可以使用 GPU 的計(jì)算能力。

在 GPU 上運(yùn)行 PyCaret 往往要快得多,這意味著您可以充分利用 PyCaret 提供的一切,而無(wú)需平衡時(shí)間成本。使用剛才提到的同一個(gè)數(shù)據(jù)集,我們?cè)?CPU 和 GPU 上測(cè)試了 PyCaret ML 功能,包括比較、創(chuàng)建、調(diào)優(yōu)和集成模型。切換到 GPU 很簡(jiǎn)單;我們?cè)谠O(shè)置函數(shù)中將use_gpu設(shè)置為T(mén)rue:

exp_reg = setup(data = df, target = ‘Year’, session_id = 123, normalize = True, use_gpu = True)

PyCaret 設(shè)置為在 GPU 上運(yùn)行,它使用 cuML 來(lái)訓(xùn)練以下所有型號(hào):

對(duì)數(shù)幾率回歸

脊分類器

隨機(jī)森林

K 鄰域分類器

K 鄰域回歸器

支持向量機(jī)

線性回歸

嶺回歸

套索回歸

群集分析

基于密度的空間聚類

僅在 GPU 上運(yùn)行相同的compare_models代碼的速度是 GPU 的2.5倍多。

對(duì)于流行但計(jì)算昂貴的模型,在模型基礎(chǔ)上的影響更大。例如, K 鄰域回歸器在 GPU 上的速度是其 265 倍。

poYBAGJec6aAZgk7AABQVDYtMHQ115.png

圖 2 : CPU 和 GPU 上運(yùn)行的常見(jiàn) PyCaret 操作的比較。

影響

PyCaret API 的簡(jiǎn)單性釋放了原本用于編碼的時(shí)間,因此數(shù)據(jù)科學(xué)家可以做更多的實(shí)驗(yàn)并對(duì)實(shí)驗(yàn)進(jìn)行微調(diào)。當(dāng)與 GPU 配合使用時(shí),這種影響甚至更大,因?yàn)槌浞掷?PyCaret 的評(píng)估和比較工具套件的計(jì)算成本顯著降低。

結(jié)論

廣泛的比較和評(píng)估模型有助于提高結(jié)果的質(zhì)量,而 PyCaret 正是為了這樣做。 GPU 上的 PyCaret 抵消了大量處理所帶來(lái)的時(shí)間成本。

RAPIDS 的目標(biāo)是加速您的數(shù)據(jù)科學(xué), PyCaret 是越來(lái)越多的庫(kù)之一,它們與 RAPIDS 套件的兼容性有助于為您的機(jī)器學(xué)習(xí)追求帶來(lái)新的效率。

關(guān)于作者

Sofia Sayyah 是 NVIDIA 的數(shù)據(jù)工程實(shí)習(xí)生。

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    4948

    瀏覽量

    131251
  • 機(jī)器學(xué)習(xí)

    關(guān)注

    66

    文章

    8503

    瀏覽量

    134627
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    瑞芯微模型量化文件構(gòu)建

    模型是一張圖片輸入時(shí),量化文件如上圖所示。但是我現(xiàn)在想量化deepprivacy人臉匿名模型,他的輸入是四個(gè)輸入。該模型訓(xùn)練時(shí)數(shù)據(jù)集只標(biāo)注了人臉框和關(guān)鍵點(diǎn),該模型的預(yù)處理是放到
    發(fā)表于 06-13 09:07

    碳化硅襯底厚度測(cè)量中探頭溫漂的熱傳導(dǎo)模型與實(shí)驗(yàn)驗(yàn)證

    引言 在碳化硅襯底厚度測(cè)量過(guò)程中,探頭溫漂會(huì)嚴(yán)重影響測(cè)量精度。構(gòu)建探頭溫漂的熱傳導(dǎo)模型并進(jìn)行實(shí)驗(yàn)驗(yàn)證,有助于深入理解探頭溫漂的產(chǎn)生機(jī)理,為提高測(cè)量準(zhǔn)確性提供理論依據(jù)與技術(shù)支持。 熱傳導(dǎo)模型構(gòu)
    的頭像 發(fā)表于 06-04 09:37 ?142次閱讀
    碳化硅襯底厚度測(cè)量中探頭溫漂的熱傳導(dǎo)<b class='flag-5'>模型</b>與實(shí)驗(yàn)驗(yàn)證

    請(qǐng)問(wèn)NanoEdge AI數(shù)據(jù)集該如何構(gòu)建

    我想用NanoEdge來(lái)識(shí)別異常的聲音,但我目前沒(méi)有辦法生成模型,我感覺(jué)可能是數(shù)據(jù)集的問(wèn)題,請(qǐng)問(wèn)我該怎么構(gòu)建數(shù)據(jù)集?或者生成模型失敗還會(huì)有哪些原因?
    發(fā)表于 03-10 08:20

    構(gòu)建開(kāi)源OpenVINO?工具套件后,模型優(yōu)化器位于何處呢?

    構(gòu)建開(kāi)源OpenVINO?工具套件后,模型優(yōu)化器位于何處?
    發(fā)表于 03-06 08:18

    Sapphire Rapids與OpenVINO?工具套件是否兼容?

    無(wú)法確定 Sapphire Rapids 與 OpenVINO? 工具套件的兼容性
    發(fā)表于 03-05 06:55

    OpenAI簡(jiǎn)化模型選擇:薩姆·奧特曼制定路線圖

    OpenAI的首席執(zhí)行官薩姆·奧特曼(Sam Altman)近期為公司的GPT-4.5和GPT-5大模型開(kāi)發(fā)制定了一項(xiàng)重要的路線圖,旨在極大地簡(jiǎn)化和優(yōu)化用戶及開(kāi)發(fā)人員在選擇AI模型時(shí)的體驗(yàn)。 在當(dāng)
    的頭像 發(fā)表于 02-18 09:12 ?501次閱讀

    小白學(xué)大模型構(gòu)建LLM的關(guān)鍵步驟

    隨著大規(guī)模語(yǔ)言模型(LLM)在性能、成本和應(yīng)用前景上的快速發(fā)展,越來(lái)越多的團(tuán)隊(duì)開(kāi)始探索如何自主訓(xùn)練LLM模型。然而,是否從零開(kāi)始訓(xùn)練一個(gè)LLM,并非每個(gè)組織都適合。本文將根據(jù)不同的需求與資源,幫助
    的頭像 發(fā)表于 01-09 12:12 ?972次閱讀
    小白學(xué)大<b class='flag-5'>模型</b>:<b class='flag-5'>構(gòu)建</b>LLM的關(guān)鍵步驟

    Simulink模型仿真與分析技巧

    1. 模型構(gòu)建基礎(chǔ) 1.1 理解系統(tǒng)需求 在開(kāi)始構(gòu)建模型之前,明確系統(tǒng)的需求和目標(biāo)是至關(guān)重要的。這包括了解系統(tǒng)的動(dòng)態(tài)特性、輸入輸出關(guān)系以及預(yù)期的性能指標(biāo)。 1.2 選擇合適的模塊 Simulink
    的頭像 發(fā)表于 12-12 09:23 ?2468次閱讀

    RAPIDS cuDF將pandas提速近150倍

    在 NVIDIA GTC 2024 上,NVIDIA 宣布,RAPIDS cuDF 當(dāng)前已能夠?yàn)?950 萬(wàn) pandas 用戶帶來(lái) GPU 加速,且無(wú)需修改代碼。
    的頭像 發(fā)表于 11-20 09:52 ?662次閱讀
    <b class='flag-5'>RAPIDS</b> cuDF將pandas提速近150倍

    如何使用Python構(gòu)建LSTM神經(jīng)網(wǎng)絡(luò)模型

    構(gòu)建一個(gè)LSTM(長(zhǎng)短期記憶)神經(jīng)網(wǎng)絡(luò)模型是一個(gè)涉及多個(gè)步驟的過(guò)程。以下是使用Python和Keras庫(kù)構(gòu)建LSTM模型的指南。 1. 安裝必要的庫(kù) 首先,確保你已經(jīng)安裝了Python
    的頭像 發(fā)表于 11-13 10:10 ?1583次閱讀

    為T(mén)HS3001構(gòu)建一個(gè)簡(jiǎn)單的SPICE模型

    電子發(fā)燒友網(wǎng)站提供《為T(mén)HS3001構(gòu)建一個(gè)簡(jiǎn)單的SPICE模型.pdf》資料免費(fèi)下載
    發(fā)表于 10-29 10:11 ?1次下載
    為T(mén)HS3001<b class='flag-5'>構(gòu)建</b>一個(gè)簡(jiǎn)單的SPICE<b class='flag-5'>模型</b>

    數(shù)據(jù)中心應(yīng)用中適用于Intel Xeon Sapphire Rapids可擴(kuò)展處理器的負(fù)載點(diǎn)解決方案

    電子發(fā)燒友網(wǎng)站提供《數(shù)據(jù)中心應(yīng)用中適用于Intel Xeon Sapphire Rapids可擴(kuò)展處理器的負(fù)載點(diǎn)解決方案.pdf》資料免費(fèi)下載
    發(fā)表于 09-03 11:20 ?0次下載
    數(shù)據(jù)中心應(yīng)用中適用于Intel Xeon Sapphire <b class='flag-5'>Rapids</b>可擴(kuò)展處理器的負(fù)載點(diǎn)解決方案

    【飛凌嵌入式OK3576-C開(kāi)發(fā)板體驗(yàn)】rkllm模型量化構(gòu)建

    (model = modelpath) if ret != 0: print(\'Load model failed!\') exit(ret) 模型量化構(gòu)建 # Build model ret
    發(fā)表于 08-27 22:50

    數(shù)據(jù)中心應(yīng)用中適用于Intel? Xeon? Sapphire Rapids可擴(kuò)展處理器的負(fù)載點(diǎn)解決方案

    電子發(fā)燒友網(wǎng)站提供《數(shù)據(jù)中心應(yīng)用中適用于Intel? Xeon? Sapphire Rapids可擴(kuò)展處理器的負(fù)載點(diǎn)解決方案.pdf》資料免費(fèi)下載
    發(fā)表于 08-26 09:54 ?2次下載
    數(shù)據(jù)中心應(yīng)用中適用于Intel? Xeon? Sapphire <b class='flag-5'>Rapids</b>可擴(kuò)展處理器的負(fù)載點(diǎn)解決方案

    如何構(gòu)建多層神經(jīng)網(wǎng)絡(luò)

    構(gòu)建多層神經(jīng)網(wǎng)絡(luò)(MLP, Multi-Layer Perceptron)模型是一個(gè)在機(jī)器學(xué)習(xí)和深度學(xué)習(xí)領(lǐng)域廣泛使用的技術(shù),尤其在處理分類和回歸問(wèn)題時(shí)。在本文中,我們將深入探討如何從頭開(kāi)始構(gòu)建一個(gè)多層神經(jīng)網(wǎng)絡(luò)
    的頭像 發(fā)表于 07-19 17:19 ?1569次閱讀