一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Scikit-learn機(jī)器學(xué)習(xí)庫的概念及工作原理

NVIDIA英偉達(dá) ? 來源:NVIDIA英偉達(dá) ? 作者: NVIDIA英偉達(dá) ? 2022-09-30 11:00 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

作為一個適用于 Python 編程語言的機(jī)器學(xué)習(xí) (ML) 庫,Scikit-learn 擁有大量算法,可供程序員和數(shù)據(jù)科學(xué)家在機(jī)器學(xué)習(xí)模型中輕松部署。

什么是 Scikit-learn?

Scikit-learn 是一個熱門且可靠的機(jī)器學(xué)習(xí)庫,擁有各種算法,同時也是用于 ML 可視化、預(yù)處理、模型擬合、選擇和評估的工具。

Scikit-learn 基于 NumPy、SciPy 和 matplotlib 構(gòu)建,并具有大量用于分類、回歸和集群的高效算法。其中包括支持向量機(jī)、隨機(jī)森林、梯度提升、k-means 和 DBSCAN。

Scikit-learn 擁有一致且設(shè)計(jì)高效的 API、適用于大多數(shù)算法的豐富文檔以及大量在線教程,因此相對易于開發(fā)。

當(dāng)前版本可用于 Linux、MacOS 和 Windows 等熱門平臺。

為何選擇 Scikit-learn?

得益于其相對易于使用、且設(shè)計(jì)周到又充滿熱情的社區(qū),Scikit-learn API 已成為機(jī)器學(xué)習(xí)實(shí)施的實(shí)際標(biāo)準(zhǔn)。

Scikit-learn 為 ML 模型構(gòu)建、擬合及評估提供了以下模塊:

預(yù)處理是指 Scikit-learn 工具,這些工具可用于數(shù)據(jù)分析期間的特征提取和歸一化。

分類是指一組工具,這組工具可識別機(jī)器學(xué)習(xí)模型中與數(shù)據(jù)相關(guān)的類別。例如,這些工具還可用于將電子郵件分類為有效郵件或垃圾郵件。實(shí)際上,分類可確定目標(biāo)所屬的類別。

回歸是指 ML 模型的創(chuàng)建,該模型試圖理解輸入和輸出數(shù)據(jù)(例如行為或股票價格)之間的關(guān)系?;貧w可預(yù)測與目標(biāo)關(guān)聯(lián)的連續(xù)值屬性。

Scikit-learn 中的聚類工具自動將具有相似特征的數(shù)據(jù)以集的形式進(jìn)行分組,例如根據(jù)物理位置排列成集的客戶數(shù)據(jù)。

降維可減少用于分析的隨機(jī)變量數(shù)量。例如,為了提升可視化的效率,可能會將離散數(shù)據(jù)排除在外。

模型選擇是指算法及其提供相應(yīng)工具的能力,并且這些工具能夠比較、驗(yàn)證和選擇最佳參數(shù),以將其用于數(shù)據(jù)科學(xué)機(jī)器學(xué)習(xí)項(xiàng)目。

流程是指用于構(gòu)建模型工作流程的實(shí)用程序。

機(jī)器學(xué)習(xí)可視化可支持快速繪圖和視覺調(diào)整。

Scikit-learn 的工作原理

Scikit-learn 主要采用 Python 編寫,并使用 NumPy 進(jìn)行高性能線性代數(shù)以及數(shù)組運(yùn)算。一些核心 Scikit-learn 算法則采用 Cython 編寫,以提升整體性能。

作為更高級別的庫,它包含各種機(jī)器學(xué)習(xí)算法的幾種實(shí)施,Scikit-learn 讓用戶僅使用幾行代碼即可構(gòu)建、訓(xùn)練和評估模型。

Scikit-learn 還提供一套統(tǒng)一的高級別 API,以供構(gòu)建 ML 流程或工作流程使用。

在 Scikit-learn ML 流程中,您可以通過轉(zhuǎn)換器傳遞數(shù)據(jù)并提取特征,使用估測器生成模型,并使用評估器測量模型的準(zhǔn)確性。

Transformer:這是一種轉(zhuǎn)換或輸入數(shù)據(jù),以進(jìn)行預(yù)處理的算法。

Estimator:這是一種機(jī)器學(xué)習(xí)算法,用于訓(xùn)練或擬合數(shù)據(jù),以構(gòu)建可用于預(yù)測的模型。

流程:流程將多個轉(zhuǎn)換器和估測器相連接,從而指定 ML 工作流程。

GPU 加速的 Scikit-learn API 和端到端數(shù)據(jù)科學(xué)

在架構(gòu)方面,CPU 僅由幾個具有大緩存內(nèi)存的核心組成,一次只可以處理幾個軟件線程。相比之下,GPU 由數(shù)百個核心組成,可以同時處理數(shù)千個線程。

基于 CUDA-X AI 創(chuàng)建的 NVIDIA RAPIDS 開源軟件庫套件使您完全能夠在 GPU 上執(zhí)行端到端數(shù)據(jù)科學(xué)和分析流程。此套件依靠 NVIDIA CUDA 基元進(jìn)行低級別計(jì)算優(yōu)化,但通過用戶友好型 Python 接口能夠?qū)崿F(xiàn) GPU 并行化和高帶寬顯存速度。

RAPIDS cuML 的機(jī)器學(xué)習(xí)算法和數(shù)學(xué)基元遵循熟悉的類似于 scikit-learn 的 API。單塊 GPU 和大型數(shù)據(jù)中心部署均支持 XGBoost、隨機(jī)森林等主流算法。針對大型數(shù)據(jù)集,相較于同等功效的 CPU,這些基于 GPU 的實(shí)施方案能夠以 10 到 50 倍的速度更快地完成任務(wù)。

借助 RAPIDS GPU DataFrame,數(shù)據(jù)可以通過一個類似 Pandas 的接口加載到 GPU 上,然后用于各種連接的機(jī)器學(xué)習(xí)和圖形分析算法,而無需離開 GPU。這種級別的互操作性可通過 Apache Arrow 等庫實(shí)現(xiàn),并且可加速端到端流程(從數(shù)據(jù)準(zhǔn)備到機(jī)器學(xué)習(xí),再到深度學(xué)習(xí))。

RAPIDS 支持在許多熱門數(shù)據(jù)科學(xué)庫之間共享設(shè)備內(nèi)存。這樣可將數(shù)據(jù)保留在 GPU 上,并省去了來回復(fù)制主機(jī)內(nèi)存的高昂成本。

審核編輯:湯梓紅

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5309

    瀏覽量

    106377
  • 機(jī)器學(xué)習(xí)

    關(guān)注

    66

    文章

    8503

    瀏覽量

    134601
  • python
    +關(guān)注

    關(guān)注

    56

    文章

    4827

    瀏覽量

    86733

原文標(biāo)題:NVIDIA 大講堂 | 什么是 Scikit-learn?

文章出處:【微信號:NVIDIA_China,微信公眾號:NVIDIA英偉達(dá)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    人工智能和機(jī)器學(xué)習(xí)以及Edge AI的概念與應(yīng)用

    與人工智能相關(guān)各種技術(shù)的概念介紹,以及先進(jìn)的Edge AI(邊緣人工智能)的最新發(fā)展與相關(guān)應(yīng)用。 人工智能和機(jī)器學(xué)習(xí)是現(xiàn)代科技的核心技術(shù) 人工智能(AI)和機(jī)器
    的頭像 發(fā)表于 01-25 17:37 ?931次閱讀
    人工智能和<b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>以及Edge AI的<b class='flag-5'>概念</b>與應(yīng)用

    傳統(tǒng)機(jī)器學(xué)習(xí)方法和應(yīng)用指導(dǎo)

    在上一篇文章中,我們介紹了機(jī)器學(xué)習(xí)的關(guān)鍵概念術(shù)語。在本文中,我們會介紹傳統(tǒng)機(jī)器學(xué)習(xí)的基礎(chǔ)知識和多種算法特征,供各位老師選擇。 01 傳統(tǒng)
    的頭像 發(fā)表于 12-30 09:16 ?1184次閱讀
    傳統(tǒng)<b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>方法和應(yīng)用指導(dǎo)

    RAG的概念及工作原理

    )與外部知識源集成,增強(qiáng)了其能力。這種集成允許模型動態(tài)地引入相關(guān)信息,使其能夠生成不僅連貫而且事實(shí)準(zhǔn)確、上下文相關(guān)的回應(yīng)。RAG系統(tǒng)的主要組成部分包括: ·檢索器(Retriever): 該組件從外部知識中獲取相關(guān)數(shù)據(jù)。 ·生成器(Generator):
    的頭像 發(fā)表于 12-17 13:41 ?1917次閱讀
    RAG的<b class='flag-5'>概念及</b><b class='flag-5'>工作原理</b>

    自然語言處理與機(jī)器學(xué)習(xí)的關(guān)系 自然語言處理的基本概念及步驟

    Learning,簡稱ML)是人工智能的一個核心領(lǐng)域,它使計(jì)算機(jī)能夠從數(shù)據(jù)中學(xué)習(xí)并做出預(yù)測或決策。自然語言處理與機(jī)器學(xué)習(xí)之間有著密切的關(guān)系,因?yàn)?b class='flag-5'>機(jī)器
    的頭像 發(fā)表于 12-05 15:21 ?1985次閱讀

    AIGC是什么及其應(yīng)用 AIGC的定義和工作原理

    的發(fā)展得益于深度學(xué)習(xí)的進(jìn)步,特別是神經(jīng)網(wǎng)絡(luò)模型,如生成對抗網(wǎng)絡(luò)(GANs)、變分自編碼器(VAEs)和自回歸模型等。 AIGC的工作原理 AIGC的工作原理可以分為以下幾個步驟: 數(shù)據(jù)收集與預(yù)處理 :首先,需要收集大量的數(shù)據(jù),這
    的頭像 發(fā)表于 11-22 16:00 ?4309次閱讀

    NPU與機(jī)器學(xué)習(xí)算法的關(guān)系

    緊密。 NPU的起源與特點(diǎn) NPU的概念最早由谷歌在其TPU(Tensor Processing Unit)項(xiàng)目中提出,旨在為TensorFlow框架提供專用的硬件加速。NPU的設(shè)計(jì)目標(biāo)是提高機(jī)器學(xué)習(xí)算法的運(yùn)行效率,特別是在處理
    的頭像 發(fā)表于 11-15 09:19 ?1216次閱讀

    如何使用 PyTorch 進(jìn)行強(qiáng)化學(xué)習(xí)

    強(qiáng)化學(xué)習(xí)(Reinforcement Learning, RL)是一種機(jī)器學(xué)習(xí)方法,它通過與環(huán)境的交互來學(xué)習(xí)如何做出決策,以最大化累積獎勵。PyTorch 是一個流行的開源
    的頭像 發(fā)表于 11-05 17:34 ?1042次閱讀

    語音識別機(jī)器人的工作原理

    語音識別機(jī)器人的工作原理主要基于一系列復(fù)雜的技術(shù)流程,包括信號采集、預(yù)處理、特征提取、聲學(xué)模型匹配、語言模型預(yù)測以及最終的解碼輸出。 一、信號采集 語音識別機(jī)器人首先通過麥克風(fēng)等音頻輸入設(shè)備采集語音
    的頭像 發(fā)表于 10-25 09:25 ?1085次閱讀

    諧波的概念及應(yīng)用

    本文簡單介紹了諧波的概念及應(yīng)用。
    的頭像 發(fā)表于 10-18 14:14 ?1287次閱讀
    諧波的<b class='flag-5'>概念及</b>應(yīng)用

    RISC-V如何支持不同的AI和機(jī)器學(xué)習(xí)框架和

    RISC-V如何支持不同的AI和機(jī)器學(xué)習(xí)框架和?還請壇友們多多指教一下。
    發(fā)表于 10-10 22:24

    光電三極管的基本概念工作原理

    光電三極管,又稱為光敏三極管或光控三極管,是一種重要的光電轉(zhuǎn)換器件,能夠?qū)⒐庑盘栟D(zhuǎn)化為電流或電壓信號。這種器件在光電通信、光電測量、光電控制等領(lǐng)域有著廣泛的應(yīng)用。下面,我們將詳細(xì)探討光電三極管的基本概念、工作原理以及其在不同領(lǐng)域的應(yīng)用。
    的頭像 發(fā)表于 09-24 11:08 ?4906次閱讀

    無源傳感器的基本概念、工作原理及分類

    、維護(hù)方便等優(yōu)點(diǎn),因此在許多領(lǐng)域得到了廣泛應(yīng)用。 一、無源傳感器的基本概念 1.1 定義 無源傳感器是一種不需要外部能源的傳感器,它通過檢測被測量對象自身的物理或化學(xué)特性變化來實(shí)現(xiàn)測量。無源傳感器的工作原理是利用被測量對象的特性變化來
    的頭像 發(fā)表于 08-19 09:53 ?3135次閱讀

    功分器的基本概念、工作原理及分類

    信號功率分配到多個輸出端口的器件。它通常由一個輸入端口和多個輸出端口組成,輸入信號通過功分器后,被等比例或不等比例地分配到各個輸出端口。 1.2 功分器的工作原理 功分器的工作原理基于電磁波的傳輸和分配。當(dāng)輸入信號通過功分
    的頭像 發(fā)表于 08-14 09:53 ?5382次閱讀

    S參數(shù)的概念及應(yīng)用

    電子發(fā)燒友網(wǎng)站提供《S參數(shù)的概念及應(yīng)用.pdf》資料免費(fèi)下載
    發(fā)表于 08-12 14:29 ?0次下載

    繼電器電感的基本概念及分類

    繼電器是一種電子控制器件,用于在控制電路中實(shí)現(xiàn)對高電壓、大電流負(fù)載的控制。它主要由電磁鐵、觸點(diǎn)系統(tǒng)和機(jī)械部件組成。在繼電器的工作原理中,電感是一個重要的參數(shù),它對繼電器的性能和穩(wěn)定性有著
    的頭像 發(fā)表于 07-24 09:41 ?1191次閱讀