一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

GPU 引領(lǐng)的深度學(xué)習(xí)

母豬會上樹 ? 2023-01-04 11:17 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

早期的機器學(xué)習(xí)是基于搜索的,主要依賴于經(jīng)過一些優(yōu)化的蠻力方法。但隨著機器學(xué)習(xí)的成熟,它專注于加速成熟的統(tǒng)計方法和優(yōu)化問題。深度學(xué)習(xí)也出現(xiàn)了,它找到了一個不太可能的優(yōu)化來源。在這里,我們將了解現(xiàn)代機器學(xué)習(xí)如何找到新方法來帶來規(guī)模和速度。

人工智能的轉(zhuǎn)變

在本系列的第 1 部分中,我們探討了 AI 的一些歷史以及從 Lisp 到現(xiàn)代編程語言和深度學(xué)習(xí)等計算智能新范式的旅程。我們還討論了依賴于優(yōu)化搜索形式的早期人工智能應(yīng)用、在海量數(shù)據(jù)集上訓(xùn)練的現(xiàn)代神經(jīng)網(wǎng)絡(luò)架構(gòu),以及解決十年前認為不可能解決的問題。今天的重點是雙重的;進一步加速這些應(yīng)用程序并將它們限制在智能手機等功率優(yōu)化環(huán)境中。

今天大多數(shù)加速的重點是深度學(xué)習(xí)。深度學(xué)習(xí)是一種神經(jīng)網(wǎng)絡(luò)架構(gòu),它依賴于許多層次的神經(jīng)網(wǎng)絡(luò),其中層可以支持不同的特征檢測功能。這些深度神經(jīng)網(wǎng)絡(luò)依賴于可以輕松受益于并行性的向量運算。這些架構(gòu)代表了神經(jīng)網(wǎng)絡(luò)層的分布式計算以及層內(nèi)許多神經(jīng)元的并行計算的機會。

使用 GPU 加速機器學(xué)習(xí)

加速深度學(xué)習(xí)應(yīng)用程序的不太可能的來源是圖形處理單元或 GPU。GPU 是一種特殊設(shè)備,用于加速輸出到顯示設(shè)備的幀緩沖區(qū)(內(nèi)存)的構(gòu)建。GPU 卸載幀緩沖區(qū)中的圖像渲染,而不是依賴處理器來執(zhí)行此操作。GPU 由數(shù)千個獨立內(nèi)核組成,這些內(nèi)核并行運行并執(zhí)行特定類型的計算,例如矢量數(shù)學(xué)。盡管最初的 GPU 專為視頻應(yīng)用而設(shè)計,但人們發(fā)現(xiàn)它們還可以加速科學(xué)計算中的運算,例如矩陣乘法。

GPU 供應(yīng)商樂于提供 API,允許開發(fā)人員將 GPU 處理集成到他們的應(yīng)用程序中,但這項工作也可以通過適用于各種不同環(huán)境的標準包來完成。R 編程語言和環(huán)境包括與 GPU 配合使用以加速處理的包,例如gputools、gmatrix和gpuR。GPU 也可以通過各種庫(例如numba包或Theano )與 Python 一起使用。

這些軟件包使任何有意使用它們的人都可以使用 GPU 加速機器學(xué)習(xí)。但更專業(yè)的方法也在路上。2019 年,英特爾?以 20 億美元的價格收購了 Habana Labs。Habana Labs 為服務(wù)器中的各種機器學(xué)習(xí)加速器開發(fā)了定制芯片。在此之前,2017 年以 150 億美元的價格收購了 Mobileye 的自動駕駛芯片技術(shù)。

定制硅和說明

除了服務(wù)器和臺式機中的 GPU 加速之外,機器學(xué)習(xí)加速器正在超越傳統(tǒng)平臺,進入功率受限的嵌入式設(shè)備和智能手機。這些加速器采用多種形式,從 U 盤、API 到智能手機神經(jīng)網(wǎng)絡(luò)加速器,以及用于深度學(xué)習(xí)加速的矢量指令。

智能手機的深度學(xué)習(xí)

深度學(xué)習(xí)工具包已經(jīng)從 PC 發(fā)展到適用于更受限網(wǎng)絡(luò)的智能手機。TensorFlow Lite 和 Core ML 等框架已經(jīng)部署在移動設(shè)備上用于機器學(xué)習(xí)應(yīng)用程序。Apple ?最近發(fā)布了 A12 仿生芯片,其中包含一個 8 核神經(jīng)網(wǎng)絡(luò)引擎,用于開發(fā)更節(jié)能的神經(jīng)網(wǎng)絡(luò)應(yīng)用程序。這將擴展 Apple 智能手機上的深度學(xué)習(xí)應(yīng)用程序。

Google 為 Android ? 8.1 發(fā)布了具有機器學(xué)習(xí)功能的神經(jīng)網(wǎng)絡(luò) API (NNAPI)。這些在 Google Lens 應(yīng)用程序的自然語言處理和圖像識別環(huán)境中用于 Google Assistant。NNAPI 類似于其他深度學(xué)習(xí)工具包,但專為 Android 智能手機環(huán)境及其資源限制而構(gòu)建。

深度學(xué)習(xí) USB

英特爾發(fā)布了其神經(jīng)計算棒的更新版本,以 USB 棒的形式加速深度學(xué)習(xí)應(yīng)用程序。這可以被各種機器學(xué)習(xí)框架使用,例如 TensorFlow、Caffe 和 PyTorch。當 GPU 不可用時,該設(shè)備是一個有趣的選擇,而且還允許深度學(xué)習(xí)應(yīng)用程序的快速原型設(shè)計。

深度學(xué)習(xí)說明

最后,雖然機器學(xué)習(xí)計算已從 CPU 轉(zhuǎn)移到 GPU,但英特爾已使用新指令優(yōu)化其至強指令集以加速深度學(xué)習(xí)。這些稱為 AVX-512 擴展的新指令(稱為向量神經(jīng)網(wǎng)絡(luò)指令或 VNNi)提高了卷積神經(jīng)網(wǎng)絡(luò)操作的吞吐量。

概括

GPU 在機器學(xué)習(xí)中的應(yīng)用創(chuàng)造了為各種應(yīng)用程序構(gòu)建和部署大規(guī)模深度神經(jīng)網(wǎng)絡(luò)的能力。機器學(xué)習(xí)框架使構(gòu)建深度學(xué)習(xí)應(yīng)用程序變得簡單。但也不甘示弱,智能手機供應(yīng)商已經(jīng)為受限應(yīng)用程序集成了節(jié)能的神經(jīng)網(wǎng)絡(luò)加速器(以及用于自定義應(yīng)用程序使用的 API)?,F(xiàn)在也可以找到其他加速器來卸載到 USB 硬件,許多新的初創(chuàng)公司正在挖掘這個加速器空間以用于未來的機器學(xué)習(xí)應(yīng)用程序。

審核編輯hhy

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    4948

    瀏覽量

    131259
  • 機器學(xué)習(xí)
    +關(guān)注

    關(guān)注

    66

    文章

    8503

    瀏覽量

    134635
  • 深度學(xué)習(xí)
    +關(guān)注

    關(guān)注

    73

    文章

    5561

    瀏覽量

    122800
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    GPU架構(gòu)深度解析

    GPU架構(gòu)深度解析從圖形處理到通用計算的進化之路圖形處理單元(GPU),作為現(xiàn)代計算機中不可或缺的一部分,已經(jīng)從最初的圖形渲染專用處理器,發(fā)展成為強大的并行計算引擎,廣泛應(yīng)用于人工智能、科學(xué)計算
    的頭像 發(fā)表于 05-30 10:36 ?389次閱讀
    <b class='flag-5'>GPU</b>架構(gòu)<b class='flag-5'>深度</b>解析

    ARM Mali GPU 深度解讀

    ARM Mali GPU 深度解讀 ARM Mali 是 Arm 公司面向移動設(shè)備、嵌入式系統(tǒng)和基礎(chǔ)設(shè)施市場設(shè)計的圖形處理器(GPU)IP 核,憑借其異構(gòu)計算架構(gòu)、能效優(yōu)化和生態(tài)協(xié)同,成為全球移動
    的頭像 發(fā)表于 05-29 10:12 ?1088次閱讀

    SLAMTEC Aurora:把深度學(xué)習(xí)“卷”進機器人日常

    在人工智能和機器人技術(shù)飛速發(fā)展的今天,深度學(xué)習(xí)與SLAM(同步定位與地圖構(gòu)建)技術(shù)的結(jié)合,正引領(lǐng)著智能機器人行業(yè)邁向新的高度。最近科技圈頂流DeepSeek簡直殺瘋了!靠著逆天的深度
    的頭像 發(fā)表于 02-19 15:49 ?461次閱讀

    深度學(xué)習(xí)工作負載中GPU與LPU的主要差異

    ,一個新的競爭力量——LPU(Language Processing Unit,語言處理單元)已悄然登場,LPU專注于解決自然語言處理(NLP)任務(wù)中的順序性問題,是構(gòu)建AI應(yīng)用不可或缺的一環(huán)。 本文旨在探討深度學(xué)習(xí)工作負載中GPU
    的頭像 發(fā)表于 12-09 11:01 ?3368次閱讀
    <b class='flag-5'>深度</b><b class='flag-5'>學(xué)習(xí)</b>工作負載中<b class='flag-5'>GPU</b>與LPU的主要差異

    GPU深度學(xué)習(xí)中的應(yīng)用 GPUs在圖形設(shè)計中的作用

    隨著人工智能技術(shù)的飛速發(fā)展,深度學(xué)習(xí)作為其核心部分,已經(jīng)成為推動技術(shù)進步的重要力量。GPU(圖形處理單元)在深度學(xué)習(xí)中扮演著至關(guān)重要的角色,
    的頭像 發(fā)表于 11-19 10:55 ?1629次閱讀

    NPU在深度學(xué)習(xí)中的應(yīng)用

    設(shè)計的硬件加速器,它在深度學(xué)習(xí)中的應(yīng)用日益廣泛。 1. NPU的基本概念 NPU是一種專門針對深度學(xué)習(xí)算法優(yōu)化的處理器,它與傳統(tǒng)的CPU和GPU
    的頭像 發(fā)表于 11-14 15:17 ?1922次閱讀

    pcie在深度學(xué)習(xí)中的應(yīng)用

    深度學(xué)習(xí)模型通常需要大量的數(shù)據(jù)和強大的計算能力來訓(xùn)練。傳統(tǒng)的CPU計算資源有限,難以滿足深度學(xué)習(xí)的需求。因此,GPU(圖形處理單元)和TPU
    的頭像 發(fā)表于 11-13 10:39 ?1359次閱讀

    PyTorch GPU 加速訓(xùn)練模型方法

    深度學(xué)習(xí)領(lǐng)域,GPU加速訓(xùn)練模型已經(jīng)成為提高訓(xùn)練效率和縮短訓(xùn)練時間的重要手段。PyTorch作為一個流行的深度學(xué)習(xí)框架,提供了豐富的工具和
    的頭像 發(fā)表于 11-05 17:43 ?1413次閱讀

    Pytorch深度學(xué)習(xí)訓(xùn)練的方法

    掌握這 17 種方法,用最省力的方式,加速你的 Pytorch 深度學(xué)習(xí)訓(xùn)練。
    的頭像 發(fā)表于 10-28 14:05 ?661次閱讀
    Pytorch<b class='flag-5'>深度</b><b class='flag-5'>學(xué)習(xí)</b>訓(xùn)練的方法

    常見GPU問題及解決方法

    GPU(圖形處理單元)是計算機硬件的重要組成部分,負責處理圖形和視頻渲染任務(wù)。隨著技術(shù)的發(fā)展,GPU深度學(xué)習(xí)、游戲、視頻編輯等領(lǐng)域扮演著越來越重要的角色。然而,在使用
    的頭像 發(fā)表于 10-27 14:12 ?3695次閱讀

    如何提高GPU性能

    在當今這個視覺至上的時代,GPU(圖形處理單元)的性能對于游戲玩家、圖形設(shè)計師、視頻編輯者以及任何需要進行高強度圖形處理的用戶來說至關(guān)重要。GPU不僅是游戲和多媒體應(yīng)用的心臟,它還在科學(xué)計算、深度
    的頭像 發(fā)表于 10-27 11:21 ?2523次閱讀

    GPU深度學(xué)習(xí)應(yīng)用案例

    GPU深度學(xué)習(xí)中的應(yīng)用廣泛且重要,以下是一些GPU深度學(xué)習(xí)應(yīng)用案例: 一、圖像識別 圖像識別是
    的頭像 發(fā)表于 10-27 11:13 ?1384次閱讀

    AI大模型與深度學(xué)習(xí)的關(guān)系

    AI大模型與深度學(xué)習(xí)之間存在著密不可分的關(guān)系,它們互為促進,相輔相成。以下是對兩者關(guān)系的介紹: 一、深度學(xué)習(xí)是AI大模型的基礎(chǔ) 技術(shù)支撐 :深度
    的頭像 發(fā)表于 10-23 15:25 ?2900次閱讀

    深度學(xué)習(xí)GPU加速效果如何

    圖形處理器(GPU)憑借其強大的并行計算能力,成為加速深度學(xué)習(xí)任務(wù)的理想選擇。
    的頭像 發(fā)表于 10-17 10:07 ?617次閱讀

    FPGA做深度學(xué)習(xí)能走多遠?

    。例如,在數(shù)據(jù)中心中,可以將 FPGA 與 CPU 或 GPU 結(jié)合使用,根據(jù)不同的任務(wù)需求進行靈活的資源分配和協(xié)同計算,提高整個系統(tǒng)的性能和效率。 ? 算法優(yōu)化和創(chuàng)新:隨著深度學(xué)習(xí)算法的不斷發(fā)展和優(yōu)化
    發(fā)表于 09-27 20:53