一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

英特爾AI實(shí)驗(yàn)室推出了高性能的神經(jīng)網(wǎng)絡(luò)壓縮工具Distiller

nlfO_thejiangme ? 來源:未知 ? 作者:李倩 ? 2018-11-06 10:05 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

近日,英特爾AI 實(shí)驗(yàn)室推出了高性能的神經(jīng)網(wǎng)絡(luò)壓縮工具Distiller,便捷地實(shí)現(xiàn)了更小更快更高效的神經(jīng)網(wǎng)絡(luò)計(jì)算。Distiller目前在PyTorch中實(shí)現(xiàn)了一系列壓縮分析算法,包括稀疏引導(dǎo)算法和低精度近似算法。工具包主要由以下三個(gè)部分組成:

一套集成了剪枝、正則化與量化的算法;

一系列分析和評(píng)價(jià)壓縮表現(xiàn)的工具;

以及一系列前沿壓縮算法的實(shí)現(xiàn)樣例。

更小更快更節(jié)能

目前的絕大多數(shù)神經(jīng)網(wǎng)絡(luò)都越來越深,其參數(shù)達(dá)到了百萬量級(jí)。如此龐大的模型即使在硬件加速的條件下也是十分消耗資源的計(jì)算密集型算法,即使只考慮推理階段也需要花費(fèi)較多的時(shí)間。在某些低延時(shí)的場(chǎng)合,比如說自動(dòng)駕駛和控制領(lǐng)域這樣的處理時(shí)間就會(huì)造成很多問題。同時(shí)在消費(fèi)電子上較長的延時(shí)也會(huì)造成用戶體驗(yàn)的下降。

大型模型同時(shí)也會(huì)消耗大量的內(nèi)存,以及隨之而來的算力與能耗,這對(duì)于移動(dòng)設(shè)備來說是十分重要的問題。同樣對(duì)于大型數(shù)據(jù)中心來說模型的能耗也是不同忽視的問題。同時(shí)考慮到存儲(chǔ)和傳輸?shù)南拗?,神?jīng)網(wǎng)絡(luò)的壓縮具有十分重要的現(xiàn)實(shí)需求。在精度可以接受的條件下,壓縮的越小神經(jīng)網(wǎng)絡(luò)需要的計(jì)算資源和帶寬就越少。由于深度神經(jīng)網(wǎng)絡(luò)的權(quán)重矩陣具有稀疏性,通過正則化和剪枝以及量化過程可以很好的壓縮模型的體量。

稀疏的神經(jīng)網(wǎng)絡(luò)模型表示可以被大幅度壓縮。目前很多神經(jīng)網(wǎng)絡(luò)性能都受制于帶寬,這意味著它們的計(jì)算性能主要取決于可用的帶寬,帶寬不足的情況下硬件需要用更多的時(shí)間將數(shù)據(jù)輸入到計(jì)算單元中。全連接層、RNN和LSTM等典型的結(jié)構(gòu)就受制于帶寬。如果能夠減小這些層所需要的帶寬就能大幅提高它們的速度。

通過修剪模型中的某些權(quán)重、核甚至是整個(gè)層實(shí)現(xiàn)減小帶寬提高速度的功能,但同時(shí)卻不影響算法最終精度的表現(xiàn),也減小了功耗和延時(shí)。最后考慮到讀寫非片上存儲(chǔ)的能耗是片上存儲(chǔ)的兩個(gè)量級(jí)以上,如果較小的模型可以保存在片上存儲(chǔ)中,可以使性能得到質(zhì)的飛躍,讓延時(shí)和能耗也隨之降低。所以同時(shí)稀疏或者壓縮表示時(shí),可以有效提升算法的表現(xiàn)。

工具框架

Distiller目前的設(shè)計(jì)與PyTorch進(jìn)行集成,其設(shè)計(jì)理念如下圖所示,PyTorch的訓(xùn)練與Distiller進(jìn)行交互。在distiller中包含了調(diào)度、算法和應(yīng)用等主要模塊以及匯總、日志的輔助功能,在很多常見的科學(xué)計(jì)算包的基礎(chǔ)上利用jupyter實(shí)現(xiàn)交互功能,基于tensorboard實(shí)現(xiàn)模型和日志信息的展示。

算法

Distiller中集成了先進(jìn)的剪枝和量化算法,幫助用戶有效的壓縮模型的體量。

剪枝算法主要分為了權(quán)重正則化、權(quán)重修剪、低精度等三種實(shí)現(xiàn)方式,7種具體的方法。

幅度剪枝利用閾值來將每一個(gè)權(quán)重進(jìn)行二值化,小于閾值的權(quán)重將被設(shè)為0,不同的層可以設(shè)置不同的權(quán)值;

敏感度剪枝與閾值的方法類似,但使用了敏感因子s與這一層的權(quán)重分布標(biāo)準(zhǔn)差σ的乘積來作為閾值。越敏感的層(靠近輸入的)設(shè)置的s就越??;

level剪枝通過設(shè)置稀疏度來實(shí)現(xiàn)剪枝,這種方法相較于前面方法穩(wěn)定,因?yàn)槟繕?biāo)的稀疏程度與元素的賦值不相關(guān)。

自動(dòng)梯度剪枝(AGP)

這種方法的稀疏度將會(huì)隨著初始稀疏和最終稀疏自適應(yīng)的變化;

RNN剪枝

結(jié)構(gòu)剪枝(通過移除整個(gè)核、濾波器甚至是整個(gè)特征圖來實(shí)現(xiàn)):包含了結(jié)構(gòu)排序剪枝和對(duì)于較少激活特征圖的激活相關(guān)剪枝。

量化也是一類重要的壓縮算法,Distall中同時(shí)也集成了四種量化算法:

DoReFa-Net: Training Low Bitwidth Convolutional Neural Networks with Low Bitwidth Gradients

PACT: Parameterized Clipping Activation for Quantized Neural Networks

WRPN: Wide Reduced-Precision Networks

對(duì)稱線性量化

安 裝

如果想要使用這個(gè)工具的小伙伴,可以到git上下載

$ git clone https://github.com/NervanaSystems/distiller.git

$ cd distiller

然后利用你喜歡的工具創(chuàng)建一個(gè)python虛擬環(huán)境

$ python3 -m virtualenv env

激活環(huán)境并安裝對(duì)應(yīng)的依賴包:

$ source env/bin/activate

$ pip3 install -r requirements.txt

注:這一版本依賴于CUDA8.0,會(huì)自動(dòng)安裝PyTorch3.1

然后就可以愉快的使用了,可以通過運(yùn)行下面的文件來熟悉工具的使用:

distiller/examples/classifier_compression/compress_classifier.py

#example

$ python3 compress_classifier.py --arch simplenet_cifar ../../../data.cifar10 -p 30 -j=1 --lr=0.01

#對(duì)于cifar10壓縮

$ time python3 compress_classifier.py -a alexnet --lr 0.005 -p 50 ../../../data.imagenet -j 44 --epochs 90 --pretrained --compress=../sensitivity-pruning/alexnet.schedule_sensitivity.yaml

#利用yaml配置文件來運(yùn)行

另外example下還有多個(gè)例子可以嘗試。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 英特爾
    +關(guān)注

    關(guān)注

    61

    文章

    10194

    瀏覽量

    174657
  • 神經(jīng)網(wǎng)絡(luò)

    關(guān)注

    42

    文章

    4814

    瀏覽量

    103556

原文標(biāo)題:英特爾推出全新可便捷實(shí)現(xiàn)「更小更快更高效的神經(jīng)網(wǎng)絡(luò)計(jì)算」的壓縮工具Distiller

文章出處:【微信號(hào):thejiangmen,微信公眾號(hào):將門創(chuàng)投】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    開售RK3576 高性能人工智能主板

    ZYSJ-2476B 高性能智能主板,采用瑞芯微 RK3576 高性能 AI 處理器、神經(jīng)網(wǎng)絡(luò)處理器 NPU, Android 14.0/debian11/ubuntu20.04 操
    發(fā)表于 04-23 10:55

    神經(jīng)網(wǎng)絡(luò)壓縮框架 (NNCF) 中的過濾器修剪統(tǒng)計(jì)數(shù)據(jù)怎么查看?

    無法觀察神經(jīng)網(wǎng)絡(luò)壓縮框架 (NNCF) 中的過濾器修剪統(tǒng)計(jì)數(shù)據(jù)
    發(fā)表于 03-06 07:10

    英特爾?獨(dú)立顯卡與OpenVINO?工具套件結(jié)合使用時(shí),無法運(yùn)行推理怎么解決?

    使用英特爾?獨(dú)立顯卡與OpenVINO?工具套件時(shí)無法運(yùn)行推理
    發(fā)表于 03-05 06:56

    英特爾推出具備高性能和能效的以太網(wǎng)解決方案

    網(wǎng)絡(luò)適配器,以及英特爾以太網(wǎng)控制器E610和網(wǎng)絡(luò)適配器,旨在滿足企業(yè)、電信、云、邊緣、科學(xué)計(jì)算(HPC)和AI等領(lǐng)域日益增長的需求。這些新一代解決方案可以提供強(qiáng)勁的
    發(fā)表于 02-25 11:17 ?223次閱讀
    <b class='flag-5'>英特爾</b><b class='flag-5'>推出</b>具備<b class='flag-5'>高性能</b>和能效的以太網(wǎng)解決方案

    英特爾OpenVINO 2025.0正式發(fā)布

    生成式AI(GenAI)在模型質(zhì)量與應(yīng)用范圍上持續(xù)爆發(fā)式增長,DeepSeek 等頂尖模型已引發(fā)行業(yè)熱議,這種勢(shì)頭預(yù)計(jì)將在 2025年延續(xù)。本次更新聚焦性能提升、更多生成式AI 模型的支持,并針對(duì)
    的頭像 發(fā)表于 02-21 10:20 ?738次閱讀
    <b class='flag-5'>英特爾</b>OpenVINO 2025.0正式發(fā)布

    BU-67121W實(shí)驗(yàn)室航空電子接口計(jì)算機(jī)North Hills

    MIL-STD-1553和ARINC 429系統(tǒng)應(yīng)用程序而設(shè)計(jì)。它顯著減少了從測(cè)試實(shí)驗(yàn)室到被測(cè)機(jī)載1553/429接口所需的長距離布線/電線,進(jìn)而降低了相關(guān)成本。優(yōu)勢(shì):編程靈活性:內(nèi)置的英特爾處理器為
    發(fā)表于 02-11 09:26

    NVIDIA推出DRIVE AI安全檢測(cè)實(shí)驗(yàn)室

    全新 NVIDIA 實(shí)驗(yàn)室獲得美國國家標(biāo)準(zhǔn)學(xué)會(huì)國家認(rèn)可委員會(huì)(ANAB)的認(rèn)證,可執(zhí)行自動(dòng)駕駛汽車的功能安全、網(wǎng)絡(luò)安全和 AI 檢測(cè)。
    的頭像 發(fā)表于 01-09 16:01 ?663次閱讀

    英特爾推出全新英特爾銳炫B系列顯卡

    備受玩家青睞的價(jià)格提供卓越的性能與價(jià)值1,很好地滿足現(xiàn)代游戲需求,并為AI工作負(fù)載提供加速。其配備的英特爾Xe矩陣計(jì)算引擎(XMX),為新推出的XeSS 2提供強(qiáng)大支持。XeSS 2的
    的頭像 發(fā)表于 12-07 10:16 ?1425次閱讀
    <b class='flag-5'>英特爾</b><b class='flag-5'>推出</b>全新<b class='flag-5'>英特爾</b>銳炫B系列顯卡

    英特爾發(fā)布全新企業(yè)AI一體化方案

    近日,英特爾正式推出了全新的企業(yè)AI一體化方案。該方案以英特爾至強(qiáng)處理器和英特爾Gaudi 2D AI
    的頭像 發(fā)表于 12-03 11:20 ?591次閱讀

    英特爾聚焦AI座艙

    英特爾推出首款銳炫車載獨(dú)立顯卡(dGPU)和第一代英特爾軟件定義車載SoC系列,滿足當(dāng)前消費(fèi)者對(duì)汽車內(nèi)部配備更多屏幕、獲得更高清晰度等AI座艙體驗(yàn)需求。
    的頭像 發(fā)表于 10-30 16:26 ?435次閱讀

    Inflection AI攜手英特爾推出企業(yè)級(jí)AI系統(tǒng)

    近日,AI初創(chuàng)企業(yè)Inflection AI英特爾聯(lián)合宣布了一項(xiàng)重大合作——推出基于英特爾Gaudi 3
    的頭像 發(fā)表于 10-09 16:40 ?751次閱讀

    英特爾發(fā)布至強(qiáng)6性能核處理器

    近日,英特爾正式推出了其全新的英特爾? 至強(qiáng)? 6性能核處理器(代號(hào)Granite Rapids),旨在為AI、數(shù)據(jù)分析、科學(xué)計(jì)算等計(jì)算密集
    的頭像 發(fā)表于 09-30 16:22 ?699次閱讀

    英特爾與百度共同為AI時(shí)代打造高性能基礎(chǔ)設(shè)施

    2024年9月25日,北京 ?——?在2024百度云智大會(huì)上,英特爾應(yīng)邀出席并披露基于英特爾?至強(qiáng)?6處理器的新一代云實(shí)例即將在百度智能云上推出,分享雙方在云數(shù)據(jù)中心、大模型軟件服務(wù)與生態(tài)以及
    的頭像 發(fā)表于 09-27 09:48 ?423次閱讀
    <b class='flag-5'>英特爾</b>與百度共同為<b class='flag-5'>AI</b>時(shí)代打造<b class='flag-5'>高性能</b>基礎(chǔ)設(shè)施

    英特爾攜手運(yùn)營商伙伴,共探AI驅(qū)動(dòng)通信網(wǎng)絡(luò)新未來

    2024年9月25日,北京?—— 今日,英特爾在2024年國際信息通信展(以下簡稱PT展)上舉辦“英特爾‘智通未來’AI通訊與網(wǎng)絡(luò)轉(zhuǎn)型研討會(huì)”。此次活動(dòng)邀請(qǐng)了中國移動(dòng)與中國電信兩大運(yùn)營
    的頭像 發(fā)表于 09-27 09:26 ?503次閱讀
    <b class='flag-5'>英特爾</b>攜手運(yùn)營商伙伴,共探<b class='flag-5'>AI</b>驅(qū)動(dòng)通信<b class='flag-5'>網(wǎng)絡(luò)</b>新未來

    開箱即用,AISBench測(cè)試展示英特爾至強(qiáng)處理器的卓越推理性能

    。 中國電子技術(shù)標(biāo)準(zhǔn)化研究院賽西實(shí)驗(yàn)室依據(jù)國家標(biāo)準(zhǔn)《人工智能服務(wù)器系統(tǒng)性能測(cè)試規(guī)范》(征求意見稿)相關(guān)要求,使用AISBench?2.0測(cè)試工具,完成了第五代英特爾至強(qiáng)可擴(kuò)展處理器的
    的頭像 發(fā)表于 09-06 15:33 ?809次閱讀
    開箱即用,AISBench測(cè)試展示<b class='flag-5'>英特爾</b>至強(qiáng)處理器的卓越推理<b class='flag-5'>性能</b>