完善資料讓更多小伙伴認識你，還能領取20積分哦，立即完善>

3天內不再提示

如何去掉batch normalization層來加速神經網絡

導讀

如何去掉batch normalization層來加速神經網絡。

介紹

Batch Normalization是將各層的輸入進行歸一化，使訓練過程更快、更穩(wěn)定的一種技術。在實踐中，它是一個額外的層，我們通常添加在計算層之后，在非線性之前。它包括兩個步驟：

首先減去其平均值，然后除以其標準差

進一步通過γ縮放，通過β偏移，這些是batch normalization層的參數，當網絡不需要數據的時候，均值為0、標準差為1。

Batch normalization在神經網絡的訓練中具有較高的效率，因此得到了廣泛的應用。但它在推理的時候有多少用處呢？

一旦訓練結束，每個Batch normalization層都擁有一組特定的γ和β，還有μ和σ，后者在訓練過程中使用指數加權平均值進行計算。這意味著在推理過程中，Batch normalization就像是對上一層（通常是卷積）的結果進行簡單的線性轉換。

由于卷積也是一個線性變換，這也意味著這兩個操作可以合并成一個單一的線性變換！這將刪除一些不必要的參數，但也會減少推理時要執(zhí)行的操作數量。

在實踐中怎么做？

用一點數學知識，我們可以很容易地重新對卷積進行排列來處理batch normalization。提醒一下，對一個輸入x進行卷積之后再進行batch normalization的運算可以表示為：

那么，如果我們重新排列卷積的W和b，考慮batch normalization的參數，如下：

我們可以去掉batch normalization層，仍然得到相同的結果！

注意：通常，在batch normalization層之前的層中是沒有bias的，因為這是無用的，也是對參數的浪費，因為任何常數都會被batch normalization抵消掉。

這樣做的效果怎樣？

我們將嘗試兩種常見的架構：

使用batch norm的VGG16

ResNet50

為了演示，我們使用ImageNet dataset和PyTorch。兩個網絡都將訓練5個epoch，看看參數數量和推理時間的變化。

1. VGG16

我們從訓練VGG16 5個epoch開始(最終的準確性并不重要)：

參數的數量：

單個圖像的初始推理時間為：

如果使用了batch normalization折疊，我們有：

以及：

8448個參數被去掉了，更好的是，幾乎快了0.4毫秒！最重要的是，這是完全無損的，在性能方面絕對沒有變化：

讓我們看看它在Resnet50的情況下是怎么樣的！

2. Resnet50

同樣的，我們開始訓練它5個epochs：

初始參數量為：

推理時間為：

使用batch normalization折疊后，有：

和：

現在，我們有26,560的參數被移除，更驚訝的hi，推理時間減少了1.5ms，性能一點也沒降。

責任編輯：lq！

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規(guī)問題，請聯系本站處理。舉報投訴

神經網絡

神經網絡

+關注

關注
42

文章
4814

瀏覽量
103668
參數

參數

+關注

關注
11

文章
1867

瀏覽量
33101
線性

線性

+關注

關注
0

文章
204

瀏覽量
25649

原文標題：使用Batch Normalization折疊來加速模型推理

文章出處：【微信號：zenRRan，微信公眾號：深度學習自然語言處理】歡迎添加關注！文章轉載請注明出處。

深度學習自然語言處理
專欄

0 文章 0 閱讀 0 粉絲 0 點贊

關注個人主頁

Hot 一個給NLP領域帶來革新的預訓練語言大模型Bert
Hot 推薦一些翻譯英文文獻比較準確的軟件

New 高效大模型的推理綜述
New 什么是RAG，RAG學習和實踐經驗

精選推薦
更多

文章

資料

帖子

AI通話的N種新玩法，讓科幻照進現實

腦極體
1天前

690 閱讀

三菱電機SiC DIPIPM在變頻家電中的應用（2）

三菱電機半導體
1天前

707 閱讀

三菱電機SiC DIPIPM在變頻家電中的應用（1）

三菱電機半導體
1天前

619 閱讀

英飛凌TLD7002-16 OTP PRG的常見問題解析

駿龍電子
1天前

548 閱讀

DC/DC轉換器電路板安裝過程中的焊接技巧與導通檢查要點

駿龍電子
1天前

694 閱讀

高效的智能手機SD閃存供電方法

劉洋
215 KB

5積分

45下載

Microsoft Application Inspector軟件特征源碼分析器

CDCNKA
7.36 MB

免費

0下載

RSSwitch可自定義的開關

h1654155273.0656
0.03 MB

免費

0下載

雙通道同步降壓轉換器 SOP-8(EP)封裝EUP3468A數據手冊

楊豐奎
0.09 MB

2積分

0下載

DA16200 超低功耗 Wi-Fi 模塊開發(fā)套件 Pro數據手冊

13.40 MB

免費

1下載

【RA-Eco-RA6M4開發(fā)板評測】基于SHELL進行ADC測試

jf_1137202360
12小時前

4 閱讀

【VisionFive 2單板計算機試用體驗】3、開源大語言模型部署

左岸cpx
1天前

217 閱讀

【M-K1HSE開發(fā)板免費體驗】DevEco Studio應用開發(fā)體驗(物理機器運行失敗)

jf_1137202360
1天前

173 閱讀

【RA-Eco-RA6M4開發(fā)板評測】開箱、Hello World（串口+OLED）

jf_57061047
1天前

196 閱讀

省錢+環(huán)保+個性：打造一臺永不“過時”的自定義電腦！

早知
2天前

733 閱讀

推薦專欄
更多

企業(yè)產品

資料

方案
更多

一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

搜索歷史

如何去掉batch normalization層來加速神經網絡

評論