亚洲日韓精品,无码一,二区,中文字幕aaaav

沒有乘法的神經(jīng)網(wǎng)絡，你敢想象嗎？無論是單個神經(jīng)元的運算還是卷積運算，都不可避免地要使用乘法。

然而乘法對硬件資源的消耗遠大于加法。如果不用乘法，全部改用加法應該可以讓運算速度大大提升。

去年年底，來自北京大學、華為諾亞方舟實驗室、鵬城實驗室的研究人員將這一想法付諸實踐，他們提出了一種只用加法的神經(jīng)網(wǎng)絡AdderNet（加法器網(wǎng)絡）。一作是華為諾亞方舟實習生，正在北大讀博三。

如今，這篇文章已經(jīng)被CVPR 2020收錄（Oral），官方也在GitHub上開放了源代碼。有興趣的同學不妨前往一試究竟。

加法器網(wǎng)絡的核心在于：用L1距離代替歐氏距離。

L1距離是求兩點之間坐標差值的絕對值之和，因此全程不涉及乘法。

在這種新的定義下，反向傳播中用到的求偏導數(shù)運算也變成了求減法。梯度下降的優(yōu)化過程也被叫做符號SGD（signSGD）。

在加法器網(wǎng)絡的新定義下，特征向量的空間分布也和CNN有很大的不同。

那么AdderNet的實際效果如何呢？

在CIFAR-10的圖像分類任務中，AdderNet相比當初Bengio等人提出的加法神經(jīng)網(wǎng)絡BNN性能有大幅提升，并且已經(jīng)接近了傳統(tǒng)CNN的結果。

開源代碼

官方的AdderNet基于Python3和PyTorch。

先按照PyTorch的官方文檔準備ImageNet數(shù)據(jù)集，運行程序評估它在驗證集上的效果：

python test.py —data_dir ‘path/to/imagenet_root/’

AdderNet可以在ImageNet數(shù)據(jù)集上達到74.9％的Top-1準確度和91.7％的Top-5準確度。

或者將CIFAR-10數(shù)據(jù)集下載到本地，測試一下它在CIFAR-10上的效果

python test.py —dataset cifar10 —model_dir models/ResNet20-AdderNet.pth —data_dir ‘path/to/cifar10_root/’

不過AdderNet仍需自己訓練，官方表示將很快發(fā)布預訓練模型。

現(xiàn)階段的AdderNet并非沒有缺陷，作者在項目主頁中說，由于AdderNet是用加法過濾器實現(xiàn)的，因此推理速度較慢，需要用CUDA編寫才能提高速度。

這與作者希望提高神經(jīng)網(wǎng)絡運算速度的初衷還有一段距離。

但這篇論文的作者表示，今后還會繼續(xù)加法器神經(jīng)網(wǎng)絡的研究，發(fā)表更多的成果，讓我們一起期待這項研究取得新的進展吧。

華為諾亞實驗室實習生領銜打造

AdderNet這篇文章的一作名叫陳漢亭，畢業(yè)于同濟大學數(shù)學系，現(xiàn)在在北京大學信息科學技術學院攻讀博士學位，同時在華為諾亞方舟實驗室實習。

在碩博連讀的前三年中，他已經(jīng)以一作身份發(fā)表了5篇論文，其中一篇《Data-Free Learning of Student Networks》被ICCV 2019收錄，另外它參與多篇論文還被NeurIPS、IJCAI、ICML等頂會收錄。

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品