一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

PEMN:參數(shù)集約型掩碼網絡

CVer ? 來源:CVer ? 作者:CVer ? 2022-12-15 14:09 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

NeurIPS 2022 | Parameter-Efficient Masking Networks,美國東北大學,羅切斯特理工等,提出參數(shù)集約型掩碼網絡,探索有限數(shù)量隨機數(shù)的表征能力并提升神經網絡儲存和傳輸效率。

為了處理更復雜的任務,近年來神經網絡的規(guī)模也在不斷變大,如何高效的儲存和傳輸神經網絡變得十分重要。另一方面,隨著彩票假說(Lottery Ticket Hypothesis (LTH))的提出,隨機稀疏神經網絡最近展現(xiàn)出很強的潛力,如何利用這種潛力來提高網絡的存儲和傳輸效率也很值得探索。

來自美國東北大學和羅切斯特理工的研究者提出參數(shù)集約型掩碼網絡(Parameter-Efficient Masking Networks (PEMN))。作者首先探索了有限數(shù)量隨機數(shù)生成的隨機網絡的表征能力。實驗表明,即使網絡由有限數(shù)量的隨機數(shù)生成,通過選擇不同的子網絡結構,其依然具有很好的表征能力。通過這種探索性實驗,作者自然地提出使用一組有限數(shù)量隨機數(shù)作為prototype,結合一組mask來表達一個神經網絡。因為有限數(shù)量的隨機數(shù)和二值的mask占用很少的儲存空間,作者以此來提出一種新的思路來進行網絡壓縮。文章已被NeurIPS 2022 接受。代碼已開源。

1a33b5fe-7c3d-11ed-8abf-dac502259ad0.png

Parameter-Efficient Masking Networks

論文地址: https://arxiv.org/abs/2210.06699

論文代碼: https://github.com/yueb17/PEMN

1. 相關研究

MIT研究人員提出彩票假說 Lottery Ticket Hypothesis (ICLR’19):在一個隨機初始化網絡中,存在一個彩票子網絡(winning ticket)在被單獨訓練的情況下達到很好的效果。彩票假說探索了隨機稀疏網絡的可訓練性。Uber研究人員提出Supermask (NeurIPS’19):在一個隨機初始化網絡中,存在一個子網絡,可以直接用來做推斷而不需要訓練。Supermask探索了隨機稀疏網絡的可用性。華盛頓大學研究人員提出Edge-Popup (CVPR’20):通過反向傳播學習子網絡的mask,大幅提升了隨機稀疏網絡的可用性。

2. 研究動機/流程

以上相關研究從不同角度探索了隨機稀疏網絡的潛力,如可訓練性和可用性,其中可用性也可以理解為表征能力。在此工作中,作者感興趣的是由隨機數(shù)生成的神經網絡在不訓練權重的情況下有多強的表征能力。隨著對該問題的探索,作者提出了Parameter-Efficient Masking Networks (PEMN)。自然地,作者運用PEMN為網絡壓縮提供了一種新的思路,并作為一個例子對PEMN的潛在應用場景進行探索。

3. 探索隨機數(shù)構成的神經網絡的表征能力

給定一個隨機網絡,作者選擇Edge-Popup算法在其中選擇子網絡來探索其表征能力。不同的是,相對于對整個網絡進行隨機初始化,作者提出了三種參數(shù)集約型的網絡生成策略來使用一個prototype構建隨機網絡。

One-layer: 選擇網絡中重復結構的權重作為prototype來填充其他的與之結構相同的網絡層。

Max-layer padding (MP): 選擇參數(shù)量最多的網絡層作為prototype并且截斷相應的參數(shù)量來填充其他網絡層。

Random vector padding (RP): 選擇一定長度的隨機向量作為prototype并對其進行復制來填充整個網絡。

1a5d0a6c-7c3d-11ed-8abf-dac502259ad0.png

三種不同的隨機網絡生成策略把網絡中不重復參數(shù)值(unique values)的數(shù)量逐步變小,我們基于不同策略得到的隨機網絡來選擇子網絡,從而探索了有限數(shù)量隨機數(shù)生成的隨機網絡的表征潛力。

1a86ae1c-7c3d-11ed-8abf-dac502259ad0.png

上圖展示了使用ConvMixer 和 ViT 網絡CIFAR10圖像分類的實驗結果。Y軸為準確率,X軸為使用不同策略得到的隨機網絡。隨之X軸的變大,隨機網絡中不重復隨機數(shù)數(shù)量逐漸變小 (RP后的數(shù)字表示相比較于MP,RP中不重復隨機數(shù)數(shù)量的比例)。根據(jù)實驗結果,我們觀察到即使隨機網絡只有非常有限的不重復隨機數(shù)(比如PR_1e-3),依然可以很好的維持選擇出來的子網絡的表征能力。至此,作者通過不同的隨機網絡生成策略,探索了有限數(shù)量隨機數(shù)構成的神經網絡的表征能力并觀察到即使不重復隨機數(shù)非常有限,其對應的隨機網絡依然可以很好地對數(shù)據(jù)進行表征。同時作者基于這些隨機網絡生成策略,結合所得到的子網絡掩碼,提出了Parameter-Efficient Masking Networks(PEMN)這種新的神經網絡類型。

4. 一種新的網絡壓縮思路

本文選擇了神經網路壓縮為例來拓展PEMN的潛在應用。具體來說,文中所提出的不同隨機網絡生成策略可以高效的使用prototype來代表完整的隨機網絡,尤其是最細粒度的random vector padding (RP)策略。作者使用RP策略中的隨機向量prototype和與之對應的一組子網絡掩碼來表示一個隨機網絡。在其中prototype需要保存浮點數(shù)格式,而掩碼只需要保存成二值格式。因為RP中的prototype長度可以很短(因為有限數(shù)量的不重復隨機數(shù)仍有很強的表征能力),所以表示一個神經網絡的開銷會變得很小,即儲存一個長度有限的浮點數(shù)格式的隨機向量和一組二值格式的掩碼。相比較于傳統(tǒng)的稀疏網絡儲存子網絡的浮點值,本文提出了一種新的網絡壓縮思路用來高效的儲存和傳輸神經網絡。

1aa0ec96-7c3d-11ed-8abf-dac502259ad0.png

在上圖中,作者使用PEMN對網絡進行壓縮并與傳統(tǒng)的網絡剪枝方法進行對比。實驗使用ResNet網絡在CIFAR數(shù)據(jù)集做圖像分類任務。我們觀察到,新的壓縮方案表現(xiàn)普遍優(yōu)于傳統(tǒng)的網絡剪枝,尤其是在很高的壓縮率下,PEMN仍然可以維持較好的準確率。

5. 結論

本文受近來隨機網絡展現(xiàn)出來的潛力所啟發(fā),提出不同種參數(shù)集約策略來構建隨機神經網絡,進而探索了在只有有限的不重復隨機數(shù)的情況下所生成的隨機神經網絡的表征潛力,并提出參數(shù)集約型掩碼網絡Parameter-Efficient Masking Networks (PEMN)。作者將PEMN應用到網絡壓縮的場景中探索了其在實際應用方面的潛力并且為網絡壓縮提供了一種新的思路。作者提供了廣泛的實驗,表明了即使隨機網絡中只有非常有限的不重復隨機數(shù),通過子網絡的選擇,其依然有較好的表征能力。此外,相比較于傳統(tǒng)剪枝算法,實驗表明新提出的方法可以取得更好的網絡壓縮效果,驗證了PEMN在該場景下的應用潛力。

審核編輯 :李倩

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 神經網絡
    +關注

    關注

    42

    文章

    4814

    瀏覽量

    103497
  • 算法
    +關注

    關注

    23

    文章

    4708

    瀏覽量

    95302

原文標題:NeurIPS 2022 | PEMN:參數(shù)集約型掩碼網絡

文章出處:【微信號:CVer,微信公眾號:CVer】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    飛凌嵌入式ElfBoard ELF 1板卡-文件系統(tǒng)之配置網絡參數(shù)

    我們可以在系統(tǒng)啟動之后,通過ifconfig命令配置網絡參數(shù)。root@ELF1:~# ifconfig eth0 192.168.0.232root@ELF1:~# ifconfig eth0
    發(fā)表于 07-01 17:49

    手把手教你如何調優(yōu)Linux網絡參數(shù)

    在高并發(fā)網絡服務場景中,Linux內核的默認網絡參數(shù)往往無法滿足需求,導致性能瓶頸、連接超時甚至服務崩潰。本文基于真實案例分析,從參數(shù)解讀、問題診斷到優(yōu)化實踐,手把手教你如何調優(yōu)Lin
    的頭像 發(fā)表于 05-29 09:21 ?194次閱讀

    愛立信如何構建意圖驅動自主網絡

    意圖驅動服務編排與AI相互協(xié)同,正在徹底改變網絡和服務的管理方式。這種協(xié)同究竟會如何革新OSS服務管理方式?又將如何發(fā)掘自動化和可編程網絡的全部潛能?
    的頭像 發(fā)表于 04-12 15:00 ?9409次閱讀
    愛立信如何構建意圖驅動<b class='flag-5'>型</b>自主<b class='flag-5'>網絡</b>

    無法轉換TF OD API掩碼RPGA模型怎么辦?

    無法轉換重新訓練的 TF OD API 掩碼 RPGA 模型,該模型使用以下命令在 GPU 上工作: mo > --saved_model_dir
    發(fā)表于 03-06 06:44

    子網掩碼反運算的步驟和應用

    32位地址,主要用來區(qū)分IP地址中的網絡部分和主機部分。它是由一串連續(xù)的1和連續(xù)的0組成,其中的1表示網絡部分,0用來表示主機部分。子網掩碼與IP地址一起使用,用于確定IP地址的所屬網絡
    的頭像 發(fā)表于 12-09 09:27 ?626次閱讀

    一文分清IP地址、子網和子網掩碼的關系

    大家在進行IPv4地址配置時都看到過“子網掩碼”這樣的參數(shù)名,許多小伙伴都會疑惑這是個啥?有什么用呢? 下面帶領大家認識認識子網掩碼以及跟其密不可分的子網! 1 IP地址、子網和子網掩碼
    的頭像 發(fā)表于 12-07 10:20 ?3181次閱讀
    一文分清IP地址、子網和子網<b class='flag-5'>掩碼</b>的關系

    卷積神經網絡參數(shù)調整方法

    卷積神經網絡因其在處理具有空間層次結構的數(shù)據(jù)時的卓越性能而受到青睞。然而,CNN的成功很大程度上依賴于其參數(shù)的合理設置。參數(shù)調整是一個復雜的過程,涉及到多個超參數(shù)的選擇和優(yōu)化。
    的頭像 發(fā)表于 11-15 15:10 ?1201次閱讀

    什么是小水電集約化管理?小水電集約化管理實現(xiàn)的價值

    小水電集約化管理,是指在集控運行中心通過網絡通道實現(xiàn)遠程對小水電站集群進行遠程控制、統(tǒng)一規(guī)范運行。以區(qū)域、流域為單元,集中相關資源和業(yè)務,專業(yè)化分工,實現(xiàn)區(qū)域、流域內水電站群集控運維、專業(yè)化的統(tǒng)一運營管理。
    的頭像 發(fā)表于 11-12 14:26 ?967次閱讀
    什么是小水電<b class='flag-5'>集約</b>化管理?小水電<b class='flag-5'>集約</b>化管理實現(xiàn)的價值

    N公頭性能參數(shù)是多少

    德索工程師說道N公頭,即N系列射頻同軸連接器的一種,因其獨特的設計、優(yōu)質的材料選擇以及嚴格的制造工藝,在射頻(RF)和微波通信系統(tǒng)中展現(xiàn)出卓越的性能。以下是關于N公頭性能參數(shù)的詳細介紹
    的頭像 發(fā)表于 10-31 09:40 ?1130次閱讀
    N<b class='flag-5'>型</b>公頭性能<b class='flag-5'>參數(shù)</b>是多少

    Linux ifconfig網絡參數(shù)詳解

    ifconfig 主要是可以手動啟動、觀察與修改網絡接口的相關參數(shù)。
    的頭像 發(fā)表于 10-24 17:31 ?1266次閱讀

    日本東京ip和子網掩碼

    日本東京的IP地址和子網掩碼是緊密相連的,它們共同決定了網絡中設備的通信方式。下面rak小編將詳細介紹日本東京的IP地址和子網掩碼。
    的頭像 發(fā)表于 10-12 10:13 ?829次閱讀

    電流反饋運放與電壓反饋運放

    ,選擇具有適當增益帶寬積(GBW)、轉換速率(SR)和輸入/輸出阻抗等參數(shù)的CFA器件。 (2)設計輸入和輸出網絡:根據(jù)所需的增益、帶寬和穩(wěn)定性等要求,設計合適的輸入和輸出網絡。這可能包括電阻、電容和電感
    發(fā)表于 09-10 09:47

    IP地址與子網劃分

    子網的劃分,實際上就是設計子網掩碼的過程,它指的是指將一個給定的IP網絡地址空間劃分為更小的子網絡。 在子網掩碼中用1和0來分別網絡號和主機
    的頭像 發(fā)表于 09-06 09:46 ?800次閱讀

    嵌入式學習-常見的shell命令之網絡相關命令

    配給任何主機,僅用作廣播地址(三)IP地址127.0.0.1為回環(huán)結構,用于本地進行軟件測試4)子網掩碼子網掩碼是一個32位的二進制地址,用來屏蔽原來網絡地址的劃分情況,從而獲得一個范圍小的,可以實際使用
    發(fā)表于 08-21 09:41

    常見的shell命令之網絡相關命令

    配給任何主機,僅用作廣播地址(三)IP地址127.0.0.1為回環(huán)結構,用于本地進行軟件測試4)子網掩碼子網掩碼是一個32位的二進制地址,用來屏蔽原來網絡地址的劃分情況,從而獲得一個范圍小的,可以實際使用
    發(fā)表于 08-20 09:50