一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

告別調(diào)參煉丹,使用隨機共享權(quán)重足矣!

2E1k_gh_baf5b3c ? 來源:陳年麗 ? 2019-08-28 17:21 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

谷歌大腦備受關(guān)注的“權(quán)重無關(guān)神經(jīng)網(wǎng)絡”終于開源了!其關(guān)鍵思想是通過不再強調(diào)權(quán)重來搜索網(wǎng)絡結(jié)構(gòu),僅使用隨機共享的權(quán)重,也可以執(zhí)行各種任務的神經(jīng)網(wǎng)絡。終于可以不用調(diào)參煉丹了嗎?快來復現(xiàn)看看!

神經(jīng)網(wǎng)絡訓練中 “權(quán)重” 有多重要不言而喻。但谷歌前段時間發(fā)表的研究表明,即使拋棄神經(jīng)網(wǎng)絡權(quán)重訓練,使用隨機共享權(quán)重,也可以執(zhí)行各種任務。

他們提出一種新的神經(jīng)網(wǎng)絡結(jié)構(gòu)的搜索方法——權(quán)重無關(guān)神經(jīng)網(wǎng)絡(Weight Agnostic Neural Networks,WANN),其關(guān)鍵思想是通過不再強調(diào)權(quán)重來搜索網(wǎng)絡結(jié)構(gòu)。

今天,該研究的兩位作者、谷歌大腦學生研究員 Adam Gaier和研究科學家David Ha在Google AI博客上撰文,介紹了該研究的核心思想和重要細節(jié),并宣布WANN的代碼已經(jīng)在GitHub上開源,以便讓廣泛的研究社區(qū)重現(xiàn)WANN實驗。

告別調(diào)參煉丹,使用隨機共享權(quán)重足矣!

當訓練神經(jīng)網(wǎng)絡完成一項給定任務時,無論是圖像分類還是強化學習,通常都需要調(diào)優(yōu)與網(wǎng)絡中每個連接相關(guān)的一組權(quán)重。另一種已經(jīng)取得實質(zhì)性進展的成功的神經(jīng)網(wǎng)絡創(chuàng)建方法是神經(jīng)架構(gòu)搜索,它利用人工設(shè)計的組件(如卷積網(wǎng)絡組件或transformer blocks)來構(gòu)建神經(jīng)網(wǎng)絡架構(gòu)。

研究表明,利用這些組件構(gòu)建的神經(jīng)網(wǎng)絡結(jié)構(gòu),如深度卷積網(wǎng)絡,對圖像處理任務具有很強的歸納偏差,甚至可以在權(quán)重隨機初始化的情況下執(zhí)行。雖然神經(jīng)架構(gòu)搜索提供了一些新的方法,可以為當前的任務域安排具有已知歸納偏差的手工工程組件,但在自動發(fā)現(xiàn)具有此類歸納偏差的新神經(jīng)網(wǎng)絡架構(gòu)(用于不同的任務域)方面幾乎沒有進展。

我們可以用一個先天和后天的例子作為類比。正如生物學中某些從出生起就具有反捕食行為的物種一樣,他們無需學習就能執(zhí)行復雜的運動和感官任務,或許我們可以構(gòu)建一個不需要訓練就能很好地完成任務的神經(jīng)網(wǎng)絡。當然,這些自然物種(作為類比,人工神經(jīng)網(wǎng)絡)通過訓練可以得到進一步的改善,但它們即使不學習也能執(zhí)行任務的能力表明,它們包含使它們非常適合于這些任務的偏差。

在“權(quán)重無關(guān)神經(jīng)網(wǎng)絡”(WANN)論文中,我們提出了搜索具有這類偏差的網(wǎng)絡的第一步:即使使用隨機共享的權(quán)重,也可以執(zhí)行各種任務的神經(jīng)網(wǎng)絡架構(gòu)。

我們在這項工作中的動機是,在不學習任何權(quán)重參數(shù)的情況下,僅神經(jīng)網(wǎng)絡架構(gòu)能在多大程度上編碼給定任務的解決方案。通過探索這樣的神經(jīng)網(wǎng)絡架構(gòu),我們提出了一種無需學習權(quán)重參數(shù)就能在其環(huán)境中運行良好的智能體。

此外,為了促進該領(lǐng)域的進步,我們還開放了源代碼,以便更廣泛的研究社區(qū)重現(xiàn)我們的WANN實驗。

左圖:一個手工設(shè)計的、完全連接的深度神經(jīng)網(wǎng)絡,有2760個權(quán)重連接。利用一種學習算法,我們可以求解2760個權(quán)重參數(shù)的集合,使該網(wǎng)絡能夠執(zhí)行一個雙足步行任務(BipedalWalker-v2)。

右圖:一個權(quán)重無關(guān)的神經(jīng)網(wǎng)絡架構(gòu),只有44個連接,但同樣能夠執(zhí)行雙足步行任務。與完全連接網(wǎng)絡不同的是, WANN仍然可以執(zhí)行任務,而不需要訓練每個連接的權(quán)重參數(shù)。實際上,為了簡化訓練,WANN被設(shè)計成在每個權(quán)重連接的值相同或共享時執(zhí)行,甚至就算共享權(quán)重參數(shù)是隨機采樣的,也會起作用。

搜索權(quán)重無關(guān)神經(jīng)網(wǎng)絡

我們從一組最小的神經(jīng)網(wǎng)絡架構(gòu)候選對象開始,每個候選對象只有很少的連接,并使用一個完善的拓撲搜索算法(NEAT),通過逐個地添加單個連接和單個節(jié)點來演化架構(gòu)。

WANN背后的關(guān)鍵思想是通過不再強調(diào)權(quán)重來搜索架構(gòu)。與傳統(tǒng)的神經(jīng)架構(gòu)搜索方法不同,新架構(gòu)的所有權(quán)重參數(shù)都需要使用學習算法進行訓練,我們采用了一種更簡單、更有效的方法。

在搜索過程中,首先在每次迭代中為所有候選架構(gòu)分配一個共享權(quán)重值,然后進行優(yōu)化,以便在更寬的共享權(quán)重值范圍內(nèi)執(zhí)行良好。

用于搜索網(wǎng)絡拓撲空間的運算符

左:一個最小的網(wǎng)絡拓撲結(jié)構(gòu),輸入和輸出僅部分連接。

中間:網(wǎng)絡的改變有三種方式:

(1)插入節(jié)點:通過分割現(xiàn)有連接插入新節(jié)點。

(2)添加連接:通過連接兩個先前未連接的節(jié)點來添加一個新連接。

(3)更改激活:重新分配隱藏節(jié)點的激活函數(shù)。

右:可能的激活函數(shù)(線性,階躍,正弦, 余弦,高斯,tanh, sigmoid,inverse,絕對值,ReLU)

除了探索一系列與權(quán)重無關(guān)的神經(jīng)網(wǎng)絡之外,重要的是還要尋找只需要復雜到它們所需的程度的網(wǎng)絡架構(gòu)。我們利用多目標優(yōu)化技術(shù)( multi-objective optimization),同時對網(wǎng)絡的性能和復雜度進行優(yōu)化。

權(quán)重無關(guān)神經(jīng)網(wǎng)絡搜索的概述,及其相應的網(wǎng)絡拓撲空間搜索算子。

訓練WANN架構(gòu)

與傳統(tǒng)網(wǎng)絡不同的是,我們可以通過簡單地找到最佳的單個共享權(quán)重參數(shù)來訓練WANN,從而最大限度地提高其性能。在下面的例子中,可以看到我們的架構(gòu)(在某種程度上)使用恒定的權(quán)重來完成一個 swing-up cartpole 任務:

WANN在不同的權(quán)重參數(shù)下執(zhí)行 swing-up cartpole 任務,也使用微調(diào)的權(quán)重參數(shù)。

正如我們在上面的圖中看到的,雖然WANN可以使用一系列共享權(quán)重參數(shù)來執(zhí)行其任務,但是其性能仍然無法與學習每個連接的權(quán)重的網(wǎng)絡相比較。

如果我們想進一步提高它的性能,我們可以使用WANN架構(gòu)和最佳共享權(quán)重作為起點,使用學習算法微調(diào)每個連接的權(quán)重,就像通常訓練神經(jīng)網(wǎng)絡的方法一樣。以網(wǎng)絡架構(gòu)的權(quán)重無關(guān)特性為出發(fā)點,通過學習微調(diào)網(wǎng)絡的性能,可能有助于為理解動物如何學習提供有洞察力的類比。

通過在性能和網(wǎng)絡簡單性方面的多目標優(yōu)化,我們的方法找到了一個簡單的WANN,用于賽車任務,它不需要顯式地訓練網(wǎng)絡的權(quán)重。

使用隨機權(quán)重的網(wǎng)絡架構(gòu)不僅易于訓練,還具有其他優(yōu)勢。例如,通過使用相同WANN架構(gòu)的副本,但是為WANN的每個副本都分配不同的權(quán)重值,我們可以為同一任務創(chuàng)建多個不同模型的集合。這種集合通常比單個模型能獲得更好的性能。下面是一個MNIST分類器處理隨機權(quán)重的例子,可以說明這一點:

MNIST分類器進化為處理隨機權(quán)重。

具有隨機初始化的傳統(tǒng)網(wǎng)絡在 MNIST 上的精度約為 10%,但這種隨機權(quán)重的特殊網(wǎng)絡架構(gòu)在 MNIST 上的精度 (》 80%) 明顯優(yōu)于隨機初始化網(wǎng)絡。當使用一組WANNs,為每個WANN分配一個不同的共享權(quán)重時,精度提高到 》 90%。

即使不使用集成方法,也可以將網(wǎng)絡中的權(quán)重值壓縮到一個網(wǎng)絡,從而使網(wǎng)絡能夠快速調(diào)整。快速調(diào)整權(quán)重的能力可能在持續(xù)的終身學習(lifelong learning)中很有用,在這種學習中,agent在整個生命周期中獲得、適應和轉(zhuǎn)移技能。這使得WANN特別適合利用 Baldwin效應, Baldwin效應是一種進化壓力,即獎勵那些傾向于學習有用行為的個體,而不會陷入“l(fā)earning to learn”這個昂貴的計算陷阱。

結(jié)論

我們希望這項工作可以作為一個墊腳石,幫助發(fā)現(xiàn)新的基礎(chǔ)神經(jīng)網(wǎng)絡組件,如卷積網(wǎng)絡,其發(fā)現(xiàn)和應用已經(jīng)在深度學習領(lǐng)域取得了令人難以置信的進展。自卷積神經(jīng)網(wǎng)絡被發(fā)現(xiàn)以來,研究界可用的計算資源顯著增加。如果我們將這些資源投入到自動發(fā)現(xiàn)神經(jīng)網(wǎng)絡架構(gòu)中,并希望實現(xiàn)網(wǎng)絡架構(gòu)的突破性改進,那么我們相信,使用新的構(gòu)建塊來搜索也是值得的。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 谷歌
    +關(guān)注

    關(guān)注

    27

    文章

    6231

    瀏覽量

    108147
  • 神經(jīng)網(wǎng)絡

    關(guān)注

    42

    文章

    4814

    瀏覽量

    103631

原文標題:“互聯(lián)網(wǎng) + 海關(guān)”背景下,企業(yè)關(guān)務系統(tǒng)的選擇和應用以及與合規(guī)內(nèi)控的結(jié)合

文章出處:【微信號:gh_baf5b3c5005b,微信公眾號:通關(guān)機器人】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    微電機關(guān)鍵零部件制造誤差對其質(zhì)量的影響權(quán)重分析

    質(zhì)量影響的權(quán)值,最后綜合計算出微電機關(guān)鍵零部件制造誤差對微電機質(zhì)量影響的權(quán)重。該方法能很好解決不存在尺寸鏈或復雜尺寸鏈關(guān)系的零部件制造誤差對產(chǎn)品質(zhì)量影響的權(quán)值計算問題。 純分享帖,需要者可點擊附件免費
    發(fā)表于 06-23 07:16

    告別延遲!Ethernetip轉(zhuǎn)modbustcp網(wǎng)關(guān)在熔煉車間監(jiān)控的極速時代

    告別延遲!Ethernetip轉(zhuǎn)modbustcp網(wǎng)關(guān)在熔煉車間監(jiān)控的極速時代
    的頭像 發(fā)表于 05-20 19:20 ?143次閱讀
    <b class='flag-5'>告別</b>延遲!Ethernetip轉(zhuǎn)modbustcp網(wǎng)關(guān)在熔煉車間監(jiān)控的極速時代

    HJ55系列三相變頻電源 電壓可分調(diào)可統(tǒng)調(diào)

    HJ55系列三相變頻電源是一種高性能的電源設(shè)備,廣泛應用于工業(yè)、科研、測試等領(lǐng)域。它具備分調(diào)和統(tǒng)調(diào)功能,能夠滿足不同場景下的電壓和頻率調(diào)節(jié)需求。以下是關(guān)于HJ55系列三相變頻電源的分調(diào)和統(tǒng)調(diào)功能
    的頭像 發(fā)表于 03-26 11:55 ?712次閱讀
    HJ55系列三相變頻電源 電壓可分<b class='flag-5'>調(diào)</b>可統(tǒng)<b class='flag-5'>調(diào)</b>

    AI的“隨機性”挑戰(zhàn):它們比人類更“不隨機”?

    你有沒有想過,人類真的能做出完全隨機的選擇嗎?答案可能出乎你的意料。事實上,人類天生就不擅長“隨機”,我們總能在看似無序的事物中發(fā)現(xiàn)規(guī)律,甚至在本該隨機的場景中創(chuàng)造出模式。這種“偽隨機
    的頭像 發(fā)表于 02-20 13:11 ?627次閱讀
    AI的“<b class='flag-5'>隨機</b>性”挑戰(zhàn):它們比人類更“不<b class='flag-5'>隨機</b>”?

    BP神經(jīng)網(wǎng)絡的調(diào)技巧與建議

    BP神經(jīng)網(wǎng)絡的調(diào)是一個復雜且關(guān)鍵的過程,涉及多個超參數(shù)的優(yōu)化和調(diào)整。以下是一些主要的調(diào)技巧與建議: 一、學習率(Learning Rate) 重要性 :學習率是BP神經(jīng)網(wǎng)絡中最重要
    的頭像 發(fā)表于 02-12 16:38 ?815次閱讀

    hyper-v共享,Hyper-V 共享:Hyper-V的資源共享設(shè)置

    的解決方案。今天就為大家介紹Hyper-V共享:Hyper-V的資源共享設(shè)置。 ? ?在Hyper-V虛擬化環(huán)境中,資源共享是實現(xiàn)高效管理和靈活部署的關(guān)鍵功能之一。Hyper-V提供了多種資源
    的頭像 發(fā)表于 02-07 10:26 ?1021次閱讀
    hyper-v<b class='flag-5'>共享</b>,Hyper-V <b class='flag-5'>共享</b>:Hyper-V的資源<b class='flag-5'>共享</b>設(shè)置

    LD2410B/C新手必看攻略! 測試教程、模塊調(diào)一文詳解~

    關(guān)于LD2410B/C那些你不得不知道的事?免費申樣、接線教程、參數(shù)解析、APP調(diào)教程、上位機調(diào)教程、常見異常情況自檢等等內(nèi)容,一文匯總~不管是萌新小白還是資深玩家,都可以快速入門
    的頭像 發(fā)表于 02-05 18:09 ?1574次閱讀
    LD2410B/C新手必看攻略! 測試教程、模塊<b class='flag-5'>調(diào)</b><b class='flag-5'>參</b>一文詳解~

    多通道相復雜調(diào)制信號產(chǎn)生系統(tǒng)

    多通道相復雜調(diào)制信號產(chǎn)生系統(tǒng)在無線通信MIMO、雷達接收系統(tǒng)測試、多目標雷達信號模擬和DBF算法研究應用中經(jīng)常會用到多通道相復雜調(diào)制信號。MIMO無線通信系統(tǒng)中,用到兩個或者兩個以上的天線,通過
    的頭像 發(fā)表于 12-13 17:38 ?888次閱讀
    多通道相<b class='flag-5'>參</b>復雜調(diào)制信號產(chǎn)生系統(tǒng)

    多通道相且相位可調(diào)射頻信號產(chǎn)生系統(tǒng)

    多通道相且相位可調(diào)信號產(chǎn)生系統(tǒng)隨著無線通信、雷達、頻譜管理等技術(shù)的快速發(fā)展,精密信號處理對多通道相信號源的需求顯著增長。多通道相信號產(chǎn)生技術(shù)能夠在多個通道間實現(xiàn)相位精確同步調(diào)控,是相控陣雷達
    的頭像 發(fā)表于 12-05 01:05 ?1024次閱讀
    多通道相<b class='flag-5'>參</b>且相位可調(diào)射頻信號產(chǎn)生系統(tǒng)

    用VESC電調(diào)代替STLink給VESC電調(diào)刷固件 可刷所有的基于VESC的電調(diào)固件

    就只能是有程序的電調(diào)接電源供電,如果兩個電調(diào)的輸入都接了輸入電源,那兩個的VCC需要斷開。 三、使用VESC TOOL工具刷固件3.1、打開VESC調(diào)工具VESC TOOL,點擊co
    發(fā)表于 12-01 21:31

    循環(huán)神經(jīng)網(wǎng)絡的常見調(diào)技巧

    循環(huán)神經(jīng)網(wǎng)絡(Recurrent Neural Networks,簡稱RNN)是一種用于處理序列數(shù)據(jù)的深度學習模型,它能夠捕捉時間序列中的動態(tài)特征。然而,RNN的訓練往往比傳統(tǒng)的前饋神經(jīng)網(wǎng)絡更具挑戰(zhàn)性。 1. 選擇合適的RNN變體 Vanilla RNN :最基本的RNN結(jié)構(gòu),但容易遇到梯度消失或梯度爆炸的問題。 LSTM(Long Short-Term Memory) :通過門控機制解決了梯度消失的問題,適合處理長序列。 GRU(Gated Recurrent Unit) :LSTM的簡化版本,參數(shù)更少,訓練更快,但在某些情況下可能不如LSTM表現(xiàn)
    的頭像 發(fā)表于 11-15 10:13 ?759次閱讀

    LSTM神經(jīng)網(wǎng)絡的調(diào)技巧

    長短時記憶網(wǎng)絡(Long Short-Term Memory, LSTM)是一種特殊的循環(huán)神經(jīng)網(wǎng)絡(RNN),它能夠?qū)W習長期依賴信息。在實際應用中,LSTM網(wǎng)絡的調(diào)是一個復雜且關(guān)鍵的過程,直接影響
    的頭像 發(fā)表于 11-13 10:01 ?1863次閱讀

    MMC DLL調(diào)優(yōu)

    電子發(fā)燒友網(wǎng)站提供《MMC DLL調(diào)優(yōu).pdf》資料免費下載
    發(fā)表于 10-11 11:48 ?0次下載
    MMC DLL<b class='flag-5'>調(diào)</b>優(yōu)

    告別接線!手機一鍵調(diào),Rd-Kit雷達藍牙底板,讓雷達模組使用更簡單

    Rd-Kit是由深圳市安信可科技有限公司開發(fā)的雷達藍牙底板。該藍牙底板核心處理器芯片PHY6252(SSOP24),是一款高集成度的低功耗藍牙系統(tǒng)級芯片(SoC),安信可對其進行了二次開發(fā): 硬件上適配了 Rd-02B、Rd-02C、Rd-03、Rd-03D、Rd-03E、Rd-03L 和 Rd-04 共七款雷達 ,專為雷達的調(diào)試場景進行設(shè)計。 軟件上目前已適配Rd-03、Rd-03D、Rd-03E和Rd-04四款雷達 ,其中Rd-03有70cm分辨率的固件和24cm分辨率的固件,Rd-03E有精準測距固件和手勢識別固件。 正面 背面 01、硬件準備 02、軟
    的頭像 發(fā)表于 08-09 11:29 ?912次閱讀
    <b class='flag-5'>告別</b>接線!手機一鍵<b class='flag-5'>調(diào)</b><b class='flag-5'>參</b>,Rd-Kit雷達藍牙底板,讓雷達模組使用更簡單

    在用機器人與未來機器人并行推進的權(quán)重關(guān)系

    在用機器人與未來機器人并行推進的權(quán)重關(guān)系
    的頭像 發(fā)表于 08-01 08:14 ?739次閱讀
    在用機器人與未來機器人并行推進的<b class='flag-5'>權(quán)重</b>關(guān)系