一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

FAIR何愷明團隊近日發(fā)表神經結構搜索NAS方面的最新力作

DPVg_AI_era ? 來源:lp ? 2019-04-19 14:34 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

FAIR何愷明團隊近日發(fā)表神經結構搜索NAS方面的最新力作,通過隨機連接的神經網絡,探索了更多樣化的連接模式,所提出的RandWire網絡ImageNet基準測試中獲得了有競爭力的準確度。

用于圖像識別的神經網絡經過大量的人工設計,已經從簡單的鏈狀模型發(fā)展到具有多個連接路徑的結構。ResNets和DenseNets的成功在很大程度上歸功于它們創(chuàng)新的連接規(guī)劃。

目前,神經結構搜索(NAS)的研究正在探索連接(wiring)與操作類型(operation types)的聯(lián)合優(yōu)化,然而,由于可能的連接空間受到限制,盡管采用了神經結構搜索,優(yōu)化仍然是由人工設計驅動的。

近日,F(xiàn)AIR何愷明等人發(fā)表最新論文,探討了在圖像識別中NAS方法的優(yōu)化。研究人員通過隨機連接的神經網絡,探索了更多樣化的連接模式。

論文地址:

https://arxiv.org/pdf/1904.01569.pdf

作者首先定義了一個隨機網絡生成器(network generator)的概念,該生成器封裝了整個網絡生成過程,從而提供了NAS和隨機連接網絡的統(tǒng)一視圖。

然后,研究人員采用三種經典的隨機圖模型來生成網絡的隨機連接圖。

實驗結果令人驚訝:這些隨機生成器生成的網絡實例在ImageNet基準測試中獲得了有競爭力的準確度。

研究人員表示,這些結果表明,專注于設計更好的網絡生成器的研究可以通過探索更少約束的搜索空間,為新設計提供更多空間,從而帶來新的突破。

不過,該研究被指其思想早已在2013年PCA-Net論文中提出過,在算法設計思想方面沒有本質的創(chuàng)新。

何愷明等人的這一新研究到底意義如何?本文對這篇論文進行了譯介:

研究概述:網絡生成器的設計很重要

今天我們所稱的深度學習是從連接主義方法發(fā)展起來的,這一范式反映了這樣一種假設,即計算網絡的連接方式對構建智能機器至關重要。

與這一觀點相呼應的是,計算機視覺領域的最新進展是由使用鏈狀連接的模型向更精細的連接模式(如ResNet和DenseNet)的轉變所驅動的,這些連接模式之所以有效,在很大程度上是因為它們的連接方式。

在這一趨勢的推進中,神經結構搜索(neural architecture search, NAS)已經成為聯(lián)合搜索連接模式和執(zhí)行操作方式的一個有前景的方向。NAS方法專注于搜索,同時隱式地依賴于一個重要但常常被忽視的組件——網絡生成器(network generator)。

NAS網絡生成器定義了一系列可能的連接模式,并根據(jù)可學習的概率分布對網絡進行采樣。然而,就像ResNet和DenseNet中的連接模式一樣,NAS網絡生成器是手工設計的,允許的連接模式的空間被限制在所有可能的圖的一個小的子集中。從這個角度來看,我們會問:如果我們放開這種約束,并設計新的網絡生成器,會發(fā)生什么?

我們通過隨機網絡生成器采樣的隨機連接神經網絡來探討這個問題,其中人工設計的隨機過程定義了生成。

圖1:隨機連接網絡的計算圖

我們使用了三個經典的隨機圖模型:Erdos-R?enyi (ER),Barabasi-Albert (BA),以及Watts-Strogatz (WS)模型。

如圖1所示,隨機連接網絡的三個實例在ImageNet基準測試中分別達到79.1%、79.1%和79.0%的精度,超過了ResNet-50的77.1%。

為了定義完整的網絡,我們將一個隨機圖轉換成一個有向無環(huán)圖(DAG),并應用從節(jié)點到其函數(shù)角色(例如,到相同類型的卷積)的一個簡單映射。

結果令人驚訝:這些隨機生成器的幾個變體在ImageNet上產生了準確率上具有競爭力的網絡。

使用WS模型的最佳生成器生成的多個網絡性能優(yōu)于或可與完全手工設計的同類網絡和通過各種神經結構搜索方法找到的網絡相媲美。

我們還觀察到,對于同一生成器生成的不同隨機網絡,精度的方差較低,但不同生成器之間存在明顯的精度差距。這些觀察結果表明,網絡生成器的設計很重要。

最后,我們的工作表明,從設計單個網絡到設計網絡生成器的新過渡是可能的,類似于如何從設計特征過渡到設計學習特征的網絡。

我們建議設計新的網絡生成器來生成用于搜索的新模型家族,而不是主要關注使用固定生成器進行搜索。設計的網絡生成器的重要性還意味著機器學習尚未實現(xiàn)自動化——底層的人工設計只是從網絡工程轉變到網絡生成器工程(network generator engineering)。

研究方法

接下來介紹網絡生成器的概念,這是隨機連接神經網絡的基礎。

網絡生成器(network generator)

我們定義一個網絡生成器為從參數(shù)空間Θ到神經網絡結構空間N的一個映射g,表示為g:Θ→N。對于一個給定的θ∈Θ,g(θ)返回一個神經網絡實例n∈N。N通常是一組相關網絡,例如VGG nets、ResNets或DenseNets。

生成器g決定了計算圖的連接方式。

隨機連接神經網絡(Randomly Wired Neural Networks)

對NAS的分析表明,網絡生成器是人工設計的,并且是人類知識的先驗編碼。網絡生成器的設計很可能起了相當大的作用,如果是這樣的話,目前的方法還沒有實現(xiàn)“AutoML”,仍然需要大量的人工。

為了研究生成器設計的重要性,僅比較相同NAS生成器的不同優(yōu)化器是不夠的;有必要研究新的網絡生成器,它們與NAS生成器有本質的不同。

這就引出了我們對隨機連接神經網絡的探索。也就是說,我們將定義網絡生成器,這些生成器生成具有隨機圖的網絡,受不同的人類特定先驗影響。

我們在研究中使用了三個經典的隨機圖模型(如上文所述)。生成隨機連接網絡的方法涉及以下概念:

生成通用的圖(general graphs)。

網絡生成器首先生成一個general graph,包含一組節(jié)點和連接節(jié)點的邊,而不受限于圖和神經網絡的對應關系。這允許我們自由地使用圖理論中的任意通用圖生成器(ER/BA/WS)。一旦生成一個圖,它就被映射到一個可計算的神經網絡。

邊操作(Edge operations)。

假設生成的圖是有方向的,我們定義邊是數(shù)據(jù)流,即有向邊將數(shù)據(jù)(張量)從一個節(jié)點發(fā)送到另一個節(jié)點。

節(jié)點操作(Node operations)。

有向圖中的節(jié)點可以具有一些輸入邊和一些輸出邊。如圖2所示。

圖2:節(jié)點操作

輸入和輸出節(jié)點。

到目前為止,即使給定邊/節(jié)點操作,通用圖也不是一個有效的神經網絡,因為它可能有多個輸入節(jié)點和多個輸出節(jié)點。對于典型的神經網絡,如圖像分類,最好有一個單一的輸入和輸出。我們應用了一個簡單的后處理步驟。

階段(Stages)。

由于具有唯一的輸入和輸出節(jié)點,一個圖就足以表示一個有效的神經網絡。然而,特別是在圖像分類中,始終保持完整輸入分辨率的網絡是不可取的。通常的方法是將網絡劃分為逐步向下采樣特征映射的階段。

表1:RandWire架構

表1總結了我們實驗中使用的隨機連接神經網絡,稱為RandWire。網絡以一個分類器輸出結束(表1,最后一行)。

圖1顯示了三個隨機連接網絡樣本的完整計算圖。

實驗和結果

我們對ImageNet 1000類分類任務進行了實驗。訓練在~1.28M圖像的訓練集上進行,并在50K驗證圖像上進行測試。

實驗結果如下:

隨機生成器

圖3

圖3比較了小型計算環(huán)境中不同生成器的結果:每個RandWire網絡有~580M FLOPs。

圖4

圖4顯示了每個生成器的一個示例圖。圖生成器由隨機圖模型(ER/BA/WS)及其參數(shù)集指定,如ER(0.2)。我們觀察到:

所有隨機生成器在所有5個隨機網絡實例上都提供良好的準確度,而且它們沒有一個不收斂。

此外,隨機網絡實例之間的差異很小。圖3中的幾乎所有隨機生成器的標準偏差(std)都為0.2 ~ 0.4%。

Graph damage.

我們通過隨機移除一個節(jié)點或邊來探索Graph damage。

圖5

當刪除邊時,我們評估了精度損失與該邊的目標節(jié)點的輸入程度(圖5,底部)。

節(jié)點操作

圖6

圖6顯示了圖3中列出的每個生成器的平均精度。

結果比較

小型計算設置

表2

表2比較了在較小計算條件下的結果,這是現(xiàn)有NAS論文中研究的一種常見設置

表3

表3比較了RandWire與ResNet和ResNeXt在與ResNet-50/101類似的FLOPs的情況下的性能。RandWire的平均準確率分別比ResNet50和ResNet-101高1.9%和1.3%,比ResNeXt高0.6%。

更大的計算條件

表4

表4比較了在更大計算條件下的結果

COCO對象檢測

最后,我們報告了通過微調網絡進行COCO對象檢測的結果。我們使用Faster R-CNN和FPN作為目標探測器。

表5

表5比較了對象檢測結果。觀察到的趨勢與表3中的ImageNet實驗相似。這些結果表明,我們的隨機連接網絡學習到的特征也可以遷移。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 神經網絡
    +關注

    關注

    42

    文章

    4814

    瀏覽量

    103697
  • NAS
    NAS
    +關注

    關注

    11

    文章

    302

    瀏覽量

    113613
  • 深度學習
    +關注

    關注

    73

    文章

    5561

    瀏覽量

    122811

原文標題:何愷明團隊神經結構搜索最新力作:設計隨機連接網絡,效果超ResNet

文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    公司在機器人全產業(yè)鏈接會 FAIR plus 2025 的精彩呈現(xiàn)

    公司在機器人全產業(yè)鏈接會 FAIR plus 2025 的精彩呈現(xiàn)
    的頭像 發(fā)表于 05-07 11:14 ?218次閱讀
    公司在機器人全產業(yè)鏈接會 <b class='flag-5'>FAIR</b> plus 2025 的精彩呈現(xiàn)

    上汽奧迪攜兩大全新力作亮相2025上海車展

    近日,第二十一屆上海國際車展正式開幕,上汽奧迪攜兩大全新力作——A5L Sportback、奧迪 E5 Sportback首次亮相車展,與A7L、Q6等明星陣容齊聚5.1號館奧迪聯(lián)合展臺。立足奧迪
    的頭像 發(fā)表于 04-27 10:35 ?365次閱讀

    晶豐源胡黎強:并購要關注人才、技術、產品和客戶等方面的協(xié)同

    對于半導體企業(yè)來說,并購是企業(yè)發(fā)展的重要途徑之一。通過并購,企業(yè)能夠迅速整合前沿技術專利與研發(fā)團隊,突破細分領域的技術瓶頸;通過并購,企業(yè)得以實現(xiàn)技術協(xié)同升級,縮短研發(fā)周期;通過并購,企業(yè)能夠開展
    發(fā)表于 03-16 14:59 ?416次閱讀

    BP神經網絡的網絡結構設計原則

    BP(back propagation)神經網絡是一種按照誤差逆向傳播算法訓練的多層前饋神經網絡,其網絡結構設計原則主要基于以下幾個方面: 一、層次
    的頭像 發(fā)表于 02-12 16:41 ?747次閱讀

    德賽電池榮膺仲高新區(qū)三項榮譽

    近日,仲高新區(qū)舉行高質量發(fā)展大會暨優(yōu)秀企業(yè)授牌活動,旨在表彰2024年度為仲高新區(qū)經濟發(fā)展作出杰出貢獻的優(yōu)秀企業(yè),激勵更多企業(yè)創(chuàng)新發(fā)展,共同推動區(qū)域經濟的繁榮與進步。區(qū)領導、園區(qū)、鎮(zhèn)(街道)領導、區(qū)直相關部門領導以及各企業(yè)代
    的頭像 發(fā)表于 02-12 09:27 ?485次閱讀

    字節(jié)跳動否認趙加盟及自研手機傳聞

    月7日正式發(fā)表聲明進行回應。公司方面明確表示,關于趙加盟字節(jié)跳動的消息并不屬實,公司并未與趙就加盟事宜進行過任何接觸或談判。這一聲迅速
    的頭像 發(fā)表于 02-10 09:12 ?580次閱讀

    惠州隆利榮獲2024年仲高新區(qū)優(yōu)秀企業(yè)經濟突出貢獻獎

    近日,在仲高新區(qū)高質量發(fā)展大會暨優(yōu)秀企業(yè)授牌活動中,公司全資子公司惠州市隆利科技發(fā)展有限公司,榮獲2024年仲高新區(qū)優(yōu)秀企業(yè)經濟突出貢獻獎。
    的頭像 發(fā)表于 02-07 11:30 ?680次閱讀

    王欣然教授團隊提出基于二維材料的高效稀疏神經網絡硬件方案

    two-dimensional semiconductor ferroelectric field-effect transistors”為題發(fā)表最新研究進展,報道了基于二維材料的高效稀疏神經網絡硬件解決方案
    的頭像 發(fā)表于 01-13 10:41 ?541次閱讀
    王欣然教授<b class='flag-5'>團隊</b>提出基于二維材料的高效稀疏<b class='flag-5'>神經</b>網絡硬件方案

    教你三招異地訪問NAS

    NAS作為家庭或企業(yè)存儲數(shù)據(jù)的神器,能夠讓我們隨時隨地訪問存儲在其中的文件。但當我們身處異地時,如何高效、安全地訪問NAS卻成了一個難題。別擔心,節(jié)點小寶來幫你! 第一招:利用內網穿透功能 首先,在
    的頭像 發(fā)表于 01-02 11:26 ?1042次閱讀
    教你三招異地訪問<b class='flag-5'>NAS</b>

    上海交大團隊發(fā)表MEMS視觸覺融合多模態(tài)人機交互新進展

    ? 近日,上海交通大學電子信息與電氣工程學院微米納米加工技術全國重點實驗室劉景全團隊和上海交通大學人工智能學院盧策吾團隊在人機交互領域取得重要進展,相關成果以“Capturing forceful
    的頭像 發(fā)表于 11-28 10:50 ?2440次閱讀
    上海交大<b class='flag-5'>團隊</b><b class='flag-5'>發(fā)表</b>MEMS視觸覺融合多模態(tài)人機交互新進展

    AI在環(huán)境可持續(xù)發(fā)展方面的作用

    近日,《聯(lián)合國氣候變化框架公約》締約方會議第二十九次會議(COP29)在阿塞拜疆巴庫落下帷幕,與會者們齊聚于此,共同應對氣候變化。AI 在環(huán)境可持續(xù)發(fā)展方面的作用成為了本屆大會關注的焦點。
    的頭像 發(fā)表于 11-27 11:24 ?789次閱讀

    廣汽豐田團隊斬獲創(chuàng)新廣汽(IGA)成果發(fā)表大會“3金2銀”

    、采購部“龍卷豐”小分隊雙雙榮獲QC發(fā)表金獎。質量管理部改善提案榮獲唯一金獎,產品企劃部首次出征榮獲改善提案銀獎。公司還榮獲組織銀獎,人事總務部璐榮獲優(yōu)秀聯(lián)絡員。公司黨委書記鄔高峰、副總經理黃堅、副總經理望軍、紀委書記周健,參
    的頭像 發(fā)表于 11-25 09:55 ?1379次閱讀

    LSTM神經網絡的結構與工作機制

    網絡的結構與工作機制的介紹: 一、LSTM神經網絡的結構 LSTM神經網絡的結構主要包括以下幾個部分: 記憶單元(Memory Cell)
    的頭像 發(fā)表于 11-13 10:05 ?1636次閱讀

    Meta開發(fā)新搜索引擎,減少對谷歌和必應的依賴

    將基于Meta AI聊天機器人進行生成。 據(jù)一位曾與Meta搜索引擎團隊交流過的人士透露,Meta希望通過這款搜索引擎降低對谷歌搜索和微軟必應的依賴。目前,這兩家
    的頭像 發(fā)表于 10-29 11:49 ?814次閱讀

    谷歌取消“站點鏈接搜索框”,適應新搜索需求

    近日,谷歌發(fā)布了一則通知,決定取消搜索結果中的“站點鏈接搜索框”。這一功能已經陪伴了用戶十多年,它允許用戶在特定網站上進行更深入的搜索,為許多網民提供了便利。然而,隨著時代的變遷和技術
    的頭像 發(fā)表于 10-23 11:20 ?669次閱讀