一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

機(jī)器學(xué)習(xí)全靠調(diào)參?谷歌發(fā)布顛覆性研究

新機(jī)器視覺 ? 來源:YXQ ? 2019-06-16 09:41 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

機(jī)器學(xué)習(xí)全靠調(diào)參?這個思路已經(jīng)過時了。

谷歌大腦團(tuán)隊發(fā)布了一項新研究:

只靠神經(jīng)網(wǎng)絡(luò)架構(gòu)搜索出的網(wǎng)絡(luò),不訓(xùn)練,不調(diào)參,就能直接執(zhí)行任務(wù)。

這樣的網(wǎng)絡(luò)叫做WANN,權(quán)重不可知神經(jīng)網(wǎng)絡(luò)。

它在MNIST數(shù)字分類任務(wù)上,未經(jīng)訓(xùn)練和權(quán)重調(diào)整,就達(dá)到了92%的準(zhǔn)確率,和訓(xùn)練后的線性分類器表現(xiàn)相當(dāng)。

除了監(jiān)督學(xué)習(xí),WANN還能勝任許多強(qiáng)化學(xué)習(xí)任務(wù)。

團(tuán)隊成員之一的大佬David Ha,把成果發(fā)上了推特,已經(jīng)獲得了1300多贊:

那么,先來看看效果吧。

效果

谷歌大腦用WANN處理了3種強(qiáng)化學(xué)習(xí)任務(wù)。

(給每一組神經(jīng)元,共享同一個權(quán)重。)

第一項任務(wù),Cart-Pole Swing-Up。

這是經(jīng)典的控制任務(wù),一條滑軌,一臺小車,車上一根桿子。

小車在滑軌的范圍里跑,要把桿子從自然下垂的狀態(tài)搖上來,保持在直立的位置不掉下來。

(這個任務(wù)比單純的Cart-Pole要難一些:

Cart-Pole桿子的初始位置就是向上直立,不需要小車把它搖上來,只要保持就可以。)

難度體現(xiàn)在,沒有辦法用線性控制器 (Linear Controller) 來解決。每一個時間步的獎勵,都是基于小車到滑軌一頭的距離,以及桿子擺動的角度。

WANN的最佳網(wǎng)絡(luò) (Champion Network) 長這樣:

它在沒有訓(xùn)練的狀態(tài)下,已經(jīng)表現(xiàn)優(yōu)異:

表現(xiàn)最好的共享權(quán)重,給了團(tuán)隊十分滿意的結(jié)果:只用幾次擺動便達(dá)到了平衡狀態(tài)。

第二項任務(wù),Bipedal Waker-v2。

一只兩足“生物”,要在隨機(jī)生成的道路上往前走,越過凸起,跨過陷坑。獎勵多少,就看它從出發(fā)到掛掉走了多長的路,以及電機(jī)扭矩的成本(為了鼓勵高效運(yùn)動) 。

每條腿的運(yùn)動,都是由一個髖關(guān)節(jié)、和一個膝關(guān)節(jié)來控制的。有24個輸入,會指導(dǎo)它的運(yùn)動:包括“激光雷達(dá)”探測的前方地形數(shù)據(jù),本體感受到的關(guān)節(jié)運(yùn)動速度等等。

比起第一項任務(wù)中的低維輸入,這里可能的網(wǎng)絡(luò)連接就更多樣了:

所以,需要WANN對從輸入到輸出的布線方式,有所選擇。

這個高維任務(wù),WANN也優(yōu)質(zhì)完成了。

你看,這是搜索出的最佳架構(gòu),比剛才的低維任務(wù)復(fù)雜了許多:

它在-1.5的權(quán)重下奔跑,長這樣:

第三項任務(wù),CarRacing-v0。

這是一個自上而下的 (Top-Down) 、像素環(huán)境里的賽車游戲。

一輛車,由三個連續(xù)命令來控制:油門、轉(zhuǎn)向、制動。目標(biāo)是在規(guī)定的時間里,經(jīng)過盡可能多的磚塊。賽道是隨機(jī)生成的。

研究人員把解釋每個像素 (Pixel Interpretation) 的工作交給了一個預(yù)訓(xùn)練的變分自編碼器 (VAE) ,它可以把像素表征壓縮到16個潛在維度。

這16維就是網(wǎng)絡(luò)輸入的維度。學(xué)到的特征是用來檢測WANN學(xué)習(xí)抽象關(guān)聯(lián) (Abstract Associations) 的能力,而不是編碼不同輸入之間顯式的幾何關(guān)系。

這是WANN最佳網(wǎng)絡(luò),在-1.4共享權(quán)重下、未經(jīng)訓(xùn)練的賽車成果:

雖然路走得有些蜿蜒,但很少偏離跑到。

而把最佳網(wǎng)絡(luò)微調(diào)一下,不用訓(xùn)練,便更加順滑了:

總結(jié)一下,在簡單程度和模塊化程度上,第二、三項任務(wù)都表現(xiàn)得優(yōu)秀,兩足控制器只用了25個可能輸入中的17個,忽略了許多LIDAR傳感器和膝關(guān)節(jié)的速度。

WANN架構(gòu)不止能在不訓(xùn)練單個權(quán)重的情況下完成任務(wù),而且只用了210個網(wǎng)絡(luò)連接(Connections) ,比當(dāng)前State-of-the-Art模型用到的2804個連接,少了一個數(shù)量級。

做完強(qiáng)化學(xué)習(xí),團(tuán)隊又瞄準(zhǔn)了MNIST,把WANN拓展到了監(jiān)督學(xué)習(xí)的分類任務(wù)上。

一個普通的網(wǎng)絡(luò),在參數(shù)隨機(jī)初始化的情況下,MNIST上面的準(zhǔn)確率可能只有10%左右。

而新方法搜索到的網(wǎng)絡(luò)架構(gòu)WANN,用隨機(jī)權(quán)重去跑,準(zhǔn)確率已經(jīng)超過了80%

如果像剛剛提到的那樣,喂給它多個權(quán)值的合集,準(zhǔn)確率就達(dá)到了91.6%。

對比一下,經(jīng)過微調(diào)的權(quán)重,帶來的準(zhǔn)確率是91.9%,訓(xùn)練過的權(quán)重,可以帶來94.2%的準(zhǔn)確率。

再對比一下,擁有幾千個權(quán)重的線性分類器:

也只是和WANN完全沒訓(xùn)練、沒微調(diào)、僅僅喂食了一些隨機(jī)權(quán)重時的準(zhǔn)確率相當(dāng)。

論文里強(qiáng)調(diào),MINST手寫數(shù)字分類是高維分類任務(wù)。WANN表現(xiàn)得非常出色。

并且沒有哪個權(quán)值,顯得比其他值更優(yōu)秀,大家表現(xiàn)得十分均衡:所以隨機(jī)權(quán)重是可行的。

不過,每個不同的權(quán)重形成的不同網(wǎng)絡(luò),有各自擅長分辨的數(shù)字,所以可以把一個擁有多個權(quán)值的WANN,用作一個自給自足的合集 (Self-Contained Ensemble) 。

實(shí)現(xiàn)原理

不訓(xùn)練權(quán)重參數(shù)獲得極高準(zhǔn)確度,WANN是如何做到的呢?

神經(jīng)網(wǎng)絡(luò)不僅有權(quán)重偏置這些參數(shù),網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)、激活函數(shù)的選擇都會影響最終結(jié)果。

谷歌大腦的研究人員在論文開頭就提出質(zhì)疑:神經(jīng)網(wǎng)絡(luò)的權(quán)重參數(shù)與其架構(gòu)相比有多重要?在沒有學(xué)習(xí)任何權(quán)重參數(shù)的情況下,神經(jīng)網(wǎng)絡(luò)架構(gòu)可以在多大程度上影響給定任務(wù)的解決方案。

為此,研究人員提出了一種神經(jīng)網(wǎng)絡(luò)架構(gòu)的搜索方法,無需訓(xùn)練權(quán)重找到執(zhí)行強(qiáng)化學(xué)習(xí)任務(wù)的最小神經(jīng)網(wǎng)絡(luò)架構(gòu)。

谷歌研究人員還把這種方法用在監(jiān)督學(xué)習(xí)領(lǐng)域,僅使用隨機(jī)權(quán)重,就能在MNIST上實(shí)現(xiàn)就比隨機(jī)猜測高得多的準(zhǔn)確率。

論文從架構(gòu)搜索、貝葉斯神經(jīng)網(wǎng)絡(luò)、算法信息論、網(wǎng)絡(luò)剪枝、神經(jīng)科學(xué)這些理論中獲得啟發(fā)。

為了生成WANN,必須將權(quán)重對網(wǎng)絡(luò)的影響最小化,用權(quán)重隨機(jī)采樣可以保證最終的網(wǎng)絡(luò)是架構(gòu)優(yōu)化的產(chǎn)物,但是在高維空間進(jìn)行權(quán)重隨機(jī)采樣的難度太大。

研究人員采取了“簡單粗暴”的方法,對所有權(quán)重強(qiáng)制進(jìn)行權(quán)重共享(weight-sharing),讓權(quán)重值的數(shù)量減少到一個。這種高效的近似可以推動對更好架構(gòu)的搜索。

操作步驟

解決了權(quán)重初始化的問題,接下來的問題就是如何收搜索權(quán)重不可知神經(jīng)網(wǎng)絡(luò)。它分為四個步驟:

1、創(chuàng)建初始的最小神經(jīng)網(wǎng)絡(luò)拓?fù)淙骸?/p>

2、通過多個rollout評估每個網(wǎng)絡(luò),并對每個rollout分配不同的共享權(quán)重值。

3、根據(jù)性能和復(fù)雜程度對網(wǎng)絡(luò)進(jìn)行排序。

4、根據(jù)排名最高的網(wǎng)絡(luò)拓?fù)鋪韯?chuàng)建新的群,通過競爭結(jié)果進(jìn)行概率性的選擇。

然后,算法從第2步開始重復(fù),在連續(xù)迭代中,產(chǎn)生復(fù)雜度逐漸增加的權(quán)重不可知拓?fù)洌╳eight agnostic topologies )。

拓?fù)渌阉?/p>

用于搜索神經(jīng)網(wǎng)絡(luò)拓?fù)涞牟僮魇艿?strong>神經(jīng)進(jìn)化算法(NEAT)的啟發(fā)。在NEAT中,拓?fù)浜蜋?quán)重值同時優(yōu)化,研究人員忽略權(quán)重,只進(jìn)行拓?fù)渌阉鞑僮鳌?/p>

上圖展示了網(wǎng)絡(luò)拓?fù)淇臻g搜索的具體操作:

一開始網(wǎng)絡(luò)上是最左側(cè)的最小拓?fù)浣Y(jié)構(gòu),僅有部分輸入和輸出是相連的。

然后,網(wǎng)絡(luò)按以下三種方式進(jìn)行更改:

1、插入節(jié)點(diǎn):拆分現(xiàn)有連接插入新節(jié)點(diǎn)。

2、添加連接:連接兩個之前未連接的節(jié)點(diǎn),添加新連接。

3、更改激活函數(shù):重新分配隱藏節(jié)點(diǎn)的激活函數(shù)。

圖的最右側(cè)展示了權(quán)重在[2,2]取值范圍內(nèi)可能的激活函數(shù),如線性函數(shù)、階躍函數(shù)、正弦余弦函數(shù)、ReLU等等。

權(quán)重依然重要

WANN與傳統(tǒng)的固定拓?fù)渚W(wǎng)絡(luò)相比,可以使用單個的隨機(jī)共享權(quán)重也能獲得更好的結(jié)果。

雖然WANN在多項任務(wù)中取得了最佳結(jié)果,但WANN并不完全獨(dú)立于權(quán)重值,當(dāng)隨機(jī)分配單個權(quán)重值時,有時也會失敗。

WANN通過編碼輸入和輸出之間的關(guān)系起作用,雖然權(quán)重的大小的重要性并不高,但它們的一致性,尤其是符號的一致性才是關(guān)鍵。

隨機(jī)共享權(quán)重的另一個好處是,調(diào)整單個參數(shù)的影響變得不重要,無需使用基于梯度的方法。

強(qiáng)化學(xué)習(xí)任務(wù)中的結(jié)果讓作者考慮推廣WANN方法的應(yīng)用范圍。他們又測試了WANN在圖像分類基礎(chǔ)任務(wù)MNIST上的表現(xiàn),結(jié)果在權(quán)重接近0時效果不佳。

有Reddit網(wǎng)友質(zhì)疑WANN的結(jié)果,對于隨機(jī)權(quán)重接近于0的情況,該網(wǎng)絡(luò)的性能并不好,先強(qiáng)化學(xué)習(xí)實(shí)驗中的具體表現(xiàn)就是,小車會跑出限定范圍。

對此,作者給出解釋,在權(quán)重趨于0的情況下,網(wǎng)絡(luò)的輸出也會趨于0,所以后期的優(yōu)化很難達(dá)到較好的性能。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 谷歌
    +關(guān)注

    關(guān)注

    27

    文章

    6231

    瀏覽量

    108053
  • 機(jī)器學(xué)習(xí)

    關(guān)注

    66

    文章

    8501

    瀏覽量

    134532

原文標(biāo)題:谷歌發(fā)布顛覆性研究:不訓(xùn)練不調(diào)參,AI自動構(gòu)建超強(qiáng)網(wǎng)絡(luò),告別煉丹一大步

文章出處:【微信號:vision263com,微信公眾號:新機(jī)器視覺】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    邊緣計算如何顛覆人工智能變革

    2025年以來,DeepSeek發(fā)布的大模型熱度居高不下,再次點(diǎn)燃了全球?qū)θ斯ぶ悄艿臒o限熱情。深度學(xué)習(xí)模型以指數(shù)級速度膨脹,性能不斷突破極限,成本效益也在向著更低的趨勢發(fā)展,這為各行各業(yè)帶來了顛覆性
    的頭像 發(fā)表于 05-30 09:29 ?362次閱讀

    谷歌發(fā)布混合量子模擬方法

    據(jù)外媒報道,谷歌發(fā)布了一種混合量子模擬方法;論文已經(jīng)在Nature正式發(fā)表,谷歌混合量子模擬器的核心在于將模擬和數(shù)字技術(shù)相結(jié)合;是全新的模擬-數(shù)字方案,可在保持速度的同時增強(qiáng)可控制,
    的頭像 發(fā)表于 04-22 17:17 ?374次閱讀

    BP神經(jīng)網(wǎng)絡(luò)的調(diào)技巧與建議

    BP神經(jīng)網(wǎng)絡(luò)的調(diào)是一個復(fù)雜且關(guān)鍵的過程,涉及多個超參數(shù)的優(yōu)化和調(diào)整。以下是一些主要的調(diào)技巧與建議: 一、學(xué)習(xí)率(Learning Rat
    的頭像 發(fā)表于 02-12 16:38 ?802次閱讀

    LD2410B/C新手必看攻略! 測試教程、模塊調(diào)一文詳解~

    關(guān)于LD2410B/C那些你不得不知道的事?免費(fèi)申樣、接線教程、參數(shù)解析、APP調(diào)教程、上位機(jī)調(diào)教程、常見異常情況自檢等等內(nèi)容,一文匯總~不管是萌新小白還是資深玩家,都可以快速入門
    的頭像 發(fā)表于 02-05 18:09 ?1524次閱讀
    LD2410B/C新手必看攻略! 測試教程、模塊<b class='flag-5'>調(diào)</b><b class='flag-5'>參</b>一文詳解~

    無壓縮機(jī)和制冷劑!海爾智家3獲顛覆性科技最高獎

    效率會驟降甚至失效。 海爾智家針對供暖領(lǐng)域的技術(shù)探索,迎來了顛覆性突破。近日在工信部主辦的第13屆中國創(chuàng)新創(chuàng)業(yè)大賽顛覆性技術(shù)創(chuàng)新大賽上,憑借無壓縮機(jī)、無制冷劑的“極低溫室效應(yīng)高效大溫跨熱聲熱泵”項目,海爾智家成功
    的頭像 發(fā)表于 12-24 17:32 ?565次閱讀
    無壓縮機(jī)和制冷劑!海爾智家3獲<b class='flag-5'>顛覆性</b>科技最高獎

    依托Chiplet&amp;高性能RDMA,奇異摩爾斬獲全國顛覆性技術(shù)創(chuàng)新大賽(未來制造領(lǐng)域賽)優(yōu)勝獎

    ? ? 近日,第十三屆中國創(chuàng)新創(chuàng)業(yè)大賽顛覆性技術(shù)創(chuàng)新大賽(未來制造領(lǐng)域賽)獲獎結(jié)果出爐,奇異摩爾參賽項目【基于Chiplet+RDMA技術(shù)的下一代萬卡AI集群的全棧式互聯(lián)解決方案】榮獲優(yōu)勝獎
    的頭像 發(fā)表于 12-19 09:39 ?1505次閱讀
    依托Chiplet&amp;高性能RDMA,奇異摩爾斬獲全國<b class='flag-5'>顛覆性</b>技術(shù)創(chuàng)新大賽(未來制造領(lǐng)域賽)優(yōu)勝獎

    谷歌發(fā)布“深度研究”AI工具,利用Gemini模型進(jìn)行網(wǎng)絡(luò)信息檢索

    據(jù)外媒最新報道,谷歌近期發(fā)布了一款名為“深度研究”的先進(jìn)AI工具。這款工具借助其內(nèi)部的Gemini大型語言模型,實(shí)現(xiàn)了對網(wǎng)絡(luò)信息的高效檢索與深度挖掘,進(jìn)一步滿足了用戶對精準(zhǔn)、詳盡信息的需求。 據(jù)悉
    的頭像 發(fā)表于 12-16 09:35 ?715次閱讀

    Tata Communications即將推出Kaleyra AI:顛覆性人工智能驅(qū)動客戶互動

    面向未來的人工智能驅(qū)動旗艦產(chǎn)品組合——Kaleyra AI,旨在重新定義客戶互動的全新體驗。 這款顛覆性產(chǎn)品組合將首度推出三項獨(dú)具特色的功能,突破傳統(tǒng)通信工具的界限,開創(chuàng)全新互動體驗。 這款產(chǎn)品套件旨在與各類通信渠道及實(shí)時代理界面無縫對接,借助生成式人工智能(GenAI)營造簡潔流暢、個性化且極具
    的頭像 發(fā)表于 12-15 09:30 ?537次閱讀

    夢之墨榮獲全國顛覆性技術(shù)創(chuàng)新大賽優(yōu)秀項目

    近日,第十三屆中國創(chuàng)新創(chuàng)業(yè)大賽顛覆性技術(shù)創(chuàng)新大賽(以下簡稱“大賽”)總決賽在杭州市余杭區(qū)圓滿結(jié)束。大賽聚焦技術(shù)革新,旨在引領(lǐng)未來產(chǎn)業(yè)的發(fā)展方向,促進(jìn)科技創(chuàng)新成果的轉(zhuǎn)化,加速新質(zhì)生產(chǎn)力的成長,是全國的重大賽事。
    的頭像 發(fā)表于 12-02 11:40 ?883次閱讀
    夢之墨榮獲全國<b class='flag-5'>顛覆性</b>技術(shù)創(chuàng)新大賽優(yōu)秀項目

    三相200V轉(zhuǎn)380V帶零線顛覆性技術(shù):出口日本變壓器引領(lǐng)行業(yè)潮流

    ? 三相200V轉(zhuǎn)380V帶零線顛覆性技術(shù):出口日本變壓器引領(lǐng)行業(yè)潮流 ? 在全球電氣設(shè)備貿(mào)易的版圖中,日本市場以其獨(dú)特的電力標(biāo)準(zhǔn)和嚴(yán)格的技術(shù)要求著稱。面對這一挑戰(zhàn),中國電力設(shè)備制造商不斷創(chuàng)新,推出
    的頭像 發(fā)表于 11-20 15:10 ?691次閱讀
    三相200V轉(zhuǎn)380V帶零線<b class='flag-5'>顛覆性</b>技術(shù):出口日本變壓器引領(lǐng)行業(yè)潮流

    NPU與機(jī)器學(xué)習(xí)算法的關(guān)系

    緊密。 NPU的起源與特點(diǎn) NPU的概念最早由谷歌在其TPU(Tensor Processing Unit)項目中提出,旨在為TensorFlow框架提供專用的硬件加速。NPU的設(shè)計目標(biāo)是提高機(jī)器學(xué)習(xí)算法的運(yùn)行效率,特別是在處理
    的頭像 發(fā)表于 11-15 09:19 ?1191次閱讀

    LSTM神經(jīng)網(wǎng)絡(luò)的調(diào)技巧

    長短時記憶網(wǎng)絡(luò)(Long Short-Term Memory, LSTM)是一種特殊的循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN),它能夠學(xué)習(xí)長期依賴信息。在實(shí)際應(yīng)用中,LSTM網(wǎng)絡(luò)的調(diào)是一個復(fù)雜且關(guān)鍵的過程,直接影響
    的頭像 發(fā)表于 11-13 10:01 ?1844次閱讀

    魯棒機(jī)器學(xué)習(xí)中的重要

    機(jī)器學(xué)習(xí)領(lǐng)域,模型的魯棒是指模型在面對輸入數(shù)據(jù)的擾動、異常值、噪聲或?qū)剐怨魰r,仍能保持性能的能力。隨著人工智能技術(shù)的快速發(fā)展,機(jī)器學(xué)習(xí)
    的頭像 發(fā)表于 11-11 10:19 ?1251次閱讀

    深視智能編《2024智能檢測裝備產(chǎn)業(yè)發(fā)展研究報告:機(jī)器視覺篇》

    為全面了解機(jī)器視覺檢測裝備產(chǎn)業(yè)發(fā)展情況,中國電子技術(shù)標(biāo)準(zhǔn)化研究院聯(lián)合業(yè)內(nèi)龍頭企業(yè)、科研院所和產(chǎn)業(yè)聯(lián)盟等(編單位名單見附件),共同編制了《智能檢測裝備產(chǎn)業(yè)發(fā)展研究報告:
    的頭像 發(fā)表于 08-05 08:38 ?642次閱讀
    深視智能<b class='flag-5'>參</b>編《2024智能檢測裝備產(chǎn)業(yè)發(fā)展<b class='flag-5'>研究</b>報告:<b class='flag-5'>機(jī)器</b>視覺篇》

    谷歌發(fā)布革命AI天氣預(yù)測模型NeuralGCM

    在科技與自然科學(xué)的交匯點(diǎn)上,谷歌公司于7月23日宣布了一項重大突破——全新的人工智能天氣預(yù)測模型NeuralGCM。這一創(chuàng)新成果不僅融合了機(jī)器學(xué)習(xí)的前沿技術(shù),還巧妙結(jié)合了傳統(tǒng)氣象學(xué)的精髓,其
    的頭像 發(fā)表于 07-23 14:24 ?803次閱讀