一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

研究人員們提出了PBA的方法來獲取更為有效的數(shù)據(jù)增強(qiáng)策略

nlfO_thejiangme ? 來源:lq ? 2019-08-02 15:56 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

近年來深度學(xué)習(xí)模型的飛速發(fā)展離不開龐大的數(shù)據(jù)體量和多樣化的數(shù)據(jù)收集。收集大量的、豐富的數(shù)據(jù)是十分耗時(shí)耗力的工作,而數(shù)據(jù)增強(qiáng)則為研究人員們提供了另一種增加數(shù)據(jù)多樣性的可能,無(wú)需真正收集數(shù)據(jù)即可得到較為豐富多樣的訓(xùn)練數(shù)據(jù)。來自伯克利的研究人員們提出了PBA(Population Based Augmentation)的方法來獲取更為有效的數(shù)據(jù)增強(qiáng)策略,并在實(shí)現(xiàn)同樣效果下實(shí)現(xiàn)了1000x的加速。

數(shù)據(jù)增強(qiáng)

數(shù)據(jù)增強(qiáng)策略通常包括剪切、填充、翻轉(zhuǎn)和旋轉(zhuǎn)等,但這些基本策略對(duì)于深度網(wǎng)絡(luò)的訓(xùn)練還是太簡(jiǎn)單,在對(duì)于數(shù)據(jù)增強(qiáng)策略和種類的研究相較于神經(jīng)網(wǎng)絡(luò)的研究還是太少了。

一些常見的數(shù)據(jù)增強(qiáng)方法

最近谷歌針對(duì)這方面進(jìn)行了深入的探索性的研究,提出了AutoAugment方法并在CIFAR-10數(shù)據(jù)集上取得了很好的成果。

這篇論文利用了強(qiáng)化學(xué)習(xí)等方法來搜索更好的數(shù)據(jù)增強(qiáng)策略,基于RNN的控制器從搜索空間中預(yù)測(cè)增強(qiáng)策略,而一個(gè)固定架構(gòu)的子網(wǎng)絡(luò)則用于在增強(qiáng)的數(shù)據(jù)上進(jìn)行訓(xùn)練收斂到精度R,最后利用精度R來作為獎(jiǎng)勵(lì)使得控制器尋求更好的數(shù)據(jù)增強(qiáng)策略。

AutoAugment引入了16種幾何、色彩變換并從中選擇兩種以固定的幅度來對(duì)每一批數(shù)據(jù)進(jìn)行增強(qiáng),所以高性能的增強(qiáng)方法可以通過強(qiáng)化學(xué)習(xí)直接由模型從數(shù)據(jù)中學(xué)習(xí)到。但這種方法的弊端在于它需要訓(xùn)練一萬(wàn)五千個(gè)模型到收斂,以便為強(qiáng)化學(xué)習(xí)模型收集足夠的樣本來學(xué)習(xí)數(shù)據(jù)增強(qiáng)策略。在樣本間的計(jì)算不能共享,使得它要耗費(fèi)15000個(gè)P100計(jì)算時(shí)來在ImageNet上實(shí)現(xiàn)較好的效果,即使在較小的CIFAR-10上也要消耗5000個(gè)GPU時(shí)(這意味著需要7500-37500美元的訓(xùn)練費(fèi)用才能得到較好的數(shù)據(jù)增強(qiáng)策略)。如果可以將先前訓(xùn)練的策略遷移或共享到新的訓(xùn)練中去,就能更高效地實(shí)現(xiàn)數(shù)據(jù)增強(qiáng)策略的搜索與獲取。

PBA算法

為了提高算法的效率,來自伯克利的研究人員提出了PBA算法,可以在比原算法少三個(gè)數(shù)量級(jí)的計(jì)算上獲得相同的測(cè)試精度。

與AutoAugment不同,這種方法在多個(gè)小模型的副本上訓(xùn)練CIFAR-10數(shù)據(jù)集,只需要在Titan XP上訓(xùn)練5小時(shí)即可得到較好的數(shù)據(jù)增強(qiáng)策略,這一策略應(yīng)用到CIFAR-100,并重新訓(xùn)練一個(gè)較大的網(wǎng)絡(luò)可以獲得十分有效的效果。與先前需要很多天的訓(xùn)練相比,這種方法耗時(shí)更短且得到的效果更好。

與AutoAugment相比,新方法給出的數(shù)據(jù)增強(qiáng)策略在不同模型上的表現(xiàn)。

研究人員從DeepMind的Population Based Training算法中借鑒了一些思想,并將其應(yīng)用在了數(shù)據(jù)增強(qiáng)策略的生成上,將訓(xùn)練中當(dāng)前的結(jié)果作為生成策略的基礎(chǔ),使得訓(xùn)練的結(jié)果可以在不同子模型中共享,避免耗時(shí)的重復(fù)訓(xùn)練。

這一改進(jìn)使得通常的工作站也可以訓(xùn)練大型的數(shù)據(jù)增強(qiáng)策略算法。與AutoAugment不同,這一方法生成了一個(gè)策略調(diào)度方法而不是一個(gè)固定的策略。這意味著,在某個(gè)訓(xùn)練周期,PBA生成的數(shù)據(jù)增強(qiáng)策略是法f(x,t),其中x是輸入圖像,t為當(dāng)前的訓(xùn)練周期。而AutoAugment則會(huì)在不同的子模型上生成固定的策略fi(x)。

研究人員利用了16個(gè)小的WideResNet,每一個(gè)會(huì)學(xué)習(xí)出不同的超參數(shù)計(jì)劃,而其中表現(xiàn)最好的調(diào)度將會(huì)被用于訓(xùn)練大型的模型,并從中得出最后的測(cè)試錯(cuò)誤率。

Population Based Training方法,首先將一系列小模型用于發(fā)現(xiàn)超參數(shù),而后將表現(xiàn)最好的模型權(quán)重(exploit)與隨機(jī)搜索結(jié)合起來(explore)。這些小模型首先在目標(biāo)數(shù)據(jù)集上從零開始訓(xùn)練,隨后通過將高性能的超參數(shù)復(fù)制到表現(xiàn)欠佳的模型上實(shí)現(xiàn)訓(xùn)練過程的復(fù)用,而后利用超參數(shù)的擾動(dòng)來實(shí)現(xiàn)隨機(jī)探索,以獲取更好的表現(xiàn)。

通過這樣的方法,研究人員得以共享不同模型間的計(jì)算,并共享不同訓(xùn)練階段得到的不同的目標(biāo)超參數(shù)。PBA算法通過這一手段避免了需要訓(xùn)練上千個(gè)模型才能獲得高性能數(shù)據(jù)增強(qiáng)策略的冗長(zhǎng)過程。下圖顯示了研究人員獲取的數(shù)據(jù)增強(qiáng)策略:

研究人員還提供了源碼和使用實(shí)例,如果想要給自己的數(shù)據(jù)集學(xué)習(xí)出合適的數(shù)據(jù)增強(qiáng)策略,可以在TUNE框架下進(jìn)行,只需要簡(jiǎn)單的定義新的數(shù)據(jù)加載器即可使用。詳情請(qǐng)參考代碼:

https://github.com/arcelien/pba

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 控制器
    +關(guān)注

    關(guān)注

    114

    文章

    17100

    瀏覽量

    184224
  • 神經(jīng)網(wǎng)絡(luò)

    關(guān)注

    42

    文章

    4814

    瀏覽量

    103578
  • 深度學(xué)習(xí)
    +關(guān)注

    關(guān)注

    73

    文章

    5561

    瀏覽量

    122793

原文標(biāo)題:1000倍提速!伯克利提出新的數(shù)據(jù)增強(qiáng)策略訓(xùn)練方法,更好更快擴(kuò)充數(shù)據(jù)

文章出處:【微信號(hào):thejiangmen,微信公眾號(hào):將門創(chuàng)投】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    安全研究人員用短信遙控開車門

    SEC的安全研究人員聲稱已經(jīng)找到一種方法來解鎖寶馬、通用、福特和現(xiàn)代四大汽車制造商的車門,他們實(shí)施逆向工程破解了這些汽車的遙控系統(tǒng),并可以在數(shù)小時(shí)內(nèi)完成一臺(tái)車的解碼
    發(fā)表于 07-29 09:43 ?1050次閱讀

    研究人員提出了“Skim-RNN”的概念,用很少的時(shí)間進(jìn)行快速閱讀

    注意力模型和LSTM等方法提高計(jì)算效率或挑選重要任務(wù),但它們的表現(xiàn)都不夠好。在本篇論文中,研究人員提出了“Skim-RNN”的概念,用很少的時(shí)間進(jìn)行快速閱讀,不影響讀者的主要目標(biāo)。
    的頭像 發(fā)表于 01-10 12:41 ?3832次閱讀
    <b class='flag-5'>研究人員</b><b class='flag-5'>提出了</b>“Skim-RNN”的概念,用很少的時(shí)間進(jìn)行快速閱讀

    Google研究人員開發(fā)增強(qiáng)現(xiàn)實(shí)顯微鏡檢測(cè)癌細(xì)胞

    Google的研究人員開發(fā)了一種增強(qiáng)現(xiàn)實(shí)顯微鏡(ARM),該顯微鏡可以從一個(gè)經(jīng)過訓(xùn)練的神經(jīng)網(wǎng)絡(luò)中獲取實(shí)時(shí)數(shù)據(jù),以檢測(cè)癌細(xì)胞,并將其顯示在查看圖像的病理學(xué)家的視野中。
    發(fā)表于 04-23 12:09 ?2399次閱讀

    斯坦福提出基于目標(biāo)的策略強(qiáng)化學(xué)習(xí)方法——SOORL

    為了達(dá)到人類學(xué)習(xí)的速率,斯坦福的研究人員提出了一種基于目標(biāo)的策略強(qiáng)化學(xué)習(xí)方法——SOORL,把重點(diǎn)放在對(duì)
    的頭像 發(fā)表于 06-06 11:18 ?5680次閱讀
    斯坦福<b class='flag-5'>提出</b>基于目標(biāo)的<b class='flag-5'>策略</b>強(qiáng)化學(xué)習(xí)<b class='flag-5'>方法</b>——SOORL

    一種新方法來檢測(cè)這些被操縱的換臉視頻的“跡象”

    利用深度學(xué)習(xí)“換臉”合成假視頻的技術(shù)發(fā)展之快令人驚嘆,也令人深感不安。研究人員已經(jīng)研究出一種新方法來檢測(cè)這些被操縱的換臉視頻,通過有效地預(yù)測(cè)眼睛的狀態(tài),準(zhǔn)確率達(dá)到99%。
    的頭像 發(fā)表于 07-03 09:48 ?6113次閱讀

    一種新型獲取太陽(yáng)能以及如氫氣類的清潔燃料的方法

    西澳大利亞科廷大學(xué)的研究人員開發(fā)了一種低成本、環(huán)保的方法來獲取太陽(yáng)能以及如氫氣類的清潔燃料。 科廷大學(xué)的研究人員在生產(chǎn)太陽(yáng)能等清潔燃料方面取得了突破性進(jìn)展,更好的向低碳經(jīng)濟(jì)轉(zhuǎn)型。
    的頭像 發(fā)表于 06-07 16:58 ?2398次閱讀

    研究人員探究大腦如何控制主動(dòng)傳感

    研究中的研究人員使用增強(qiáng)現(xiàn)實(shí)技術(shù)改變主動(dòng)感知行為與其產(chǎn)生的感官反饋之間的聯(lián)系,并更多地了解該過程的工作原理。
    的頭像 發(fā)表于 12-29 15:11 ?3183次閱讀

    研究人員提出了一系列新的點(diǎn)云處理模塊

    為了探索這些問題的解決辦法、來自倫敦大學(xué)學(xué)院的研究人員提出了一系列新的點(diǎn)云處理模塊,從效率、信息共享和點(diǎn)云卷積操作等方面進(jìn)行了研究,得到了更寬、更深、更快效率更高的點(diǎn)云處理網(wǎng)絡(luò),讓更
    的頭像 發(fā)表于 08-02 14:44 ?3321次閱讀
    <b class='flag-5'>研究人員</b><b class='flag-5'>們</b><b class='flag-5'>提出了</b>一系列新的點(diǎn)云處理模塊

    JD和OPPO的研究人員提出了一種姿勢(shì)引導(dǎo)的時(shí)尚圖像生成模型

    研究人員的主要目的在于訓(xùn)練一個(gè)生成模型,將模特在當(dāng)前姿勢(shì)上的圖像遷移到其他的目標(biāo)姿勢(shì)上去,實(shí)現(xiàn)對(duì)于衣著等商品的全面展示。
    的頭像 發(fā)表于 08-02 14:50 ?2781次閱讀

    研究人員提出了一種多尺度高效率的新模型FAMED-Net

    而基于學(xué)習(xí)的方法采用了數(shù)據(jù)驅(qū)動(dòng)的方法來學(xué)習(xí)出圖像特征和透射率之間的關(guān)系,克服了手工選取先驗(yàn)特征的不足。隨著深度學(xué)習(xí)的方法,這種方法朝著更強(qiáng)大
    的頭像 發(fā)表于 08-02 15:08 ?4183次閱讀
    <b class='flag-5'>研究人員</b><b class='flag-5'>提出了</b>一種多尺度高效率的新模型FAMED-Net

    Facebook的研究人員提出了Mesh R-CNN模型

    這一研究的目標(biāo)是通過單張圖像輸入,對(duì)圖像中的物體進(jìn)行檢測(cè)、獲取不同物體的類別、掩膜和對(duì)應(yīng)的三維網(wǎng)格,并對(duì)真實(shí)世界中的復(fù)雜模型進(jìn)行有效處理。在2D深度網(wǎng)絡(luò)的基礎(chǔ)上,研究人員改進(jìn)并
    的頭像 發(fā)表于 08-02 15:51 ?4265次閱讀
    Facebook的<b class='flag-5'>研究人員</b><b class='flag-5'>提出了</b>Mesh R-CNN模型

    研究人員使用聲音技術(shù)進(jìn)行藥物的傳遞

    從電信技術(shù)改造而來的技術(shù)有望實(shí)現(xiàn)更有效的癌癥治療。墨爾本研究人員發(fā)現(xiàn),藥物可以通過聲波傳遞到各個(gè)細(xì)胞中。
    發(fā)表于 03-11 09:38 ?559次閱讀

    研究人員出了一種新的基于深度學(xué)習(xí)的策略

    蘇黎世聯(lián)邦理工學(xué)院的研究人員最近推出了一種新的基于深度學(xué)習(xí)的策略,該策略可以在不需要大量真實(shí)數(shù)據(jù)的情況下在機(jī)器人中實(shí)現(xiàn)觸覺傳感。在arXiv
    的頭像 發(fā)表于 03-26 15:47 ?2868次閱讀

    馬來西亞研究人員提出一種評(píng)估光伏模塊不同冷卻系統(tǒng)有效性的新方法

    馬來西亞多媒體大學(xué)研究人員發(fā)表的一篇新論文提供了一種評(píng)估光伏模塊不同冷卻系統(tǒng)有效性的新方法。所提出的技術(shù)依賴于在附加冷卻的情況下測(cè)量模塊的輸出,并將其與標(biāo)準(zhǔn)測(cè)試條件下的額定功率進(jìn)行比較
    發(fā)表于 04-17 15:47 ?868次閱讀

    研究人員找到了一種更好的方法來冷卻 GaN 器件

    佐治亞理工學(xué)院的研究人員開發(fā)了一種新的鍵合技術(shù),可以改善 GaN 器件的冷卻效果,從而轉(zhuǎn)化為各種應(yīng)用的更好性能,包括無(wú)線發(fā)射器、雷達(dá)和衛(wèi)星設(shè)備
    發(fā)表于 08-17 15:57 ?653次閱讀
    <b class='flag-5'>研究人員</b>找到了一種更好的<b class='flag-5'>方法來</b>冷卻 GaN 器件