五月天无码在线观看,国产精品原创自拍视频,911国产 91九色

在開發(fā)以卷積神經(jīng)網(wǎng)絡(luò)（CNN）為核心的機(jī)器學(xué)習(xí)模型時(shí)，我們通常會(huì)先使用固定的資源成本，構(gòu)建最初的模型，然后增加更多資源（層數(shù)）擴(kuò)展模型，從而獲得更高的準(zhǔn)確率。

著名的 CNN 模型 ResNet（深度殘差網(wǎng)絡(luò)），就可以用增加層數(shù)的方法從ResNet-18 擴(kuò)展到 ResNet-200。谷歌的 GPipe 模型也通過將基線 CNN 擴(kuò)展 4 倍，在 ImageNet 數(shù)據(jù)庫上達(dá)到84.3% 的準(zhǔn)確率，力壓所有模型。

一般來說，模型的擴(kuò)大和縮小都是任意增加 CNN 的深度或?qū)挾?，抑或是使用分辨率更大的圖像進(jìn)行訓(xùn)練和評估。雖然這些傳統(tǒng)方法提高準(zhǔn)確率的效果不錯(cuò)，但大多需要繁瑣的手動(dòng)調(diào)整，還可能無法達(dá)到最佳性能。

因此，谷歌AI團(tuán)隊(duì)最近提出了新的模型縮放方法“復(fù)合縮放（CompoundScaling）”和配套的EfficientNet 模型。他們使用復(fù)合系數(shù)和 AutoML 從多個(gè)維度均衡縮放 CNN，綜合考慮深度和寬度等參數(shù)，而不是只單純地考慮一個(gè)，使得模型的準(zhǔn)確率和效率大幅提升，圖像識(shí)別的效率甚至可以大幅提升 10 倍。

這項(xiàng)新方法的根本優(yōu)勢在于實(shí)踐起來非常簡單，背后的原理很好理解，甚至讓人懷疑為什么沒有被更早發(fā)現(xiàn)。該研究成果以論文的形式被 ICML2019（國際機(jī)器學(xué)習(xí)大會(huì)）接收，名為 EfficientNet: Rethinking Model Scaling for Convolutional Neural Networks。EfficientNet 模型的相關(guān)代碼和 TPU 訓(xùn)練數(shù)據(jù)也已經(jīng)在 GitHub 上開源。

尋找復(fù)合系數(shù)

為了弄清楚神經(jīng)網(wǎng)絡(luò)縮放之后的效果，谷歌團(tuán)隊(duì)系統(tǒng)地研究了改變不同維度對模型的影響，維度參數(shù)包括網(wǎng)絡(luò)深度、寬度和圖像分辨率。

首先他們進(jìn)行了柵格搜索（GridSearch）。這是一種窮舉搜索方法，可以在固定資源的限定下，列出所有參數(shù)之間的關(guān)系，顯示出改變某一種維度時(shí)，基線網(wǎng)絡(luò)模型會(huì)受到什么樣的影響。換句話說，如果只改變了寬度、深度或分辨率，模型的表現(xiàn)會(huì)發(fā)生什么變化。

圖 |以基線網(wǎng)絡(luò)為基礎(chǔ)，列出所有維度變化對模型的影響

綜合考慮所有情況之后，他們確定了每個(gè)維度最合適的調(diào)整系數(shù)，然后將它們一同應(yīng)用到基線網(wǎng)絡(luò)中，對每個(gè)維度都進(jìn)行適當(dāng)?shù)目s放，并且確保其符合目標(biāo)模型的大小和計(jì)算預(yù)算。

簡單來說，就是分別找到寬度、深度和分辨率的最佳系數(shù)，然后將它們組合起來一起放入原本的網(wǎng)絡(luò)模型中，對每一個(gè)維度都有所調(diào)整。從整體的角度縮放模型。

與傳統(tǒng)方法相比，這種復(fù)合縮放法可以持續(xù)提高模型的準(zhǔn)確性和效率。在現(xiàn)有模型 MobileNet 和 ResNet 上的測試結(jié)果顯示，它分別提高了 1.4% 和 0.7% 的準(zhǔn)確率。

高效的網(wǎng)絡(luò)架構(gòu)和性能

縮放模型的有效性也依賴于基線網(wǎng)絡(luò)（架構(gòu)）本身。

因?yàn)?，為了進(jìn)一步提高性能，谷歌 AI 團(tuán)隊(duì)還使用了 AutoMLMNAS 框架進(jìn)行神經(jīng)架構(gòu)搜索，優(yōu)化準(zhǔn)確性和效率。AutoML 是一種可以自動(dòng)設(shè)計(jì)神經(jīng)網(wǎng)絡(luò)的技術(shù)，由谷歌團(tuán)隊(duì)在 2017 年提出，而且經(jīng)過了多次優(yōu)化更新。使用這種技術(shù)可以更簡便地創(chuàng)造神經(jīng)網(wǎng)絡(luò)。

由此產(chǎn)生的架構(gòu)使用了移動(dòng)倒置瓶頸卷積（MBConv），類似于 MobileNetV2 和 MnasNet 模型，但由于計(jì)算力（FLOPS）預(yù)算增加，MBConv 模型體積略大。隨后他們多次縮放了基線網(wǎng)絡(luò)，組成了一系列模型，統(tǒng)稱為EfficientNets。

圖 |EfficientNet-B0 基線網(wǎng)絡(luò)架構(gòu)

為了測試其性能，研究人員與 ImageNet 上的其他現(xiàn)有 CNN 進(jìn)行了比較。結(jié)果顯示，EfficientNet 在大多數(shù)情況下表現(xiàn)亮眼，比現(xiàn)有 CNN 的準(zhǔn)確率和效率都高，還將參數(shù)大小和計(jì)算力降低了一個(gè)數(shù)量級。

比如 EfficientNet-B7 在 ImageNet 上達(dá)到的 Top-1 最高準(zhǔn)確率是 84.4%，Top-5 準(zhǔn)確率是 97.1%。在 CPU 推理上，它的體積比最好的 CNN 模型 GPipe 小 8.4 倍，但速度快了 6.1 倍。與廣泛使用的 ResNet-50 相比，EfficientNet-B4 使用了類似的計(jì)算力，但 Top-1 準(zhǔn)確率從 76.3% 提升到了 82.6%。

圖 |參數(shù)使用量和 ImageNetTop-1 準(zhǔn)確率對比

此外，EfficientNets 不僅在 ImageNet 上表現(xiàn)出眾，其能力還可以轉(zhuǎn)移到其它數(shù)據(jù)集上。

他們在 8 個(gè)流行的遷移學(xué)習(xí)數(shù)據(jù)集上測試了 EfficientNets。結(jié)果顯示，它在其中的 5 個(gè)上面都拿到了頂尖成績，例如在 CIFAR-100 上獲得了 91.7％的成績，在 Flowers 上獲得了 98.8％的成績，而且參數(shù)至少減少了一個(gè)數(shù)量級，甚至還可以最多減少 21 倍，說明 EfficientNets 具有很強(qiáng)的遷移能力。

谷歌 AI 團(tuán)隊(duì)認(rèn)為，EfficientNets 有望憑借簡單易操作的特點(diǎn)，成為未來計(jì)算機(jī)視覺任務(wù)的新基石。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報(bào)投訴