一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

CVPR 2019競賽第一解決方案分享

DPVg_AI_era ? 來源:lq ? 2019-06-23 07:58 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

CVPR 2019細粒度圖像分類workshop的挑戰(zhàn)賽公布了最終結(jié)果:中國團隊DeepBlueAI獲得冠軍。本文帶來冠軍團隊解決方案的技術(shù)分享。

近日,在Kaggle上舉辦的CVPR 2019 Cassava Disease Classification挑戰(zhàn)賽公布了最終結(jié)果,國內(nèi)團隊 DeepBlueAI 獲得冠軍。

國際計算機視覺與模式識別會議(CVPR)是IEEE一年一度的學(xué)術(shù)性會議,CVPR是世界頂級的計算機視覺會議之一,會議的主要內(nèi)容是計算機視覺與模式識別技術(shù)。CVPR 2019 在洛杉磯長灘舉行,F(xiàn)GVC6 Workshop也將作為 CVPR 2019 的一部分如期召開。FGVC6 Workshop 共有十個挑戰(zhàn)賽,每個都代表了細粒度視覺分類在某個細分領(lǐng)域的挑戰(zhàn)。

FGVC全稱為Fine-Grained Visual Categorization,細粒度圖像分類,即區(qū)分不同的動物和植物、汽車和摩托車模型、建筑風(fēng)格等,是機器視覺社區(qū)剛剛開始解決的最有趣和最有用的開放問題之一。細粒度圖像分類在于基本的分類識別(對象識別)和個體識別(人臉識別,生物識別)之間的連續(xù)性。相似的類別之間的視覺區(qū)別通常非常小,因此很難用當(dāng)今的通用識別算法來解決。

今年是FGVC舉辦的第六屆比賽,往屆比較著名的比賽諸如iNaturalist和iMaterialist,前者側(cè)重于區(qū)分自然界不同的生物,后者則是側(cè)重于區(qū)分不同的人造物體。

不同于傳統(tǒng)的廣義上的分類任務(wù),F(xiàn)GVC的挑戰(zhàn)致力于子類別的劃分,需要分類的對象之間更加相似,例如區(qū)分不同的鳥類、不同的植物、不同的日用品等。

賽題介紹

Cassava Disease Classification挑戰(zhàn)賽是一個根據(jù)木薯的葉子區(qū)分不同種類的木薯疾病的任務(wù)。Cassava 譯為木薯,是非洲第二大碳水化合物供應(yīng)者,因為其能夠承受惡劣的環(huán)境。因此木薯是小農(nóng)種植的一種關(guān)鍵的糧食安全作物,在撒哈拉以南非洲,至少80%的小農(nóng)家庭種植木薯,而病毒性疾病是低產(chǎn)量的主要來源。

在這次比賽中,主辦方引入一個包含5種類別的木薯葉疾病的數(shù)據(jù)集,該數(shù)據(jù)集源于在烏干達定期調(diào)查中收集到的9436標記圖像,主要從農(nóng)民在自家田地里拍攝的圖片,然后由國家作物資源研究所(NaCRRI)與Makarere大學(xué)的人工智能實驗室共同對圖像進行標注。

數(shù)據(jù)集包括木薯植株的葉子圖像,9,436張帶注釋的圖像和12,595張未標記的圖像。參與者可以選擇使用未標記的圖像作為額外的訓(xùn)練數(shù)據(jù)。目標是學(xué)習(xí)一個模型,使用訓(xùn)練數(shù)據(jù)中的圖像將給定的圖像分類為這4個疾病類別或健康葉子的類別。

團隊成績

題目特點以及常用方法

細粒度圖像分類 (Fine-grained imagecategorization), 又被稱作子類別圖像分類 (Sub-category recognition)。其目的是對屬于同一基礎(chǔ)類別的圖像進行更加細致的子類劃分, 但由于子類別間細微的類間差異以及較大的類內(nèi)差異, 更傳統(tǒng)的圖像分類任務(wù)相比, 細粒度圖像分類難度明顯要大很多。從下圖中的木薯的葉子可以看出,不同的葉子病變情況長相非常相似,此外同一類別由于姿態(tài),背景以及拍攝角度的不同,存在較大的類內(nèi)差異。

細粒度圖像分類的常用方法可以分為兩種,分別是基于強監(jiān)督信息的方法和僅使用弱監(jiān)督信息的方法。前者需要使用對象的邊界框和局部標注信息,后者僅使用類別標簽,Cassava Disease Classification是一種弱監(jiān)督信息的細粒度識別,一般采用預(yù)訓(xùn)練模型finetune,并結(jié)合訓(xùn)練技巧對模型精調(diào)。

實驗?zāi)P停篠ENet、ResNet、DenseNet

ResNet是CNN歷史上一個里程碑事件,模型深度達到了152層,這和之前CNN的層數(shù)完全不在一個量級上。ResNet中的identity的這條線類似一條電路上的短路(shortcuts,skip connection),使得模型學(xué)習(xí)更加容易,深層可以直接得到淺層的網(wǎng)絡(luò)特征。

DenseNet的原理不同于ResNet通過加深網(wǎng)絡(luò)層數(shù)以及Inception通過加寬網(wǎng)絡(luò)寬度來提高模型識別能力,而是利用特征重用和類似ResNet的Bypass的方式,減少了網(wǎng)絡(luò)參數(shù)和緩解了梯度消失的問題。

SENet提出了Sequeeze and Excitation block,該模塊于傳統(tǒng)網(wǎng)絡(luò)的最大區(qū)別在于其側(cè)重于構(gòu)建通道之間的依賴關(guān)系,利用global average pooling來Sequeeze特征圖,并用Excitation對前者進行非線性變換,最后再疊加到輸入特征上。可以自適應(yīng)的校準通道的相應(yīng)特征,并且該模塊可以嵌入到現(xiàn)有的網(wǎng)絡(luò)結(jié)構(gòu)中,實現(xiàn)精度的提升。

模型訓(xùn)練與評測

原圖 VerticalFlip HorizontalFlip RandomRotateRandomCrop

RandomErasing

CutOut

由于訓(xùn)練集樣本過少,對比分析后對輸入數(shù)據(jù)采取 VerticalFlip,HorizontalFilp 、RandomRotate和RandomCrop的增強操作。此外,還使用了RandomErasing和Cutout,方法會在原圖隨機選擇一些矩形區(qū)域,改變該區(qū)域的像素值,通過這些數(shù)據(jù)增強的方式,訓(xùn)練集的圖片會被不同程度的遮擋,這樣可以進一步降低過擬合的風(fēng)險并提高模型的魯棒性。

同樣的,為了增強模型的魯棒性減少過擬合,本次比賽我們利用5-fold crossvalidation,交叉驗證有效利用了有限的數(shù)據(jù),并且評估結(jié)果能夠盡可能接近模型在測試集上的表現(xiàn)。用crossvalidation之后,SE_ResNeXt50測試集準確率提升0.01016,ResNet34測試集準確率提升0.01142。

這次比賽中,我們還使用了Mixup和label smoothing的訓(xùn)練策略。Mixup顧名思義就是將兩張圖片按一定比例融合起來作為輸入,計算loss時,針對兩張圖片的標簽分別計算,然后按比例加權(quán)求和。Mixup是一種抑制過擬合的策略,通過增加了一些數(shù)據(jù)上的擾動,從而提升了模型的泛化能力。

實驗證明,該方式能將Top1準確率提高近一個百分點。對于分類問題,常規(guī)做法時將類別換成one-hot vector。由于標簽是類別的one-hot vector,這樣做易導(dǎo)致過擬合使得模型泛化能力下降;同時這種做法會將所屬類別和非所屬類別之間的差距盡可能大,因此很難調(diào)優(yōu)模型。

為此,可以用label smoothing對標簽進行平滑處理,軟化one-hot類型標簽,使得計算損失函數(shù)時能有效抑制過擬合現(xiàn)象。

訓(xùn)練以Adam為optimiser,學(xué)習(xí)率的設(shè)置為階梯狀,共四個取值,[3e-4, 1e-4,1e-5, 1e-6],設(shè)置patience為4來衰減學(xué)習(xí)率,即模型連續(xù)4個epoch在驗證集上效果沒有提升則衰減學(xué)習(xí)率,訓(xùn)練總的epcoh在20次左右。本實驗使用的GPU為4卡2080Ti,并行訓(xùn)練一個模型,batchsize通常設(shè)為32,較大的模型根據(jù)實際情況適當(dāng)減小。

模型在預(yù)測時采用了數(shù)據(jù)增強的方式Test time augmentation(TTA),即將樣本圖像進行多個不同的變換獲得多個不同的預(yù)測結(jié)果,再將預(yù)測結(jié)果進行平均,提高精度。本次任務(wù)利用3*TTA,包括 RandomCrop, RandomCrop+HorizontalFlip 和RandomCrop+VerticalFlip 。

模型集成是算法比賽中常用的提高模型精度方法,本次比賽我們訓(xùn)練了大量在ImageNet上表現(xiàn)優(yōu)良的模型,其中表現(xiàn)較好的模型如下表所示、在采取多種融合方式之后,最終發(fā)現(xiàn)SE_ResNeXt50、SE_ResNeXt101、SENet154以及DenseNet201按照歸一化后權(quán)重的融合效果最好,在測試集上的準確率達到了0.92516。

模型 測試集準確率
SE_ResNeXt50 0.92251
SE_ResNeXt101 0.92384
SENet154 0.92384
DenseNet201 0.91721
MobileNetV2 0.91601
ResNet152 0.91710
SE_ResNeXt50+SE_ResNeXt101+SENet154+DenseNet201 0.92516

本次比賽主辦方提供了12595張未帶label的額外數(shù)據(jù)集,為了充分利用該數(shù)據(jù)集,利用在測試集表現(xiàn)最好的融合模型給這些數(shù)據(jù)集貼上偽標簽。然后利用訓(xùn)練集和偽標簽數(shù)據(jù)集訓(xùn)練模型,為了防止模型在偽標簽上過擬合,我們對偽標簽采取了一定的篩選操作。

采取的思路是:用多個不同概率閾值的過濾所得到的偽標簽進行線下實驗,看哪個閾值下的數(shù)據(jù)在線下的表現(xiàn)最好,就用通過該閾值篩選過濾出的數(shù)據(jù),最終以0.95的閾值篩選出一半的數(shù)據(jù)作為添加到訓(xùn)練集的偽標簽數(shù)據(jù)。

實驗證明這種半監(jiān)督的學(xué)習(xí)方法具有更強的泛化能力。

模型 測試集準確率
(public leaderboard)
Private leaderboard
SE_ResNeXt50 0.92251 0.93012
SE_ResNeXt50 with pseudo data 0.92195 0.93512
SE_ResNeXt101 0.92384 0.93134
SE_ResNeXt101 with pseudo data 0.92202 0.93409
SENet154 0.92384 0.93054
SE_ResNeXt154 with pseudo data 0.92283 0.93428
SE_ResNeXt50+SE_ResNeXt101+
SENet154+DenseNet201
0.92516 0.93727
SE_ResNeXt50+SE_ResNeXt101+
SENet154+DenseNet201
with pseudo data
0.92516 0.93860

進一步工作

針對細粒度圖像分類,MSRA有一個結(jié)論:分析該問題時圖像的形態(tài)、輪廓特征原沒細節(jié)紋理特征重要,而傳統(tǒng)的CNN模型都是在構(gòu)建輪廓特征,因此在構(gòu)建神經(jīng)網(wǎng)絡(luò)時,應(yīng)該更加精確地找到圖像中最有區(qū)分度的子區(qū)域,然后再對這些區(qū)域采用高分辨率、精細化特征的方法,這樣可以進一步提高細粒度圖像分類的準確率。

另外對數(shù)據(jù)本身我們可能需要做更多的工作,在任務(wù)初期沒有做足夠的探索性數(shù)據(jù)分析,例如數(shù)據(jù)的分布、類型、輸入圖像的尺寸等都是影響結(jié)果的因素,因此數(shù)據(jù)分析也是后面的一個嘗試點。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 圖像
    +關(guān)注

    關(guān)注

    2

    文章

    1094

    瀏覽量

    41281
  • 人工智能
    +關(guān)注

    關(guān)注

    1807

    文章

    49029

    瀏覽量

    249642
  • 計算機視覺
    +關(guān)注

    關(guān)注

    9

    文章

    1709

    瀏覽量

    46784

原文標題:CVPR 2019細粒度圖像分類競賽中國團隊DeepBlueAI獲冠軍 | 技術(shù)干貨分享

文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    潤和軟件穩(wěn)居數(shù)字業(yè)務(wù)類解決方案市場第一

    ”)憑借自身卓越的技術(shù)實力和創(chuàng)新能力,連續(xù)五年穩(wěn)居數(shù)字業(yè)務(wù)類解決方案市場第一名;在細分領(lǐng)域:數(shù)字信貸系統(tǒng)解決方案子市場持續(xù)保持第一名,數(shù)字銀行解決方
    的頭像 發(fā)表于 07-14 17:36 ?450次閱讀

    傳音多媒體團隊攬獲CVPR NTIRE 2025兩項挑戰(zhàn)賽冠亞軍

    近日,在計算機視覺領(lǐng)域最具影響力的國際競賽 CVPR NTIRE 2025中,傳音多媒體團隊與上海交通大學(xué)圖像所MediaLab聯(lián)合團隊分別斬獲 高效超分辨率挑戰(zhàn)賽(NTIRE 2025
    的頭像 發(fā)表于 06-24 16:08 ?975次閱讀
    傳音多媒體團隊攬獲<b class='flag-5'>CVPR</b> NTIRE 2025兩項挑戰(zhàn)賽冠亞軍

    如何在ctd解決方案中使用FRS (ccg2,3)?

    的話,你能否給我舉個來自 ctd us 解決方案代碼的示例,這是 ctd 解決方案的示例代碼? 如果那不起作用,除了圖片的設(shè)置之外我還需要留點什么嗎? 上面的代碼說,frs_enable 將在初始協(xié)商后應(yīng)用,所以我
    發(fā)表于 05-27 07:56

    挑戰(zhàn)具身機器人協(xié)同操作新高度!地瓜機器人邀你共戰(zhàn)CVPR 2025雙臂協(xié)作機器人競賽

    ,本屆會議聚焦“生成式人工智能時代的多智能體具身系統(tǒng)”,深入探討人工智能技術(shù)的前沿發(fā)展與應(yīng)用。作為CVPR協(xié)作智能workshop的核心賽事之,RoboTwin雙臂
    的頭像 發(fā)表于 04-11 05:30 ?736次閱讀
    挑戰(zhàn)具身機器人協(xié)同操作新高度!地瓜機器人邀你共戰(zhàn)<b class='flag-5'>CVPR</b> 2025雙臂協(xié)作機器人<b class='flag-5'>競賽</b>

    解決方案】安科瑞智慧用電產(chǎn)品解決方案介紹

    解決方案】安科瑞智慧用電產(chǎn)品解決方案介紹
    的頭像 發(fā)表于 02-19 08:42 ?497次閱讀
    【<b class='flag-5'>解決方案</b>】安科瑞智慧用電產(chǎn)品<b class='flag-5'>解決方案</b>介紹

    電摩電機控制器解決方案

    請問各位大佬,哪些途徑可以買到解決方案?或者哪位大佬有成熟的電摩電機控制器解決方案,可以聯(lián)系我,有使用需求。
    發(fā)表于 02-12 15:43

    【藍橋杯物聯(lián)網(wǎng)STM32WLE5】第一競賽規(guī)則及說明

    第一節(jié)組別說明1.具有正式全日制學(xué)籍并且符合相關(guān)科目報名要求的研究生、本科及高職高專學(xué)生(以報名時狀態(tài)為準),以個人為單位進行比賽。該科目設(shè)大學(xué)組。2.每位選手配備名指導(dǎo)教師,每名選手的指導(dǎo)教師
    的頭像 發(fā)表于 12-18 21:03 ?933次閱讀
    【藍橋杯物聯(lián)網(wǎng)STM32WLE5】<b class='flag-5'>第一</b>章 <b class='flag-5'>競賽</b>規(guī)則及說明

    種使用LDO簡單電源電路解決方案

    本期我們介紹種使用LDO簡單電源電路解決方案,該方案可以處理12V/24V、多節(jié)鋰離子電池和4節(jié)干電池等相對較高的輸入電壓。
    的頭像 發(fā)表于 12-04 16:05 ?830次閱讀
    <b class='flag-5'>一</b>種使用LDO簡單電源電路<b class='flag-5'>解決方案</b>

    解決方案】智慧用電解決方案

    解決方案】智慧用電解決方案
    的頭像 發(fā)表于 11-11 01:00 ?407次閱讀
    【<b class='flag-5'>解決方案</b>】智慧用電<b class='flag-5'>解決方案</b>

    解決方案 | 基于TSMaster的平板電腦解決方案

    Tosun基于TSMaster的平板電腦解決方案基于TSMaster的平板電腦是款集成了TSMaster軟件平臺和多種總線分析硬件工具的綜合產(chǎn)品,旨在充分發(fā)揮同星自主研發(fā)的技術(shù)優(yōu)勢,解決實車路試
    的頭像 發(fā)表于 11-10 01:02 ?949次閱讀
    <b class='flag-5'>解決方案</b> | 基于TSMaster的平板電腦<b class='flag-5'>解決方案</b>

    智慧公交是什么?文帶你詳解智慧公交的解決方案

    智慧公交是什么?文帶你詳解智慧公交的解決方案
    的頭像 發(fā)表于 11-05 12:26 ?977次閱讀
    智慧公交是什么?<b class='flag-5'>一</b>文帶你詳解智慧公交的<b class='flag-5'>解決方案</b>!

    中國科大-云知聲聯(lián)合團隊斬獲CVPR2024開放環(huán)境情感行為分析競賽三項季軍

    日前, IEEE/CVF計算機視覺國際頂級會議——CVPR 2024公布第六屆開放環(huán)境下情感行為分析國際挑戰(zhàn)賽(The 6th Workshop and Competition
    發(fā)表于 09-18 10:28 ?438次閱讀

    安森美OBC系統(tǒng)解決方案設(shè)計指南

    “OBC系統(tǒng)解決方案設(shè)計指南”又上新了,第一篇文章介紹了系統(tǒng)用途、系統(tǒng)實施方法、系統(tǒng)說明、市場趨勢和標準等,本文將繼續(xù)介紹解決方案概述及拓撲。
    的頭像 發(fā)表于 08-20 16:34 ?1714次閱讀
    安森美OBC系統(tǒng)<b class='flag-5'>解決方案</b>設(shè)計指南

    炬芯科技第一代K歌音箱單芯片解決方案量產(chǎn)

    近日,炬芯科技宣布其第一代K歌音箱單芯片解決方案已成功實現(xiàn)量產(chǎn),并攜手維爾晶品牌推出旗艦產(chǎn)品——W-KING D11,正式登陸市場,為消費者帶來前所未有的音樂娛樂體驗。這款集科技與音樂美學(xué)于身的音箱,不僅標志著炬芯科技在音頻技
    的頭像 發(fā)表于 08-12 11:06 ?1468次閱讀

    潤和軟件連續(xù)四年蟬聯(lián)數(shù)字業(yè)務(wù)類解決方案市場第一

    ,連續(xù)四年蟬聯(lián)數(shù)字業(yè)務(wù)類解決方案市場第一名。在細分領(lǐng)域:數(shù)字信貸系統(tǒng)解決方案子市場持續(xù)保持第一名,數(shù)字銀行解決方案子市場穩(wěn)居第二名,開放銀行
    的頭像 發(fā)表于 07-31 10:10 ?1101次閱讀