一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

在各種檢測(cè)器的所有模塊實(shí)現(xiàn)無監(jiān)督預(yù)訓(xùn)練

jf_pmFSk4VX ? 來源:GiantPandaCV ? 2023-08-01 11:42 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

1. 背景介紹

近年來,大規(guī)模預(yù)訓(xùn)練后微調(diào)優(yōu)化方法在計(jì)算機(jī)視覺中取得了重大進(jìn)展。一系列預(yù)訓(xùn)練算法被設(shè)計(jì)出來,以學(xué)習(xí)特定領(lǐng)域的或任務(wù)感知的概念,以提升下游性能。就目標(biāo)檢測(cè)而言,當(dāng)前方法通常利用ImageNet來預(yù)訓(xùn)練骨干網(wǎng)絡(luò),采用面向分類的監(jiān)督。然而,與面向檢測(cè)的微調(diào)過程相比,這種預(yù)訓(xùn)練方法存在三個(gè)差異,如圖1所示。

數(shù)據(jù):大多數(shù)預(yù)訓(xùn)練方法是在單個(gè)以物體為中心的數(shù)據(jù)集上進(jìn)行的,如ImageNet。但是,檢測(cè)數(shù)據(jù)集,例如COCO,通常由不同尺度和位置的多個(gè)物體組成。數(shù)據(jù)特征和領(lǐng)域上的差異可能導(dǎo)致預(yù)訓(xùn)練偏離下游任務(wù)。

模型:由于檢測(cè)器的多樣性和復(fù)雜性,當(dāng)前預(yù)訓(xùn)練算法主要關(guān)注模型內(nèi)的部分模塊(例如骨干網(wǎng)絡(luò))。檢測(cè)器中的某些關(guān)鍵組件(例如RPN和回歸頭)仍然是隨機(jī)初始化的。

任務(wù):現(xiàn)有預(yù)訓(xùn)練方法僅將分類任務(wù)視為替代任務(wù),未能捕獲包括建議生成、目標(biāo)分配和框回歸在內(nèi)的與物體相關(guān)的位置上下文。

這些差異可能導(dǎo)致受限的結(jié)果、較差的泛化能力和較慢的收斂速度。

2. 相關(guān)知識(shí)補(bǔ)充

目標(biāo)檢測(cè)。 當(dāng)前的目標(biāo)檢測(cè)算法可以根據(jù)不同的預(yù)測(cè)流程分為基于錨點(diǎn)、基于點(diǎn)和基于查詢的方法?;阱^點(diǎn)的方法在每個(gè)像素上生成多個(gè)具有預(yù)定義大小和尺度的錨點(diǎn)。它們通常通過交并比將訓(xùn)練樣本劃分為正樣本和負(fù)樣本?;邳c(diǎn)的方法旨在找到與每個(gè)對(duì)象相對(duì)應(yīng)的參考點(diǎn),這可以是每個(gè)實(shí)例的中心點(diǎn),預(yù)定義或自學(xué)習(xí)的關(guān)鍵點(diǎn) 。與基于錨點(diǎn)和基于點(diǎn)的方法中使用預(yù)定義的先驗(yàn)知識(shí)不同,基于查詢的方法通過一組可學(xué)習(xí)的查詢來表示不同的對(duì)象。

自監(jiān)督預(yù)訓(xùn)練。 自監(jiān)督學(xué)習(xí)充分利用了大量無標(biāo)注數(shù)據(jù)來學(xué)習(xí)結(jié)構(gòu)化的數(shù)據(jù)特征,預(yù)訓(xùn)練的權(quán)重被轉(zhuǎn)移到下游任務(wù)中以確保良好的初始化。已經(jīng)為無監(jiān)督預(yù)訓(xùn)練提出了許多替代任務(wù),例如特征聚類 ,著色,上下文預(yù)測(cè),旋轉(zhuǎn)預(yù)測(cè)和圖像填充。一方面,對(duì)比學(xué)習(xí)通過最大化來自同一實(shí)例的不同視圖的相似度來捕獲良好的表征 ,在多個(gè)下游任務(wù)中取得了有競(jìng)爭(zhēng)力的性能。另一方面,Mask Image Modeling (MIM)最近在自監(jiān)督學(xué)習(xí)中引起了越來越多的關(guān)注。MIM不需要特定的數(shù)據(jù)增強(qiáng),并且對(duì)下游任務(wù)具有更強(qiáng)大的泛化能力。

目標(biāo)檢測(cè)的自監(jiān)督預(yù)訓(xùn)練。 盡管無監(jiān)督預(yù)訓(xùn)練在目標(biāo)檢測(cè)中顯示出了有競(jìng)爭(zhēng)力的結(jié)果,但直接將圖像級(jí)預(yù)訓(xùn)練知識(shí)轉(zhuǎn)移到密集級(jí)下游任務(wù)存在一系列不一致之處。為減小預(yù)訓(xùn)練和微調(diào)之間的差距,一些方法通過探索不同視圖之間的局部特征相似性來提出密集級(jí)對(duì)比學(xué)習(xí)。一些研究人員發(fā)現(xiàn)僅預(yù)訓(xùn)練骨干網(wǎng)絡(luò)是不夠的,他們嘗試預(yù)訓(xùn)練其他常見模塊,如FPN 。然而,這些方法需要從頭開始進(jìn)行大量的預(yù)訓(xùn)練,檢測(cè)器中的其他關(guān)鍵模塊(如RetinaNet 中的回歸頭)仍然是隨機(jī)初始化的。另一方面,UP-DETR和DETReg 通過引入?yún)^(qū)域匹配和特征重構(gòu)替代任務(wù)來預(yù)訓(xùn)練整個(gè)DETR樣式檢測(cè)器。盡管這些方法可以對(duì)整個(gè)模型進(jìn)行充分的預(yù)訓(xùn)練,但DETR定向的替代任務(wù)無法直接應(yīng)用于其他檢測(cè)方法。相比之下,AlignDet實(shí)現(xiàn)了各種檢測(cè)器的高效充分的自監(jiān)督預(yù)訓(xùn)練。

3. 方法詳解

最近的工作通過構(gòu)建無監(jiān)督預(yù)訓(xùn)練替代任務(wù)來擴(kuò)展“預(yù)訓(xùn)練和微調(diào)”方法,與僅使用監(jiān)督預(yù)訓(xùn)練的方法相比,這些方法取得了更高的性能。然而,與檢測(cè)過程相比,當(dāng)前預(yù)訓(xùn)練方法在數(shù)據(jù)、模型和任務(wù)上存在不一致之處,如圖1所示。盡管可以通過大規(guī)模標(biāo)注數(shù)據(jù)集的訓(xùn)練來緩解這些不一致,但它需要巨大的計(jì)算資源和手工標(biāo)注成本。這些問題和局限激發(fā)我們提出AlignDet,一個(gè)通用的自監(jiān)督框架,用于減小預(yù)訓(xùn)練和微調(diào)階段中的差異。

ba50e4da-2fa2-11ee-9e74-dac502259ad0.png

圖2 AlignDet的預(yù)訓(xùn)練流程圖。監(jiān)督和自監(jiān)督預(yù)訓(xùn)練都可以用于圖像域階段,以捕捉整體視覺概念。對(duì)于框域預(yù)訓(xùn)練,首先采用選擇性搜索生成無監(jiān)督建議作為偽標(biāo)簽,然后對(duì)每個(gè)建議進(jìn)行擴(kuò)充,構(gòu)建兩個(gè)具有不同尺度和變換的視圖。每個(gè)預(yù)測(cè)框用于構(gòu)建對(duì)比學(xué)習(xí)和協(xié)調(diào)相關(guān)損失,以適應(yīng)檢測(cè)任務(wù)。

整個(gè)預(yù)訓(xùn)練流程如圖2所示。在以下小節(jié)中,我們分別在第3.1節(jié)和第3.2節(jié)中介紹圖像域預(yù)訓(xùn)練和框域預(yù)訓(xùn)練。我們提供了偽代碼,以便更直觀地理解AlignDet流程,以及與其他方法在技術(shù)細(xì)節(jié)上的比較見補(bǔ)充材料。

3.1 圖像域預(yù)訓(xùn)練

圖像域預(yù)訓(xùn)練優(yōu)化骨干網(wǎng)絡(luò),為后續(xù)的框域預(yù)訓(xùn)練提取高層語義特征,如圖2左側(cè)的步驟1所示。一方面,給定圖像x,骨干網(wǎng)絡(luò)可以在完全監(jiān)督的設(shè)置下與分類器和分類類別進(jìn)行預(yù)訓(xùn)練。另一方面,最近出現(xiàn)的無監(jiān)督學(xué)習(xí)算法有助于通過大量無標(biāo)注數(shù)據(jù)捕獲更普適的表征。以SimSiam 為例,從輸入圖像中構(gòu)造兩個(gè)視圖和,并采用不同的數(shù)據(jù)增強(qiáng)。骨干網(wǎng)絡(luò)可以通過最大化不同視圖的相似性來學(xué)習(xí)普適的表征,并且利用預(yù)測(cè)器和停止梯度用來防止模式崩潰。

圖像域預(yù)訓(xùn)練通常在大規(guī)模的圖像分類數(shù)據(jù)集(如ImageNet)上進(jìn)行,其中每個(gè)樣本主要包含一個(gè)或少數(shù)幾個(gè)主要物體位于圖像中心。這里存在一個(gè)差距,因?yàn)樵陬A(yù)訓(xùn)練過程無法訪問包含不同尺度和位置的多個(gè)物體目標(biāo)數(shù)據(jù)集。此外,檢測(cè)頭仍然是隨機(jī)初始化的,回歸工作在此圖像域預(yù)訓(xùn)練中也未明確學(xué)習(xí)到。為此,我們?cè)O(shè)計(jì)框域預(yù)訓(xùn)練以減小這些差異。

3.2 框域預(yù)訓(xùn)練

wKgZomTIf6WAdk2MAAMv-iD3gRQ925.jpg
wKgZomTIf7iASeEnAAEPGjlowrE082.jpg

4. 結(jié)論

本文中,我們指出預(yù)訓(xùn)練和微調(diào)階段在目標(biāo)檢測(cè)中存在數(shù)據(jù)、模型和任務(wù)的差異,并提出了AlignDet來解決這些問題。AlignDet學(xué)習(xí)分類和回歸知識(shí),實(shí)現(xiàn)高效針對(duì)所有模塊的預(yù)訓(xùn)練。值得注意的是,AlignDet是第一個(gè)實(shí)現(xiàn)各種檢測(cè)器完全無監(jiān)督預(yù)訓(xùn)練的框架。我們廣泛的實(shí)驗(yàn)表明,AlignDet可以在各種設(shè)置下顯著提升檢測(cè)性能,包括不同的檢測(cè)器、骨干網(wǎng)絡(luò)、數(shù)據(jù)設(shè)置和微調(diào)計(jì)劃。我們相信我們的工作為目標(biāo)檢測(cè)中的預(yù)訓(xùn)練問題提供了有價(jià)值的洞見,并開辟了新的研究方向。




審核編輯:劉清

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 檢測(cè)器
    +關(guān)注

    關(guān)注

    1

    文章

    894

    瀏覽量

    48696
  • MIM
    MIM
    +關(guān)注

    關(guān)注

    0

    文章

    13

    瀏覽量

    9512
  • 圖像變換
    +關(guān)注

    關(guān)注

    0

    文章

    5

    瀏覽量

    1585

原文標(biāo)題:ICCV2023-AlignDet:在各種檢測(cè)器的所有模塊實(shí)現(xiàn)無監(jiān)督預(yù)訓(xùn)練

文章出處:【微信號(hào):GiantPandaCV,微信公眾號(hào):GiantPandaCV】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    軸承異步電機(jī)轉(zhuǎn)子徑向位移白檢測(cè)

    訓(xùn)練構(gòu)建轉(zhuǎn)子位移預(yù)測(cè)模型,利用位移預(yù)測(cè)模型的泛化能力,進(jìn)行轉(zhuǎn)子位移估計(jì)。仿真結(jié)果表明,提出的位移估計(jì)方法能夠準(zhǔn)確檢測(cè)轉(zhuǎn)子徑向位移信號(hào),并且能實(shí)現(xiàn)電機(jī)位移傳感
    發(fā)表于 07-14 17:45

    5 GHz 802.11ax 超線性 WLAN 前端模塊,帶集成對(duì)數(shù)檢測(cè)器 skyworksinc

    電子發(fā)燒友網(wǎng)為你提供()5 GHz 802.11ax 超線性 WLAN 前端模塊,帶集成對(duì)數(shù)檢測(cè)器相關(guān)產(chǎn)品參數(shù)、數(shù)據(jù)手冊(cè),更有5 GHz 802.11ax 超線性 WLAN 前端模塊,帶集成
    發(fā)表于 07-02 18:32
    5 GHz 802.11ax 超線性 WLAN 前端<b class='flag-5'>模塊</b>,帶集成對(duì)數(shù)<b class='flag-5'>檢測(cè)器</b> skyworksinc

    帶功率檢測(cè)器的 5 GHz 前端模塊 skyworksinc

    電子發(fā)燒友網(wǎng)為你提供()帶功率檢測(cè)器的 5 GHz 前端模塊相關(guān)產(chǎn)品參數(shù)、數(shù)據(jù)手冊(cè),更有帶功率檢測(cè)器的 5 GHz 前端模塊的引腳圖、接線圖、封裝手冊(cè)、中文資料、英文資料,帶功率
    發(fā)表于 06-19 18:35
    帶功率<b class='flag-5'>檢測(cè)器</b>的 5 GHz 前端<b class='flag-5'>模塊</b> skyworksinc

    使用MATLAB進(jìn)行監(jiān)督學(xué)習(xí)

    監(jiān)督學(xué)習(xí)是一種根據(jù)未標(biāo)注數(shù)據(jù)進(jìn)行推斷的機(jī)器學(xué)習(xí)方法。監(jiān)督學(xué)習(xí)旨在識(shí)別數(shù)據(jù)中隱藏的模式和關(guān)系,無需任何監(jiān)督或關(guān)于結(jié)果的先驗(yàn)知識(shí)。
    的頭像 發(fā)表于 05-16 14:48 ?688次閱讀
    使用MATLAB進(jìn)行<b class='flag-5'>無</b><b class='flag-5'>監(jiān)督</b>學(xué)習(xí)

    阿童木雙張檢測(cè)器汽車沖壓產(chǎn)線的應(yīng)用

    檢測(cè)器
    阿童木(廣州)智能科技有限公司
    發(fā)布于 :2025年04月10日 17:31:44

    用PaddleNLP4060單卡上實(shí)踐大模型預(yù)訓(xùn)練技術(shù)

    作者:算力魔方創(chuàng)始人/英特爾創(chuàng)新大使劉力 之前我們分享了《從零開始訓(xùn)練一個(gè)大語言模型需要投資多少錢》,其中高昂的預(yù)訓(xùn)練費(fèi)用讓許多對(duì)大模型預(yù)訓(xùn)練
    的頭像 發(fā)表于 02-19 16:10 ?999次閱讀
    用PaddleNLP<b class='flag-5'>在</b>4060單卡上實(shí)踐大模型<b class='flag-5'>預(yù)</b><b class='flag-5'>訓(xùn)練</b>技術(shù)

    壓力檢測(cè)器有哪些優(yōu)勢(shì)

    現(xiàn)代工業(yè)與基礎(chǔ)設(shè)施管理中,壓力檢測(cè)器作為監(jiān)測(cè)與控制系統(tǒng)的關(guān)鍵組件,扮演著重要的角色。壓力檢測(cè)器集高精度、高穩(wěn)定性與便捷操作于一體,供水、排水、消防水系統(tǒng)、輸油管道、輸氣管道等多個(gè)領(lǐng)
    的頭像 發(fā)表于 01-07 17:09 ?729次閱讀

    直播預(yù)約 |數(shù)據(jù)智能系列講座第4期:預(yù)訓(xùn)練的基礎(chǔ)模型下的持續(xù)學(xué)習(xí)

    神經(jīng)網(wǎng)絡(luò),特別是預(yù)訓(xùn)練的基礎(chǔ)模型研究得到了廣泛的應(yīng)用,但其仍然主要依賴于大量樣本上的批量式訓(xùn)練。本報(bào)告將探討實(shí)現(xiàn)模型的增量式
    的頭像 發(fā)表于 10-18 08:09 ?595次閱讀
    直播預(yù)約 |數(shù)據(jù)智能系列講座第4期:<b class='flag-5'>預(yù)</b><b class='flag-5'>訓(xùn)練</b>的基礎(chǔ)模型下的持續(xù)學(xué)習(xí)

    UCC28070實(shí)現(xiàn)橋功率因數(shù)校正(PFC)預(yù)調(diào)節(jié)設(shè)計(jì)

    電子發(fā)燒友網(wǎng)站提供《UCC28070實(shí)現(xiàn)橋功率因數(shù)校正(PFC)預(yù)調(diào)節(jié)設(shè)計(jì).pdf》資料免費(fèi)下載
    發(fā)表于 10-17 10:17 ?17次下載
    UCC28070<b class='flag-5'>實(shí)現(xiàn)</b><b class='flag-5'>無</b>橋功率因數(shù)校正(PFC)<b class='flag-5'>預(yù)</b>調(diào)節(jié)<b class='flag-5'>器</b>設(shè)計(jì)

    高效液相色譜儀的檢測(cè)器有哪些

    高效液相色譜儀(HPLC)是一種廣泛應(yīng)用于化學(xué)分析、生物醫(yī)藥、環(huán)境監(jiān)測(cè)等領(lǐng)域的分離和檢測(cè)技術(shù)。HPLC的檢測(cè)器是整個(gè)系統(tǒng)的關(guān)鍵部分,它能夠?qū)⑸V柱分離出的組分轉(zhuǎn)化為可測(cè)量的信號(hào),從而實(shí)現(xiàn)對(duì)樣品的定量
    的頭像 發(fā)表于 08-08 10:43 ?3109次閱讀

    熒光檢測(cè)器用的是什么燈光

    現(xiàn)象。熒光是指物質(zhì)受到激發(fā)光照射后,吸收光能并躍遷到高能級(jí),然后返回基態(tài)的過程中釋放出光能的現(xiàn)象。熒光檢測(cè)器通過測(cè)量熒光物質(zhì)所發(fā)出的熒光信號(hào),來分析物質(zhì)的濃度、結(jié)構(gòu)等信息。 熒光檢測(cè)器
    的頭像 發(fā)表于 08-08 10:38 ?1713次閱讀

    熒光檢測(cè)器適用范圍有哪些

    、材料科學(xué)等多個(gè)方面。 一、生物分子檢測(cè) 核酸檢測(cè) 熒光檢測(cè)器核酸檢測(cè)中具有重要應(yīng)用,如DNA測(cè)序、基因表達(dá)分析、基因突變
    的頭像 發(fā)表于 08-08 10:35 ?2373次閱讀

    熒光檢測(cè)器用來檢測(cè)什么物質(zhì)

    光能后,部分能量以光的形式重新釋放出來,這種光稱為熒光。熒光檢測(cè)器通過測(cè)量熒光的強(qiáng)度、波長(zhǎng)等參數(shù),實(shí)現(xiàn)對(duì)物質(zhì)的定性和定量分析。 熒光檢測(cè)器的工作原理主要包括以下幾個(gè)步驟: 激發(fā):熒光檢測(cè)器
    的頭像 發(fā)表于 08-08 10:34 ?2001次閱讀

    電流檢測(cè)器有什么和什么組成

    電流檢測(cè)器是一種用于檢測(cè)電流大小的電子設(shè)備,廣泛應(yīng)用于電力系統(tǒng)、工業(yè)自動(dòng)化、家用電器等領(lǐng)域。 一、電流檢測(cè)器的組成 電流檢測(cè)器主要由以下幾個(gè)部分組成: 電流傳感
    的頭像 發(fā)表于 07-19 17:12 ?2016次閱讀

    電路檢測(cè)器和電流檢測(cè)器的區(qū)別

    1. 引言 電路檢測(cè)器和電流檢測(cè)器是電子工程中常用的工具,它們幫助工程師和技術(shù)人員診斷和監(jiān)測(cè)電子設(shè)備的性能。 2. 電路檢測(cè)器 定義和功能 :電路檢測(cè)器是一種用于
    的頭像 發(fā)表于 07-19 16:34 ?2116次閱讀