一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

基于transformer和自監(jiān)督學(xué)習(xí)的路面異常檢測(cè)方法分享

冬至子 ? 來源:蘇大軌道交通學(xué)院研究生 ? 作者:Zijie Lina,b,Hui Wang ? 2023-12-06 14:57 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

01

文章摘要

鋪設(shè)異常檢測(cè)可以幫助減少數(shù)據(jù)存儲(chǔ)、傳輸、標(biāo)記和處理的壓力。本論文描述了一種基于Transformer和自監(jiān)督學(xué)習(xí)的新方法,有助于定位異常區(qū)域。實(shí)驗(yàn)結(jié)果顯示,自監(jiān)督學(xué)習(xí)可以提高在小型未標(biāo)記圖像數(shù)據(jù)集上的性能。Transformer被證明在路面損壞檢測(cè)領(lǐng)域是適用的。文章構(gòu)建的類似于人臉識(shí)別的框架可以通過將新的補(bǔ)丁放入圖庫中來增強(qiáng)性能,而移除相似的補(bǔ)丁不會(huì)影響識(shí)別結(jié)果。該方法足夠高效和小型化,以支持實(shí)時(shí)工作,并且可以直接應(yīng)用于邊緣檢測(cè)。

02

主要工作與貢獻(xiàn)

  1. 該論文提出了一種新穎的方法,將Transformer模型和自監(jiān)督學(xué)習(xí)相結(jié)合,用于路面異常檢測(cè)。Transformer是一種強(qiáng)大的神經(jīng)網(wǎng)絡(luò)架構(gòu),用于處理序列數(shù)據(jù),在該研究中被應(yīng)用于圖像數(shù)據(jù),并取得了顯著的成果。
  2. 監(jiān)督學(xué)習(xí)是一種無需人工標(biāo)注的學(xué)習(xí)方法,可以從未標(biāo)記的數(shù)據(jù)中學(xué)習(xí)有用的特征。該論文展示了自監(jiān)督學(xué)習(xí)在小型未標(biāo)記圖像數(shù)據(jù)集上的應(yīng)用,并證明它能夠顯著提高性能。
  3. 研究人員構(gòu)建了一個(gè)類似于人臉識(shí)別的框架,通過將新的圖像補(bǔ)丁加入圖庫中,來增強(qiáng)路面異常檢測(cè)的性能。這種方法能夠在不進(jìn)行訓(xùn)練的情況下實(shí)現(xiàn)性能的提升。
  4. 該方法被證明足夠高效和小型化,能夠支持實(shí)時(shí)工作,因此可以在實(shí)際應(yīng)用中進(jìn)行邊緣檢測(cè)和路面異常監(jiān)測(cè)。

03

所提方法

Transformer可能比CNN更好,因?yàn)門ransformer天然具有全局感受野,可以捕捉長距離像素之間的關(guān)系。自注意力機(jī)制可能有助于解決缺乏數(shù)據(jù)的問題,因?yàn)樵陬愃茥l件下,MAE(掩碼自編碼器)表現(xiàn)良好。本論文將自監(jiān)督學(xué)習(xí)和Transformer應(yīng)用于路面異常檢測(cè)。使用ViT-S的自監(jiān)督學(xué)習(xí)來重構(gòu)未標(biāo)記的路面圖像,并提出了一種編碼-檢索-匹配的路面異常檢測(cè)方法來解決分類重訓(xùn)練的問題。文章方法的框架如圖1所示。主要由兩個(gè)部分組成:圖庫和編碼器。首先,圖像將被劃分為幾個(gè)補(bǔ)丁,并且典型的補(bǔ)丁將被添加到圖庫中。這將降低分辨率并減少背景像素。在模型訓(xùn)練完成后,將提取編碼器部分。所有的補(bǔ)丁都可以被編碼成特征向量。一旦向量被編碼,計(jì)算它們之間的距離得到一個(gè)距離向量(一列)。最后,將找到與預(yù)測(cè)類別最接近的補(bǔ)丁。

圖片

圖1 論文方法總體架構(gòu)

01.編碼器

圖片

圖2 ViT架構(gòu)

ViT是Transformer在計(jì)算機(jī)視覺領(lǐng)域的第一個(gè)成功應(yīng)用,它簡(jiǎn)單地將圖像劃分為補(bǔ)丁作為輸入序列,以便Transformer能夠處理。參考了BERT,ViT在其中添加了一個(gè)[class]標(biāo)記來融合用于分類的信息。如圖2所示,ViT首先通過平均劃分輸入來獲取圖像補(bǔ)丁,然后進(jìn)行線性投影以獲取圖像標(biāo)記。一旦生成了標(biāo)記,將添加位置嵌入以恢復(fù)丟失的位置信息。然后,它們將被輸入到Transformer編碼器中。最后,只有[class]標(biāo)記將在分類中使用。多頭注意力機(jī)制可以用公式(1)來描述。

圖片

其中,n表示嵌入的數(shù)量,Zh是第h個(gè)注意頭的輸出,dk表示K的維度。嵌入E和可學(xué)習(xí)權(quán)重W進(jìn)行點(diǎn)積運(yùn)算,以得到查詢(Query)Q,鍵(Key)K和值(Value)V。

最終輸出是可學(xué)習(xí)權(quán)重和Z(堆疊Zh)的點(diǎn)生成。不同頭部的權(quán)重是獨(dú)立的,以確保從各種表示子空間中提取特征。整個(gè)過程可以大致描述為等式(2)-(5)。

圖片

其中Z0表示輸入向量,Y是用于分類的圖像表示。Z0L是Z的位置0上的標(biāo)記(也稱為[class]標(biāo)記)。LN表示層標(biāo)準(zhǔn)化。

02.Drop path

文章采用“drop path” 作為一種規(guī)范化方法來防止過擬合。簡(jiǎn)單來說,它會(huì)根據(jù)預(yù)先確定的概率隨機(jī)地禁用每一層之間的路徑,至少保留一條路徑。在實(shí)現(xiàn)中,對(duì)于每一層的多個(gè)輸入,會(huì)隨機(jī)丟棄一些輸入。這個(gè)效果類似于模型集成,其中不同的路徑組合意味著不同的子網(wǎng)絡(luò),而在預(yù)測(cè)時(shí)不會(huì)丟棄路徑來將它們組合起來。

03.監(jiān)督學(xué)習(xí)

在實(shí)驗(yàn)中,文章使用圖像補(bǔ)丁作為輸入,輸出為正常或異常。因此,這是一個(gè)二元分類任務(wù);輸出值是介于0到1之間的sigmoid輸入得分。數(shù)值越接近0,輸入越有可能是異常(類別0)。相反,越接近1,輸入越有可能是正常的(類別1)。在訓(xùn)練過程中,sigmoid得分(x)與真實(shí)值(y)之間的差距越大,二元交叉熵?fù)p失就越大。在模型用于推斷時(shí),會(huì)設(shè)置一個(gè)閾值(通常為0.5)。當(dāng)sigmoid得分低于閾值時(shí),輸入被視為異常,反之亦然。

04.自監(jiān)督學(xué)習(xí)

MAE是一種基于部分掩膜圖像的像素級(jí)重建任務(wù)的方法。編碼器僅對(duì)可見的補(bǔ)丁進(jìn)行編碼。編碼完成后,[mask]標(biāo)記將添加到相應(yīng)的位置。解碼器將接收所有標(biāo)記作為輸入進(jìn)行重建。

MAE的關(guān)鍵方面可以分為四個(gè)部分:掩膜策略、編碼器、解碼器和重建目標(biāo)。掩膜策略通常選擇隨機(jī)掩膜,掩膜比例較大。在這種情況下,被掩膜部分占據(jù)了圖像的大部分區(qū)域,很難找到掩膜周圍的未掩膜區(qū)域,迫使模型學(xué)習(xí)不依賴局部信息。文章選擇純粹的ViT作為編碼器,因?yàn)樗鼪]有引入過多的修改,導(dǎo)致對(duì)特定領(lǐng)域過擬合,并且重建目標(biāo)是均方損失。

05.類似面部識(shí)別的框架

通常,模型在超出其訓(xùn)練數(shù)據(jù)分布范圍的數(shù)據(jù)上表現(xiàn)較差。不同地區(qū)之間存在明顯的道路差異,例如路面分類,將會(huì)降低模型的精度。文章從最佳ViT-S模型中提取編碼器作為幀中的編碼器。選擇第11、12、13、10、9、8和6列的圖像塊作為輸入,因?yàn)檫@些位置的異常概率較高。如果Sigmoid輸出低于某個(gè)閾值,該類別被認(rèn)為是異常(類別0)。一旦預(yù)測(cè)為異常,整個(gè)輸入圖像都被視為異常。

04

實(shí)驗(yàn)驗(yàn)證

1

監(jiān)督學(xué)習(xí)結(jié)果

表1 ViT-S在不同DA和drop path下的精度比較

圖片

監(jiān)督學(xué)習(xí)的結(jié)果顯示在表格1和圖3、圖4中。表格1顯示數(shù)據(jù)增強(qiáng)(DAs)比隨機(jī)刪除路徑(drop paths)可以帶來更多的性能提升。從圖3和圖4可以看出,兩個(gè)模型在最后幾個(gè)周期開始過擬合。Resnet的結(jié)果較好,因?yàn)樗諗康揭粋€(gè)更好的局部最優(yōu)點(diǎn)。CNN具有局部相關(guān)性等先驗(yàn)知識(shí),當(dāng)數(shù)據(jù)較少時(shí)會(huì)導(dǎo)致這樣的結(jié)果。而Transformer沒有這樣的知識(shí),因此需要從更多數(shù)據(jù)中進(jìn)行學(xué)習(xí)。

圖片

圖3 resnet34的學(xué)習(xí)曲線

圖片

圖4 ViT–S的學(xué)習(xí)曲線

2

自我監(jiān)督學(xué)習(xí)結(jié)果

表2證明,在微調(diào)中應(yīng)用DA對(duì)于提高性能是必要的,因?yàn)樽?a target="_blank">高精度主要取決于微調(diào),使模型適應(yīng)二進(jìn)制分類任務(wù)。如果微調(diào)數(shù)據(jù)的數(shù)量不足,模型仍然會(huì)過擬合。根據(jù)有監(jiān)督和自監(jiān)督學(xué)習(xí)圖,MAE可以顯著加速收斂并提高精度。

表2 在不同位置應(yīng)用DA的準(zhǔn)確性

圖片

3

可視化視角討論

文章使用GradCAM(梯度加權(quán)類激活映射)來直觀地分析文章的路面異常檢測(cè)算法。選擇了兩張分別具有兩種類型的明顯遇險(xiǎn)的測(cè)試圖像。圖5圖6顯示了結(jié)果?;旌辖Y(jié)果意味著所有頭的平均值。圖中的響應(yīng)越高,它與分類的相關(guān)性就越大。圖6與無MAE的ViT相比,有MAE的ViT在遇險(xiǎn)周圍有更集中的活動(dòng)區(qū)域。這一事實(shí)支持了像MAE這樣的自監(jiān)督學(xué)習(xí)可以幫助模型在數(shù)據(jù)集幾乎沒有標(biāo)記數(shù)據(jù)的情況下學(xué)習(xí)更好的表示。此外,我們可以看到,最后兩個(gè)區(qū)塊比其他區(qū)塊更關(guān)注遇險(xiǎn)區(qū)域。有一些像Block_9這樣的塊具有統(tǒng)一的響應(yīng)。這一發(fā)現(xiàn)在圖5中更為明顯。

圖片

圖5 測(cè)試圖像A中ViT w/MAE的單獨(dú)結(jié)果

圖片

圖6 測(cè)試圖像A中ViT w/MAE和ViT w/o MAE的混合結(jié)果

05

結(jié)論

研究旨在快速檢測(cè)道路異常,以減少路面損壞識(shí)別、數(shù)據(jù)存儲(chǔ)和標(biāo)注的工作量。通過驗(yàn)證異常檢測(cè)任務(wù),自監(jiān)督學(xué)習(xí)對(duì)這個(gè)問題產(chǎn)生了顯著影響,其價(jià)值比數(shù)據(jù)增強(qiáng)(準(zhǔn)確率為0.9268 vs 0.9183)更為重要。Transformer在道路領(lǐng)域適用,因?yàn)樗哂胁蹲介L距離關(guān)系的強(qiáng)大能力。第二個(gè)重要發(fā)現(xiàn)是,通過定制畫廊,類似于人臉識(shí)別的框架可以快速識(shí)別不同的損壞類型?;赩iT(Visual Transformer)和MAE,本研究設(shè)計(jì)了一種新穎的方法來檢測(cè)異常的路面部分。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 解碼器
    +關(guān)注

    關(guān)注

    9

    文章

    1176

    瀏覽量

    41982
  • 編碼器
    +關(guān)注

    關(guān)注

    45

    文章

    3799

    瀏覽量

    138041
  • 人臉識(shí)別
    +關(guān)注

    關(guān)注

    77

    文章

    4089

    瀏覽量

    84271
  • 計(jì)算機(jī)視覺
    +關(guān)注

    關(guān)注

    9

    文章

    1709

    瀏覽量

    46777
  • Transformer
    +關(guān)注

    關(guān)注

    0

    文章

    151

    瀏覽量

    6519
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    使用MATLAB進(jìn)行無監(jiān)督學(xué)習(xí)

    監(jiān)督學(xué)習(xí)是一種根據(jù)未標(biāo)注數(shù)據(jù)進(jìn)行推斷的機(jī)器學(xué)習(xí)方法。無監(jiān)督學(xué)習(xí)旨在識(shí)別數(shù)據(jù)中隱藏的模式和關(guān)系,無需任何監(jiān)督或關(guān)于結(jié)果的先驗(yàn)知識(shí)。
    的頭像 發(fā)表于 05-16 14:48 ?683次閱讀
    使用MATLAB進(jìn)行無<b class='flag-5'>監(jiān)督學(xué)習(xí)</b>

    適用于任意數(shù)據(jù)模態(tài)的監(jiān)督學(xué)習(xí)數(shù)據(jù)增強(qiáng)技術(shù)

    模態(tài)的。這意味著需要為不同的數(shù)據(jù)模態(tài)開發(fā)不同的監(jiān)督學(xué)習(xí)算法。為此,本文提出了一種通用的數(shù)據(jù)增強(qiáng)技術(shù),可以應(yīng)用于任意數(shù)據(jù)模態(tài)。相較于已有的通用的監(jiān)督學(xué)習(xí),該
    的頭像 發(fā)表于 09-04 10:07 ?1406次閱讀
    適用于任意數(shù)據(jù)模態(tài)的<b class='flag-5'>自</b><b class='flag-5'>監(jiān)督學(xué)習(xí)</b>數(shù)據(jù)增強(qiáng)技術(shù)

    如何用卷積神經(jīng)網(wǎng)絡(luò)方法去解決機(jī)器監(jiān)督學(xué)習(xí)下面的分類問題?

    人工智能下面有哪些機(jī)器學(xué)習(xí)分支?如何用卷積神經(jīng)網(wǎng)絡(luò)(CNN)方法去解決機(jī)器學(xué)習(xí)監(jiān)督學(xué)習(xí)下面的分類問題?
    發(fā)表于 06-16 08:09

    基于半監(jiān)督學(xué)習(xí)的跌倒檢測(cè)系統(tǒng)設(shè)計(jì)_李仲年

    基于半監(jiān)督學(xué)習(xí)的跌倒檢測(cè)系統(tǒng)設(shè)計(jì)_李仲年
    發(fā)表于 03-19 19:11 ?4次下載

    基于半監(jiān)督學(xué)習(xí)框架的識(shí)別算法

    人體行為識(shí)別是計(jì)算機(jī)視覺研究的熱點(diǎn)問題,現(xiàn)有的行為識(shí)別方法都是基于監(jiān)督學(xué)習(xí)框架.為了取得較好的識(shí)別效果,通常需要大量的有標(biāo)記樣本來建模.然而,獲取有標(biāo)記樣本是一個(gè)費(fèi)時(shí)又費(fèi)力的工作.為了解決這個(gè)
    發(fā)表于 01-21 10:41 ?1次下載

    機(jī)器學(xué)習(xí)算法中有監(jiān)督和無監(jiān)督學(xué)習(xí)的區(qū)別

    監(jiān)督學(xué)習(xí)的好處之一是,它不需要監(jiān)督學(xué)習(xí)必須經(jīng)歷的費(fèi)力的數(shù)據(jù)標(biāo)記過程。但是,要權(quán)衡的是,評(píng)估其性能的有效性也非常困難。相反,通過將監(jiān)督學(xué)習(xí)算法的輸出與測(cè)試數(shù)據(jù)的實(shí)際標(biāo)簽進(jìn)行比較,可以很容易地衡量
    的頭像 發(fā)表于 07-07 10:18 ?6108次閱讀

    監(jiān)督學(xué)習(xí)Transformer相關(guān)論文

    、Transformer、圖神經(jīng)網(wǎng)絡(luò)、自然語言處理、模型壓縮等熱點(diǎn)領(lǐng)域,將分多期為大家?guī)硐盗姓撐慕庾x。 本期的關(guān)注焦點(diǎn)是監(jiān)督學(xué)習(xí)
    的頭像 發(fā)表于 11-02 15:50 ?2914次閱讀
    <b class='flag-5'>自</b><b class='flag-5'>監(jiān)督學(xué)習(xí)</b>與<b class='flag-5'>Transformer</b>相關(guān)論文

    最基礎(chǔ)的半監(jiān)督學(xué)習(xí)

    導(dǎo)讀 最基礎(chǔ)的半監(jiān)督學(xué)習(xí)的概念,給大家一個(gè)感性的認(rèn)識(shí)。 半監(jiān)督學(xué)習(xí)(SSL)是一種機(jī)器學(xué)習(xí)技術(shù),其中任務(wù)是從一個(gè)小的帶標(biāo)簽的數(shù)據(jù)集和相對(duì)較大的未帶標(biāo)簽的數(shù)據(jù)中學(xué)習(xí)得到的。SSL的目標(biāo)是
    的頭像 發(fā)表于 11-02 16:08 ?2953次閱讀

    監(jiān)督學(xué)習(xí)最基礎(chǔ)的3個(gè)概念

    導(dǎo)讀 今天給大家介紹半監(jiān)督學(xué)習(xí)中的3個(gè)最基礎(chǔ)的概念:一致性正則化,熵最小化和偽標(biāo)簽,并介紹了兩個(gè)經(jīng)典的半監(jiān)督學(xué)習(xí)方法。 沒看一的點(diǎn)這里哈:半監(jiān)督學(xué)習(xí)入門基礎(chǔ)(一) 半監(jiān)督學(xué)習(xí) (SSL
    的頭像 發(fā)表于 11-02 16:14 ?3285次閱讀
    半<b class='flag-5'>監(jiān)督學(xué)習(xí)</b>最基礎(chǔ)的3個(gè)概念

    為什么半監(jiān)督學(xué)習(xí)是機(jī)器學(xué)習(xí)的未來?

    為什么半監(jiān)督學(xué)習(xí)是機(jī)器學(xué)習(xí)的未來。 監(jiān)督學(xué)習(xí)是人工智能領(lǐng)域的第一種學(xué)習(xí)類型。從它的概念開始,無數(shù)的算法,從簡(jiǎn)單的邏輯回歸到大規(guī)模的神經(jīng)網(wǎng)絡(luò),都已經(jīng)被研究用來提高精確度和預(yù)測(cè)能力。 然而
    的頭像 發(fā)表于 11-27 10:42 ?4147次閱讀

    監(jiān)督學(xué)習(xí):比監(jiān)督學(xué)習(xí)做的更好

    監(jiān)督學(xué)習(xí)是人工智能領(lǐng)域的第一種學(xué)習(xí)類型。從它的概念開始,無數(shù)的算法,從簡(jiǎn)單的邏輯回歸到大規(guī)模的神經(jīng)網(wǎng)絡(luò),都已經(jīng)被研究用來提高精...
    的頭像 發(fā)表于 12-08 23:32 ?1716次閱讀

    基于人工智能的監(jiān)督學(xué)習(xí)詳解

    監(jiān)督學(xué)習(xí)讓 AI 系統(tǒng)能夠從很少的數(shù)據(jù)中學(xué)習(xí)知識(shí),這樣才能識(shí)別和理解世界上更微妙、更不常見的表示形式。
    的頭像 發(fā)表于 03-30 17:09 ?6391次閱讀
    基于人工智能的<b class='flag-5'>自</b><b class='flag-5'>監(jiān)督學(xué)習(xí)</b>詳解

    機(jī)器學(xué)習(xí)中的無監(jiān)督學(xué)習(xí)應(yīng)用在哪些領(lǐng)域

    解決數(shù)據(jù)中心、云計(jì)算、人工智能和邊緣計(jì)算等各個(gè)行業(yè)的問題,為人們帶來極大便益。 監(jiān)督學(xué)習(xí)是什么? 監(jiān)督學(xué)習(xí)監(jiān)督學(xué)習(xí)和非
    發(fā)表于 01-20 10:52 ?5259次閱讀
    機(jī)器<b class='flag-5'>學(xué)習(xí)</b>中的無<b class='flag-5'>監(jiān)督學(xué)習(xí)</b>應(yīng)用在哪些領(lǐng)域

    監(jiān)督學(xué)習(xí)的一些思考

    監(jiān)督學(xué)習(xí)的流行是勢(shì)在必然的。在各種主流有監(jiān)督學(xué)習(xí)任務(wù)都做到很成熟之后,數(shù)據(jù)成了最重要的瓶頸。從無標(biāo)注數(shù)據(jù)中學(xué)習(xí)有效信息一直是...
    發(fā)表于 01-26 18:50 ?1次下載
    <b class='flag-5'>自</b><b class='flag-5'>監(jiān)督學(xué)習(xí)</b>的一些思考

    深度學(xué)習(xí)中的無監(jiān)督學(xué)習(xí)方法綜述

    應(yīng)用中往往難以實(shí)現(xiàn)。因此,無監(jiān)督學(xué)習(xí)在深度學(xué)習(xí)中扮演著越來越重要的角色。本文旨在綜述深度學(xué)習(xí)中的無監(jiān)督學(xué)習(xí)方法,包括自編碼器、生成對(duì)抗網(wǎng)絡(luò)、聚類算法等,并分析它們的原理、應(yīng)用場(chǎng)景以及優(yōu)
    的頭像 發(fā)表于 07-09 10:50 ?1711次閱讀