一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

頂刊TIP 2023!浙大提出:基于全頻域通道選擇的的無(wú)監(jiān)督異常檢測(cè)

CVer ? 來(lái)源:APRIL機(jī)器人智能感知與學(xué)習(xí) ? 2024-01-11 16:02 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

1.導(dǎo)語(yǔ)

503f6dc2-b040-11ee-8b88-92fbcf53809c.png ? 近年來(lái),無(wú)監(jiān)督異常檢測(cè)任務(wù)逐漸受到大家關(guān)注,其中基于密度和分類的方法在無(wú)監(jiān)督異常檢測(cè)中占據(jù)主導(dǎo)地位,而基于重構(gòu)的方法由于重構(gòu)能力差、性能不高而很少被提及,但后者不需要額外花費(fèi)大量的訓(xùn)練樣本進(jìn)行無(wú)監(jiān)督訓(xùn)練,具有更大的實(shí)用價(jià)值。本文著重改進(jìn)基于重構(gòu)的方法,從頻率的角度處理感知異常檢測(cè)任務(wù)(sensory anomaly detection),提出了一種新的全頻率通道選擇重構(gòu)網(wǎng)絡(luò)(Omni-frequency Channel-selection Reconstruction,OCR-GAN)。實(shí)驗(yàn)結(jié)果證明了提出方法的有效性和優(yōu)越性,例如,在沒(méi)有額外訓(xùn)練數(shù)據(jù)的情況下(不使用預(yù)訓(xùn)練模型或者其他數(shù)據(jù)集,即模型train from scratch),在MVTec AD數(shù)據(jù)集上實(shí)現(xiàn)了新的最先進(jìn)的98.3檢測(cè)AUC,顯著地比基于重建的基線高+38.1↑,比SOTA高?+0.3↑。 ?

2.背景介紹

504302ca-b040-11ee-8b88-92fbcf53809c.png 異常檢測(cè)是視覺(jué)圖像理解中的一項(xiàng)重要的二分類任務(wù),用于區(qū)分給定圖像是否偏離預(yù)定義的正常分布,在現(xiàn)實(shí)世界中有各種應(yīng)用,例如新穎性檢測(cè)、工業(yè)產(chǎn)品質(zhì)量監(jiān)控、缺陷修復(fù)等?,F(xiàn)實(shí)應(yīng)用中,異常檢測(cè)任務(wù)可以分為感知異常檢測(cè)(Sensory Anomaly Detection,見(jiàn)圖1左圖)和語(yǔ)義異常檢測(cè)(Semantic Anomaly Detection,見(jiàn)圖1右圖)兩大類,前者只存在協(xié)變量偏差而不存在語(yǔ)義偏差(常用MVTec AD[1]、DAGM[2]、KolektorSDD[3]等數(shù)據(jù)集),而后者則相反(常用CIFAR-10[4]數(shù)據(jù)集)。

504b192e-b040-11ee-8b88-92fbcf53809c.png

圖1感知AD和語(yǔ)義AD任務(wù)圖解

異常檢測(cè)任務(wù)中獲取異常樣本耗時(shí)且成本較高,這驅(qū)動(dòng)我們開(kāi)展更實(shí)用的無(wú)監(jiān)督AD方法研究。目前的無(wú)監(jiān)督異常檢測(cè)方法主要分為三類,如圖2所示。

1)Density-based方法:基于密度的方法通常采用預(yù)訓(xùn)練的模型來(lái)提取輸入圖像的有意義嵌入向量,測(cè)試圖像時(shí)通過(guò)計(jì)算嵌入表示與參考表示分布之間的相似度以得到異常分?jǐn)?shù)。這種方法在MVTec AD等數(shù)據(jù)集上取得了較高的指標(biāo)分?jǐn)?shù),但需要預(yù)訓(xùn)練模型加持且可解釋性不足。

2)Classification-based方法:基于分類的方法試圖找到正常/異常數(shù)據(jù)的分類邊界,一般使用代理任務(wù)訓(xùn)練的模型來(lái)檢測(cè)異常,因此該類方法依賴于代理任務(wù)與測(cè)試數(shù)據(jù)的匹配程度,且需要預(yù)訓(xùn)練模型和額外的訓(xùn)練數(shù)據(jù)。

3)Reconstruction-based方法:基于重構(gòu)的方法包含一個(gè)用于重構(gòu)輸入圖像的生成器結(jié)構(gòu),異常分?jǐn)?shù)可解釋為重構(gòu)誤差。這類方法不需要預(yù)訓(xùn)練的模型和額外的訓(xùn)練數(shù)據(jù),但目前該類方法相較于其他方法表達(dá)能力略有差距。

本文重點(diǎn)研究基于重構(gòu)的方法,期望增強(qiáng)生成器的重構(gòu)能力以提升模型的異常檢測(cè)能力。

506c0db4-b040-11ee-8b88-92fbcf53809c.png

圖2無(wú)監(jiān)督異常檢測(cè)方法pipeline對(duì)比 對(duì)于一幅圖像,不同的頻段包含不同類型的信息,例如低頻代表更多的語(yǔ)義信息,高頻代表更詳細(xì)的紋理信息。在此思想的推動(dòng)下,我們發(fā)現(xiàn)異常檢測(cè)任務(wù)中正常和異常圖像的頻率分布存在明顯差異,如圖3所示。

5096ac4a-b040-11ee-8b88-92fbcf53809c.png

圖3 MVTec AD數(shù)據(jù)集中正常和異常樣本的能量隨頻率的分布,陰影表示標(biāo)準(zhǔn)差

基于此,我們認(rèn)為僅使用一個(gè)生成器來(lái)學(xué)習(xí)RGB圖像的全頻率重建是困難且不合適的,因此提出了一種利用多頻分支分別重構(gòu)不同頻帶信息的異常檢測(cè)框架,并設(shè)計(jì)了合適的結(jié)構(gòu)以提升模型的異常檢測(cè)效果,相較于對(duì)比方法取得了最SOTA結(jié)果,如圖4所示。

509ef47c-b040-11ee-8b88-92fbcf53809c.png

圖4不同方法AUROC檢測(cè)結(jié)果對(duì)比圖

具體地,本文有如下幾點(diǎn)貢獻(xiàn):

1)從頻域的角度重新思考了正常和異常圖像的區(qū)別,提出了一種全頻率通道選擇重構(gòu)網(wǎng)絡(luò)(Omni-frequency Channel-selection Reconstruction,OCR-GAN)。

2)提出了頻率解耦(Frequency Decoupling,F(xiàn)D)模塊來(lái)獲取圖像的不同頻帶信息,實(shí)現(xiàn)多分支的全頻重建。

3)提出了通道選擇(Channel Selection,CS)模塊來(lái)實(shí)現(xiàn)多支路之間的全頻率交互和不同信道特征的自適應(yīng)選擇。

4)大量的實(shí)驗(yàn)證明了提出方法的優(yōu)越性,例如,我們?cè)跊](méi)有額外訓(xùn)練數(shù)據(jù)的MVTec AD數(shù)據(jù)集上實(shí)現(xiàn)了新的SOTA 98.3檢測(cè)AUROC,相較于沒(méi)有額外訓(xùn)練數(shù)據(jù)的基于重構(gòu)方法獲得了+18.3↑提升,同時(shí)相較于SOTA方法獲得了+0.3↑提升。

3.方法介紹

50af48d6-b040-11ee-8b88-92fbcf53809c.png 3.1??總覽我們的方法包含多個(gè)生成器對(duì)不同頻率圖像進(jìn)行重建,同時(shí)與鑒別器D交替訓(xùn)練以進(jìn)一步提高模型性能。具體來(lái)說(shuō),我們提出了一個(gè)有效的頻率解耦模塊(FD)來(lái)解耦輸入圖像到全頻圖像,以及一個(gè)通道選擇模塊(CS)在多個(gè)頻率編碼器之間通過(guò)自適應(yīng)通道選擇的方式進(jìn)行特征交互。模型完成訓(xùn)練后的推理階段,重構(gòu)圖像與原圖像的重構(gòu)誤差作為圖像的異常得分。

50b28f3c-b040-11ee-8b88-92fbcf53809c.png

圖5OCR-GAN方法示意圖

3.2 頻率解耦模塊

圖像中不同的頻段包含不同類型的信息,例如低頻代表更多的語(yǔ)義信息,高頻代表更詳細(xì)的紋理信息。該模塊用來(lái)將原始圖像分解為多個(gè)頻段圖像,以獲得信息更豐富的全頻段顯性表達(dá),具體包含如下3個(gè)過(guò)程:

1)將原始圖像與5x5高斯核進(jìn)行卷積,獲得下采樣圖像

2)通過(guò)多次上下采樣操作得到一組模糊圖像

3)模糊圖像按照處理深度不同程度地丟失了一些高頻信息,進(jìn)一步計(jì)算相鄰圖像之間的差值得到全頻域圖像。圖5顯示了多個(gè)不同頻域分量的定性表示結(jié)果。

3.3 通道選擇模塊

在只有FD模塊的異常檢測(cè)框架中,多頻率分支相對(duì)獨(dú)立,這違背了不同頻率相輔相成的客觀事實(shí)。為此,我們?cè)O(shè)計(jì)了一種新穎的通道選擇模塊,實(shí)現(xiàn)了多支路間的頻域交互和不同通道特征的自適應(yīng)選擇。圖6(a)展示了雙頻率下CS模塊的微觀詳細(xì)結(jié)構(gòu),即只包含低頻和高頻特征,但其可以很容易地?cái)U(kuò)展到多分支。圖6(b)展示了CS模塊與頻率編碼器之間的宏觀交互方式。

50b680b0-b040-11ee-8b88-92fbcf53809c.png

圖6 (a)CS模塊示意圖;(b)CS模塊與多頻編碼器交互方式

4.實(shí)驗(yàn)結(jié)果

50be22d4-b040-11ee-8b88-92fbcf53809c.png 4.1? 定量對(duì)比

本文與主流的異常檢測(cè)方法(AGAN[5]、AE[6]、Skip-GANomaly[7]、GradCon[8]、Puzzle-AE[9]、DGAD[10]、DRAEM[11]、DifferNet[12]、CutPaste[13]、InTra[14])在多個(gè)數(shù)據(jù)集上進(jìn)行定量對(duì)比實(shí)驗(yàn)。如表1/2/3/4所示,提出的OCR-GAN在MVTec AD上獲得了98.3 AUROC結(jié)果,且在全部數(shù)據(jù)集上都獲取了SOTA結(jié)果,相較于對(duì)比方法取得了明顯優(yōu)勢(shì)。

50c56a8a-b040-11ee-8b88-92fbcf53809c.png

表1MVTecAD結(jié)果對(duì)比表

50e59d32-b040-11ee-8b88-92fbcf53809c.png

表2 DAGM結(jié)果對(duì)比表

50f8351e-b040-11ee-8b88-92fbcf53809c.png

表3KolektorSDD結(jié)果對(duì)比表

51020eea-b040-11ee-8b88-92fbcf53809c.png

表4 CIFAR-10結(jié)果對(duì)比表

4.2 定性對(duì)比

圖7展示了不同重建方法的定性對(duì)比,可以看到本文提出的方法對(duì)輸入圖像的正常區(qū)域具有很好的重建結(jié)果,對(duì)于異常區(qū)域具有明顯的區(qū)分性,證明了OCR-GAN的有效性。

511dd3d2-b040-11ee-8b88-92fbcf53809c.png

圖7 不同方法的重建結(jié)果對(duì)比

4.3 解釋性實(shí)驗(yàn)及剝離實(shí)驗(yàn)

1)圖8展示了不同模塊對(duì)異常得分分布影響,可以看到,在基線直方圖中,正常樣本和異常樣本無(wú)法通過(guò)異常得分進(jìn)行有效區(qū)分。逐步增加FD和CS模塊后,模型的區(qū)分能力得到了提高,表明每個(gè)模塊對(duì)方法結(jié)果都有貢獻(xiàn)。

514dc394-b040-11ee-8b88-92fbcf53809c.png

圖8不同模塊組合下的異常得分分布圖

2)我們將每個(gè)測(cè)試樣本的潛在空間特征從D的最后一個(gè)卷積層映射到一個(gè)二維子空間。如圖9顯示,正常和異常樣本在潛在空間中具有較強(qiáng)的聚類效應(yīng),且具有明顯的區(qū)分性。

516384ae-b040-11ee-8b88-92fbcf53809c.png

圖9 正常/異常樣本t-SNE分布圖

3)表5展示了頻率分支對(duì)于模型結(jié)果影響。結(jié)果表明,僅使用高頻信息比使用低頻信息效果更好,這意味著異常區(qū)域包含更多的高頻信息。然而,由于缺乏不同頻率支路之間的信息交互,單獨(dú)使用雙頻支路效果有限,而設(shè)計(jì)的CS模塊可以很好地處理該問(wèn)題,進(jìn)一步提高了模型的性能。

5187a2d0-b040-11ee-8b88-92fbcf53809c.png

表5 頻率分支數(shù)量剝離實(shí)驗(yàn)結(jié)果

5.總結(jié)與展望

51a2c6b4-b040-11ee-8b88-92fbcf53809c.png

本文從頻域的角度提出了一種基于重構(gòu)的OCR-GAN異常檢測(cè)方法。具體來(lái)說(shuō),我們提出了FD模塊將輸入圖像解耦到不同的頻率空間,并將圖像重建過(guò)程建模為并行的全頻率圖像恢復(fù)的組合。為了更好地實(shí)現(xiàn)不同編碼器之間的頻率交互,我們提出了一種定制的CS模塊,其可以自適應(yīng)地在多個(gè)支路之間選擇不同的信道以增強(qiáng)每一個(gè)頻域的特征。我們的方法在沒(méi)有額外訓(xùn)練數(shù)據(jù)的情況下,在Sensory AD和Semantic AD任務(wù)上相較于同時(shí)代方法具有明顯的優(yōu)勢(shì)。未來(lái),我們將進(jìn)一步探索AD任務(wù)中輕量化模型的設(shè)計(jì),同時(shí)構(gòu)建更具有挑戰(zhàn)性的實(shí)際應(yīng)用數(shù)據(jù)集。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 異常檢測(cè)
    +關(guān)注

    關(guān)注

    1

    文章

    44

    瀏覽量

    9855
  • 模型
    +關(guān)注

    關(guān)注

    1

    文章

    3521

    瀏覽量

    50428
  • 生成器
    +關(guān)注

    關(guān)注

    7

    文章

    322

    瀏覽量

    21901
  • 數(shù)據(jù)集
    +關(guān)注

    關(guān)注

    4

    文章

    1224

    瀏覽量

    25448

原文標(biāo)題:頂刊TIP 2023!浙大提出:基于全頻域通道選擇的的無(wú)監(jiān)督異常檢測(cè)

文章出處:【微信號(hào):CVer,微信公眾號(hào):CVer】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    基于transformer和自監(jiān)督學(xué)習(xí)的路面異常檢測(cè)方法分享

    鋪設(shè)異常檢測(cè)可以幫助減少數(shù)據(jù)存儲(chǔ)、傳輸、標(biāo)記和處理的壓力。本論文描述了一種基于Transformer和自監(jiān)督學(xué)習(xí)的新方法,有助于定位異常區(qū)域。
    的頭像 發(fā)表于 12-06 14:57 ?2388次閱讀
    基于transformer和自<b class='flag-5'>監(jiān)督</b>學(xué)習(xí)的路面<b class='flag-5'>異常</b><b class='flag-5'>檢測(cè)</b>方法分享

    提高IT運(yùn)維效率,深度解讀京東云AIOps落地實(shí)踐(異常檢測(cè)篇)

    基于深度學(xué)習(xí)對(duì)運(yùn)維時(shí)序指標(biāo)進(jìn)行異常檢測(cè),快速發(fā)現(xiàn)線上業(yè)務(wù)問(wèn)題 時(shí)間序列的異常檢測(cè)是實(shí)際應(yīng)用中的一個(gè)關(guān)鍵問(wèn)題,尤其是在 IT 行業(yè)。我們沒(méi)有采用傳統(tǒng)的基于閾值的方法來(lái)實(shí)現(xiàn)
    的頭像 發(fā)表于 05-22 16:38 ?432次閱讀
    提高IT運(yùn)維效率,深度解讀京東云AIOps落地實(shí)踐(<b class='flag-5'>異常</b><b class='flag-5'>檢測(cè)</b>篇)

    機(jī)器學(xué)習(xí)異常檢測(cè)實(shí)戰(zhàn):用Isolation Forest快速構(gòu)建無(wú)標(biāo)簽異常檢測(cè)系統(tǒng)

    本文轉(zhuǎn)自:DeepHubIMBA無(wú)監(jiān)督異常檢測(cè)作為機(jī)器學(xué)習(xí)領(lǐng)域的重要分支,專門用于在缺乏標(biāo)記數(shù)據(jù)的環(huán)境中識(shí)別異常事件。本文深入探討
    的頭像 發(fā)表于 06-24 11:40 ?639次閱讀
    機(jī)器學(xué)習(xí)<b class='flag-5'>異常</b><b class='flag-5'>檢測(cè)</b>實(shí)戰(zhàn):用Isolation Forest快速構(gòu)建<b class='flag-5'>無(wú)</b>標(biāo)簽<b class='flag-5'>異常</b><b class='flag-5'>檢測(cè)</b>系統(tǒng)

    tip122-tip127參數(shù)中文資料

    tip122-tip127參數(shù) pdf資料 該TIP120,TIP121和TIP122疏外延基NPN達(dá)林頓功率晶體管采用TO-220塑料封裝。與互補(bǔ)類型的
    發(fā)表于 09-19 16:44 ?168次下載
    <b class='flag-5'>tip122-tip</b>127參數(shù)中文資料

    基于聲學(xué)分段模型的無(wú)監(jiān)督語(yǔ)音樣例檢測(cè)

    基于聲學(xué)分段模型的無(wú)監(jiān)督語(yǔ)音樣例檢測(cè)_李勃昊
    發(fā)表于 01-07 16:24 ?0次下載

    用于自步學(xué)習(xí)的無(wú)監(jiān)督屬性選擇算法資料介紹

    針對(duì)現(xiàn)有屬性選擇算法平等地對(duì)待每個(gè)樣本而忽略樣本之間的差異性,從而使學(xué)習(xí)模型無(wú)法避免噪聲樣本影響問(wèn)題,提出一種融合自步學(xué)習(xí)理論的無(wú)監(jiān)督屬性選擇
    發(fā)表于 12-07 13:40 ?5次下載

    無(wú)監(jiān)督機(jī)器學(xué)習(xí)如何保護(hù)金融

    無(wú)監(jiān)督機(jī)器學(xué)習(xí)是近年才發(fā)展起來(lái)的反欺詐手法。目前國(guó)內(nèi)反欺詐金融服務(wù)主要是應(yīng)用黑白名單、有監(jiān)督學(xué)習(xí)和無(wú)監(jiān)督機(jī)器學(xué)習(xí)的方法來(lái)實(shí)現(xiàn)。
    發(fā)表于 05-01 22:11 ?1128次閱讀

    一種協(xié)作式步進(jìn)頻域能量檢測(cè)算法

    為實(shí)現(xiàn)230MHz頻段電力無(wú)線通信頻譜的快速可靠認(rèn)知,提出一種協(xié)作式步進(jìn)頻域能量檢測(cè)算法。該算法在頻域進(jìn)行2次步進(jìn)能量檢測(cè),第一次步進(jìn)能量
    發(fā)表于 03-30 13:47 ?8次下載
    一種協(xié)作式步進(jìn)<b class='flag-5'>頻域</b>能量<b class='flag-5'>檢測(cè)</b>算法

    集成流挖掘和圖挖掘的內(nèi)網(wǎng)異常檢測(cè)方法

    內(nèi)網(wǎng)惡意內(nèi)部活動(dòng)的證據(jù)通常隱藏在大型數(shù)據(jù)流中,例如數(shù)月或年累積的系統(tǒng)日志,然而數(shù)據(jù)流往往是無(wú)界的、不斷變化的和未標(biāo)記的。因此,為實(shí)現(xiàn)高度準(zhǔn)確的異常檢測(cè),提出集成流挖掘和圖挖掘的內(nèi)網(wǎng)異常
    發(fā)表于 04-12 11:29 ?7次下載
    集成流挖掘和圖挖掘的內(nèi)網(wǎng)<b class='flag-5'>異常</b><b class='flag-5'>檢測(cè)</b>方法

    聯(lián)合多流行結(jié)構(gòu)和自表示的無(wú)監(jiān)督特征選擇方法

    特征選擇是一種通過(guò)去除不相關(guān)和冗余的特征來(lái)降低數(shù)據(jù)維數(shù)和提高后續(xù)學(xué)習(xí)算法效率的數(shù)據(jù)處理方法。無(wú)監(jiān)督特征選擇已經(jīng)成為維數(shù)約簡(jiǎn)中具有挑戰(zhàn)性的問(wèn)題之一。首先,通過(guò)結(jié)合特征自表示能力和流形結(jié)構(gòu)
    發(fā)表于 04-28 11:39 ?4次下載
    聯(lián)合多流行結(jié)構(gòu)和自表示的<b class='flag-5'>無(wú)</b><b class='flag-5'>監(jiān)督</b>特征<b class='flag-5'>選擇</b>方法

    如何選擇異常檢測(cè)算法

    異常檢測(cè)(也稱為離群點(diǎn)檢測(cè))是檢測(cè)異常實(shí)例的任務(wù),異常實(shí)例與常規(guī)實(shí)例非常不同。這些實(shí)例稱為
    的頭像 發(fā)表于 10-25 09:15 ?1965次閱讀

    一種新的無(wú)監(jiān)督時(shí)間序列異常檢測(cè)方法

    時(shí)間序列數(shù)據(jù)是生活中常見(jiàn)的一種數(shù)據(jù),在時(shí)間順序上具有一定規(guī)律,且大量存在于金融貿(mào)易、工業(yè)生產(chǎn)、環(huán)境保護(hù)、網(wǎng)絡(luò)安全等眾多領(lǐng)域。時(shí)間序列異常檢測(cè)在生產(chǎn)和生活中有著重要的作用,如在網(wǎng)絡(luò)安全領(lǐng)域中分析網(wǎng)絡(luò)異常行為,在金融領(lǐng)域中識(shí)別欺詐交
    的頭像 發(fā)表于 08-10 11:29 ?3225次閱讀

    基于視覺(jué)Transformer的監(jiān)督視頻異常檢測(cè)架構(gòu)進(jìn)行腸息肉檢測(cè)的研究

    本文提出一種有效的基于視覺(jué)Transformer的弱監(jiān)督視頻異常檢測(cè)架構(gòu)來(lái)實(shí)現(xiàn)精準(zhǔn)檢測(cè)結(jié)直腸息肉。這也是首篇利用弱
    的頭像 發(fā)表于 09-27 11:15 ?2055次閱讀

    使用MATLAB進(jìn)行異常檢測(cè)(下)

    在使用 MATLAB 進(jìn)行異常檢測(cè)(上)中,我們探討了什么是異常值,簡(jiǎn)單的一維數(shù)據(jù)異常檢測(cè)問(wèn)題,針對(duì)高維數(shù)據(jù)的有
    的頭像 發(fā)表于 11-24 10:46 ?2835次閱讀

    哈工大提出Myriad:利用視覺(jué)專家進(jìn)行工業(yè)異常檢測(cè)的大型多模態(tài)模型

    最近,大型多模態(tài)(即視覺(jué)和語(yǔ)言)模型(LMM)在圖像描述、視覺(jué)理解、視覺(jué)推理等多種視覺(jué)任務(wù)上表現(xiàn)出了卓越的感知能力,使其成為更易于理解的異常檢測(cè)的有競(jìng)爭(zhēng)力的潛在選擇。然而,現(xiàn)有的通用 LMM 中缺乏有關(guān)
    的頭像 發(fā)表于 11-21 16:08 ?3192次閱讀
    哈工<b class='flag-5'>大提出</b>Myriad:利用視覺(jué)專家進(jìn)行工業(yè)<b class='flag-5'>異常</b><b class='flag-5'>檢測(cè)</b>的大型多模態(tài)模型