一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

如何選擇異常檢測(cè)算法

Dbwd_Imgtec ? 來源:DeepHub IMBA ? 作者:Dmytro Nikolaiev ? 2021-10-25 09:15 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

異常檢測(cè)(也稱為離群點(diǎn)檢測(cè))是檢測(cè)異常實(shí)例的任務(wù),異常實(shí)例與常規(guī)實(shí)例非常不同。這些實(shí)例稱為異?;螂x群值,而正常實(shí)例稱為內(nèi)部值。

異常檢測(cè)可用于多種應(yīng)用,例如:

① 欺詐識(shí)別

② 檢測(cè)制造中的缺陷產(chǎn)品

③ 數(shù)據(jù)清理——在訓(xùn)練另一個(gè)模型之前從數(shù)據(jù)集中去除異常值。

你可能已經(jīng)注意到,一些不平衡分類的問題也經(jīng)常使用異常檢測(cè)算法來解決。例如,垃圾郵件檢測(cè)任務(wù)可以被認(rèn)為是一個(gè)分類任務(wù)(垃圾郵件比普通電子郵件少得多),但是我們可以用異常檢測(cè)的方法實(shí)現(xiàn)這個(gè)任務(wù)。

一個(gè)相關(guān)的任務(wù)是奇異值檢測(cè)(Novelty Detection)。它與異常檢測(cè)的不同之處在于,假設(shè)該算法是在干凈的數(shù)據(jù)集(沒有異常值)上訓(xùn)練的。它被廣泛應(yīng)用于在線學(xué)習(xí)中,當(dāng)需要識(shí)別一個(gè)新實(shí)例是否是一個(gè)離群值時(shí)。

另一個(gè)相關(guān)任務(wù)是密度估計(jì)。它是估計(jì)數(shù)據(jù)集生成的隨機(jī)過程的概率密度函數(shù)的任務(wù)。密度估計(jì)通常用于異常檢測(cè)(位于低密度區(qū)域的實(shí)例很可能是異常)和數(shù)據(jù)分析。通常使用基于密度(高斯混合模型或 DBSCAN)的聚類算法來解決。

統(tǒng)計(jì)方法

檢測(cè)離群值最簡(jiǎn)單的方法是嘗試統(tǒng)計(jì)方法,這是很久以前開發(fā)出來的。其中最流行的一種方法被稱為離群值檢測(cè)Tukey方法(或四分位數(shù)距離IQR) 。

它的本質(zhì)是計(jì)算百分位數(shù)和四分位數(shù)之間的范圍。位于Q1-1.5 * IQR之前和Q3 + 1.5 * IQR之后的數(shù)據(jù)點(diǎn)被認(rèn)為是異常值。下面你可以看到一個(gè)使用人的身高數(shù)據(jù)集的例子。高度低于54.95英寸(139厘米)和高于77.75英寸(197厘米)被認(rèn)為是異常值。

這種和其他統(tǒng)計(jì)方法(用于檢測(cè)異常值的 z-score 方法等)通常用于數(shù)據(jù)清理。

聚類和降維算法

另一種簡(jiǎn)單、直觀且通常有效的異常檢測(cè)方法是使用一些聚類算法(如高斯混合模型和 DBSCAN)來解決密度估計(jì)任務(wù)。那么,任何位于低密度區(qū)域的實(shí)例都可以被認(rèn)為是異常,我們只需要設(shè)置一些密度閾值。

此外,可以使用任何具有 inverse_transform() 方法的降維算法。這是因?yàn)楫惓5闹亟ㄕ`差總是比正常實(shí)例的重建誤差大得多。

孤立森林和 SVM

一些監(jiān)督學(xué)習(xí)算法也可用于異常檢測(cè),其中最流行的兩種是孤立森林和 SVM。這些算法更適合奇異值檢測(cè),但通常也適用于異常檢測(cè)。

孤立森林算法構(gòu)建了一個(gè)隨機(jī)森林,其中每個(gè)決策樹都是隨機(jī)生長(zhǎng)的。每走一步,這片森林就會(huì)隔離越來越多的點(diǎn),直到所有點(diǎn)都變得孤立。由于異常位于遠(yuǎn)離通常數(shù)據(jù)點(diǎn)的位置,因此它們通常比正常實(shí)例以更少的步驟被孤立。該算法對(duì)于高維數(shù)據(jù)表現(xiàn)良好,但需要比 SVM 更大的數(shù)據(jù)集。

SVM(在我們的例子中是一類 SVM)也廣泛用于異常檢測(cè)。內(nèi)核化 SVM 可以構(gòu)建一個(gè)有效的“限制超平面”,它將正常點(diǎn)與異常點(diǎn)分開。像任何 SVM 修改一樣,它可以很好地處理高維或稀疏數(shù)據(jù),但僅適用于中小型數(shù)據(jù)集。

局部異常因子

局部異常值因子 (LOF) 算法基于異常位于低密度區(qū)域的假設(shè)。它不只是設(shè)置密度閾值(就像我們可以用 DBSCAN 做的那樣),而是將某個(gè)點(diǎn)的密度與其最近鄰居的 k 的密度進(jìn)行比較。如果這個(gè)特定點(diǎn)的密度比它的鄰點(diǎn)低得多(這意味著它離它們很遠(yuǎn)),它被認(rèn)為是一個(gè)異常。

該算法既可用于異常檢測(cè),也可用于奇異值檢測(cè)。由于其計(jì)算簡(jiǎn)單且質(zhì)量好,會(huì)被經(jīng)常使用。

最小協(xié)方差行列式

最小協(xié)方差行列式(MCD 或其修改型 Fast-MCD)可用于異常值檢測(cè),尤其是在數(shù)據(jù)清理的時(shí)候。它假設(shè)內(nèi)點(diǎn)是從單個(gè)高斯分布中生成的,而離群點(diǎn)不是從這個(gè)分布中生成的。由于許多數(shù)據(jù)具有正態(tài)分布(或可以簡(jiǎn)化為正態(tài)分布),因此該算法通常表現(xiàn)良好。在 sklearn 中EllipticEnvelope類就是它的實(shí)現(xiàn)。

如何選擇異常檢測(cè)算法?

如果你需要清理數(shù)據(jù)集,你應(yīng)該首先嘗試經(jīng)典的統(tǒng)計(jì)方法,比如 Tukey Method for Outlier Detection。如果知道數(shù)據(jù)分布是高斯分布 則可以使用Fast-MCD,。

如果你做異常檢測(cè)不是為了數(shù)據(jù)清理,首先試試簡(jiǎn)單快速的LOF。如果它不能很好地工作(或者如果你出于某種原因需要分離超平面)——根據(jù)你的任務(wù)和數(shù)據(jù)集嘗試其他算法:

用于稀疏高維數(shù)據(jù)的單類SVM 或用于連續(xù)高維數(shù)據(jù)的孤立森林

如果可以假設(shè)數(shù)據(jù)是由多個(gè)高斯分布的混合生成的,可以試試高斯混合模型

責(zé)任編輯:haq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 數(shù)據(jù)
    +關(guān)注

    關(guān)注

    8

    文章

    7256

    瀏覽量

    91886
  • 異常檢測(cè)
    +關(guān)注

    關(guān)注

    1

    文章

    44

    瀏覽量

    9855
  • 模型
    +關(guān)注

    關(guān)注

    1

    文章

    3521

    瀏覽量

    50427

原文標(biāo)題:10分鐘掌握異常檢測(cè)

文章出處:【微信號(hào):Imgtec,微信公眾號(hào):Imagination Tech】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    基于FPGA的SSD目標(biāo)檢測(cè)算法設(shè)計(jì)

    。有名的LeNet-5手寫數(shù)字識(shí)別網(wǎng)絡(luò),精度達(dá)到99%,AlexNet模型和VGG-16模型的提出突破了傳統(tǒng)圖像識(shí)別算法,GooLeNet和ResNet推動(dòng)了卷積神經(jīng)網(wǎng)絡(luò)的應(yīng)用。
    的頭像 發(fā)表于 07-10 11:12 ?857次閱讀
    基于FPGA的SSD目標(biāo)<b class='flag-5'>檢測(cè)算法</b>設(shè)計(jì)

    機(jī)器學(xué)習(xí)異常檢測(cè)實(shí)戰(zhàn):用Isolation Forest快速構(gòu)建無標(biāo)簽異常檢測(cè)系統(tǒng)

    算法進(jìn)行異常檢測(cè),并結(jié)合LightGBM作為主分類器,構(gòu)建完整的欺詐檢測(cè)系統(tǒng)。文章詳細(xì)闡述了從無監(jiān)督異常
    的頭像 發(fā)表于 06-24 11:40 ?639次閱讀
    機(jī)器學(xué)習(xí)<b class='flag-5'>異常</b><b class='flag-5'>檢測(cè)</b>實(shí)戰(zhàn):用Isolation Forest快速構(gòu)建無標(biāo)簽<b class='flag-5'>異常</b><b class='flag-5'>檢測(cè)</b>系統(tǒng)

    提高IT運(yùn)維效率,深度解讀京東云AIOps落地實(shí)踐(異常檢測(cè)篇)

    基于深度學(xué)習(xí)對(duì)運(yùn)維時(shí)序指標(biāo)進(jìn)行異常檢測(cè),快速發(fā)現(xiàn)線上業(yè)務(wù)問題 時(shí)間序列的異常檢測(cè)是實(shí)際應(yīng)用中的一個(gè)關(guān)鍵問題,尤其是在 IT 行業(yè)。我們沒有采用傳統(tǒng)的基于閾值的方法來實(shí)現(xiàn)
    的頭像 發(fā)表于 05-22 16:38 ?432次閱讀
    提高IT運(yùn)維效率,深度解讀京東云AIOps落地實(shí)踐(<b class='flag-5'>異常</b><b class='flag-5'>檢測(cè)</b>篇)

    基于RK3576開發(fā)板的車輛檢測(cè)算法

    車輛檢測(cè)是一種基于深度學(xué)習(xí)的對(duì)人進(jìn)行檢測(cè)定位的目標(biāo)檢測(cè),能廣泛的用于園區(qū)管理、交通分析等多種場(chǎng)景,是違停識(shí)別、堵車識(shí)別、車流統(tǒng)計(jì)等多種算法的基石算法
    的頭像 發(fā)表于 05-08 17:34 ?912次閱讀
    基于RK3576開發(fā)板的車輛<b class='flag-5'>檢測(cè)算法</b>

    基于RK3576開發(fā)板的安全帽檢測(cè)算法

    安全帽佩戴檢測(cè)是工地、生產(chǎn)安全、安防的重中之重,但人為主觀檢測(cè)的方式時(shí)效性差且不能全程監(jiān)控。AI技術(shù)的日漸成熟催生了安全帽佩戴檢測(cè)方案,成為了監(jiān)督佩戴安全帽的利器。本安全帽檢測(cè)算法是一
    的頭像 發(fā)表于 05-08 16:59 ?1585次閱讀
    基于RK3576開發(fā)板的安全帽<b class='flag-5'>檢測(cè)算法</b>

    基于RK3576開發(fā)板的人員檢測(cè)算法

    展示了RK3576開發(fā)板的人員檢測(cè)算法例程及API說明
    的頭像 發(fā)表于 05-07 17:33 ?299次閱讀
    基于RK3576開發(fā)板的人員<b class='flag-5'>檢測(cè)算法</b>

    基于RV1126開發(fā)板的車輛檢測(cè)算法開發(fā)

    車輛檢測(cè)是一種基于深度學(xué)習(xí)的對(duì)人進(jìn)行檢測(cè)定位的目標(biāo)檢測(cè),能廣泛的用于園區(qū)管理、交通分析等多種場(chǎng)景,是違停識(shí)別、堵車識(shí)別、車流統(tǒng)計(jì)等多種算法的基石算法
    的頭像 發(fā)表于 04-14 16:00 ?294次閱讀
    基于RV1126開發(fā)板的車輛<b class='flag-5'>檢測(cè)算法</b>開發(fā)

    基于RV1126開發(fā)板的安全帽檢測(cè)算法開發(fā)

    安全帽佩戴檢測(cè)是工地、生產(chǎn)安全、安防的重中之重,但人為主觀檢測(cè)的方式時(shí)效性差且不能全程監(jiān)控。AI技術(shù)的日漸成熟催生了安全帽佩戴檢測(cè)方案,成為了監(jiān)督佩戴安全帽的利器。本安全帽檢測(cè)算法是一
    的頭像 發(fā)表于 04-14 15:10 ?289次閱讀
    基于RV1126開發(fā)板的安全帽<b class='flag-5'>檢測(cè)算法</b>開發(fā)

    基于RV1126開發(fā)板的人員檢測(cè)算法開發(fā)

    在RV1126上開發(fā)人員檢測(cè)AI算法組件
    的頭像 發(fā)表于 04-14 13:56 ?311次閱讀
    基于RV1126開發(fā)板的人員<b class='flag-5'>檢測(cè)算法</b>開發(fā)

    基于RV1126開發(fā)板的人臉檢測(cè)算法開發(fā)

    在RV1126上開發(fā)人臉檢測(cè)算法組件
    的頭像 發(fā)表于 04-14 10:19 ?329次閱讀
    基于RV1126開發(fā)板的人臉<b class='flag-5'>檢測(cè)算法</b>開發(fā)

    軒轅智駕紅外目標(biāo)檢測(cè)算法在汽車領(lǐng)域的應(yīng)用

    在 AI 技術(shù)蓬勃發(fā)展的當(dāng)下,目標(biāo)檢測(cè)算法取得了重大突破,其中紅外目標(biāo)檢測(cè)算法更是在汽車行業(yè)掀起了波瀾壯闊的變革,從根本上重塑著汽車的安全性能、駕駛體驗(yàn)與產(chǎn)業(yè)生態(tài)。
    的頭像 發(fā)表于 03-27 15:55 ?428次閱讀

    睿創(chuàng)微納推出新一代目標(biāo)檢測(cè)算法

    隨著AI技術(shù)的發(fā)展,目標(biāo)檢測(cè)算法也迎來重大突破。睿創(chuàng)微納作為熱成像領(lǐng)軍者,憑借深厚的技術(shù)積累與創(chuàng)新能力,結(jié)合AI技術(shù)推出新一代目標(biāo)檢測(cè)算法,以三大核心技術(shù)帶來AI視覺感知全場(chǎng)景解決方案突破,助力各產(chǎn)業(yè)智能化升級(jí)。
    的頭像 發(fā)表于 03-20 13:49 ?435次閱讀

    如何制定一套優(yōu)質(zhì)的工業(yè)視覺檢測(cè)算法方案?

    很難與當(dāng)下主流的AI平臺(tái)工具配型,或者是通過單一算法模型進(jìn)行訓(xùn)練,通常情況下,工業(yè)視覺檢測(cè)項(xiàng)目面臨著一系列獨(dú)特的難點(diǎn)與挑戰(zhàn)。比如:算法實(shí)現(xiàn)難。工業(yè)環(huán)境中的背景往往非
    的頭像 發(fā)表于 11-14 01:05 ?2546次閱讀
    如何制定一套優(yōu)質(zhì)的工業(yè)視覺<b class='flag-5'>檢測(cè)算法</b>方案?

    bq2750x系列中的Impedance Track?電池電量監(jiān)測(cè)算法的理論及實(shí)現(xiàn)

    電子發(fā)燒友網(wǎng)站提供《bq2750x系列中的Impedance Track?電池電量監(jiān)測(cè)算法的理論及實(shí)現(xiàn).pdf》資料免費(fèi)下載
    發(fā)表于 08-30 10:21 ?1次下載
    bq2750x系列中的Impedance Track?電池電量監(jiān)<b class='flag-5'>測(cè)算法</b>的理論及實(shí)現(xiàn)

    旗晟機(jī)器人環(huán)境檢測(cè)算法有哪些?

    硬件支撐,更離不開強(qiáng)大的算法庫(kù)作為軟件核心,二者相輔相成,缺一不可。今天就來了解旗晟機(jī)器人環(huán)境檢測(cè)算法。 1、設(shè)施異常監(jiān)測(cè) 通過集成高精度傳感器與智能圖像識(shí)別技術(shù)。它不僅能檢測(cè)A字梯是
    的頭像 發(fā)表于 07-19 17:54 ?869次閱讀
    旗晟機(jī)器人環(huán)境<b class='flag-5'>檢測(cè)算法</b>有哪些?