一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線(xiàn)課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

如何畫(huà)roc曲線(xiàn)?為什么使用Roc和Auc評(píng)價(jià)分類(lèi)器?

Dbwd_Imgtec ? 來(lái)源:未知 ? 作者:李倩 ? 2018-08-22 14:47 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

一、roc曲線(xiàn)

1、roc曲線(xiàn):接收者操作特征(receiveroperating characteristic),roc曲線(xiàn)上每個(gè)點(diǎn)反映著對(duì)同一信號(hào)刺激的感受性。

橫軸:負(fù)正類(lèi)率(false postive rate FPR)特異度,劃分實(shí)例中所有負(fù)例占所有負(fù)例的比例;(1-Specificity)

縱軸:真正類(lèi)率(true postive rate TPR)靈敏度,Sensitivity(正類(lèi)覆蓋率)

2、針對(duì)一個(gè)二分類(lèi)問(wèn)題,將實(shí)例分成正類(lèi)(postive)或者負(fù)類(lèi)(negative)。但是實(shí)際中分類(lèi)時(shí),會(huì)出現(xiàn)四種情況.

(1)若一個(gè)實(shí)例是正類(lèi)并且被預(yù)測(cè)為正類(lèi),即為真正類(lèi)(True Postive TP)

(2)若一個(gè)實(shí)例是正類(lèi),但是被預(yù)測(cè)成為負(fù)類(lèi),即為假負(fù)類(lèi)(False Negative FN)

(3)若一個(gè)實(shí)例是負(fù)類(lèi),但是被預(yù)測(cè)成為正類(lèi),即為假正類(lèi)(False Postive FP)

(4)若一個(gè)實(shí)例是負(fù)類(lèi),但是被預(yù)測(cè)成為負(fù)類(lèi),即為真負(fù)類(lèi)(True Negative TN)

TP:正確的肯定數(shù)目

FN:漏報(bào),沒(méi)有找到正確匹配的數(shù)目

FP:誤報(bào),沒(méi)有的匹配不正確

TN:正確拒絕的非匹配數(shù)目

列聯(lián)表如下,1代表正類(lèi),0代表負(fù)類(lèi):

由上表可得出橫,縱軸的計(jì)算公式:

(1)真正類(lèi)率(True Postive Rate)TPR:TP/(TP+FN),代表分類(lèi)器預(yù)測(cè)的正類(lèi)中實(shí)際正實(shí)例占所有正實(shí)例的比例。Sensitivity

(2)負(fù)正類(lèi)率(False Postive Rate)FPR:FP/(FP+TN),代表分類(lèi)器預(yù)測(cè)的正類(lèi)中實(shí)際負(fù)實(shí)例占所有負(fù)實(shí)例的比例。1-Specificity

(3)真負(fù)類(lèi)率(True Negative Rate)TNR: TN/(FP+TN),代表分類(lèi)器預(yù)測(cè)的負(fù)類(lèi)中實(shí)際負(fù)實(shí)例占所有負(fù)實(shí)例的比例,TNR=1-FPR。Specificity

假設(shè)采用邏輯回歸分類(lèi)器,其給出針對(duì)每個(gè)實(shí)例為正類(lèi)的概率,那么通過(guò)設(shè)定一個(gè)閾值如0.6,概率大于等于0.6的為正類(lèi),小于0.6的為負(fù)類(lèi)。對(duì)應(yīng)的就可以算出一組(FPR,TPR),在平面中得到對(duì)應(yīng)坐標(biāo)點(diǎn)。隨著閾值的逐漸減小,越來(lái)越多的實(shí)例被劃分為正類(lèi),但是這些正類(lèi)中同樣也摻雜著真正的負(fù)實(shí)例,即TPR和FPR會(huì)同時(shí)增大。閾值最大時(shí),對(duì)應(yīng)坐標(biāo)點(diǎn)為(0,0),閾值最小時(shí),對(duì)應(yīng)坐標(biāo)點(diǎn)(1,1)。

如下面這幅圖,(a)圖中實(shí)線(xiàn)為ROC曲線(xiàn),線(xiàn)上每個(gè)點(diǎn)對(duì)應(yīng)一個(gè)閾值。

橫軸FPR:1-TNR,1-Specificity,F(xiàn)PR越大,預(yù)測(cè)正類(lèi)中實(shí)際負(fù)類(lèi)越多。

縱軸TPR:Sensitivity(正類(lèi)覆蓋率),TPR越大,預(yù)測(cè)正類(lèi)中實(shí)際正類(lèi)越多。

理想目標(biāo):TPR=1,F(xiàn)PR=0,即圖中(0,1)點(diǎn),故ROC曲線(xiàn)越靠攏(0,1)點(diǎn),越偏離45度對(duì)角線(xiàn)越好,Sensitivity、Specificity越大效果越好。

二、如何畫(huà)roc曲線(xiàn)

假設(shè)已經(jīng)得出一系列樣本被劃分為正類(lèi)的概率,然后按照大小排序,下圖是一個(gè)示例,圖中共有20個(gè)測(cè)試樣本,“Class”一欄表示每個(gè)測(cè)試樣本真正的標(biāo)簽(p表示正樣本,n表示負(fù)樣本),“Score”表示每個(gè)測(cè)試樣本屬于正樣本的概率。

接下來(lái),我們從高到低,依次將“Score”值作為閾值threshold,當(dāng)測(cè)試樣本屬于正樣本的概率大于或等于這個(gè)threshold時(shí),我們認(rèn)為它為正樣本,否則為負(fù)樣本。舉例來(lái)說(shuō),對(duì)于圖中的第4個(gè)樣本,其“Score”值為0.6,那么樣本1,2,3,4都被認(rèn)為是正樣本,因?yàn)樗鼈兊摹癝core”值都大于等于0.6,而其他樣本則都認(rèn)為是負(fù)樣本。每次選取一個(gè)不同的threshold,我們就可以得到一組FPR和TPR,即ROC曲線(xiàn)上的一點(diǎn)。這樣一來(lái),我們一共得到了20組FPR和TPR的值,將它們畫(huà)在ROC曲線(xiàn)的結(jié)果如下圖:

AUC(Area under Curve):Roc曲線(xiàn)下的面積,介于0.1和1之間。Auc作為數(shù)值可以直觀的評(píng)價(jià)分類(lèi)器的好壞,值越大越好。

首先AUC值是一個(gè)概率值,當(dāng)你隨機(jī)挑選一個(gè)正樣本以及負(fù)樣本,當(dāng)前的分類(lèi)算法根據(jù)計(jì)算得到的Score值將這個(gè)正樣本排在負(fù)樣本前面的概率就是AUC值,AUC值越大,當(dāng)前分類(lèi)算法越有可能將正樣本排在負(fù)樣本前面,從而能夠更好地分類(lèi)。

三、為什么使用Roc和Auc評(píng)價(jià)分類(lèi)器

既然已經(jīng)這么多標(biāo)準(zhǔn),為什么還要使用ROC和AUC呢?因?yàn)镽OC曲線(xiàn)有個(gè)很好的特性:當(dāng)測(cè)試集中的正負(fù)樣本的分布變換的時(shí)候,ROC曲線(xiàn)能夠保持不變。在實(shí)際的數(shù)據(jù)集中經(jīng)常會(huì)出現(xiàn)樣本類(lèi)不平衡,即正負(fù)樣本比例差距較大,而且測(cè)試數(shù)據(jù)中的正負(fù)樣本也可能隨著時(shí)間變化。下圖是ROC曲線(xiàn)和Presision-Recall曲線(xiàn)的對(duì)比:

在上圖中,(a)和(c)為Roc曲線(xiàn),(b)和(d)為Precision-Recall曲線(xiàn)。

(a)和(b)展示的是分類(lèi)其在原始測(cè)試集(正負(fù)樣本分布平衡)的結(jié)果,(c)(d)是將測(cè)試集中負(fù)樣本的數(shù)量增加到原來(lái)的10倍后,分類(lèi)器的結(jié)果,可以明顯的看出,ROC曲線(xiàn)基本保持原貌,而Precision-Recall曲線(xiàn)變化較大。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴

原文標(biāo)題:機(jī)器學(xué)習(xí)之分類(lèi)器性能指標(biāo)之ROC曲線(xiàn)、AUC值

文章出處:【微信號(hào):Imgtec,微信公眾號(hào):Imagination Tech】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    ROC曲線(xiàn)AUC值有何關(guān)系

    什么是ROC曲線(xiàn)ROC曲線(xiàn)有何功能?ROC曲線(xiàn)AUC
    發(fā)表于 08-23 06:59

    LSI推出6Gb/s SAS RoC芯片

    LSI推出6Gb/s SAS RoC芯片 LSI 公司 宣布向 OEM 客戶(hù)提供 LSISAS2208 雙核 6Gb/s SAS 片上 RAID (RoC) IC 樣片。高性能 LSI SAS RoC 旨在支持 PCI-SIG
    發(fā)表于 12-19 09:25 ?799次閱讀

    MATLAB的ROC曲線(xiàn)繪制比較研究

    基于非計(jì)算機(jī)專(zhuān)業(yè)人員的計(jì)算機(jī)應(yīng)用能力稍差,而又要經(jīng)常使用受試者工作特征(ROC曲線(xiàn)作為判斷的評(píng)價(jià)方法,介紹了ROC曲線(xiàn)的概念、原理和優(yōu)點(diǎn),
    發(fā)表于 01-17 15:44 ?35次下載

    ROC RK3568 PC固件Buildroot

    電子發(fā)燒友網(wǎng)站提供《ROC RK3568 PC固件Buildroot.txt》資料免費(fèi)下載
    發(fā)表于 09-20 09:52 ?8次下載
    <b class='flag-5'>ROC</b> RK3568 PC固件Buildroot

    ROC RK3568 PC固件Debian

    電子發(fā)燒友網(wǎng)站提供《ROC RK3568 PC固件Debian.txt》資料免費(fèi)下載
    發(fā)表于 09-20 09:51 ?8次下載
    <b class='flag-5'>ROC</b> RK3568 PC固件Debian

    ROC RK3568 PC固件LEDE

    電子發(fā)燒友網(wǎng)站提供《ROC RK3568 PC固件LEDE.txt》資料免費(fèi)下載
    發(fā)表于 09-20 09:50 ?12次下載
    <b class='flag-5'>ROC</b> RK3568 PC固件LEDE

    ROC RK3568 PC固件OpenWRT

    電子發(fā)燒友網(wǎng)站提供《ROC RK3568 PC固件OpenWRT.txt》資料免費(fèi)下載
    發(fā)表于 09-20 09:50 ?19次下載
    <b class='flag-5'>ROC</b> RK3568 PC固件OpenWRT

    ROC RK3566 PC固件Buildroot

    電子發(fā)燒友網(wǎng)站提供《ROC RK3566 PC固件Buildroot.txt》資料免費(fèi)下載
    發(fā)表于 09-21 14:55 ?9次下載
    <b class='flag-5'>ROC</b> RK3566 PC固件Buildroot

    ROC RK3566 PC固件Debian

    電子發(fā)燒友網(wǎng)站提供《ROC RK3566 PC固件Debian.txt》資料免費(fèi)下載
    發(fā)表于 09-21 14:54 ?10次下載
    <b class='flag-5'>ROC</b> RK3566 PC固件Debian

    ROC RK3566 PC固件OpenWRT

    電子發(fā)燒友網(wǎng)站提供《ROC RK3566 PC固件OpenWRT.txt》資料免費(fèi)下載
    發(fā)表于 09-21 14:51 ?20次下載
    <b class='flag-5'>ROC</b> RK3566 PC固件OpenWRT

    ROC RK3566 PC固件Ubuntu

    電子發(fā)燒友網(wǎng)站提供《ROC RK3566 PC固件Ubuntu.txt》資料免費(fèi)下載
    發(fā)表于 09-21 14:50 ?12次下載
    <b class='flag-5'>ROC</b> RK3566 PC固件Ubuntu

    為什么使用ROC曲線(xiàn)?

    對(duì)于樣本數(shù)據(jù),我們使用分類(lèi)對(duì)其進(jìn)行分類(lèi),分類(lèi)會(huì)給出每個(gè)數(shù)據(jù)為正例的概率。我們可以針對(duì)此來(lái)設(shè)定一個(gè)閾值,當(dāng)某個(gè)樣本被預(yù)測(cè)為正例的概率大于這
    的頭像 發(fā)表于 12-15 15:34 ?1832次閱讀

    面積曲線(xiàn)AUC(area under curve)

    首先介紹 ROC。ROC 分析是從醫(yī)療分析領(lǐng)域引入了一種新的分類(lèi)模型 performance 評(píng)判方法。
    的頭像 發(fā)表于 01-12 10:36 ?2020次閱讀
    面積<b class='flag-5'>曲線(xiàn)</b><b class='flag-5'>AUC</b>(area under curve)

    支持向量機(jī)(系統(tǒng)識(shí)別的性能度量之ROC曲線(xiàn)

    ROC曲線(xiàn)的英文名稱(chēng)為Receiver Operating Characteristic Curve,中文譯為受試者工作特征曲線(xiàn)
    的頭像 發(fā)表于 06-26 16:12 ?1815次閱讀
    支持向量機(jī)(系統(tǒng)識(shí)別的性能度量之<b class='flag-5'>ROC</b><b class='flag-5'>曲線(xiàn)</b>)

    SAS3516 Tri-Mode ROC產(chǎn)品介紹

    電子發(fā)燒友網(wǎng)站提供《SAS3516 Tri-Mode ROC產(chǎn)品介紹.pdf》資料免費(fèi)下載
    發(fā)表于 08-23 10:54 ?0次下載
    SAS3516 Tri-Mode <b class='flag-5'>ROC</b>產(chǎn)品介紹