一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

阿里達(dá)摩院提出MogFace:人臉檢測新工作

CVer ? 來源:CVer ? 作者:CVer ? 2022-11-29 15:24 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

一、開源

77fd25c0-6f37-11ed-8abf-dac502259ad0.png

MogFace: Towards a Deeper Appreciation on Face Detection

1. 論文鏈接:

https://openaccess.thecvf.com/content/CVPR2022/papers/Liu_MogFace_Towards_a_Deeper_Appreciation_on_Face_Detection_CVPR_2022_paper.pdf

2. 代碼模型:

https://modelscope.cn/models/damo/cv_resnet101_face-detection_cvpr22papermogface/summary

3. 可玩應(yīng)用:

https://modelscope.cn/studios/baigui/face_album/summary

二、背景

人臉檢測算法是在一幅圖片或者視頻序列中檢測出來人臉的位置,給出人臉的具體坐標(biāo),一般是矩形坐標(biāo)。它是人臉關(guān)鍵點(diǎn)、屬性、編輯、風(fēng)格化、識別等模塊的基礎(chǔ)。本文通過實(shí)驗(yàn)觀察發(fā)現(xiàn),對應(yīng)設(shè)計(jì)出如下三個(gè)模塊構(gòu)建出一個(gè)高性能的人臉檢測器MogFace:1.)動態(tài)標(biāo)簽分配策略(dynamic label assignment),2.)誤檢上下文相關(guān)性分析(FP context analysis),3.)金字塔層級監(jiān)督信號分配(pyramid layer level GT assignment)。該方法的模型在WIDER FACE榜單上取得了截止目前將近兩年的六項(xiàng)第一。

三、觀察

1.1 動態(tài)標(biāo)簽分配策略(dynamic label assignment)

為每個(gè)anchor點(diǎn)定義cls和reg目標(biāo)是訓(xùn)練檢測器的必要過程,在人臉檢測中這個(gè)過程稱之為標(biāo)簽分配(Label Assignment)。最近,標(biāo)簽分配吸引了諸多研究人員的注意,在人臉檢測及通用物體檢測領(lǐng)域提出了一系列方法,例如:OTA、PAA,ATSS以及HAMBox。如示例圖(a),標(biāo)簽分配過程依賴4個(gè)元素。分別是:1.)offline information: a.)IoU (anchor與ground-truth框的IoU) , b.)CPD (anchor與ground-truth中心點(diǎn)的距離) ,2.)online information: a.)PCS (cls分支對anchor的前景分類概率值) ,b.)PLC (reg分支對anchor的預(yù)測坐標(biāo)值)。

781a5fd2-6f37-11ed-8abf-dac502259ad0.png

但是,目前的標(biāo)簽分配方法存在三個(gè)問題。1.)若只用offline information做靜態(tài)標(biāo)簽分配,那么會有很多具備更強(qiáng)回歸能力的negative anchor無法被有效利用起來,會導(dǎo)致標(biāo)簽分配策略欠飽和。2.)若過度信任online information動態(tài)調(diào)整正負(fù)anchor時(shí)(如OTA和Hambox),由于online information屬于預(yù)測信息可信度不高,會導(dǎo)致標(biāo)簽分配策略錯(cuò)誤多, 極端情況下會陷入trivial 的分配結(jié)果。3.) 若引入大量超參 (K in ATSS, alpha in OTA)做標(biāo)簽分配,則當(dāng)數(shù)據(jù)集分布發(fā)生變化時(shí),需要大量的調(diào)參時(shí)間。

1.2 誤檢上下文相關(guān)性分析(FP context analysis)

在實(shí)際應(yīng)用中,人臉檢測器并不會十分care AP的指標(biāo),而對誤檢(false positive [FP])的數(shù)量十分敏感。針對這個(gè)問題,目前的做法是收集大量帶有FP的圖片去fine-tune或者from scratch訓(xùn)練檢測器,來幫助檢測器了解更多范式的FP,但是我們發(fā)現(xiàn)有些頻繁出現(xiàn)在訓(xùn)練集中的的FP在這種策略下無法有效解決。這篇文章,我們發(fā)現(xiàn)了一個(gè)有趣的現(xiàn)象:對于同一個(gè)FP,當(dāng)它的context發(fā)生變化時(shí),對于同一個(gè)檢測器來說它可能就不是FP了。如下圖(c),最左面的圖片里日歷是FP,剩余兩張日歷都不是FP。

783f0d50-6f37-11ed-8abf-dac502259ad0.png

1.3 金字塔層級監(jiān)督信號分配(pyramid layer level GT assignment)

scale-level 數(shù)據(jù)增強(qiáng)策略常常作通用物體檢測以及人臉檢測中解決scale variance主要手段。如圖(b)所示,相對于COCO,人臉檢測數(shù)據(jù)集Wider Face 中人臉的尺度分布更為嚴(yán)峻。為此,我們分提出了一個(gè)新的問題,如何合理的分配ground-truth 在不同pyramidlayer上的分布?即檢測器的性能與每個(gè)pyramidlayer匹配ground-truth的個(gè)數(shù)之間的關(guān)系是什么?是否越多越好?通過嚴(yán)格的對比實(shí)驗(yàn)我們發(fā)現(xiàn):“對于所有的pyramid layer來說,并不是這個(gè)pyramid layer匹配到越多的ground-truth就越好”。這說明要挖掘每一個(gè)pyramidlayer的最好性能,需要控制在這個(gè)pyramidlayer上的ground-truth分配的比例。

785e88d8-6f37-11ed-8abf-dac502259ad0.png

四、方法

2.1 Adaptive Online Incremental Anchor Mining Strategy (Ali-AMS)

針對上述“動態(tài)標(biāo)簽分配策略(dynamic label assignment)”觀察分析,本文提出了在里面一種自適應(yīng)的在線增量錨挖掘策略(Ali-AMS),它基于standard anchor matching 策略,并進(jìn)一步adaptive 幫助outlier face匹配anchor。如下:

7880139a-6f37-11ed-8abf-dac502259ad0.png

2.2 Hierachical Context-Aware Module (HCAM)

基于上述“誤檢上下文相關(guān)性分析(FP context analysis)”觀察分析,發(fā)現(xiàn)“對于同一個(gè)FP,當(dāng)它的context發(fā)生變化時(shí),對于同一個(gè)檢測器來說他可能就不是FP了”,我們進(jìn)一步提出了一個(gè)two-step的模塊來顯示的encode context 信息來幫助區(qū)分FP和TP,顯著減少了FP的數(shù)量。

7895de46-6f37-11ed-8abf-dac502259ad0.png

2.3 Selective Scale Enhancement Strategy (SSE)

基于上述的“金字塔層級監(jiān)督信號分配(pyramid layer level GT assignment)”觀察分析,發(fā)現(xiàn)“對于所有的pyramid layer來說,并不是這個(gè)pyramid layer匹配到越多的ground-truth就越好”,我們提出通過控制pyramid layer 匹配的ground-truth的數(shù)量來最大化pyramid layer 的性能。

78b71a5c-6f37-11ed-8abf-dac502259ad0.png

五、實(shí)驗(yàn)

3.1 Ablation Study

78d401a8-6f37-11ed-8abf-dac502259ad0.png

3.2 Comparison with sota

79003fac-6f37-11ed-8abf-dac502259ad0.png

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 模塊
    +關(guān)注

    關(guān)注

    7

    文章

    2788

    瀏覽量

    50397
  • 檢測器
    +關(guān)注

    關(guān)注

    1

    文章

    894

    瀏覽量

    48697
  • 檢測算法
    +關(guān)注

    關(guān)注

    0

    文章

    122

    瀏覽量

    25500

原文標(biāo)題:WIDER FACE六項(xiàng)第一!阿里達(dá)摩院提出MogFace:人臉檢測新工作 | CVPR 2022

文章出處:【微信號:CVer,微信公眾號:CVer】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    阿里巴巴達(dá)摩劉志偉:QEMU RISC-V 的進(jìn)展、特性與未來規(guī)劃

    2025 年 7 月 18 日,在第五屆(2025)RISC-V 中國峰會的軟件與生態(tài)系統(tǒng)分論壇上,阿里巴巴達(dá)摩 RISC-V 及生態(tài)部技術(shù)專家劉志偉帶來了關(guān)于 QEMU RISC-V 的報(bào)告
    發(fā)表于 07-18 11:20 ?4830次閱讀

    【Milk-V Duo S 開發(fā)板免費(fèi)體驗(yàn)】人臉檢測測試(視頻)

    https://bbs.elecfans.com/jishu_2494616_1_1.html我們編譯了人臉檢測的應(yīng)用,現(xiàn)在攝像頭到了, 我們就進(jìn)行實(shí)際測試。 視頻見https
    發(fā)表于 07-11 22:33

    【HarmonyOS 5】VisionKit人臉活體檢測詳解

    【HarmonyOS 5】VisionKit人臉活體檢測詳解 ##鴻蒙開發(fā)能力 ##HarmonyOS SDK應(yīng)用服務(wù)##鴻蒙金融類應(yīng)用 (金融理財(cái)# 一、VisionKit人臉活體檢測
    的頭像 發(fā)表于 06-21 11:52 ?299次閱讀
    【HarmonyOS 5】VisionKit<b class='flag-5'>人臉</b>活體<b class='flag-5'>檢測</b>詳解

    基于RV1126開發(fā)板實(shí)現(xiàn)人臉檢測方案

    在RV1126開發(fā)板上實(shí)現(xiàn)人臉檢測:在圖像中找出人臉,以及每張人臉的landmarks位置。 方案設(shè)計(jì)邏輯流程圖,方案代碼分為分為兩個(gè)業(yè)務(wù)流程,主體代碼負(fù)責(zé)抓取、合成圖像,
    的頭像 發(fā)表于 04-21 17:59 ?469次閱讀
    基于RV1126開發(fā)板實(shí)現(xiàn)<b class='flag-5'>人臉</b><b class='flag-5'>檢測</b>方案

    基于RV1126開發(fā)板實(shí)現(xiàn)人臉檢測方案

    在RV1126開發(fā)板上實(shí)現(xiàn)人臉檢測:在圖像中找出人臉,以及每張人臉的landmarks位置。 方案設(shè)計(jì)邏輯流程圖,方案代碼分為分為兩個(gè)業(yè)務(wù)流程,主體代碼負(fù)責(zé)抓取、合成圖像,
    的頭像 發(fā)表于 04-21 14:00 ?13次閱讀
    基于RV1126開發(fā)板實(shí)現(xiàn)<b class='flag-5'>人臉</b><b class='flag-5'>檢測</b>方案

    基于RV1126開發(fā)板實(shí)現(xiàn)人臉檢測方案

    在RV1126開發(fā)板上實(shí)現(xiàn)人臉檢測:在圖像中找出人臉,以及每張人臉的landmarks位置。 方案設(shè)計(jì)邏輯流程圖,方案代碼分為分為兩個(gè)業(yè)務(wù)流程,主體代碼負(fù)責(zé)抓取、合成圖像,
    的頭像 發(fā)表于 04-21 10:21 ?99次閱讀
    基于RV1126開發(fā)板實(shí)現(xiàn)<b class='flag-5'>人臉</b><b class='flag-5'>檢測</b>方案

    基于RV1126開發(fā)板實(shí)現(xiàn)人臉檢測方案

    在RV1126上實(shí)現(xiàn)人臉檢測:在圖像中找出人臉,以及每張人臉的landmarks位置。方案設(shè)計(jì)邏輯流程圖,方案代碼分為分為兩個(gè)業(yè)務(wù)流程,主體代碼負(fù)責(zé)抓取、合成圖像, 算法代碼負(fù)責(zé)
    的頭像 發(fā)表于 04-18 16:47 ?277次閱讀
    基于RV1126開發(fā)板實(shí)現(xiàn)<b class='flag-5'>人臉</b><b class='flag-5'>檢測</b>方案

    RV1126 實(shí)現(xiàn)人臉檢測方案

    基于RV1126開發(fā)板實(shí)現(xiàn)人臉檢測方案,充分體現(xiàn)了電子方面的實(shí)踐經(jīng)驗(yàn)和目標(biāo)檢測技術(shù)。
    的頭像 發(fā)表于 04-14 09:25 ?263次閱讀
    RV1126 實(shí)現(xiàn)<b class='flag-5'>人臉</b><b class='flag-5'>檢測</b>方案

    普華基礎(chǔ)軟件蒞臨阿里巴巴達(dá)摩調(diào)研交流

    近日, 普華基礎(chǔ)軟件股份有限公司(以下簡稱普華基礎(chǔ)軟件)董事、總經(jīng)理劉宏倩一行前往阿里巴巴達(dá)摩(杭州)科技有限公司(以下簡稱達(dá)摩)調(diào)研交
    的頭像 發(fā)表于 04-08 10:10 ?545次閱讀

    使用OpenVINO?模型的OpenCV進(jìn)行人臉檢測,檢測到多張人臉時(shí),伺服電機(jī)和步入器電機(jī)都發(fā)生移動是為什么?

    使用OpenVINO?模型的 OpenCV* 進(jìn)行人臉檢測。 使用 cv2.矩形 函數(shù),能夠獲取檢測到的面部的坐標(biāo)。 檢測到多張人臉時(shí),多
    發(fā)表于 03-07 06:35

    請問是否可以使用單個(gè)輸入圖像運(yùn)行人臉檢測MTCNN Python演示?

    是否可以使用單個(gè)輸入圖像運(yùn)行人臉檢測 MTCNN Python* 演示?
    發(fā)表于 03-06 08:15

    在Raspberry Pi 4上為OpenVINO? 2021.4.2安裝DL工作臺,加載人臉檢測-0200模型時(shí)遇到錯(cuò)誤怎么解決?

    在 Raspberry Pi* 4 上為 OpenVINO? 2021.4.2 安裝的 DL 工作臺 加載人臉檢測-0200 模型時(shí)遇到錯(cuò)誤: Unknown model format
    發(fā)表于 03-05 07:57

    【米爾RK3576開發(fā)板評測】+項(xiàng)目名稱RetinaFace人臉檢測

    一、簡介 Pytorch_Retinaface?是一個(gè)基于PyTorch框架實(shí)現(xiàn)的人臉檢測算法,它能夠快速而準(zhǔn)確地檢測出圖像中的人臉,并提供豐富的特征信息。該算法的核心思想是使用多尺度
    發(fā)表于 02-15 13:28

    如何用OpenCV的相機(jī)捕捉視頻進(jìn)行人臉檢測--基于米爾NXP i.MX93開發(fā)板

    本篇測評由優(yōu)秀測評者“eefocus_3914144”提供。 本文將介紹基于米爾電子MYD-LMX93開發(fā)板(米爾基于NXP i.MX93開發(fā)板)的基于OpenCV的人臉檢測方案測試。 OpenCV
    發(fā)表于 11-15 17:58

    阿里達(dá)摩發(fā)布玄鐵R908 CPU

    在杭州第四屆RISC-V中國峰會上,阿里達(dá)摩再次展現(xiàn)技術(shù)實(shí)力,隆重推出了玄鐵處理器家族的最新成員——R908 CPU。此次發(fā)布標(biāo)志著玄鐵系列在高端計(jì)算領(lǐng)域的全面升級,吸引了業(yè)界的廣泛矚目。
    的頭像 發(fā)表于 08-23 16:27 ?1469次閱讀