一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

阿里達摩院提出MogFace:人臉檢測新工作

CVer ? 來源:CVer ? 作者:CVer ? 2022-11-29 15:24 ? 次閱讀

一、開源

77fd25c0-6f37-11ed-8abf-dac502259ad0.png

MogFace: Towards a Deeper Appreciation on Face Detection

1. 論文鏈接:

https://openaccess.thecvf.com/content/CVPR2022/papers/Liu_MogFace_Towards_a_Deeper_Appreciation_on_Face_Detection_CVPR_2022_paper.pdf

2. 代碼模型:

https://modelscope.cn/models/damo/cv_resnet101_face-detection_cvpr22papermogface/summary

3. 可玩應(yīng)用:

https://modelscope.cn/studios/baigui/face_album/summary

二、背景

人臉檢測算法是在一幅圖片或者視頻序列中檢測出來人臉的位置,給出人臉的具體坐標,一般是矩形坐標。它是人臉關(guān)鍵點、屬性、編輯、風格化、識別等模塊的基礎(chǔ)。本文通過實驗觀察發(fā)現(xiàn),對應(yīng)設(shè)計出如下三個模塊構(gòu)建出一個高性能的人臉檢測器MogFace:1.)動態(tài)標簽分配策略(dynamic label assignment),2.)誤檢上下文相關(guān)性分析(FP context analysis),3.)金字塔層級監(jiān)督信號分配(pyramid layer level GT assignment)。該方法的模型在WIDER FACE榜單上取得了截止目前將近兩年的六項第一。

三、觀察

1.1 動態(tài)標簽分配策略(dynamic label assignment)

為每個anchor點定義cls和reg目標是訓(xùn)練檢測器的必要過程,在人臉檢測中這個過程稱之為標簽分配(Label Assignment)。最近,標簽分配吸引了諸多研究人員的注意,在人臉檢測及通用物體檢測領(lǐng)域提出了一系列方法,例如:OTA、PAA,ATSS以及HAMBox。如示例圖(a),標簽分配過程依賴4個元素。分別是:1.)offline information: a.)IoU (anchor與ground-truth框的IoU) , b.)CPD (anchor與ground-truth中心點的距離) ,2.)online information: a.)PCS (cls分支對anchor的前景分類概率值) ,b.)PLC (reg分支對anchor的預(yù)測坐標值)。

781a5fd2-6f37-11ed-8abf-dac502259ad0.png

但是,目前的標簽分配方法存在三個問題。1.)若只用offline information做靜態(tài)標簽分配,那么會有很多具備更強回歸能力的negative anchor無法被有效利用起來,會導(dǎo)致標簽分配策略欠飽和。2.)若過度信任online information動態(tài)調(diào)整正負anchor時(如OTA和Hambox),由于online information屬于預(yù)測信息可信度不高,會導(dǎo)致標簽分配策略錯誤多, 極端情況下會陷入trivial 的分配結(jié)果。3.) 若引入大量超參 (K in ATSS, alpha in OTA)做標簽分配,則當數(shù)據(jù)集分布發(fā)生變化時,需要大量的調(diào)參時間。

1.2 誤檢上下文相關(guān)性分析(FP context analysis)

在實際應(yīng)用中,人臉檢測器并不會十分care AP的指標,而對誤檢(false positive [FP])的數(shù)量十分敏感。針對這個問題,目前的做法是收集大量帶有FP的圖片去fine-tune或者from scratch訓(xùn)練檢測器,來幫助檢測器了解更多范式的FP,但是我們發(fā)現(xiàn)有些頻繁出現(xiàn)在訓(xùn)練集中的的FP在這種策略下無法有效解決。這篇文章,我們發(fā)現(xiàn)了一個有趣的現(xiàn)象:對于同一個FP,當它的context發(fā)生變化時,對于同一個檢測器來說它可能就不是FP了。如下圖(c),最左面的圖片里日歷是FP,剩余兩張日歷都不是FP。

783f0d50-6f37-11ed-8abf-dac502259ad0.png

1.3 金字塔層級監(jiān)督信號分配(pyramid layer level GT assignment)

scale-level 數(shù)據(jù)增強策略常常作通用物體檢測以及人臉檢測中解決scale variance主要手段。如圖(b)所示,相對于COCO,人臉檢測數(shù)據(jù)集Wider Face 中人臉的尺度分布更為嚴峻。為此,我們分提出了一個新的問題,如何合理的分配ground-truth 在不同pyramidlayer上的分布?即檢測器的性能與每個pyramidlayer匹配ground-truth的個數(shù)之間的關(guān)系是什么?是否越多越好?通過嚴格的對比實驗我們發(fā)現(xiàn):“對于所有的pyramid layer來說,并不是這個pyramid layer匹配到越多的ground-truth就越好”。這說明要挖掘每一個pyramidlayer的最好性能,需要控制在這個pyramidlayer上的ground-truth分配的比例。

785e88d8-6f37-11ed-8abf-dac502259ad0.png

四、方法

2.1 Adaptive Online Incremental Anchor Mining Strategy (Ali-AMS)

針對上述“動態(tài)標簽分配策略(dynamic label assignment)”觀察分析,本文提出了在里面一種自適應(yīng)的在線增量錨挖掘策略(Ali-AMS),它基于standard anchor matching 策略,并進一步adaptive 幫助outlier face匹配anchor。如下:

7880139a-6f37-11ed-8abf-dac502259ad0.png

2.2 Hierachical Context-Aware Module (HCAM)

基于上述“誤檢上下文相關(guān)性分析(FP context analysis)”觀察分析,發(fā)現(xiàn)“對于同一個FP,當它的context發(fā)生變化時,對于同一個檢測器來說他可能就不是FP了”,我們進一步提出了一個two-step的模塊來顯示的encode context 信息來幫助區(qū)分FP和TP,顯著減少了FP的數(shù)量。

7895de46-6f37-11ed-8abf-dac502259ad0.png

2.3 Selective Scale Enhancement Strategy (SSE)

基于上述的“金字塔層級監(jiān)督信號分配(pyramid layer level GT assignment)”觀察分析,發(fā)現(xiàn)“對于所有的pyramid layer來說,并不是這個pyramid layer匹配到越多的ground-truth就越好”,我們提出通過控制pyramid layer 匹配的ground-truth的數(shù)量來最大化pyramid layer 的性能。

78b71a5c-6f37-11ed-8abf-dac502259ad0.png

五、實驗

3.1 Ablation Study

78d401a8-6f37-11ed-8abf-dac502259ad0.png

3.2 Comparison with sota

79003fac-6f37-11ed-8abf-dac502259ad0.png

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 模塊
    +關(guān)注

    關(guān)注

    7

    文章

    2773

    瀏覽量

    49122
  • 檢測器
    +關(guān)注

    關(guān)注

    1

    文章

    882

    瀏覽量

    48300
  • 檢測算法
    +關(guān)注

    關(guān)注

    0

    文章

    121

    瀏覽量

    25407

原文標題:WIDER FACE六項第一!阿里達摩院提出MogFace:人臉檢測新工作 | CVPR 2022

文章出處:【微信號:CVer,微信公眾號:CVer】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦
    熱點推薦

    基于RV1126開發(fā)板實現(xiàn)人臉檢測方案

    在RV1126開發(fā)板上實現(xiàn)人臉檢測:在圖像中找出人臉,以及每張人臉的landmarks位置。 方案設(shè)計邏輯流程圖,方案代碼分為分為兩個業(yè)務(wù)流程,主體代碼負責抓取、合成圖像,
    的頭像 發(fā)表于 04-21 17:59 ?234次閱讀
    基于RV1126開發(fā)板實現(xiàn)<b class='flag-5'>人臉</b><b class='flag-5'>檢測</b>方案

    基于RV1126開發(fā)板實現(xiàn)人臉檢測方案

    在RV1126開發(fā)板上實現(xiàn)人臉檢測:在圖像中找出人臉,以及每張人臉的landmarks位置。 方案設(shè)計邏輯流程圖,方案代碼分為分為兩個業(yè)務(wù)流程,主體代碼負責抓取、合成圖像,
    的頭像 發(fā)表于 04-21 14:00 ?13次閱讀
    基于RV1126開發(fā)板實現(xiàn)<b class='flag-5'>人臉</b><b class='flag-5'>檢測</b>方案

    基于RV1126開發(fā)板實現(xiàn)人臉檢測方案

    在RV1126開發(fā)板上實現(xiàn)人臉檢測:在圖像中找出人臉,以及每張人臉的landmarks位置。 方案設(shè)計邏輯流程圖,方案代碼分為分為兩個業(yè)務(wù)流程,主體代碼負責抓取、合成圖像,
    的頭像 發(fā)表于 04-21 10:21 ?99次閱讀
    基于RV1126開發(fā)板實現(xiàn)<b class='flag-5'>人臉</b><b class='flag-5'>檢測</b>方案

    基于RV1126開發(fā)板實現(xiàn)人臉檢測方案

    在RV1126上實現(xiàn)人臉檢測:在圖像中找出人臉,以及每張人臉的landmarks位置。方案設(shè)計邏輯流程圖,方案代碼分為分為兩個業(yè)務(wù)流程,主體代碼負責抓取、合成圖像, 算法代碼負責
    的頭像 發(fā)表于 04-18 16:47 ?277次閱讀
    基于RV1126開發(fā)板實現(xiàn)<b class='flag-5'>人臉</b><b class='flag-5'>檢測</b>方案

    RV1126 實現(xiàn)人臉檢測方案

    基于RV1126開發(fā)板實現(xiàn)人臉檢測方案,充分體現(xiàn)了電子方面的實踐經(jīng)驗和目標檢測技術(shù)。
    的頭像 發(fā)表于 04-14 09:25 ?93次閱讀
    RV1126 實現(xiàn)<b class='flag-5'>人臉</b><b class='flag-5'>檢測</b>方案

    普華基礎(chǔ)軟件蒞臨阿里巴巴達摩調(diào)研交流

    近日, 普華基礎(chǔ)軟件股份有限公司(以下簡稱普華基礎(chǔ)軟件)董事、總經(jīng)理劉宏倩一行前往阿里巴巴達摩(杭州)科技有限公司(以下簡稱達摩)調(diào)研交
    的頭像 發(fā)表于 04-08 10:10 ?323次閱讀

    使用OpenVINO?模型的OpenCV進行人臉檢測檢測到多張人臉時,伺服電機和步入器電機都發(fā)生移動是為什么?

    使用OpenVINO?模型的 OpenCV* 進行人臉檢測。 使用 cv2.矩形 函數(shù),能夠獲取檢測到的面部的坐標。 檢測到多張人臉時,多
    發(fā)表于 03-07 06:35

    在Raspberry Pi 4上為OpenVINO? 2021.4.2安裝DL工作臺,加載人臉檢測-0200模型時遇到錯誤怎么解決?

    在 Raspberry Pi* 4 上為 OpenVINO? 2021.4.2 安裝的 DL 工作臺 加載人臉檢測-0200 模型時遇到錯誤: Unknown model format
    發(fā)表于 03-05 07:57

    阿里達摩發(fā)布玄鐵R908 CPU

    在杭州第四屆RISC-V中國峰會上,阿里達摩再次展現(xiàn)技術(shù)實力,隆重推出了玄鐵處理器家族的最新成員——R908 CPU。此次發(fā)布標志著玄鐵系列在高端計算領(lǐng)域的全面升級,吸引了業(yè)界的廣泛矚目。
    的頭像 發(fā)表于 08-23 16:27 ?1325次閱讀

    人臉檢測模型的精確度怎么算

    人臉檢測模型的精確度評估是一個復(fù)雜的過程,涉及到多個方面的因素。本文將從以下幾個方面進行介紹:人臉檢測模型的基本概念、評估指標、評估方法、影響因素以及提高精確度的策略。
    的頭像 發(fā)表于 07-04 09:14 ?910次閱讀

    人臉檢測模型有哪些

    人臉檢測是計算機視覺領(lǐng)域的一個重要研究方向,它涉及到從圖像或視頻中檢測出人臉的位置和大小。隨著深度學習技術(shù)的發(fā)展,人臉檢測模型的性能得到了顯
    的頭像 發(fā)表于 07-03 17:05 ?1597次閱讀

    人臉檢測人臉識別的區(qū)別是什么

    人臉檢測人臉識別是計算機視覺領(lǐng)域的兩個重要技術(shù),它們在許多應(yīng)用場景中都有廣泛的應(yīng)用,如安全監(jiān)控、身份驗證、社交媒體等。盡管它們在某些方面有相似之處,但它們之間存在一些關(guān)鍵的區(qū)別。本文將詳細介紹
    的頭像 發(fā)表于 07-03 14:49 ?1933次閱讀

    人臉檢測的五種方法各有什么特征和優(yōu)缺點

    人臉檢測是計算機視覺領(lǐng)域的一個重要研究方向,主要用于識別和定位圖像中的人臉。以下是五種常見的人臉檢測方法及其特征和優(yōu)缺點的介紹: 基于膚色的
    的頭像 發(fā)表于 07-03 14:47 ?1339次閱讀

    人臉檢測與識別的方法有哪些

    人臉檢測與識別是計算機視覺領(lǐng)域中的一個重要研究方向,具有廣泛的應(yīng)用前景,如安全監(jiān)控、身份認證、智能視頻分析等。本文將詳細介紹人臉檢測與識別的方法。 引言
    的頭像 發(fā)表于 07-03 14:45 ?1089次閱讀

    阿里達摩提出“知識鏈”框架,降低大模型幻覺

    近日,阿里巴巴達摩(湖畔實驗室)攜手新加坡南洋理工大學等研究機構(gòu),共同推出了大模型知識鏈(CoK)框架。該框架不僅可實時檢索異構(gòu)知識源,還能逐步糾正推理錯誤,有效提高了大模型在回答知識型問題時的準確率,并顯著降低了所謂的“幻覺
    的頭像 發(fā)表于 05-10 11:46 ?870次閱讀