我們每天用人臉識(shí)別技術(shù)解鎖手機(jī)、結(jié)賬付款,是那么的自然,但相信很少有同學(xué)深入思考這項(xiàng)技術(shù)背后是怎樣一個(gè)流程。
前面我們說,計(jì)算機(jī)視覺是人臉識(shí)別關(guān)系最緊密的技術(shù)。所以我們從這一點(diǎn)入手。
計(jì)算機(jī)視覺,通俗來說就是利用攝像頭等設(shè)備代替人眼,來獲取圖像,利用計(jì)算機(jī)對(duì)圖像信息進(jìn)行處理,綜合人類的認(rèn)知模式來建立人類視覺的計(jì)算理論。
這其中,最難的無疑是如何處理圖像信息、如何模擬人類的認(rèn)知模式。
為了解決這些問題,計(jì)算機(jī)視覺還引入了圖像處理、模式識(shí)別、圖像理解、圖像生成等學(xué)科的知識(shí)。
圖像處理就是把原始圖像轉(zhuǎn)換成計(jì)算機(jī)更容易識(shí)別的圖像;模式識(shí)別,就是計(jì)算機(jī)判斷自己要識(shí)別的是什么和怎么識(shí)別的過程;圖像理解,就是對(duì)圖像中描述的景物進(jìn)行分析;圖像生成,舉例來說就是當(dāng)圖像的部分信息缺失時(shí),能夠?qū)⑷笔У男畔⒀a(bǔ)上……
這些都是計(jì)算機(jī)視覺需要借助的學(xué)科技術(shù)。這里面我們要著重講的是模式識(shí)別,它是一個(gè)獨(dú)立的理論體系,具體到計(jì)算機(jī)視覺領(lǐng)域的應(yīng)用,它表示將計(jì)算機(jī)表示出來的圖像和一致的類別進(jìn)行匹配的過程。
有點(diǎn)懂是吧。在這里為大家通俗解釋一下,所謂“識(shí)別”,就是先認(rèn)識(shí),然后辨別。認(rèn)識(shí)什么?認(rèn)識(shí)的是圖像和從圖像中總結(jié)的目標(biāo)物體的特征。怎么辨別?就是將總結(jié)出來的特征和自己已經(jīng)掌握的特征庫進(jìn)行比對(duì),然后才能實(shí)現(xiàn)辨別。
我們?nèi)祟愖R(shí)別一樣物體也是遵循這個(gè)邏輯,先總結(jié)特征,然后比對(duì)。至于前面的“模式”,就有點(diǎn)抽象了,你可以理解為一種規(guī)律,它影響著特征和類型比對(duì)的結(jié)果。
沒錯(cuò),人臉識(shí)別本質(zhì)上也是這個(gè)過程。
所以,我們沿著模式識(shí)別的思路,來看看它的整體過程:分別為預(yù)處理、特征提取和分類等。我們畫出如下流程圖:
預(yù)處理是第一步,但是這部分工作可能很多很雜,例如減少圖像中的噪聲干擾、提高清晰度、還有包括圖像濾波、變換、轉(zhuǎn)碼、模數(shù)轉(zhuǎn)化等。
特征提取,就是在預(yù)處理后的圖像中,提取對(duì)識(shí)別有明顯作用的特征,并在這個(gè)過程中降低模式特征的維數(shù),令其便于處理。這是一個(gè)復(fù)雜的過程,后面我們講到具體方法時(shí)候會(huì)有體現(xiàn);
分類,就是對(duì)提取到的特征值按照一定的準(zhǔn)則進(jìn)行分類,便于決策。
舉個(gè)例子,計(jì)算機(jī)要識(shí)別出這張照片中的男人,當(dāng)它拿到照片時(shí),可能覺得畫面太暗,先提個(gè)亮度,然后又發(fā)現(xiàn)噪點(diǎn)太多,再做個(gè)降噪……一頓操作后感覺可以了,再將照片轉(zhuǎn)化為數(shù)字信息,這個(gè)過程是預(yù)處理。
提取出來的特征值會(huì)進(jìn)入單獨(dú)的特征空間,因?yàn)檫@樣可以更好地識(shí)別和做分類。接下來,就要對(duì)特征空間里的數(shù)據(jù)進(jìn)行分類了,讓它們眼睛歸眼睛,鼻子歸鼻子,頭發(fā)歸頭發(fā)……基于這些分類好的數(shù)據(jù),計(jì)算機(jī)才可以進(jìn)行識(shí)別判斷和決策。
當(dāng)然,為了方便大家理解這個(gè)邏輯過程,小編在這里只是舉例粗略地說明,可能不準(zhǔn)確,實(shí)際的步驟也是相當(dāng)復(fù)雜的,還要考慮各種干擾的因素,例如圖像的質(zhì)量不清晰、背景復(fù)雜、圖像光照分布不均勻、目標(biāo)姿勢(shì)角度出現(xiàn)扭曲或者佩戴了頭飾、眼鏡以及張了胡須、化了妝等等各種情況。
還有要說明的一點(diǎn)是,這個(gè)模式識(shí)別的系統(tǒng)是需要一個(gè)自我訓(xùn)練、學(xué)習(xí)的過程的,其中最重要的是對(duì)前面分類錯(cuò)誤率的訓(xùn)練(分類器訓(xùn)練),因?yàn)樵谇懊娴姆诸愔校覀儫o法保證分類的結(jié)果是100%正確的,但必須控制在一定的錯(cuò)誤率之類,這必須通過大量的訓(xùn)練樣本來不斷修正,令錯(cuò)誤率符合要求。
好了,基于以上對(duì)計(jì)算機(jī)視覺模式識(shí)別的討論,我們就可以給出人臉識(shí)別系統(tǒng)的主要功能模塊了:
可能有小伙伴覺得上面這個(gè)舉出功能模塊太簡(jiǎn)單了,所以我們?cè)倬_一些,給出下面的邏輯架構(gòu)圖,相信不難理解:
-
架構(gòu)
+關(guān)注
關(guān)注
1文章
528瀏覽量
25987 -
人臉識(shí)別
+關(guān)注
關(guān)注
77文章
4089瀏覽量
84299
原文標(biāo)題:PLC編程和繼電器控制,很全面的入門干貨全在這
文章出處:【微信號(hào):GKYXT1508,微信公眾號(hào):工控云學(xué)堂】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
基于LockAI視覺識(shí)別模塊:C++人臉識(shí)別
基于LockAI視覺識(shí)別模塊:C++人臉識(shí)別

人臉識(shí)別身份核驗(yàn)終端使用鴻蒙系統(tǒng),有什么好處?

人臉識(shí)別解決方案:智能安防與高效管理的創(chuàng)新之選

人臉識(shí)別技術(shù)在智能家居中的應(yīng)用有哪些
人臉識(shí)別技術(shù)的優(yōu)勢(shì)與劣勢(shì)
人臉識(shí)別技術(shù)的算法原理解析
人臉識(shí)別技術(shù)在安全監(jiān)控中的應(yīng)用
人臉識(shí)別技術(shù)的應(yīng)用場(chǎng)景
新唐科技基于NuMaker-M55M1平臺(tái)的人臉識(shí)別系統(tǒng)
校園人臉識(shí)別閘機(jī)通道的應(yīng)用

幾款性價(jià)比很不錯(cuò)的門禁人臉識(shí)別系統(tǒng)及其常見應(yīng)用

隧道門禁人臉識(shí)別系統(tǒng)是專為隧道安全管理設(shè)計(jì)的先進(jìn)技術(shù)系統(tǒng)

評(píng)論