現(xiàn)階段比較受歡迎的圖像識別基礎(chǔ)算法為深度學(xué)習(xí)法,深度學(xué)習(xí)模型屬于神經(jīng)網(wǎng)絡(luò),而神經(jīng)網(wǎng)絡(luò)的歷史可追溯至上世紀(jì)四十年代,曾經(jīng)在八九十年代流行。神經(jīng)網(wǎng)絡(luò)試圖通過模擬大腦認(rèn)知的激勵,解決各種機(jī)器學(xué)習(xí)的問題。1986年Rumelhart、Hinton和Williams在《自然》發(fā)表了著名的反向傳播算法用于訓(xùn)練神經(jīng)網(wǎng)絡(luò),直到今天仍被廣泛應(yīng)用。
但是后來由于種種原因,大多數(shù)學(xué)者在相當(dāng)長的一段時間內(nèi)放棄了神經(jīng)網(wǎng)絡(luò),轉(zhuǎn)而采用諸如支持向量機(jī)、Boosting、最近鄰等分類器。這些分類器可以用具有一個或兩個隱含層的神經(jīng)網(wǎng)絡(luò)模擬,因此被稱作淺層機(jī)器學(xué)習(xí)模型。它們不再模擬大腦的認(rèn)知機(jī)理;相反,針對不同的任務(wù)設(shè)計不同的系統(tǒng),并采用不同的手工設(shè)計的特征,例如語音識別采用高斯混合模型和隱馬爾可夫模型,物體識別采用SIFT特征,人臉識別采用LBP特征,行人檢測采用HOG特征。
深度學(xué)習(xí)在計算機(jī)視覺領(lǐng)域最具影響力的突破發(fā)生在2012年,Hinton的研究小組采用深度學(xué)習(xí)贏得了ImageNet圖像分類的比賽。ImageNet是當(dāng)今計算機(jī)視覺領(lǐng)域最具影響力的比賽之一,它的訓(xùn)練和測試樣本都來自于互聯(lián)網(wǎng)圖片,訓(xùn)練樣本超過百萬,任務(wù)是將測試樣本分成1000類。自2009年,包括工業(yè)界在內(nèi)的很多計算機(jī)視覺小組都參加了每年一度的比賽,各個小組的方法逐漸趨同;2012年,排名2到4位的小組都采用的傳統(tǒng)模擬識別方法,他們準(zhǔn)確率的差別不超過1%,而首次參賽的Hinton研究小組采用的是深度學(xué)習(xí)的方法,且準(zhǔn)確率超出第二名10%以上。這個結(jié)果在計算機(jī)視覺領(lǐng)域產(chǎn)生了極大的震動,掀起了深度學(xué)習(xí)的熱潮。
與傳統(tǒng)模式識別相比,深度學(xué)習(xí)最大的不同在于它是從大數(shù)據(jù)中自動學(xué)習(xí)特征,而非采用手工設(shè)計的特征模型。在過去幾十年模式識別的各種應(yīng)用中,手工設(shè)計的特征處于統(tǒng)治地位,它主要依靠設(shè)計者的經(jīng)驗知識,很難利用大數(shù)據(jù)的優(yōu)勢;由于依賴手工調(diào)整參數(shù),特征的設(shè)計中只允許出現(xiàn)少量參數(shù)。深度學(xué)習(xí)的優(yōu)勢則顯而易見——大數(shù)據(jù)中可以包含成千上萬的參數(shù),用來訓(xùn)練深度學(xué)習(xí)的數(shù)據(jù)越多,深度學(xué)習(xí)算法的魯棒性、泛化能力就越強(qiáng)。
目前,深度學(xué)習(xí)算法的訓(xùn)練數(shù)據(jù)普遍都是幾十萬、上百萬級,像一些互聯(lián)網(wǎng)行業(yè)的IT巨頭們,他們的訓(xùn)練數(shù)據(jù)會是上千萬、甚至上億級別,這也是國外如Google、Facebook、Microsoft等,國內(nèi)如百度、騰訊等IT巨頭在深度學(xué)習(xí)算法的應(yīng)用效果上有著一定優(yōu)勢的原因。但I(xiàn)T企業(yè)與安防企業(yè)所用的訓(xùn)練數(shù)據(jù)不同,IT巨頭擁有的是互聯(lián)網(wǎng),安防企業(yè)擁有的則是安防大數(shù)據(jù)。二者圖像識別技術(shù)的關(guān)注點(diǎn)也有不同,IT巨頭的人臉識別技術(shù)是服務(wù)于他們的商業(yè)目標(biāo),比如圖像檢索、身份認(rèn)證、無人駕駛等,而安防企業(yè)主要關(guān)注的是人臉識別技術(shù)在公共安全領(lǐng)域的應(yīng)用。
-
圖像識別
+關(guān)注
關(guān)注
9文章
527瀏覽量
39109 -
深度學(xué)習(xí)
+關(guān)注
關(guān)注
73文章
5561瀏覽量
122794
原文標(biāo)題:【技術(shù)知識】深度學(xué)習(xí)在圖像識別中的應(yīng)用
文章出處:【微信號:jingzhenglizixun,微信公眾號:機(jī)器人博覽】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
深度學(xué)習(xí)視角下的貓狗圖像識別實現(xiàn)

深度學(xué)習(xí)在圖像識別領(lǐng)域的四大方向

深度學(xué)習(xí)進(jìn)軍太空領(lǐng)域——衛(wèi)星實時圖像識別
技術(shù) | 基于深度學(xué)習(xí)圖像識別的變電站監(jiān)控系統(tǒng)
深度學(xué)習(xí)圖像識別解釋方法的概述

細(xì)粒度圖像識別深度學(xué)習(xí)開源工具庫Hawkeye解析
圖像識別技術(shù)原理 深度學(xué)習(xí)的圖像識別應(yīng)用研究
模擬矩陣在圖像識別中的應(yīng)用

評論