本文主要是關(guān)于機(jī)器視覺(jué)的相關(guān)介紹,并著重對(duì)機(jī)器視覺(jué)入門經(jīng)典書籍進(jìn)行了詳盡的闡述。
機(jī)器視覺(jué)
機(jī)器視覺(jué)是人工智能正在快速發(fā)展的一個(gè)分支。簡(jiǎn)單說(shuō)來(lái),機(jī)器視覺(jué)就是用機(jī)器代替人眼來(lái)做測(cè)量和判斷。機(jī)器視覺(jué)系統(tǒng)是通過(guò)機(jī)器視覺(jué)產(chǎn)品(即圖像攝取裝置,分CMOS和CCD兩種)將被攝取目標(biāo)轉(zhuǎn)換成圖像信號(hào),傳送給專用的圖像處理系統(tǒng),得到被攝目標(biāo)的形態(tài)信息,根據(jù)像素分布和亮度、顏色等信息,轉(zhuǎn)變成數(shù)字化信號(hào);圖像系統(tǒng)對(duì)這些信號(hào)進(jìn)行各種運(yùn)算來(lái)抽取目標(biāo)的特征,進(jìn)而根據(jù)判別的結(jié)果來(lái)控制現(xiàn)場(chǎng)的設(shè)備動(dòng)作。
一個(gè)典型的工業(yè)機(jī)器視覺(jué)系統(tǒng)包括:光源、鏡頭(定焦鏡頭、變倍鏡頭、遠(yuǎn)心鏡頭、顯微鏡頭)、 相機(jī)(包括CCD相機(jī)和COMS相機(jī))、圖像處理單元(或圖像捕獲卡)、圖像處理軟件、監(jiān)視器、通訊 / 輸入輸出單元等。
系統(tǒng)可再分為
一、采集和分析分開的系統(tǒng)。
影像擷取卡(Frame Grabber)與影像處理器
影像攝影機(jī)
定焦鏡頭鏡頭
顯微鏡頭
照明設(shè)備
Halogen光源LED光源
高周波螢光燈源
閃光燈源
其他特殊光源
影像顯示器
LCD
機(jī)構(gòu)及控制系統(tǒng)
精密桌臺(tái)
伺服運(yùn)動(dòng)機(jī)臺(tái)
二、采集和分析一體的系統(tǒng)
智能相機(jī)(圖像采集和分析一體)
其他配套外圍設(shè)備:光源、顯示、PLC控制系統(tǒng)等等。
工作原理編輯
機(jī)器視覺(jué)檢測(cè)系統(tǒng)采用CCD照相機(jī)將被檢測(cè)的目標(biāo)轉(zhuǎn)換成圖像信號(hào),傳送給專用的圖像處理系統(tǒng),根據(jù)像素分布和亮度、顏色等信息,轉(zhuǎn)變成數(shù)字化信號(hào),圖像處理系統(tǒng)對(duì)這些信號(hào)進(jìn)行各種運(yùn)算來(lái)抽取目標(biāo)的特征,如面積、數(shù)量、位置、長(zhǎng)度,再根據(jù)預(yù)設(shè)的允許度和其他條件輸出結(jié)果,包括尺寸、角度、個(gè)數(shù)、合格 / 不合格、有 / 無(wú)等,實(shí)現(xiàn)自動(dòng)識(shí)別功能。
典型結(jié)構(gòu)
一個(gè)典型的機(jī)器視覺(jué)系統(tǒng)包括以下五大塊:
照明
照明是影響機(jī)器視覺(jué)系統(tǒng)輸入的重要因素,它直接影響輸入數(shù)據(jù)的質(zhì)量和應(yīng)用效果。由于沒(méi)有通用的機(jī)器視覺(jué)照明設(shè)備,所以針對(duì)每個(gè)特定的應(yīng)用實(shí)例,要選擇相應(yīng)的照明裝置,以達(dá)到最佳效果。光源可分為可見(jiàn)光和不可見(jiàn)光。常用的幾種可見(jiàn)光源是白熾燈、日光燈、水銀燈和鈉光燈??梢?jiàn)光的缺點(diǎn)是光能不能保持穩(wěn)定。如何使光能在一定的程度上保持穩(wěn)定,是實(shí)用化過(guò)程中急需要解決的問(wèn)題。另一方面,環(huán)境光有可能影響圖像的質(zhì)量,所以可采用加防護(hù)屏的方法來(lái)減少環(huán)境光的影響。照明系統(tǒng)按其照射方法可分為:背向照明、前向照明、結(jié)構(gòu)光和頻閃光照明等。其中,背向照明是被測(cè)物放在光源和攝像機(jī)之間,它的優(yōu)點(diǎn)是能獲得高對(duì)比度的圖像。前向照明是光源和攝像機(jī)位于被測(cè)物的同側(cè),這種方式便于安裝。結(jié)構(gòu)光照明是將光柵或線光源等投射到被測(cè)物上,根據(jù)它們產(chǎn)生的畸變,解調(diào)出被測(cè)物的三維信息。頻閃光照明是將高頻率的光脈沖照射到物體上,攝像機(jī)拍攝要求與光源同步。
鏡頭
FOV(Field of Vision)=所需分辨率*亞象素*相機(jī)尺寸/PRTM(零件測(cè)量公差比)
鏡頭選擇應(yīng)注意:
①焦距②目標(biāo)高度 ③影像高度 ④放大倍數(shù) ⑤影像至目標(biāo)的距離 ⑥中心點(diǎn) /節(jié)點(diǎn)⑦畸變
視覺(jué)檢測(cè)中如何確定鏡頭的焦距
為特定的應(yīng)用場(chǎng)合選擇合適的工業(yè)鏡頭時(shí)必須考慮以下因素:
· 視野 - 被成像區(qū)域的大小。
· 工作距離 (WD) - 攝像機(jī)鏡頭與被觀察物體或區(qū)域之間的距離。
· CCD - 攝像機(jī)成像傳感器裝置的尺寸。
· 這些因素必須采取一致的方式對(duì)待。如果在測(cè)量物體的寬度,則需要使用水平方向的 CCD 規(guī)格,等等。如果以英寸為單位進(jìn)行測(cè)量,則以英尺進(jìn)行計(jì)算,最后再轉(zhuǎn)換為毫米。
參考如下例子:有一臺(tái) 1/3” C 型安裝的 CCD 攝像機(jī)(水平方向?yàn)?4.8 毫米)。物體到鏡頭前部的距離為 12”(305 毫米)。視野或物體的尺寸為2.5”(64 毫米)。換算系數(shù)為 1” = 25.4 毫米(經(jīng)過(guò)圓整)。
FL = 4.8 毫米 x 305 毫米 / 64 毫米
FL = 1464 毫米 / 64 毫米
FL = 按 23 毫米鏡頭的要求
FL = 0.19” x 12” / 2.5”
FL = 2.28” / 2.5”
FL = 0.912” x 25.4 毫米/inch
FL = 按 23 毫米鏡頭的要求
注:勿將工作距離與物體到像的距離混淆。工作距離是從工業(yè)鏡頭前部到被觀察物體之間的距離。而物體到像的距離是 CCD 傳感器到物體之間的距離。計(jì)算要求的工業(yè)鏡頭焦距時(shí),必須使用工作距離
高速相機(jī)
按照不同標(biāo)準(zhǔn)可分為:標(biāo)準(zhǔn)分辨率數(shù)字相機(jī)和模擬相機(jī)等
。要根據(jù)不同的實(shí)際應(yīng)用場(chǎng)合選不同的相機(jī)和高分辨率相機(jī):
按成像色彩劃分,可分為彩色相機(jī)和黑白相機(jī);
按分辨率劃分,像素?cái)?shù)在38萬(wàn)以下的為普通型,像素?cái)?shù)在38萬(wàn)以上的高分辨率型;
按光敏面尺寸大小劃分,可分為1/4、1/3、1/2、1英寸相機(jī);
按掃描方式劃分,可分為行掃描相機(jī)(線陣相機(jī))和面掃描相機(jī)(面陣相機(jī))兩種方式;(面掃描相機(jī)又可分為隔行掃描相機(jī)和逐行掃描相機(jī));
按同步方式劃分,可分為普通相機(jī)(內(nèi)同步)和具有外同步功能的相機(jī)等。
圖像采集卡
圖像采集卡只是完整的機(jī)器視覺(jué)系統(tǒng)的一個(gè)部件,但是
它扮演一個(gè)非常重要的角色。圖像采集卡直接決定了攝像頭的接口:黑白、彩色、模擬、數(shù)字等等。
比較典型的是PCI或AGP兼容的捕獲卡,可以將圖像迅速地傳送到計(jì)算機(jī)存儲(chǔ)器進(jìn)行處理。有些采集卡有內(nèi)置的多路開關(guān)。例如,可以連接8個(gè)不同的攝像機(jī),然后告訴采集卡采用那一個(gè)相機(jī)抓拍到的信息。有些采集卡有內(nèi)置的數(shù)字輸入以觸發(fā)采集卡進(jìn)行捕捉,當(dāng)采集卡抓拍圖像時(shí)數(shù)字輸出口就觸發(fā)閘門。
機(jī)器視覺(jué)入門經(jīng)典書籍推薦
1. 線性代數(shù) (Linear Algebra):
我想國(guó)內(nèi)的大學(xué)生都會(huì)學(xué)過(guò)這門課程,但是,未必每一位老師都能貫徹它的精要。這門學(xué)科對(duì)于Learning是必備的基礎(chǔ),對(duì)它的透徹掌握是必不可少 的。我在科大一年級(jí)的時(shí)候就學(xué)習(xí)了這門課,后來(lái)到了香港后,又重新把線性代數(shù)讀了一遍,所讀的是
Introduction to Linear Algebra (3rd Ed.) by Gilbert Strang.
這本書是MIT的線性代數(shù)課使用的教材,也是被很多其它大學(xué)選用的經(jīng)典教材。它的難度適中,講解清晰,重要的是對(duì)許多核心的概念討論得比較 透徹。我個(gè)人覺(jué)得,學(xué)習(xí)線性代數(shù),最重要的不是去熟練矩陣運(yùn)算和解方程的方法——這些在實(shí)際工作中MATLAB可以代勞,關(guān)鍵的是要深入理解幾個(gè)基礎(chǔ)而又 重要的概念:子空間(Subspace),正交(Orthogonality),特征值和特征向量(Eigenvalues and eigenvectors),和線性變換(Linear transform)。從我的角度看來(lái),一本線代教科書的質(zhì)量,就在于它能否給這些根本概念以足夠的重視,能否把它們的聯(lián)系講清楚。Strang的這本書 在這方面是做得很好的。
而且,這本書有個(gè)得天獨(dú)厚的優(yōu)勢(shì)。書的作者長(zhǎng)期在MIT講授線性代數(shù)課(18.06),課程的video在MIT的Open courseware網(wǎng)站上有提供。有時(shí)間的朋友可以一邊看著名師授課的錄像,一邊對(duì)照課本學(xué)習(xí)或者復(fù)習(xí)。
http://ocw.mit.edu/OcwWeb/Mathematics/18-06Spring-2005/CourseHome/index.htm
2. 概率和統(tǒng)計(jì) (Probability and Statistics):
概率論和統(tǒng)計(jì)的入門教科書很多,我目前也沒(méi)有特別的推薦。我在這里想介紹的是一本關(guān)于多元統(tǒng)計(jì)的基礎(chǔ)教科書:
Applied Multivariate Statistical Analysis (5th Ed.) by Richard A. Johnson and Dean W. Wichern
這本書是我在剛接觸向量統(tǒng)計(jì)的時(shí)候用于學(xué)習(xí)的,我在香港時(shí)做研究的基礎(chǔ)就是從此打下了。實(shí)驗(yàn)室的一些同學(xué)也借用這本書學(xué)習(xí)向量統(tǒng)計(jì)。這本書 沒(méi)有特別追求數(shù)學(xué)上的深度,而是以通俗易懂的方式講述主要的基本概念,讀起來(lái)很舒服,內(nèi)容也很實(shí)用。對(duì)于Linear regression, factor analysis, principal component analysis (PCA), and canonical component analysis (CCA)這些Learning中的基本方法也展開了初步的論述。
之后就可以進(jìn)一步深入學(xué)習(xí)貝葉斯統(tǒng)計(jì)和Graphical models。一本理想的書是
Introduction to Graphical Models (draft version)。 by M. Jordan and C. Bishop.
我不知道這本書是不是已經(jīng)出版了(不要和Learning in Graphical Models混淆,那是個(gè)論文集,不適合初學(xué))。這本書從基本的貝葉斯統(tǒng)計(jì)模型出發(fā)一直深入到復(fù)雜的統(tǒng)計(jì)網(wǎng)絡(luò)的估計(jì)和推斷,深入淺 出,statistical learning的許多重要方面都在此書有清楚論述和詳細(xì)講解。MIT內(nèi)部可以access,至于外面,好像也是有電子版的。
3. 分析 (Analysis):
我想大家基本都在大學(xué)就學(xué)過(guò)微積分或者數(shù)學(xué)分析,深度和廣度則隨各個(gè)學(xué)校而異了。這個(gè)領(lǐng)域是很多學(xué)科的基礎(chǔ),值得推薦的教科書莫過(guò)于
Principles of Mathematical Analysis, by Walter Rudin
有點(diǎn)老,但是絕對(duì)經(jīng)典,深入透徹。缺點(diǎn)就是比較艱深——這是Rudin的書的一貫風(fēng)格,適合于有一定基礎(chǔ)后回頭去看。
在分析這個(gè)方向,接下來(lái)就是泛函分析(Functional Analysis)。
Introductory Functional Analysis with Applications, by Erwin Kreyszig.
適合作為泛函的基礎(chǔ)教材,容易切入而不失全面。我特別喜歡它對(duì)于譜論和算子理論的特別關(guān)注,這對(duì)于做learning的研究是特別重要的。 Rudin也有一本關(guān)于functional analysis的書,那本書在數(shù)學(xué)上可能更為深刻,但是不易于上手,所講內(nèi)容和learning的切合度不如此書。
在分析這個(gè)方向,還有一個(gè)重要的學(xué)科是測(cè)度理論(Measure theory),但是我看過(guò)的書里面目前還沒(méi)有感覺(jué)有特別值得介紹的。
4. 拓?fù)?(Topology):
在我讀過(guò)的基本拓?fù)鋾饔刑厣?,但是綜合而言,我最推崇:
Topology (2nd Ed.) by James Munkres
這本書是Munkres教授長(zhǎng)期執(zhí)教MIT拓?fù)湔n的心血所凝。對(duì)于一般拓?fù)鋵W(xué)(General topology)有全面介紹,而對(duì)于代數(shù)拓?fù)洌ˋlgebraic topology)也有適度的探討。此書不需要特別的數(shù)學(xué)知識(shí)就可以開始學(xué)習(xí),由淺入深,從最基本的集合論概念(很多書不屑講這個(gè))到Nagata- Smirnov Theorem和Tychonoff theorem等較深的定理(很多書避開了這個(gè))都覆蓋了。講述方式思想性很強(qiáng),對(duì)于很多定理,除了給出證明過(guò)程和引導(dǎo)你思考其背后的原理脈絡(luò),很多令人 贊嘆的亮點(diǎn)——我常讀得忘卻饑餓,不愿釋手。很多習(xí)題很有水平。
5. 流形理論 (Manifold theory):
對(duì)于拓?fù)浜头治鲇幸欢ò盐諘r(shí),方可開始學(xué)習(xí)流形理論,否則所學(xué)只能流于浮淺。我所使用的書是
Introduction to Smooth Manifolds. by John M. Lee
雖然書名有introduction這個(gè)單詞,但是實(shí)際上此書涉入很深,除了講授了基本的manifold, tangent space, bundle, sub-manifold等,還探討了諸如綱理論(Category theory),德拉姆上同調(diào)(De Rham cohomology)和積分流形等一些比較高級(jí)的專題。對(duì)于李群和李代數(shù)也有相當(dāng)多的討論。行文通俗而又不失嚴(yán)謹(jǐn),不過(guò)對(duì)某些記號(hào)方式需要熟悉一下。
雖然李群論是建基于平滑流形的概念之上,不過(guò),也可能從矩陣出發(fā)直接學(xué)習(xí)李群和李代數(shù)——這種方法對(duì)于急需使用李群論解決問(wèn)題的朋友可能更加實(shí)用。 而且,對(duì)于一個(gè)問(wèn)題從不同角度看待也利于加深理解。下面一本書就是這個(gè)方向的典范:
Lie Groups, Lie Algebras, and Representations: An Elementary Introduction. by Brian C. Hall
此書從開始即從矩陣切入,從代數(shù)而非幾何角度引入矩陣?yán)钊旱母拍?。并通過(guò)定義運(yùn)算的方式建立exponential mapping,并就此引入李代數(shù)。這種方式比起傳統(tǒng)的通過(guò)“左不變向量場(chǎng)(Left-invariant vector field)“的方式定義李代數(shù)更容易為人所接受,也更容易揭示李代數(shù)的意義。最后,也有專門的論述把這種新的定義方式和傳統(tǒng)方式聯(lián)系起來(lái)。
結(jié)語(yǔ)
關(guān)于機(jī)器視覺(jué)的相關(guān)介紹就到這了,如有不足之處歡迎指正。
-
控制器
+關(guān)注
關(guān)注
114文章
17098瀏覽量
184184 -
機(jī)器視覺(jué)
+關(guān)注
關(guān)注
163文章
4594瀏覽量
122867
發(fā)布評(píng)論請(qǐng)先 登錄
很不錯(cuò)的LABVIEW入門書籍
Linux學(xué)習(xí)書籍—入門
Linux學(xué)習(xí)書籍—入門
機(jī)器人基礎(chǔ)書籍
java入門經(jīng)典書籍推薦
c語(yǔ)言入門書籍推薦
7本Matlab入門經(jīng)典教程書籍介紹
python入門書籍推薦
機(jī)器視覺(jué)系統(tǒng)的經(jīng)典應(yīng)用
機(jī)器視覺(jué)檢測(cè)系統(tǒng)的最經(jīng)典結(jié)構(gòu)簡(jiǎn)介
入門必看機(jī)器視覺(jué)詳解1

評(píng)論