機(jī)器視覺(jué)是工業(yè)4.0,即工業(yè)物聯(lián)網(wǎng)背景下高度自動(dòng)化和無(wú)縫聯(lián)網(wǎng)過(guò)程的關(guān)鍵技術(shù)。使用諸如深度學(xué)習(xí)之類(lèi)的新的人工智能過(guò)程變得越來(lái)越重要。許多好處使這項(xiàng)技術(shù)具有吸引力,但同時(shí)它也有局限性。
工業(yè)生產(chǎn)的自動(dòng)化正在迅速發(fā)展。完全網(wǎng)絡(luò)化和數(shù)字化的流程鏈在生產(chǎn)車(chē)間早已司空見(jiàn)慣。在工業(yè)4.0和智能工廠中,所有涉及的組件——包括機(jī)器、機(jī)器人、傳輸和處理系統(tǒng)、傳感器和圖像采集設(shè)備——一起工作,彼此無(wú)縫通信。機(jī)器人領(lǐng)域也出現(xiàn)了一種新趨勢(shì):小型、緊湊的移動(dòng)機(jī)器人,即協(xié)作機(jī)器人(collaborative robots, cobots)正在加入生產(chǎn)流程,并經(jīng)常與人類(lèi)同事密切合作。cobots的最大好處是,它們可以快速地重新裝備,并且只需很少的工作,這使得靈活地使用它們來(lái)完成不同的生產(chǎn)任務(wù)成為可能。
伴隨并支持整個(gè)價(jià)值創(chuàng)建過(guò)程的互補(bǔ)技術(shù)在這些高度自動(dòng)化的場(chǎng)景中扮演著重要的角色。這些包括,例如,可編程邏輯控制器(plc)和機(jī)器視覺(jué)。后者作為“生產(chǎn)之眼”實(shí)時(shí)觀察和監(jiān)控生產(chǎn)過(guò)程。圖像采集設(shè)備,如相機(jī)、掃描儀和3D傳感器,被放置在多個(gè)位置,并從不同的角度記錄過(guò)程。生成的數(shù)字圖像數(shù)據(jù)通過(guò)集成的機(jī)器視覺(jué)軟件進(jìn)行處理,可用于處理鏈中的各種任務(wù)。例如,可以根據(jù)光學(xué)特性可靠地檢測(cè)目標(biāo)并精確定位。該技術(shù)還可以檢測(cè)產(chǎn)品的制造故障,從而自動(dòng)排除故障,從而優(yōu)化質(zhì)量保證流程。
基于卷積神經(jīng)網(wǎng)絡(luò)(CNNs)架構(gòu)的深度學(xué)習(xí)
越來(lái)越多的先進(jìn)人工智能(AI)技術(shù)被納入機(jī)器視覺(jué)系統(tǒng)。其中一項(xiàng)技術(shù)是基于卷積神經(jīng)網(wǎng)絡(luò)(CNN)體系結(jié)構(gòu)的深度學(xué)習(xí)。大量的數(shù)字圖像信息用于廣泛的培訓(xùn)過(guò)程。基于這些數(shù)據(jù),軟件可以獨(dú)立地對(duì)新對(duì)象進(jìn)行分類(lèi)。在訓(xùn)練過(guò)程中,自動(dòng)學(xué)習(xí)特定對(duì)象類(lèi)的特征。因此,新的圖像數(shù)據(jù)可以精確地分配給它們的特定類(lèi)別,從而產(chǎn)生非常高和強(qiáng)大的識(shí)別率。這些深度學(xué)習(xí)算法也適用于精確目標(biāo) 定位 和缺陷識(shí)別。
機(jī)器視覺(jué)是“生產(chǎn)之眼”
深度學(xué)習(xí)技術(shù)注定要在機(jī)器視覺(jué)應(yīng)用程序的某些領(lǐng)域使用。這些主要包括分類(lèi)、對(duì)象檢測(cè)和語(yǔ)義分割。這就是智能算法的優(yōu)勢(shì)所在。然而,在其他機(jī)器視覺(jué)應(yīng)用中,深度學(xué)習(xí)的適用性有一定的局限性。由于需要分析大量的數(shù)據(jù),訓(xùn)練過(guò)程通常需要非常大的計(jì)算能力和適當(dāng)尺寸的硬件。特別是在時(shí)間非常關(guān)鍵的應(yīng)用程序中,標(biāo)準(zhǔn)CPU通常是不夠的。不適用于高速應(yīng)用程序,例如高精度測(cè)量任務(wù)和具有毫米或微米精度的目標(biāo)定位。在這種情況下,深度學(xué)習(xí)算法在一個(gè)標(biāo)準(zhǔn)CPU上需要50到100毫秒。然而,這種精確定位只需要幾毫秒。這里需要的是一個(gè)功能強(qiáng)大的GPU, 通常 GPU是不適用于工業(yè)用途的硬件。
深度學(xué)習(xí)并非適用于所有應(yīng)用
在工業(yè)應(yīng)用中,深度學(xué)習(xí)也不是最佳選擇,例如在電子和半導(dǎo)體工業(yè)中,要檢測(cè)或識(shí)別的對(duì)象與實(shí)際情況非常相似。由于這些組件通常具有非常相似的外觀,因此使用傳統(tǒng)機(jī)器視覺(jué)方法進(jìn)行培訓(xùn)只需要幾個(gè)示例圖像。在許多情況下,即使是單個(gè)圖像也足以可靠地檢測(cè)到對(duì)象并精確定位它們。然而,只有當(dāng)每個(gè)對(duì)象至少有100個(gè)訓(xùn)練圖像可用時(shí),使用深度學(xué)習(xí)算法才有意義。因此,使用常規(guī)方法(如基于規(guī)則的軟件技術(shù))可以更好地解決機(jī)器視覺(jué)任務(wù),其中要識(shí)別的對(duì)象非常相似。特別是對(duì)于讀取數(shù)據(jù)代碼和條形碼,采用啟發(fā)式算法而不是深度學(xué)習(xí)算法。對(duì)目標(biāo)的度量,如亞像素精確輪廓提取,也依賴(lài)于啟發(fā)式算法。
深度學(xué)習(xí)可以提高識(shí)別率
然而,在深度學(xué)習(xí)能夠帶來(lái)全部好處的應(yīng)用中,必須考慮某些挑戰(zhàn)。深度學(xué)習(xí)是一種相對(duì)較新的技術(shù),市場(chǎng)對(duì)其提供的通用標(biāo)準(zhǔn)很少。此外,深度學(xué)習(xí)的整體處理非常復(fù)雜,需要深入的知識(shí)以及在人工智能、編程和機(jī)器視覺(jué)領(lǐng)域的多年經(jīng)驗(yàn)。這通常超出了一般公司的能力,因?yàn)樗麄內(nèi)狈Ρ匾膶?zhuān)業(yè)人才。
通過(guò)預(yù)先培訓(xùn)的深度學(xué)習(xí)網(wǎng)絡(luò)減少工作量
然而,有些公司可以通過(guò)合理的努力從深度學(xué)習(xí)中獲益。例如,他們可以利用預(yù)先培訓(xùn)的深度學(xué)習(xí)網(wǎng)絡(luò)。為此,市場(chǎng)上提供了許多免費(fèi)的開(kāi)源解決方案。不過(guò),使用它們還是有一些陷阱。例如,可能會(huì)出現(xiàn)許可證問(wèn)題。通常需要幾十萬(wàn)個(gè)樣本圖像來(lái)精確識(shí)別物體。之所以需要如此多的特征,是因?yàn)樵S多不同的特征,如顏色、形狀、紋理和表面結(jié)構(gòu),對(duì)識(shí)別過(guò)程至關(guān)重要。在選擇如此大量的圖像時(shí),確保它們不受開(kāi)源產(chǎn)品很少保證的第三方權(quán)利的約束是很重要的。
使用開(kāi)源工具的另一個(gè)挑戰(zhàn)是,它們通常只單獨(dú)執(zhí)行某些機(jī)器視覺(jué)任務(wù),很難集成到其他應(yīng)用程序或現(xiàn)有框架中。典型的機(jī)器視覺(jué)問(wèn)題通常涉及幾個(gè)步驟。首先,必須將來(lái)自圖像采集設(shè)備的數(shù)字圖像數(shù)據(jù)提供給特定應(yīng)用程序。然后在第二個(gè)步驟中對(duì)數(shù)據(jù)進(jìn)行預(yù)處理,在該步驟中,圖像被優(yōu)化定向以將對(duì)象放置在所需的位置。最后,處理后的數(shù)據(jù)被集成到其他解決方案中,例如PLC,這樣就可以無(wú)縫地將結(jié)果用于其他流程步驟。這就是開(kāi)源系統(tǒng)達(dá)到其極限的地方。
標(biāo)準(zhǔn)專(zhuān)有軟件有很多優(yōu)點(diǎn)
已經(jīng)擁有預(yù)先培訓(xùn)的網(wǎng)絡(luò)的專(zhuān)有標(biāo)準(zhǔn)軟件解決方案是機(jī)器視覺(jué)的更實(shí)用的選擇。這些解決方案包括配備培訓(xùn)深度學(xué)習(xí)網(wǎng)絡(luò)的所有重要功能的軟件?;谄鋸V泛的功能和專(zhuān)門(mén)配置的工具,它可以最佳地集成到其他應(yīng)用程序中。該解決方案包括多個(gè)網(wǎng)絡(luò),這些網(wǎng)絡(luò)已根據(jù)工業(yè)環(huán)境中大約一百萬(wàn)個(gè)精心挑選的免許可證圖像進(jìn)行了預(yù)先培訓(xùn)。公司只需要一些額外的圖像就可以根據(jù)自己的特定應(yīng)用定制網(wǎng)絡(luò)培訓(xùn)流程。這大大減少了培訓(xùn)工作,節(jié)省了資金,并避免了與圖像權(quán)利相關(guān)的風(fēng)險(xiǎn)。
通過(guò)深度學(xué)習(xí),可以精確地檢測(cè)物體。圖像來(lái)源:MVTec Software GmbH
使用開(kāi)源工具是另一個(gè)挑戰(zhàn)。深度學(xué)習(xí)應(yīng)用程序通常包含數(shù)十萬(wàn)行編程代碼。要正確操作,此代碼必須滿(mǎn)足某些質(zhì)量標(biāo)準(zhǔn)。使用一個(gè)未知社區(qū)開(kāi)發(fā)的開(kāi)源代碼會(huì)在這方面產(chǎn)生一定的風(fēng)險(xiǎn)。為了安全起見(jiàn),公司需要在內(nèi)部檢查代碼以確定其質(zhì)量。由于大量的代碼,這項(xiàng)任務(wù)非常勞動(dòng)密集,并且產(chǎn)生了幾乎無(wú)法計(jì)算的成本。然而,使用專(zhuān)有的商業(yè)解決方案,公司可以從高質(zhì)量、經(jīng)過(guò)測(cè)試和安全的代碼中獲益。如果需要支持的話(huà),專(zhuān)業(yè)顧問(wèn)和專(zhuān)家是可以利用的,這在開(kāi)放的社區(qū)中是不可指望的。
結(jié)論
在數(shù)字化時(shí)代和工業(yè)物聯(lián)網(wǎng)時(shí)代,機(jī)器視覺(jué)是高度自動(dòng)化和網(wǎng)絡(luò)化生產(chǎn)過(guò)程中不可或缺的伴隨技術(shù)?;贏I的技術(shù),如深度學(xué)習(xí)和CNN,是這些機(jī)器視覺(jué)解決方案的重要組成部分。但是,請(qǐng)務(wù)必記住它們僅適用于某些應(yīng)用程序。公司還應(yīng)該仔細(xì)考慮開(kāi)源系統(tǒng)是否足以滿(mǎn)足他們的要求,或者是否值得花時(shí)間投資商業(yè)的專(zhuān)有軟件解決方案。
-
機(jī)器視覺(jué)
+關(guān)注
關(guān)注
163文章
4597瀏覽量
122924 -
人工智能
+關(guān)注
關(guān)注
1807文章
49029瀏覽量
249623 -
深度學(xué)習(xí)
+關(guān)注
關(guān)注
73文章
5561瀏覽量
122805
原文標(biāo)題:用于目標(biāo)識(shí)別的自學(xué)習(xí)機(jī)器視覺(jué)系統(tǒng)
文章出處:【微信號(hào):vision263com,微信公眾號(hào):新機(jī)器視覺(jué)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
斑馬技術(shù)榮獲2025視覺(jué)系統(tǒng)設(shè)計(jì)創(chuàng)新獎(jiǎng)
【「# ROS 2智能機(jī)器人開(kāi)發(fā)實(shí)踐」閱讀體驗(yàn)】視覺(jué)實(shí)現(xiàn)的基礎(chǔ)算法的應(yīng)用
基于RV1126開(kāi)發(fā)板實(shí)現(xiàn)自學(xué)習(xí)圖像分類(lèi)方案

機(jī)器視覺(jué)系統(tǒng)中如何評(píng)價(jià)光源的好壞
工業(yè)相機(jī)與采集卡配套方案:構(gòu)建高性能機(jī)器視覺(jué)系統(tǒng)的核心要素

廠家芯資訊|WTK6900系列語(yǔ)音識(shí)別芯片自學(xué)習(xí)功能深度答疑

芯資訊|WTK6900系列語(yǔ)音識(shí)別芯片IC自學(xué)習(xí)功能解析

工業(yè)相機(jī)采集卡:機(jī)器視覺(jué)系統(tǒng)的關(guān)鍵樞紐

協(xié)作機(jī)器人TM25S:內(nèi)置視覺(jué)系統(tǒng)實(shí)現(xiàn)精準(zhǔn)作業(yè)

適用于機(jī)器視覺(jué)應(yīng)用的智能機(jī)器視覺(jué)控制平臺(tái)

《DNK210使用指南 -CanMV版 V1.0》第四十八章 自學(xué)習(xí)分類(lèi)實(shí)驗(yàn)
安森美機(jī)器視覺(jué)系統(tǒng)解決方案

適用于機(jī)器人視覺(jué)系統(tǒng)的LED光源

評(píng)論