只需10行Python代碼,我們就能實(shí)現(xiàn)計(jì)算機(jī)視覺(jué)中目標(biāo)檢測(cè)。
fromimageai.DetectionimportObjectDetectionimportosexecution_path=os.getcwd()detector=ObjectDetection()detector.setModelTypeAsRetinaNet()detector.setModelPath(os.path.join(execution_path,"resnet50_coco_best_v2.0.1.h5"))detector.loadModel()detections=detector.detectObjectsFromImage(input_image=os.path.join(execution_path,"image.jpg"),output_image_path=os.path.join(execution_path,"imagenew.jpg"))foreachObjectindetections:print(eachObject["name"]+":"+eachObject["percentage_probability"])
沒(méi)錯(cuò),用這寥寥10行代碼,就能實(shí)現(xiàn)目前AI產(chǎn)品中應(yīng)用廣泛的目標(biāo)檢測(cè)技術(shù)。
看完了代碼,下面容我們聊聊目標(biāo)檢測(cè)背后的技術(shù)背景,并解讀這10行Python代碼的由來(lái)和實(shí)現(xiàn)原理。
目標(biāo)檢測(cè)簡(jiǎn)介
人工智能的一個(gè)重要領(lǐng)域就是計(jì)算機(jī)視覺(jué),它是指計(jì)算機(jī)及軟件系統(tǒng)識(shí)別和理解圖像與視頻的科學(xué)。計(jì)算機(jī)視覺(jué)包含很多細(xì)分方向,比如圖像識(shí)別、目標(biāo)檢測(cè)、圖像生成和圖像超分辨率等。其中目標(biāo)檢測(cè)由于用途廣泛,在計(jì)算機(jī)視覺(jué)領(lǐng)域的意義最為深遠(yuǎn)。
目標(biāo)檢測(cè)是指計(jì)算機(jī)和軟件系統(tǒng)能夠定位出圖像/畫(huà)面中的物體,并識(shí)別出它們。目標(biāo)檢測(cè)技術(shù)已經(jīng)廣泛應(yīng)用于人臉檢測(cè)、車輛檢測(cè)、人流量統(tǒng)計(jì)、網(wǎng)絡(luò)圖像、安防系統(tǒng)和無(wú)人車等領(lǐng)域。和其它計(jì)算機(jī)視覺(jué)技術(shù)一樣,目標(biāo)檢測(cè)未來(lái)會(huì)進(jìn)一步成為人工智能的重要組成部分,有著廣闊的發(fā)展前景。
不過(guò),在軟件應(yīng)用和系統(tǒng)中使用現(xiàn)代目標(biāo)檢測(cè)方法以及根據(jù)這些方法創(chuàng)建應(yīng)用,并非簡(jiǎn)單直接。早期的目標(biāo)檢測(cè)實(shí)現(xiàn)主要是應(yīng)用一些經(jīng)典算法,比如OpenCV中支持的算法。然而這些算法的表現(xiàn)并不穩(wěn)定,在不同情況下差異巨大。
2012年深度學(xué)習(xí)技術(shù)的突破性進(jìn)展,催生了一大批高度精準(zhǔn)的目標(biāo)檢測(cè)算法,比如R-CNN,F(xiàn)ast-RCNN,F(xiàn)aster-RCNN,RetinaNet和既快又準(zhǔn)的SSD及YOLO。使用這些基于深度學(xué)習(xí)的方法和算法,需要理解大量的數(shù)學(xué)和深度學(xué)習(xí)框架?,F(xiàn)在全世界有數(shù)以百萬(wàn)計(jì)的開(kāi)發(fā)者在借助目標(biāo)檢測(cè)技術(shù)創(chuàng)造新產(chǎn)品新項(xiàng)目,但由于理解和使用較為復(fù)雜困難,仍有很多人不得要領(lǐng)。
為了解決這個(gè)困擾開(kāi)發(fā)者們的問(wèn)題,計(jì)算機(jī)視覺(jué)專家Moses Olafenwa帶領(lǐng)團(tuán)隊(duì)推出了Python庫(kù)ImageAI,能讓開(kāi)發(fā)人員只需寥寥數(shù)行代碼就能很容易的將最先進(jìn)的計(jì)算機(jī)視覺(jué)技術(shù)應(yīng)用到自己的項(xiàng)目和產(chǎn)品中。
我們開(kāi)頭所示的10行代碼實(shí)現(xiàn),就是要用到ImageAI。
如何借助ImageAI輕松實(shí)現(xiàn)目標(biāo)檢測(cè)
使用ImageAI執(zhí)行目標(biāo)檢測(cè),你只需以下4步:
1.在電腦上安裝Python 2.安裝ImageAI及其環(huán)境依賴 3.下載目標(biāo)檢測(cè)模塊文件 4.運(yùn)行示例代碼,就是我們展示的那10行
下面我們一步步詳細(xì)講解。
1)從Python官網(wǎng)下載和安裝Python 3
https://python.org/
2)通過(guò)pip安裝如下環(huán)境依賴
pipinstalltensorflow
2.Numpy
pipinstallnumpy
3.SciPy
pipinstallscipy
4.OpenCV
pipinstallopencv-python
5.Pillow
pipinstallpillow
6.Matplotlib
pipinstallmatplotlib
7.H5py
pipinstallh5py
Keras
pipinstallkeras
ImageAI
pipinstall
3)通過(guò)該鏈接下載RetinaNet 模型文件用于目標(biāo)檢測(cè)。
到了這里我們已經(jīng)安裝好了所有依賴,就可以準(zhǔn)備寫(xiě)自己的首個(gè)目標(biāo)檢測(cè)代碼了。 創(chuàng)建一個(gè)Python文件,為其命名(比如FirstDetection.py),然后將如下代碼寫(xiě)到文件中,再把RetinaNet模型文件以及你想檢測(cè)的圖像拷貝到包含該P(yáng)ython文件的文件夾里。FirstDetection.py
fromimageai.DetectionimportObjectDetectionimportosexecution_path=os.getcwd()detector=ObjectDetection()detector.setModelTypeAsRetinaNet()detector.setModelPath(os.path.join(execution_path,"resnet50_coco_best_v2.0.1.h5"))detector.loadModel()detections=detector.detectObjectsFromImage(input_image=os.path.join(execution_path,"image.jpg"),output_image_path=os.path.join(execution_path,"imagenew.jpg"))foreachObjectindetections:print(eachObject["name"]+":"+eachObject["percentage_probability"])
然后運(yùn)行代碼,等待控制臺(tái)打印結(jié)果。等控制臺(tái)打印出結(jié)果后,就可以打開(kāi)FirstDetection.py所在的文件夾,你就會(huì)發(fā)現(xiàn)有新的圖像保存在了里面。比如下面兩張示例圖像,以及執(zhí)行目標(biāo)檢測(cè)后保存的兩張新圖像。目標(biāo)檢測(cè)之前:
目標(biāo)檢測(cè)之后:
我們可以看到圖像上顯示了檢測(cè)出的物體名稱及概率。
解讀10行代碼
下面我們解釋一下這10行代碼的工作原理。
fromimageai.DetectionimportObjectDetectionimportosexecution_path=os.getcwd()
在上面3行代碼中,我們?cè)诘谝恍袑?dǎo)入了ImageAI目標(biāo)檢測(cè)類,在第二行導(dǎo)入Python os類,在第三行定義了一個(gè)變量,獲取通往我們的Python文件、RetinaNet模型文件和圖像所在文件夾的路徑。
detector=ObjectDetection()detector.setModelTypeAsRetinaNet()detector.setModelPath(os.path.join(execution_path,"resnet50_coco_best_v2.0.1.h5"))detector.loadModel()detections=detector.detectObjectsFromImage(input_image=os.path.join(execution_path,"image.jpg"),output_image_path=os.path.join(execution_path,"imagenew.jpg"))
在上面5行代碼中,我們?cè)诘谝恍卸x我們的目標(biāo)檢測(cè)類,在第二行設(shè)定RetinaNet的模型類型,在第三行將模型路徑設(shè)置為RetinaNet模型的路徑,在第四行將模型加載到目標(biāo)檢測(cè)類中,然后我們?cè)诘谖逍姓{(diào)用檢測(cè)函數(shù),并在輸入和輸出圖像路徑中進(jìn)行解析。
foreachObjectindetections:print(eachObject["name"]+":"+eachObject["percentage_probability"])
在上面兩行代碼中,我們迭代了第一行中detector.detectObjectFromImage函數(shù)返回的所有結(jié)果,然后打印出第二行中模型對(duì)圖像上每個(gè)物體的檢測(cè)結(jié)果(名稱和概率)。
ImageAI支持很多強(qiáng)大的目標(biāo)檢測(cè)自定義功能,其中一項(xiàng)就是能夠提取在圖像上檢測(cè)到的每個(gè)物體的圖像。只需將附加參數(shù)extract_detected_objects=True解析為detectObjectsFromImage函數(shù),如下所示,目標(biāo)檢測(cè)類就會(huì)為圖像物體創(chuàng)建一個(gè)文件夾,提取每張圖像,將它們保存在新創(chuàng)建的文件夾中,并返回一個(gè)包含通過(guò)每張圖像的路徑的額外數(shù)組。
detections,extracted_images=detector.detectObjectsFromImage(input_image=os.path.join(execution_path,"image.jpg"),output_image_path=os.path.join(execution_path,"imagenew.jpg"),extract_detected_objects=True)
我們用前面的第一張圖像作為例子,可以得到圖像中檢測(cè)到的各個(gè)物體的單獨(dú)圖像:
ImageAI提供了很多功能,能夠用于各類目標(biāo)檢測(cè)任務(wù)的自定義和生產(chǎn)部署。包括:
-調(diào)整最小概率:默認(rèn)概率小于50%的物體不會(huì)顯示,如有需要,你可以自行調(diào)整這個(gè)數(shù)字。 -自定義目標(biāo)檢測(cè):使用提供的CustomObject類,你可以檢測(cè)一個(gè)或多個(gè)特定物體。 -調(diào)整檢測(cè)速度:可以通過(guò)將檢測(cè)速度設(shè)為“快”“更快”“最快”三個(gè)不同等級(jí),調(diào)整檢測(cè)速度。 -輸入輸出類型:你可以自定義圖像的路徑,Numpy數(shù)組或圖像的文件流為輸入輸出。
誠(chéng)然,單看這10行代碼每一行,談不上驚艷,也借助了不少庫(kù),但是僅用10行代碼就能讓我們輕松實(shí)現(xiàn)之前很麻煩的目標(biāo)檢測(cè),還是能談得上“給力”二字。
-
人工智能
+關(guān)注
關(guān)注
1806文章
49013瀏覽量
249393 -
計(jì)算機(jī)視覺(jué)
+關(guān)注
關(guān)注
9文章
1708瀏覽量
46775 -
python
+關(guān)注
關(guān)注
56文章
4827瀏覽量
86723
原文標(biāo)題:只需10行Python代碼,就能實(shí)現(xiàn)計(jì)算機(jī)視覺(jué)中目標(biāo)檢測(cè)
文章出處:【微信號(hào):TheBigData1024,微信公眾號(hào):人工智能與大數(shù)據(jù)技術(shù)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
計(jì)算機(jī)視覺(jué)技術(shù)面臨的挑戰(zhàn)
采用OpenCV計(jì)算機(jī)視覺(jué)庫(kù)實(shí)現(xiàn)人臉檢測(cè)系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)

機(jī)器視覺(jué)與計(jì)算機(jī)視覺(jué)的關(guān)系簡(jiǎn)述
【我是電子發(fā)燒友】七步帶你認(rèn)識(shí)計(jì)算機(jī)視覺(jué)(Computer Vision)
如何在FPGA上實(shí)現(xiàn)許多計(jì)算機(jī)視覺(jué)算法?
【RISC-V + OpenCV 計(jì)算機(jī)視覺(jué)】用 VisionFive 2 昉·星光 2 進(jìn)行物體識(shí)別
基于OpenCV的計(jì)算機(jī)視覺(jué)技術(shù)實(shí)現(xiàn)

計(jì)算機(jī)視覺(jué)與機(jī)器視覺(jué)區(qū)別
python實(shí)現(xiàn)目標(biāo)檢測(cè)的源代碼免費(fèi)下載

如何使用Python+OpenCV+yolov5實(shí)現(xiàn)行人目標(biāo)檢測(cè)?
計(jì)算機(jī)視覺(jué)之目標(biāo)檢測(cè)

評(píng)論