TinyAnimal:Grove Vision AI上的動(dòng)物識(shí)別實(shí)踐
資料介紹
描述
問題
有許多項(xiàng)目專注于邊緣 AI/ML 的硬件。但在實(shí)際場景中,并沒有在產(chǎn)品之上的軟件側(cè)學(xué)習(xí)細(xì)節(jié)的顯著實(shí)踐來展現(xiàn),本文彌補(bǔ)了這一不足。
同時(shí),該項(xiàng)目在一個(gè)廉價(jià)的邊緣人工智能硬件上提供了完整的、可重現(xiàn)的EdgeML/TinyML動(dòng)物識(shí)別工作流程,這在已知的現(xiàn)有項(xiàng)目中是很少見的。
硬件

該項(xiàng)目的硬件是Seeed SenseCAP K1100/A1100中的 Grove Vision AI 模塊。官方商店有單機(jī)版的Grove Vision AI Module 。
Vision AI Module有一顆芯片:Himax HX6537-A。芯片上的mcu基于消費(fèi)者比較陌生的ARC架構(gòu)。主頻是400Mhz,也不高。但最有趣的是 HX6537-A,具有快速XY SDRAM 內(nèi)存架構(gòu)來加速 TinyML,如 tensorflow lite 模型推理。我們稍后會(huì)看到這款芯片的性能。
工作流程

上面的工作流程很常見,也很清晰。我們只討論一些有趣的需求:
- 該數(shù)據(jù)集是具有 9.6GB 圖像的公共數(shù)據(jù)集。
這避免了樣本太少或代表性不足的常見問題。
- 培訓(xùn)在當(dāng)?shù)赝瓿伞?/font>
這避免了樣本太少或代表性不足的常見問題。
- 數(shù)據(jù)收集和實(shí)時(shí)分析是通過邊緣數(shù)據(jù)庫JoinBase完成的。
與 PostgreSQL 或 TimescaleDB 等常見數(shù)據(jù)庫不同,JoinBase 直接接受 MQTT 消息。與云服務(wù)不同,JoinBase支持運(yùn)行在邊緣,可以在沒有網(wǎng)絡(luò)的環(huán)境下使用。最后,JoinBase 可免費(fèi)用于商業(yè)用途,這也有利于邊緣平臺(tái)的進(jìn)一步發(fā)展。
準(zhǔn)備數(shù)據(jù)集

目前,針對(duì)野生動(dòng)物或動(dòng)物的工作邊緣 AI 的公開研究并不多。使用了少數(shù)公開可用的動(dòng)物數(shù)據(jù)集之一——來自 Kaggle 的動(dòng)物檢測(cè)圖像數(shù)據(jù)集(稱為“animals-80”數(shù)據(jù)集)。它包含 9.6GB 圖像中的 80 只動(dòng)物,對(duì)于常見的動(dòng)物識(shí)別任務(wù)應(yīng)該足夠了。
準(zhǔn)備訓(xùn)練數(shù)據(jù)
animals-80 數(shù)據(jù)集的好處是它已經(jīng)被標(biāo)記了。但是原始標(biāo)簽格式不是Yolov5標(biāo)簽格式。已經(jīng)進(jìn)行了準(zhǔn)備工作。核心部分就是上圖的預(yù)處理函數(shù)。請(qǐng)稍后的代碼回購以獲得更多信息。
火車
因?yàn)槲覀儧]有足夠的資源來對(duì)完整的 9.6GB 訓(xùn)練進(jìn)行完整的訓(xùn)練。因此,選擇了animals-80數(shù)據(jù)集的一個(gè)子集。
- 15-動(dòng)物子集訓(xùn)練

我們使用 24c/48T Xeon Platinum 8260 處理器使用上面從官方示例中獲得的命令進(jìn)行訓(xùn)練。
python3 train.py --img 192 --batch 32 --epochs 200 --data data/animal.yaml --cfg yolov5n6-xiao.yaml --weights yolov5n6-xiao.pt --name animals --cache --project runs/train2
然而,兩個(gè)小時(shí)后(是的,再次證明Don't use CPU to train even is a top Xeon SP),發(fā)現(xiàn)最后的識(shí)別效果很差。
主要指標(biāo)非常低:精度為 0.6,召回率和 mAP_0.5 都在 0.3 左右。
事實(shí)上,這個(gè)結(jié)果接近于不起作用。
- 4-動(dòng)物子集訓(xùn)練
讓我們將可識(shí)別的動(dòng)物種類減少為四種:蜘蛛、鴨子、喜鵲和蝴蝶,這當(dāng)然是郊區(qū)野外最常見的動(dòng)物。
注意,重新運(yùn)行準(zhǔn)備腳本以生成正確的data/animal.yaml.

主要指標(biāo)變得更好:精度約為 0.81,召回率和 mAP_0.5 約為 0.6。
我們將在后期推理試驗(yàn)和評(píng)估中回顧該模型的性能。可以只進(jìn)行二元分類:一種動(dòng)物和一種動(dòng)物。但在這個(gè)項(xiàng)目中,我更期待在更復(fù)雜的場景下評(píng)估識(shí)別效果。
- YoLov5官方預(yù)訓(xùn)練模型的 4 動(dòng)物子集訓(xùn)練
以上訓(xùn)練均由Seeed官方文檔推薦完成。預(yù)訓(xùn)練模型yolov5n6-xiao
可能缺乏良好的泛化能力。在這個(gè)項(xiàng)目中,我們嘗試了一個(gè) YoLOv5 官方最小的預(yù)訓(xùn)練模型yolov5n6
,看看是否有一些差異。

上面的結(jié)果是從官方yolov5n6
模型中得到的epochs=150.
結(jié)果很好。因?yàn)椋?/font>
主要指標(biāo):precision、recall 和 mAP_0, 5 均大于 0.9。在 ML 中,mAP_0.5 在 0.6 和 0.9 之間的差異在現(xiàn)實(shí)世界的檢測(cè)中是巨大而巨大的。
不幸的是,基于官方訓(xùn)練的最終模型yolov5n6
接近4MB,而Grove AI模塊的約束模型大小不超過1MB。因此,我們不能使用任何此類更大的模型(已嘗試)。一些建議將在最后一節(jié)中討論。 推論

經(jīng)過以上訓(xùn)練,我們進(jìn)行圖片仿真,初步評(píng)估模型的效果。讓我們看例子。
以上是 Grove AI 模塊的輸出。分類指數(shù)在中間,置信度在旁邊。對(duì)應(yīng)指標(biāo)的動(dòng)物名稱可以在上面的訓(xùn)練圖中看到。
第一次和第二次檢測(cè)是正確的,第三次檢測(cè)是錯(cuò)誤的。第三張圖是一只喜鵲在天上飛,推理結(jié)果是蝴蝶。我們只是在后面的real-wprld評(píng)估中看到這個(gè)分類模型的影響。
真實(shí)世界評(píng)估
現(xiàn)實(shí)世界中的推理比實(shí)驗(yàn)室中的推理更具挑戰(zhàn)性。因?yàn)闇y(cè)試時(shí)所處的環(huán)境或測(cè)試者或被測(cè)對(duì)象的狀態(tài)都會(huì)對(duì)結(jié)果產(chǎn)生很大的影響。這就是我們?cè)诠ぷ髁鞒滩糠诌M(jìn)行規(guī)劃的原因。
我們通過TinyWild 項(xiàng)目中的郊野公園野生動(dòng)物調(diào)查進(jìn)行了真實(shí)世界的評(píng)估。執(zhí)行兩種類型的檢測(cè):
- 基于動(dòng)態(tài)視口(移動(dòng)相機(jī))的檢測(cè)

上圖是整個(gè)調(diào)查的分類統(tǒng)計(jì)(置信度>75)。相機(jī)移動(dòng)的時(shí)間很長。因此,這是一個(gè)基于動(dòng)態(tài)視口(移動(dòng)相機(jī))的檢測(cè)。源于軟件邏輯的“未知”和空動(dòng)物已被排除在外。
基本結(jié)論是,對(duì)于個(gè)體識(shí)別來說,不是特別理想,但是收集到的定性信息是有效的。
Bufferfly在統(tǒng)計(jì)上相對(duì)突出,但沒有在公園里見過很多次的Magpie。
這似乎是喜鵲被識(shí)別為緩沖蠅,如上面推理部分的分析所示。它們的共同點(diǎn)是,它們經(jīng)常在空中飛行。三個(gè)真實(shí)世界的因素:移動(dòng)的相機(jī)、移動(dòng)的物體和低分辨率,對(duì)識(shí)別結(jié)果有很大的影響。
- 基于靜態(tài)視口(靜態(tài)相機(jī))的檢測(cè)
為減少移動(dòng)因素的影響,還在湖邊開展了野鴨(野鴨)專項(xiàng)觀測(cè)。
在上面的第一個(gè)捕獲中,我們前端 UI 中鴨子的數(shù)量(其中一個(gè)有趣的地方是 UI 中的動(dòng)態(tài)表是由 SQL 查詢驅(qū)動(dòng)的,請(qǐng)參閱我們未來項(xiàng)目中的更多信息)。突然,兩個(gè)鴨子游入鏡頭范圍。鴨子的數(shù)量已經(jīng)增加到13??紤]到原來的鴨子是被數(shù)過的,13是當(dāng)時(shí)精確的數(shù)。發(fā)現(xiàn)Grove AI 對(duì)附近的動(dòng)物檢測(cè)非常有效,就像我們?cè)诤吽龅哪菢樱寒?dāng)三只鴨子突然以相對(duì)靜態(tài)定位游入相機(jī)范圍時(shí),我們得到了三個(gè)計(jì)數(shù)。(注:在TinyWild項(xiàng)目中,我們說有四項(xiàng)計(jì)數(shù),但根據(jù)我們的錄音應(yīng)該更正為三項(xiàng)計(jì)數(shù)。)
建議
基于以上實(shí)踐,我們針對(duì)廉價(jià)邊緣人工智能硬件上的 EdgeML 或 TinyML給出以下建議:
- 嘗試靜態(tài)觀察
即觀察者不做大動(dòng)作。
- 檢測(cè)盡可能少的物體
例如,只做二元分類:人或沒有人,猴子或沒有猴子,鳥或沒有鳥。
- 使模型的主要指標(biāo)盡可能大
例如,precision > 0.8,recall 和 mAP_0.5 > 0.6。
- 盡可能提高識(shí)別準(zhǔn)確率(比如,更長的訓(xùn)練時(shí)間)
廉價(jià)的邊緣 ML 硬件通常資源有限,例如 Grove AI 模塊的約束模型大小不超過 1MB,低于 yolov5 官方 yolov5n 預(yù)訓(xùn)練網(wǎng)絡(luò)訓(xùn)練的模型大小。發(fā)現(xiàn)較小的模型會(huì)顯著影響模型的主要指標(biāo)。
- Vision_Board_schematic
- AI遇冷?2023從融資再看AI“芯”賽道? 2次下載
- PowerAI Vision:用于圖像和視頻的自動(dòng)AI
- 使用帶RGB背光的Grove LCD
- Grove IR通用遠(yuǎn)程項(xiàng)目
- 如何將Grove語音識(shí)別器模塊與Arduino板連接
- DB3962_FP_AI_VISION1數(shù)據(jù)手冊(cè)摘要
- Grove Feux/TrafficLights模塊
- GitHub入門與實(shí)踐 0次下載
- LabVIEW Vision圖像處理開發(fā)寶典電子版 0次下載
- 基于ADC121C021的Grove模數(shù)轉(zhuǎn)換器原理圖PCB使用教程.
- 動(dòng)物群體逃生行為及群體虛擬仿真實(shí)驗(yàn) 11次下載
- 使用數(shù)字識(shí)別和AI實(shí)現(xiàn)OCR的資料合集 20次下載
- 無線動(dòng)物識(shí)別和跟蹤管理系統(tǒng)的設(shè)計(jì)方案解析 0次下載
- 跟蹤運(yùn)動(dòng)物體軌跡算法的研究
- 助盲環(huán)境感知裝置設(shè)計(jì)方案 268次閱讀
- AMD Vitis? Libraries Vision L3 Isppipeline U50流程示例 1033次閱讀
- M-Vision在LinuxRT下使用OpenVINO加速AI推理 860次閱讀
- 射頻識(shí)別系統(tǒng)基本組成 4787次閱讀
- AI愛克斯開發(fā)板上使用OpenVINO加速YOLOv8目標(biāo)檢測(cè)模型 1278次閱讀
- Kubernetes上Java應(yīng)用的最佳實(shí)踐 709次閱讀
- Grove Beginner Kit for Arduino入門套件試用指南 2785次閱讀
- AI行為識(shí)別分析技術(shù)在智慧養(yǎng)老行業(yè)的應(yīng)用 1w次閱讀
- 中控智慧科技識(shí)別終端AI702簡介 5712次閱讀
- 中控智慧科技人臉識(shí)別終端AI302介紹 5610次閱讀
- 大疆無人機(jī)借助微軟AI技術(shù)識(shí)別物體 4930次閱讀
- 深度解析人臉識(shí)別技術(shù) 1.2w次閱讀
- 追溯3D人臉識(shí)別背后的技術(shù)之源 5547次閱讀
- 攜程信息安全部在web攻擊識(shí)別方面的機(jī)器學(xué)習(xí)實(shí)踐之路 5640次閱讀
- 無線射頻識(shí)別技術(shù)在畜牧業(yè)動(dòng)物管理中的應(yīng)用案例分析 3148次閱讀
下載排行
本周
- 1山景DSP芯片AP8248A2數(shù)據(jù)手冊(cè)
- 1.06 MB | 532次下載 | 免費(fèi)
- 2RK3399完整板原理圖(支持平板,盒子VR)
- 3.28 MB | 339次下載 | 免費(fèi)
- 3TC358743XBG評(píng)估板參考手冊(cè)
- 1.36 MB | 330次下載 | 免費(fèi)
- 4DFM軟件使用教程
- 0.84 MB | 295次下載 | 免費(fèi)
- 5元宇宙深度解析—未來的未來-風(fēng)口還是泡沫
- 6.40 MB | 227次下載 | 免費(fèi)
- 6迪文DGUS開發(fā)指南
- 31.67 MB | 194次下載 | 免費(fèi)
- 7元宇宙底層硬件系列報(bào)告
- 13.42 MB | 182次下載 | 免費(fèi)
- 8FP5207XR-G1中文應(yīng)用手冊(cè)
- 1.09 MB | 178次下載 | 免費(fèi)
本月
- 1OrCAD10.5下載OrCAD10.5中文版軟件
- 0.00 MB | 234315次下載 | 免費(fèi)
- 2555集成電路應(yīng)用800例(新編版)
- 0.00 MB | 33566次下載 | 免費(fèi)
- 3接口電路圖大全
- 未知 | 30323次下載 | 免費(fèi)
- 4開關(guān)電源設(shè)計(jì)實(shí)例指南
- 未知 | 21549次下載 | 免費(fèi)
- 5電氣工程師手冊(cè)免費(fèi)下載(新編第二版pdf電子書)
- 0.00 MB | 15349次下載 | 免費(fèi)
- 6數(shù)字電路基礎(chǔ)pdf(下載)
- 未知 | 13750次下載 | 免費(fèi)
- 7電子制作實(shí)例集錦 下載
- 未知 | 8113次下載 | 免費(fèi)
- 8《LED驅(qū)動(dòng)電路設(shè)計(jì)》 溫德爾著
- 0.00 MB | 6656次下載 | 免費(fèi)
總榜
- 1matlab軟件下載入口
- 未知 | 935054次下載 | 免費(fèi)
- 2protel99se軟件下載(可英文版轉(zhuǎn)中文版)
- 78.1 MB | 537798次下載 | 免費(fèi)
- 3MATLAB 7.1 下載 (含軟件介紹)
- 未知 | 420027次下載 | 免費(fèi)
- 4OrCAD10.5下載OrCAD10.5中文版軟件
- 0.00 MB | 234315次下載 | 免費(fèi)
- 5Altium DXP2002下載入口
- 未知 | 233046次下載 | 免費(fèi)
- 6電路仿真軟件multisim 10.0免費(fèi)下載
- 340992 | 191187次下載 | 免費(fèi)
- 7十天學(xué)會(huì)AVR單片機(jī)與C語言視頻教程 下載
- 158M | 183279次下載 | 免費(fèi)
- 8proe5.0野火版下載(中文版免費(fèi)下載)
- 未知 | 138040次下載 | 免費(fèi)
評(píng)論