本文檔基于瑞芯微RV1106的LockAI凌智視覺識(shí)別模塊,通過(guò)C++語(yǔ)言做的目標(biāo)檢測(cè)實(shí)驗(yàn)。
本文檔展示了如何使用 lockzhiner_vision_module::PaddleDet 類進(jìn)行目標(biāo)檢測(cè),并通過(guò)lockzhiner_vision_module::Visualize 函數(shù)將檢測(cè)結(jié)果可視化。
源代碼網(wǎng)址:https://gitee.com/LockzhinerAI/LockzhinerVisionModule/tree/master/Cpp_example/D01_test_detection
1. 基礎(chǔ)知識(shí)講解
1.1 目標(biāo)檢測(cè)的基本介紹
目標(biāo)檢測(cè)是計(jì)算機(jī)視覺領(lǐng)域中的一個(gè)關(guān)鍵任務(wù),它不僅需要識(shí)別圖像中存在哪些對(duì)象,還需要定位這些對(duì)象的位置。具體來(lái)說(shuō),目標(biāo)檢測(cè)算法會(huì)輸出每個(gè)檢測(cè)到的對(duì)象的邊界框(Bounding Box)以及其所屬類別的概率或置信度得分。
應(yīng)用場(chǎng)景:目標(biāo)檢測(cè)技術(shù)廣泛應(yīng)用于多個(gè)領(lǐng)域,包括但不限于安全監(jiān)控、自動(dòng)駕駛汽車、智能零售和醫(yī)療影像分析。
1.2 PaddleDetection 的基本介紹
PaddleDetection 是基于百度飛槳深度學(xué)習(xí)框架開發(fā)的一個(gè)高效的目標(biāo)檢測(cè)庫(kù),支持多種先進(jìn)的目標(biāo)檢測(cè)模型,如 YOLO 系列、SSD、Faster R-CNN、Mask R-CNN 等。它提供了簡(jiǎn)單易用的接口,使得開發(fā)者能夠快速部署高性能的目標(biāo)檢測(cè)應(yīng)用。
特點(diǎn):
高性能:優(yōu)化了推理速度,在保持高精度的同時(shí)實(shí)現(xiàn)了快速響應(yīng)。
靈活性:支持多種預(yù)訓(xùn)練模型,可以根據(jù)具體需求選擇合適的模型架構(gòu)。
易于集成:提供 C++ API,便于嵌入式系統(tǒng)或桌面應(yīng)用程序中使用。
豐富的模型庫(kù):涵蓋單階段(One-stage)和雙階段(Two-stage)檢測(cè)模型,滿足不同場(chǎng)景的需求。
適用場(chǎng)景:適用于需要對(duì)視頻流或圖像進(jìn)行實(shí)時(shí)分析的應(yīng)用場(chǎng)景,例如安防監(jiān)控、智能交通系統(tǒng)、工業(yè)自動(dòng)化等。
2. API 文檔
2.1 PaddleDetection 類
2.1.1 頭文件
#include
2.1.2 構(gòu)造函數(shù)
lockzhiner_vision_module::PaddleDetection();
作用:
創(chuàng)建一個(gè) PaddleDetection 對(duì)象,并初始化相關(guān)成員變量。
參數(shù):
無(wú)
返回值:
無(wú)
2.1.3 Initialize函數(shù)
boolInitialize(conststd::string&model_path);
作用:
加載預(yù)訓(xùn)練的 PaddleDetection 模型。
參數(shù):
model_path:模型路徑,包含模型文件和參數(shù)文件。
返回值:
true:模型加載成功。
false:模型加載失敗。
2.1.4 SetThreshold函數(shù)
voidSetThreshold(floatscore_threshold=0.5,floatnms_threshold=0.3);
作用:
設(shè)置目標(biāo)檢測(cè)的置信度閾值和NMS閾值。
參數(shù):
score_threshold:置信度閾值,默認(rèn)值為0.5。
nms_threshold:NMS閾值,默認(rèn)值為0.3。
返回值:
無(wú)
2.1.5 Predict函數(shù)
std::vector<lockzhiner_vision_module::DetectionResult>Predict(constcv::Mat&image);
作用:
使用加載的模型對(duì)輸入圖像進(jìn)行目標(biāo)檢測(cè),返回檢測(cè)結(jié)果。
參數(shù):
input_mat (const cv::Mat&): 輸入的圖像數(shù)據(jù),通常是一個(gè) cv::Mat 變量。
返回值:
返回一個(gè)包含多個(gè) DetectionResult 對(duì)象的向量,每個(gè)對(duì)象表示一個(gè)檢測(cè)結(jié)果。
2.2 DetectionResult 類
2.2.1 頭文件
#include
2.2.2 box函數(shù)
lockzhiner_vision_module::Rectbox()const;
作用:
獲取目標(biāo)檢測(cè)結(jié)果的邊界框。
參數(shù):
無(wú)
返回值:
返回一個(gè) lockzhiner_vision_module::Rect 對(duì)象,表示目標(biāo)檢測(cè)結(jié)果的邊界框。
2.2.3 score函數(shù)
floatscore()const;
作用:
獲取目標(biāo)檢測(cè)結(jié)果的置信度得分。
參數(shù):
無(wú)
返回值:
返回一個(gè) float 類型的置信度得分。
2.2.4 label_id函數(shù)
作用:
獲取目標(biāo)檢測(cè)結(jié)果的標(biāo)簽ID。
參數(shù):
無(wú)
返回值:
返回一個(gè)整數(shù),表示目標(biāo)檢測(cè)結(jié)果的標(biāo)簽ID。
2.3 Visualize 函數(shù)
2.3.1 頭文件
#include
2.3.2 函數(shù)定義
voidlockzhiner_vision_module::Visualize(
constcv::Mat&input_mat,
cv::Mat&output_image,
conststd::vector<lockzhiner_vision_module::DetectionResult>&results,
conststd::vector<std::string>&labels={},
floatfont_scale=0.4
);
作用:
將目標(biāo)檢測(cè)結(jié)果可視化到輸入圖像上,并返回可視化后的圖像。
參數(shù):
input_mat (const cv::Mat&): 輸入圖像。
output_image (cv::Mat&): 輸出圖像,包含標(biāo)注后的結(jié)果。
results (const std::vectorlockzhiner_vision_module::DetectionResult&): 檢測(cè)結(jié)果列表。
labels (const std::vectorstd::string&): 可選的標(biāo)簽列表,用于標(biāo)注類別名稱,默認(rèn)為空。
font_scale (float): 字體大小比例,默認(rèn)為 0.4。
返回值:
無(wú)
3. 示例代碼解析
3.1 流程圖
3.2 核心代碼解析
初始化模型
lockzhiner_vision_module::PaddleDetmodel;
if(!model.Initialize(argv[1])) {
std::cout<<"Failed to initialize model."<<std::endl;
return1;
}
模型推理
autoresults=model.Predict(input_mat);
可視化推理結(jié)果
cv::Matoutput_image;
lockzhiner_vision_module::Visualize(input_mat,output_image,results);
edit.Print(output_image);
3.3 完整代碼實(shí)現(xiàn)
#include
#include
#include
#include
#include
#include
usingnamespacestd::chrono;
intmain(intargc,char*argv[]) {
if(argc!=2) {
std::cerr<<"Usage: Test-PaddleDet model_path"<<std::endl;
return1;
}
// 初始化模型
lockzhiner_vision_module::PaddleDetmodel;
if(!model.Initialize(argv[1])) {
std::cout<<"Failed to initialize model."<<std::endl;
return1;
}
lockzhiner_vision_module::Editedit;
if(!edit.StartAndAcceptConnection()) {
std::cerr<<"Error: Failed to start and accept connection."<<std::endl;
returnEXIT_FAILURE;
}
std::cout<<"Device connected successfully."<<std::endl;
// 打開攝像頭
cv::VideoCapturecap;
cap.set(cv::CAP_PROP_FRAME_WIDTH,640);
cap.set(cv::CAP_PROP_FRAME_HEIGHT,480);
cap.open(0);
if(!cap.isOpened()) {
std::cerr<<"Error: Could not open camera."<<std::endl;
return1;
}
cv::Matinput_mat;
while(true) {
// 捕獲一幀圖像
cap>>input_mat;
if(input_mat.empty()) {
std::cerr<<"Warning: Captured an empty frame."<<std::endl;
continue;
}
// 調(diào)用模型進(jìn)行預(yù)測(cè)
high_resolution_clock::time_pointstart_time=high_resolution_clock::now();
autoresults=model.Predict(input_mat);
high_resolution_clock::time_pointend_time=high_resolution_clock::now();
// 計(jì)算推理時(shí)間
autotime_span=duration_cast<milliseconds>(end_time-start_time);
std::cout<<"Inference time: "<<time_span.count()<<" ms"<<std::endl;
// 可視化結(jié)果
cv::Matoutput_image;
lockzhiner_vision_module::Visualize(input_mat,output_image,results);
edit.Print(output_image);
}
cap.release();
return0;
}
4. 編譯過(guò)程
4.1 編譯環(huán)境搭建
請(qǐng)確保你已經(jīng)按照開發(fā)環(huán)境搭建指南正確配置了開發(fā)環(huán)境。
同時(shí)以正確連接開發(fā)板。
4.2 Cmake介紹
cmake_minimum_required(VERSION3.10)
project(D01_test_detection)
set(CMAKE_CXX_STANDARD17)
set(CMAKE_CXX_STANDARD_REQUIRED ON)
# 定義項(xiàng)目根目錄路徑
set(PROJECT_ROOT_PATH"${CMAKE_CURRENT_SOURCE_DIR}/../..")
message("PROJECT_ROOT_PATH = "${PROJECT_ROOT_PATH})
include("${PROJECT_ROOT_PATH}/toolchains/arm-rockchip830-linux-uclibcgnueabihf.toolchain.cmake")
# 定義 OpenCV SDK 路徑
set(OpenCV_ROOT_PATH"${PROJECT_ROOT_PATH}/third_party/opencv-mobile-4.10.0-lockzhiner-vision-module")
set(OpenCV_DIR"${OpenCV_ROOT_PATH}/lib/cmake/opencv4")
find_package(OpenCV REQUIRED)
set(OPENCV_LIBRARIES"${OpenCV_LIBS}")
# 定義 LockzhinerVisionModule SDK 路徑
set(LockzhinerVisionModule_ROOT_PATH"${PROJECT_ROOT_PATH}/third_party/lockzhiner_vision_module_sdk")
set(LockzhinerVisionModule_DIR"${LockzhinerVisionModule_ROOT_PATH}/lib/cmake/lockzhiner_vision_module")
find_package(LockzhinerVisionModule REQUIRED)
add_executable(Test-detection test_detection.cc)
target_include_directories(Test-detection PRIVATE${LOCKZHINER_VISION_MODULE_INCLUDE_DIRS})
target_link_libraries(Test-detection PRIVATE${OPENCV_LIBRARIES}${LOCKZHINER_VISION_MODULE_LIBRARIES})
install(
TARGETS Test-detection
RUNTIME DESTINATION .
)
4.3 編譯項(xiàng)目
使用 Docker Destop 打開 LockzhinerVisionModule 容器并執(zhí)行以下命令來(lái)編譯項(xiàng)目
# 進(jìn)入Demo所在目錄
cd/LockzhinerVisionModuleWorkSpace/LockzhinerVisionModule/Cpp_example/D01_test_detection
# 創(chuàng)建編譯目錄
rm-rfbuild &&mkdirbuild &&cdbuild
# 配置交叉編譯工具鏈
exportTOOLCHAIN_ROOT_PATH="/LockzhinerVisionModuleWorkSpace/arm-rockchip830-linux-uclibcgnueabihf"
# 使用cmake配置項(xiàng)目
cmake ..
# 執(zhí)行編譯項(xiàng)目
make-j8&&makeinstall
在執(zhí)行完上述命令后,會(huì)在build目錄下生成可執(zhí)行文件。
5. 例程運(yùn)行示例
5.1 運(yùn)行
chmod777Test-detection
# 在實(shí)際應(yīng)用的過(guò)程中LZ-Picodet需要替換為下載的或者你的rknn模型
./Test-detection LZ-Picodet
5.2 結(jié)果展示
可以看到我們正確識(shí)別了綠色的方塊,同時(shí)打印了標(biāo)簽和置信度。
6. 總結(jié)
本文檔詳細(xì)介紹了目標(biāo)檢測(cè)的基礎(chǔ)知識(shí)及 PaddleDetection 的基本概念,并提供了詳細(xì)的API文檔說(shuō)明,幫助開發(fā)者理解和實(shí)現(xiàn)目標(biāo)檢測(cè)與可視化功能。通過(guò)上述流程,可以構(gòu)建高效的實(shí)時(shí)目標(biāo)檢測(cè)系統(tǒng),滿足多種應(yīng)用場(chǎng)景的需求。
-
嵌入式系統(tǒng)
+關(guān)注
關(guān)注
41文章
3672瀏覽量
131126 -
AI
+關(guān)注
關(guān)注
88文章
34765瀏覽量
276914 -
視覺識(shí)別
+關(guān)注
關(guān)注
3文章
105瀏覽量
17016
發(fā)布評(píng)論請(qǐng)先 登錄
基于LockAI視覺識(shí)別模塊:C++圖像采集例程
基于LockAI視覺識(shí)別模塊:C++尋找色塊
基于LockAI視覺識(shí)別模塊:C++輪廓檢測(cè)
基于LockAI視覺識(shí)別模塊:C++二維碼識(shí)別
基于LockAI視覺識(shí)別模塊:C++條碼識(shí)別
基于LockAI視覺識(shí)別模塊:C++目標(biāo)檢測(cè)
目標(biāo)檢測(cè)與識(shí)別技術(shù)的關(guān)系是什么
基于LockAI視覺識(shí)別模塊:C++圖像采集例程

基于LockAI視覺識(shí)別模塊:C++圖像的基本運(yùn)算

基于LockAI視覺識(shí)別模塊:C++使用圖像的統(tǒng)計(jì)信息

# 基于LockAI視覺識(shí)別模塊:C++尋找色塊

基于LockAI視覺識(shí)別模塊:C++輪廓檢測(cè)

基于LockAI視覺識(shí)別模塊:C++同時(shí)識(shí)別輪廓和色塊

基于LockAI視覺識(shí)別模塊:C++二維碼識(shí)別

基于LockAI視覺識(shí)別模塊:C++條碼識(shí)別

評(píng)論