來自中國清華大學(xué)的研究人員推出了YOLOv10,這是一種具有卓越進(jìn)步的創(chuàng)新模型,展示了在計算機(jī)視覺領(lǐng)域的重要突破。這次發(fā)布體現(xiàn)了讓AI既易于使用又功能強(qiáng)大的承諾,標(biāo)志著重大進(jìn)展和改進(jìn)。
YOLO(You Only Look Once)系列一直是實時目標(biāo)檢測的基準(zhǔn),成功平衡了計算成本和檢測性能。盡管在架構(gòu)設(shè)計和優(yōu)化策略方面取得了進(jìn)展,但對非最大值抑制(NMS)的依賴阻礙了端到端部署,影響了推理延遲。YOLOv10通過消除NMS并優(yōu)化模型架構(gòu)推進(jìn)了效率和性能的邊界。
在這些進(jìn)展的背景下,OpenSistemas在AI領(lǐng)域脫穎而出,特別是在訓(xùn)練、測試和部署如YOLOv10這樣的模型方面。憑借對前沿技術(shù)的深刻理解和專長,OpenSistemas能夠充分利用YOLOv10的功能,提升目標(biāo)檢測任務(wù)的精度和效率。這種合作象征著創(chuàng)新與實際應(yīng)用的融合,推動了AI技術(shù)的可能性。
YOLOv10 的特別之處
YOLOv10的主要顯著進(jìn)步是消除了非最大值抑制(NMS)。NMS是許多目標(biāo)檢測模型中用于消除檢測到同一對象的冗余邊界框的后處理步驟。它通過保留得分最高的邊界框并移除其他重疊顯著的框來工作。盡管有效,但NMS增加了計算復(fù)雜性并增加了推理延遲,這會減慢實時應(yīng)用的速度。
YOLOv10通過采用一致的雙分配方法進(jìn)行無NMS訓(xùn)練,改變了模型處理重疊檢測的方式。通過將這一過程集成到模型的架構(gòu)和訓(xùn)練策略中,YOLOv10減少了后處理的需要,大大縮短了推理時間。這種延遲的減少對于速度和效率至關(guān)重要的實時應(yīng)用,如自動駕駛、監(jiān)控和實時視頻分析至關(guān)重要。消除NMS不僅簡化了部署過程,還通過提高模型的效率和響應(yīng)能力來提升其性能。
預(yù)訓(xùn)練模型
自從Ultralytics發(fā)布YOLOv5以來,我們已經(jīng)習(xí)慣了每次YOLO發(fā)布時提供各種模型尺寸:nano、small、medium、large和xlarge。YOLOv10也不例外,清華大學(xué)的研究人員也提供了一系列預(yù)訓(xùn)練模型,可以用于各種目標(biāo)檢測任務(wù)。
所有這些模型在延遲和平均精度(AP)方面表現(xiàn)出優(yōu)于之前YOLO版本的性能,如下圖所示:
(圖:各YOLO模型在延遲(左)和參數(shù)數(shù)量(右)方面的性能比較)
你可以在下表中查看實際性能:
(表:可用的YOLOv10預(yù)訓(xùn)練模型,來源:Ultralytics網(wǎng)站)
使用
我們將嘗試使用原始的倉庫:
git clone https://github.com/THU-MIG/yolov10 cd yolov10 pip install -e . # Choose the size of your model I will use the XLarge version wget https://github.com/THU-MIG/yolov10/releases/download/v1.1/yolov10n/s/m/b/l/x.pt
然后,使用方法類似于YOLOv8:
from ultralytics import YOLOv10 # Note the "v10" in the end # Load a model model = YOLOv10('yolov10x.pt') # load an official model # Predict with the model model.predict(0) # predict on your webcam
CLI
yolo predict model=yolov10x.pt source=0 # predict with official model on webcam
Ultralytics框架的預(yù)測源也可用:
(圖:可用于預(yù)測的源,來源:Ultralytics文檔)
結(jié)果
(圖:YOLOv10的目標(biāo)檢測示例。推理分辨率為384x640)
YOLOv8 vs YOLOv10: 推理延遲
比較YOLOv8和YOLOv10時,最顯著的改進(jìn)之一是推理延遲的減少。推理延遲,即模型處理圖像并進(jìn)行預(yù)測所需的時間,對于自動駕駛、視頻監(jiān)控和交互式AI系統(tǒng)等實時應(yīng)用至關(guān)重要。
YOLOv8盡管高效且強(qiáng)大,但依賴于非最大值抑制(NMS)來過濾冗余邊界框。這個額外步驟雖然有效地提高了檢測準(zhǔn)確性,但增加了計算開銷并延長了整體推理時間。
而YOLOv10通過一致的雙分配方法進(jìn)行無NMS訓(xùn)練,消除了對NMS的需求。通過將這一過程集成到模型架構(gòu)中,YOLOv10顯著減少了推理過程中所需的計算步驟。這使得處理時間更快,延遲更低,使YOLOv10更適合高速實時應(yīng)用。
在同一個視頻上,我使用NVIDIA GeForce RTX 4060 Laptop GPU, 7940MiB,得到的日志顯示差異非常大:
(圖:YOLOv10在384x640分辨率下的推理延遲)
(圖:YOLOv8在384x640分辨率下的推理延遲)
導(dǎo)出模型
如果你想了解導(dǎo)出模型的好處,可以查看這篇詳細(xì)介紹速度改進(jìn)的文章。類似于其他任務(wù),如檢測、分割和姿勢估計,你可以使用Ultralytics框架導(dǎo)出YOLOv10模型。此過程包括將模型轉(zhuǎn)換為ONNX、CoreML、TensorFlow Lite等格式,確保與各種平臺和設(shè)備的兼容性。
這種多功能性允許在不同環(huán)境中更廣泛的集成,從移動應(yīng)用到邊緣設(shè)備。與前輩一樣,YOLOv10框架支持模型導(dǎo)出,便于在各種平臺上無縫部署。
Python
from ultralytics import YOLOv10 # Load a model model = YOLOv10('yolov10x.pt') # load an official model model = YOLOv10('path/to/best.pt') # load a custom trained model # Export the model model.export(format='onnx')
CLI
yolo export model=yolov10x.pt format=onnx # export official model yolo export model=path/to/best.pt format=onnx # export custom trained model
結(jié)論
清華大學(xué)研究人員推出的YOLOv10,作為首個無NMS目標(biāo)檢測模型,代表了計算機(jī)視覺領(lǐng)域的重大進(jìn)步。與YOLOv8相比,YOLOv10顯著減少了推理延遲,使其更適合高速實時應(yīng)用,如自動駕駛、視頻監(jiān)控和交互式AI系統(tǒng)。這種推理過程中計算步驟的減少突顯了YOLOv10的效率和響應(yīng)能力。
此外,YOLOv10采用了新的無NMS訓(xùn)練方法,對其各部分進(jìn)行了微調(diào)以提高性能,并在速度和準(zhǔn)確性之間達(dá)到了很好的平衡。這些升級使得模型的部署更容易,性能更強(qiáng),速度更快,響應(yīng)更迅速。
-
AI
+關(guān)注
關(guān)注
87文章
33554瀏覽量
274195 -
目標(biāo)檢測
+關(guān)注
關(guān)注
0文章
220瀏覽量
15843 -
計算機(jī)視覺
+關(guān)注
關(guān)注
9文章
1705瀏覽量
46474
原文標(biāo)題:YOLOv10:無NMS實時目標(biāo)檢測的先鋒
文章出處:【微信號:vision263com,微信公眾號:新機(jī)器視覺】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
labview調(diào)用yolo目標(biāo)檢測、分割、分類、obb
深藍(lán)汽車攜手華為開創(chuàng)全民智駕新紀(jì)元
采用華為云 Flexus 云服務(wù)器 X 實例部署 YOLOv3 算法完成目標(biāo)檢測

Flexus X 實例 ultralytics 模型 yolov10 深度學(xué)習(xí) AI 部署與應(yīng)用

電梯物聯(lián)網(wǎng):重塑電梯行業(yè)的智能與安全新紀(jì)元
YOLOv10自定義目標(biāo)檢測之理論+實踐

在樹莓派上部署YOLOv5進(jìn)行動物目標(biāo)檢測的完整流程

倒計時1天 | 第三屆OpenHarmony技術(shù)大會——明天,上海見!
跨越地理限制:動態(tài)海外住宅IP技術(shù)引領(lǐng)全球化網(wǎng)絡(luò)新紀(jì)元
能耗管理系統(tǒng)新紀(jì)元:智能科技引領(lǐng)綠色生活風(fēng)尚
基于迅為RK3588【RKNPU2項目實戰(zhàn)1】:YOLOV5實時目標(biāo)分類
AI技術(shù)引領(lǐng)奧運轉(zhuǎn)播新紀(jì)元
用OpenVINO C# API在intel平臺部署YOLOv10目標(biāo)檢測模型

評論