一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

基于PyTorch的物體檢測包圍框數(shù)據(jù)增強包

新機器視覺 ? 來源:AI公園 ? 作者:Harpal Sahota ? 2021-07-01 09:23 ? 次閱讀

作者:Harpal Sahota

編譯:ronghuaiyang

導(dǎo)讀

實現(xiàn)了Google Research,Brain Team中的增強策略。

像許多神經(jīng)網(wǎng)絡(luò)模型一樣,目標(biāo)檢測模型在訓(xùn)練大量數(shù)據(jù)時效果最好。通常情況下,可用的數(shù)據(jù)有限,世界各地的許多研究人員正在研究增強策略,以增加可用的數(shù)據(jù)量。谷歌的大腦團(tuán)隊進(jìn)行了一項這樣的研究,并發(fā)表在了一篇論文中,名為Learning Data Augmentation Strategies for Object Detection。在這篇論文中,作者確定了一組增強稱為策略,它對目標(biāo)檢測問題表現(xiàn)良好。該策略通過增強搜索獲得,提高了通用模型的性能。

作者將增強策略定義為一組子策略。在模型進(jìn)行訓(xùn)練時,隨機選擇其中一個子策略用于增強圖像。在每個子策略中都有要依次應(yīng)用于圖像的增強。每個轉(zhuǎn)換也有兩個超參數(shù):概率和幅度。概率表示該增強將被應(yīng)用的可能性,而幅度表示該增強的程度。下面的代碼顯示了本文中使用的策略:

policy = [

[(‘TranslateX_BBox’, 0.6, 4), (‘Equalize’, 0.8, 10)],

[(‘TranslateY_Only_BBoxes’, 0.2, 2), (‘Cutout’, 0.8, 8)],

[(‘Sharpness’, 0.0, 8), (‘ShearX_BBox’, 0.4, 0)],

[(‘ShearY_BBox’, 1.0, 2), (‘TranslateY_Only_BBoxes’, 0.6, 6)],

[(‘Rotate_BBox’, 0.6, 10), (‘Color’, 1.0, 6)],

在這個策略中有5個子策略,如果我們?nèi)〉谝粋€子策略,它就包含了TranslateX_BBox和Equalize增強。TranslateX_BBox操作在x軸上轉(zhuǎn)換圖像的幅度為4。在本例中,大小并不直接轉(zhuǎn)換為像素,而是根據(jù)大小縮放為像素值。該增強的概率也為0.6,這意味著如果該增強被選中,則應(yīng)用該增強的概率為60%。

隨著每個增強都有一個相關(guān)的概率,引入了一個隨機的概念,給訓(xùn)練增加了一定程度的隨機性??偟膩碚f,Brain Team已經(jīng)提出了4個策略: v0, v1, v2和v3。本文中顯示了v0策略,其他三個策略包含更多的子策略,這些子策略具有幾種不同的轉(zhuǎn)換??偟膩碚f,增加分為三類,作者定義為:

顏色操作: 扭曲顏色通道,不影響邊界框的位置。

幾何操作:幾何扭曲圖像,這相應(yīng)地改變了邊界框的位置和大小。

包圍框操作:只會扭曲包圍框中包含的像素內(nèi)容。

BBAug

那么BBAug)在這方面有什么貢獻(xiàn)呢?BBAug是一個python包,它實現(xiàn)了谷歌Brain Team的所有策略。這個包是一個包裝器,可以更容易地使用這些策略。實際的擴展是由優(yōu)秀的imgaug包完成的。

上面顯示的策略應(yīng)用于一個示例圖像,如下所示。每一行是一個不同的子策略,每一列是該子策略的不同運行。

正如你所看到的,在子策略的運行之間有一定程度的變化,因此給訓(xùn)練增加了一定程度的隨機性。這只是BBAug實施的4個策略之一。要查看所有4個策略的完整可視化,請查看包的GitHub頁面:https://github.com/harpalsahota/bbaug。

該包還提供了一些有用的功能,比如定制策略的可能性,以及位于圖像外部的邊界框,如果它們部分位于圖像外部,則會被自動刪除或剪切。例如,在下面的圖像中,應(yīng)用了平移增強,將邊界框部分推到圖像外部。你可以看到新的邊界框已經(jīng)縮小以適應(yīng)這一點。

也可以創(chuàng)建只影響邊界框區(qū)域的增強。在下圖中,solarisaugmentation只應(yīng)用于邊界框區(qū)域:

用隨機策略增加單個圖像有多容易?就像這樣簡單:

from bbaug import policies

# select policy v0 set

aug_policy = policies.policies_v0()

# instantiate the policy container with the selected policy set

policy_container = policies.PolicyContainer(aug_policy)

# select a random policy from the policy set

random_policy = policy_container.select_random_policy()

# Apply the augmentation. Returns the augmented image and bounding boxes.

# Image is a numpy array of the image

# Bounding boxes is a list of list of bounding boxes in pixels (int)。

# e.g. [[x_min, y_min, x_man, y_max], [x_min, y_min, x_man, y_max]]

# Labels are the class labels for the bounding boxes as an iterable of ints e.g. [1,0]

img_aug, bbs_aug = policy_container.apply_augmentation(random_policy, image, bounding_boxes, labels)

# image_aug: numpy array of the augmented image

# bbs_aug: numpy array of augmneted bounding boxes in format: [[label, x_min, y_min, x_man, y_max],。。。]

總結(jié)

該包實現(xiàn)了谷歌Brain Team推導(dǎo)出的增強策略。目前,已經(jīng)實現(xiàn)了所有4個策略,該包還附帶了notebooks,以幫助用戶將這些策略集成到他們的PyTorch訓(xùn)練pipeline中。

英文原文:https://towardsdatascience.com/bbaug-a-package-for-bounding-box-augmentation-in-pytorch-e9b9fbf1504b

編輯:jq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 神經(jīng)網(wǎng)絡(luò)

    關(guān)注

    42

    文章

    4797

    瀏覽量

    102367
  • pytorch
    +關(guān)注

    關(guān)注

    2

    文章

    808

    瀏覽量

    13686

原文標(biāo)題:BBAug: 一個用于PyTorch的物體檢測包圍框數(shù)據(jù)增強包

文章出處:【微信號:vision263com,微信公眾號:新機器視覺】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    便攜式+多功能+可定制!工廠直發(fā),重新定義氣體檢測效率

    體檢測
    奕帆科技
    發(fā)布于 :2025年04月25日 15:05:25

    體檢漏儀如何操作?注意事項有哪些?

    體檢漏儀 ,從名稱上就能看出,這是一種用于檢測氣體泄漏情況的專業(yè)設(shè)備,在工業(yè)、環(huán)保等領(lǐng)域中有著廣泛的應(yīng)用潛力。那么,氣體檢漏儀如何操作?注意事項有哪些?為方便大家了解,下面就讓小編來為大家簡單介紹
    發(fā)表于 03-12 15:08

    【米爾RK3576開發(fā)板評測】+項目名稱RetinaFace人臉檢測

    一、簡介 Pytorch_Retinaface?是一個基于PyTorch框架實現(xiàn)的人臉檢測算法,它能夠快速而準(zhǔn)確地檢測出圖像中的人臉,并提供豐富的特征信息。該算法的核心思想是使用多尺度
    發(fā)表于 02-15 13:28

    《DNK210使用指南 -CanMV版 V1.0》第四十一章 YOLO2物體檢測實驗

    第四十一章 YOLO2物體檢測實驗 在上一章節(jié)中,介紹了利用maix.KPU模塊實現(xiàn)YOLO2的人手檢測,本章將繼續(xù)介紹利用maix.KPU模塊實現(xiàn)YOLO2的物體檢測。通過本章的學(xué)習(xí),讀者將學(xué)習(xí)到
    發(fā)表于 11-14 09:22

    PyTorch 數(shù)據(jù)加載與處理方法

    PyTorch 是一個流行的開源機器學(xué)習(xí)庫,它提供了強大的工具來構(gòu)建和訓(xùn)練深度學(xué)習(xí)模型。在構(gòu)建模型之前,一個重要的步驟是加載和處理數(shù)據(jù)。 1. PyTorch 數(shù)據(jù)加載基礎(chǔ) 在
    的頭像 發(fā)表于 11-05 17:37 ?765次閱讀

    在目標(biāo)檢測中大物體的重要性

    導(dǎo)讀實驗表明,對大型物體賦予更大的權(quán)重可以提高所有尺寸物體檢測分?jǐn)?shù),從而整體提升目標(biāo)檢測器的性能(在COCOval2017數(shù)據(jù)集上使用In
    的頭像 發(fā)表于 10-09 08:05 ?690次閱讀
    在目標(biāo)<b class='flag-5'>檢測</b>中大<b class='flag-5'>物體</b>的重要性

    安帕爾:可燃?xì)?b class='flag-5'>體檢測儀怎么樣選擇

    安帕爾:可燃?xì)?b class='flag-5'>體檢測儀怎么樣選擇 可燃?xì)?b class='flag-5'>體檢測儀怎么樣選擇?下面安帕爾給大家介紹下 一要看可燃?xì)?b class='flag-5'>體檢測儀是否具有穩(wěn)定性。這個是必須要考慮的因素,零點偏移和全幅偏移的數(shù)值越小越好,所有的氣體檢測
    的頭像 發(fā)表于 08-16 10:16 ?437次閱讀

    pytorch怎么在pycharm中運行

    第一部分:PyTorch和PyCharm的安裝 1.1 安裝PyTorch PyTorch是一個開源的機器學(xué)習(xí)庫,用于構(gòu)建和訓(xùn)練神經(jīng)網(wǎng)絡(luò)。要在PyCharm中使用PyTorch,首先需
    的頭像 發(fā)表于 08-01 16:22 ?2119次閱讀

    pytorch環(huán)境搭建詳細(xì)步驟

    了conda、Python等180多個科學(xué)及其依賴項,非常適合用于科學(xué)計算(數(shù)據(jù)科學(xué)、機器學(xué)習(xí)應(yīng)用、大數(shù)據(jù)處理
    的頭像 發(fā)表于 08-01 15:38 ?1533次閱讀

    低功耗藍(lán)牙模塊+氣體檢測儀藍(lán)牙方案介紹

    在工業(yè)安全領(lǐng)域,氣體檢測儀是保障工作場所安全的關(guān)鍵設(shè)備之一。氣體檢測儀藍(lán)牙模組方案的出現(xiàn),使得氣體檢測數(shù)據(jù)可以通過藍(lán)牙技術(shù)傳輸?shù)街悄苁謾C、平板電腦等移動設(shè)備上,實現(xiàn)遠(yuǎn)程監(jiān)測與管理。工作
    的頭像 發(fā)表于 07-17 16:59 ?575次閱讀
    低功耗藍(lán)牙模塊+氣<b class='flag-5'>體檢測</b>儀藍(lán)牙方案介紹

    pytorch如何訓(xùn)練自己的數(shù)據(jù)

    本文將詳細(xì)介紹如何使用PyTorch框架來訓(xùn)練自己的數(shù)據(jù)。我們將從數(shù)據(jù)準(zhǔn)備、模型構(gòu)建、訓(xùn)練過程、評估和測試等方面進(jìn)行講解。 環(huán)境搭建 首先,我們需要安裝PyTorch。可以通過訪問
    的頭像 發(fā)表于 07-11 10:04 ?891次閱讀

    pytorch中有神經(jīng)網(wǎng)絡(luò)模型嗎

    處理、語音識別等領(lǐng)域取得了顯著的成果。PyTorch是一個開源的深度學(xué)習(xí)框架,由Facebook的AI研究團(tuán)隊開發(fā)。它以其易用性、靈活性和高效性而受到廣泛歡迎。在PyTorch中,有許多預(yù)訓(xùn)練的神經(jīng)網(wǎng)絡(luò)模型可供選擇,這些模型可以用于各種任務(wù),如圖像分類、目標(biāo)
    的頭像 發(fā)表于 07-11 09:59 ?1311次閱讀

    tensorflow和pytorch哪個更簡單?

    PyTorch更簡單。選擇TensorFlow還是PyTorch取決于您的具體需求和偏好。如果您需要一個易于使用、靈活且具有強大社區(qū)支持的框架,PyTorch可能是一個更好的選擇。如果您需要一個在
    的頭像 發(fā)表于 07-05 09:45 ?1270次閱讀

    PyTorch如何訓(xùn)練自己的數(shù)據(jù)

    PyTorch是一個廣泛使用的深度學(xué)習(xí)框架,它以其靈活性、易用性和強大的動態(tài)圖特性而聞名。在訓(xùn)練深度學(xué)習(xí)模型時,數(shù)據(jù)集是不可或缺的組成部分。然而,很多時候,我們可能需要使用自己的數(shù)據(jù)集而不是現(xiàn)成
    的頭像 發(fā)表于 07-02 14:09 ?3060次閱讀

    便攜三合一氣體檢測儀的功能使用說明

    便攜三合一氣體檢測儀的功能使用說明
    的頭像 發(fā)表于 06-20 11:42 ?1367次閱讀
    便攜三合一氣<b class='flag-5'>體檢測</b>儀的功能使用說明