一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

眾多常見的有效圖像預(yù)處理方法

新機器視覺 ? 來源:機器之心 ? 作者:機器之心 ? 2021-05-03 18:26 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

一個經(jīng)歷了 39 場 Kaggle 比賽的團隊在 reddit 上發(fā)帖表示,他們整理了一份結(jié)構(gòu)化的圖像分割技巧列表,涵蓋數(shù)據(jù)增強、建模、損失函數(shù)、訓(xùn)練技巧等多個方面,不失為一份可以參考的圖像分割技巧資料。

圖像分割是圖像處理和計算機視覺的熱點之一,是根據(jù)圖像內(nèi)容對指定區(qū)域進行標(biāo)記的計算機視覺任務(wù)。它基于某些標(biāo)準(zhǔn)將輸入圖像劃分為多個相同的類別,簡言之就是「這張圖片里有什么,其在圖片中的位置是什么?」以便提取人們感興趣的區(qū)域。圖像分割是圖像分析和圖像特征提取及識別的基礎(chǔ)。

圖像分割也是 Kaggle 中的一類常見賽題,比如衛(wèi)星圖像分割與識別、氣胸疾病圖像分割等。除了密切的團隊配合、給力的 GPU 配置等條件,技巧在這類比賽中也發(fā)揮了很大的作用。但這些技巧去哪里找呢?Medium、大牛博客、參賽經(jīng)驗帖中都散落著各種技巧分享,但這些資源往往比較零散,于是就有人想到,為什么不把它們集中到一起呢? Derrick Mwiti 就帶頭做了這么一件事,他和他所在的團隊將過去 39 場 Kaggle 比賽中討論過的圖像分割技巧、資料都匯總到了一起,希望可以幫到在圖像分割任務(wù)中遇到困難的同學(xué)。 這份列表分為十大板塊,包括外部數(shù)據(jù)、預(yù)處理、數(shù)據(jù)增強、建模、硬件配置、損失函數(shù)、訓(xùn)練技巧、評估和交叉驗證、集成方法以及后處理。

每個版塊的具體內(nèi)容以條目的形式呈現(xiàn),每個條目又都嵌入了一些鏈接,點開可以看到一些優(yōu)秀的 Kaggle 解決方案分享、Medium 博客教程、高贊的 GitHub 項目等,讀者可以根據(jù)自己的具體問題和需要進行查找。 本文選取了其中一部分內(nèi)容進行介紹,具體細(xì)節(jié)及鏈接請參見原文。 接下來,我們來看每個步驟都有哪些技巧吧。 預(yù)處理 這一部分包含眾多常見的有效圖像預(yù)處理方法,例如:

使用高斯差分方法進行斑點檢測;

使用基于圖像塊的輸入進行訓(xùn)練,以減少訓(xùn)練時間;

加載數(shù)據(jù)時,用 cudf 替換 Pandas;

確保所有圖像保持相同的方向;

使用 OpenCV 對所有常規(guī)圖像進行預(yù)處理;

采用自主學(xué)習(xí)并手動添加注釋;

將所有圖像調(diào)整成相同的分辨率,以便將相同的模型用于不同厚度的掃描等。

數(shù)據(jù)增強 數(shù)據(jù)增強能夠使網(wǎng)絡(luò)具有更復(fù)雜的表征能力,從而減小網(wǎng)絡(luò)性能在驗證集和訓(xùn)練集以及最終測試集上的差距,讓網(wǎng)絡(luò)更好地學(xué)習(xí)遷移數(shù)據(jù)集上的數(shù)據(jù)分布。這部分介紹了一些常用的數(shù)據(jù)增強方法:

用 albumentations 包進行數(shù)據(jù)增強;

使用 90 度隨機旋轉(zhuǎn);

使用水平、垂直翻轉(zhuǎn)或這兩個方向都做翻轉(zhuǎn);

嘗試進行復(fù)雜的幾何變換,包括彈性變換、透視變換、分段仿射變換、枕形失真;

應(yīng)用隨機 HSV;

使用損失較小的增強數(shù)據(jù)進行泛化,以防止有用圖像信息丟失;

應(yīng)用通道 shuffle;

根據(jù)類別頻率進行數(shù)據(jù)擴充;

應(yīng)用高斯噪聲等。

建模網(wǎng)絡(luò)架構(gòu) 這一部分介紹了一些可用在圖像分割上的常用網(wǎng)絡(luò)框架,例如:

使用基于 U-net 的架構(gòu);

用 inception-ResNet v2 架構(gòu)得到具備不同感受野的訓(xùn)練特征;

經(jīng)過對抗訓(xùn)練的 Siamese 網(wǎng)絡(luò);

以密集(FC)層作為最后一層的 ResNet50、Xception、Inception ResNet v2 x 5;

使用全局最大池化層,無論輸入尺寸如何,該層都將返回固定長度的輸出;

使用堆疊的膨脹卷積;

VoxelNet;

用 concat 和 conv1x1 替換 LinkNet 跳躍連接中的加號;

廣義平均池化;

用 3D 卷積網(wǎng)絡(luò)在圖像上滑動;

使用在 Imagenet 數(shù)據(jù)集上預(yù)訓(xùn)練的 ResNet152 作為特征提取器等。

以及下列經(jīng)典網(wǎng)絡(luò)框架:

23f94f26-9cde-11eb-8b86-12bb97331649.png

損失函數(shù) 損失函數(shù)常用來估計模型預(yù)測結(jié)果與真值之間的差距。選擇合適的損失函數(shù),對模型效果很重要。 這部分介紹了一系列損失函數(shù)和使用場景,例如:

dice 系數(shù):能夠很好地處理不平衡數(shù)據(jù);

加權(quán)邊界損失:減少預(yù)測分割與真值之間的距離;

MultiLabelSoftMarginLoss:基于最大熵優(yōu)化多標(biāo)簽一對多損失的標(biāo)準(zhǔn);

具備 logit 損失的平衡交叉熵(Balanced cross entropy,BCE):以特定系數(shù)權(quán)衡正例和負(fù)例;

……

此外,作者還介紹了 Arc margin 損失、BCE 和 dice 系數(shù)的組合等等,更多詳情參見原文。

訓(xùn)練技巧 這部分介紹了常用的模型訓(xùn)練技巧,如:

嘗試不同的學(xué)習(xí)率;

嘗試不同批大??;

使用帶有動量項的 SDG,并且手動設(shè)置學(xué)習(xí)率衰減;

數(shù)據(jù)增強過多會降低準(zhǔn)確率;

使用裁剪后的圖像訓(xùn)練,并在完整的圖像上做預(yù)測;

在學(xué)習(xí)速率調(diào)整上使用 Keras 中的 ReduceLROnPlateau() 方法;

凍結(jié)除了最后一層以外所有的網(wǎng)絡(luò)層,并使用 Stage1 中的 1000 張圖片進行模型微調(diào);

開發(fā)一個能使標(biāo)簽更加均勻的采樣器;

使用類別感知采樣(class aware sampling)等。

評估和交叉驗證 這部分介紹了 k 折交叉驗證、對抗驗證和權(quán)衡等方法,以及在調(diào)整模型最后一層時使用交叉驗證方法以有效避免過擬合。

集成方法 許多機器學(xué)習(xí)競賽(包括 Kaggle)中最優(yōu)秀的解決方案所采用的集成方法都建立在一個這樣的假設(shè)上:將多個模型組合在一起通??梢援a(chǎn)生更強大的模型。 這部分介紹了多種集成方法,如多數(shù)投票法、XGBoost、LightGBM、CatBoost 等方法,以及集成 ResNet50、InceptionV3 和 InceptionResNetV2 的方法。

后處理 這部分介紹了多種后處理方法:

測試時增強(Test Time Augmentation,TTA):向模型多次展示經(jīng)過不同隨機變換的圖像,取預(yù)測平均值;

均衡使用測試預(yù)測概率,而不是僅使用預(yù)測類;

將幾何平均數(shù)應(yīng)用于預(yù)測;

在推理過程中將圖塊重疊,使每個邊緣像素至少覆蓋 3 次,因為 UNET 在邊緣區(qū)域范圍的預(yù)測往往較差;

非極大抑制和邊界框收縮;

分水嶺后處理:在實例分割問題中分離對象。

最后需要注意的是,這份列表給出的某些技巧可能有一定的適用范圍,具體能不能用還要視數(shù)據(jù)而定。

原文標(biāo)題:圖像分割的實用技巧

文章出處:【微信公眾號:新機器視覺】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

責(zé)任編輯:haq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 圖像處理
    +關(guān)注

    關(guān)注

    27

    文章

    1329

    瀏覽量

    58069
  • 機器視覺
    +關(guān)注

    關(guān)注

    163

    文章

    4597

    瀏覽量

    122919

原文標(biāo)題:圖像分割的實用技巧

文章出處:【微信號:vision263com,微信公眾號:新機器視覺】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    FPGA Verilog HDL語法之編譯預(yù)處理

    Verilog HDL語言和C語言一樣也提供了編譯預(yù)處理的功能。“編譯預(yù)處理”是Verilog HDL編譯系統(tǒng)的一個組成部分。Verilog HDL語言允許在程序中使用幾種特殊的命令(它們不是一般
    的頭像 發(fā)表于 03-27 13:30 ?630次閱讀
    FPGA Verilog HDL語法之編譯<b class='flag-5'>預(yù)處理</b>

    基于嵌入式人工智能的高速圖像處理的微處理器RZ/A2M數(shù)據(jù)手冊

    RZ/A2M MPU設(shè)計用于需要高速e-AI圖像處理的智能電器,網(wǎng)絡(luò)攝像機,服務(wù)機器人,掃描儀產(chǎn)品和工業(yè)機械。它采用獨特的圖像識別和機器視覺混合方法,結(jié)合了專有的DRP技術(shù),對
    的頭像 發(fā)表于 03-11 15:54 ?497次閱讀
    基于嵌入式人工智能的高速<b class='flag-5'>圖像</b><b class='flag-5'>處理</b>的微<b class='flag-5'>處理</b>器RZ/A2M數(shù)據(jù)手冊

    如何確定在OpenVINO? Toolkit中預(yù)處理支持的輸入顏色格式?

    無法確定在 OpenVINO? Toolkit 中預(yù)處理支持的輸入顏色格式。
    發(fā)表于 03-06 07:28

    FPGA上的圖像處理算法集成與優(yōu)化

    、Tophat形態(tài)學(xué)濾波、RAW8轉(zhuǎn)RGB888、彩色圖像均值濾波、Alpha背景疊加、直方圖灰度拉伸算法以及自動白平衡算法。每種算法都提供了實現(xiàn)方法和相關(guān)公式,涵蓋了圖像處理的核心概
    的頭像 發(fā)表于 02-14 13:46 ?660次閱讀
    FPGA上的<b class='flag-5'>圖像</b><b class='flag-5'>處理</b>算法集成與優(yōu)化

    常見處理器故障及解決方法

    處理器(CPU)是計算機的核心部件,負(fù)責(zé)執(zhí)行程序指令和處理數(shù)據(jù)。處理器故障可能會導(dǎo)致計算機性能下降、死機、重啟等問題。以下是一些常見處理
    的頭像 發(fā)表于 02-07 09:17 ?1219次閱讀

    常見xgboost錯誤及解決方案

    的XGBoost錯誤及其解決方案: 1. 數(shù)據(jù)預(yù)處理錯誤 錯誤 :未對數(shù)據(jù)進行適當(dāng)?shù)?b class='flag-5'>預(yù)處理,如缺失值處理、特征編碼、特征縮放等。 解決方案 : 使用 pandas 或 sklearn 庫來處理
    的頭像 發(fā)表于 01-19 11:22 ?2527次閱讀

    BOSCH-REXROTH300擰緊系統(tǒng)常見故障及處理方法

    BOSCH-REXROTH300擰緊系統(tǒng)常見故障及處理方法
    發(fā)表于 12-24 14:22 ?0次下載

    Minitab 數(shù)據(jù)清理與預(yù)處理技巧

    Minitab是一款功能強大的統(tǒng)計分析和質(zhì)量管理軟件,在數(shù)據(jù)分析過程中,數(shù)據(jù)清理與預(yù)處理是至關(guān)重要的環(huán)節(jié)。以下是一些在Minitab中進行數(shù)據(jù)清理與預(yù)處理的技巧: 一、數(shù)據(jù)導(dǎo)入與格式調(diào)整 導(dǎo)入數(shù)據(jù)
    的頭像 發(fā)表于 12-02 16:06 ?1555次閱讀

    【每天學(xué)點AI】實戰(zhàn)圖像增強技術(shù)在人工智能圖像處理中的應(yīng)用

    圖像增強(ImageEnhancement)是人工智能和計算機視覺中一項重要的技術(shù),也是人工智能數(shù)據(jù)集預(yù)處理的一個重要步驟。它旨在提高圖像的質(zhì)量,使其在視覺上更加清晰、細(xì)節(jié)更豐富。這項技術(shù)在自動駕駛
    的頭像 發(fā)表于 11-22 17:14 ?1730次閱讀
    【每天學(xué)點AI】實戰(zhàn)<b class='flag-5'>圖像</b>增強技術(shù)在人工智能<b class='flag-5'>圖像</b><b class='flag-5'>處理</b>中的應(yīng)用

    共聚焦激光顯微鏡圖像處理技巧

    共聚焦激光顯微鏡圖像處理技巧涉及多個方面,以下是一些關(guān)鍵的步驟和注意事項: 一、圖像預(yù)處理 文件格式選擇 : 在拍攝好圖像后,保存的圖象格式
    的頭像 發(fā)表于 10-30 09:37 ?2632次閱讀

    FPGA在圖像處理領(lǐng)域的優(yōu)勢有哪些?

    單元和可編程互聯(lián)線,可以實現(xiàn)高度并行的數(shù)據(jù)處理。在圖像處理任務(wù)中,如圖像預(yù)處理、特征提取和圖像
    發(fā)表于 10-09 14:36

    C55x CSL音頻預(yù)處理

    電子發(fā)燒友網(wǎng)站提供《C55x CSL音頻預(yù)處理.pdf》資料免費下載
    發(fā)表于 09-19 11:30 ?0次下載
    C55x CSL音頻<b class='flag-5'>預(yù)處理</b>

    光學(xué)識別的過程包含哪些

    。 1. 圖像預(yù)處理 圖像預(yù)處理是OCR過程的第一步,其目的是提高圖像質(zhì)量,以便后續(xù)步驟能夠更準(zhǔn)確地識別文字。 1.1 去噪 目的 :去除
    的頭像 發(fā)表于 09-10 15:36 ?821次閱讀

    雷達(dá)液位計常見故障及處理方法

    雷達(dá)液位計作為一種高精度的液位檢測設(shè)備,在實際應(yīng)用中可能會遇到多種故障。以下是一些常見的故障及其處理方法: 一、常見故障 數(shù)據(jù)不準(zhǔn)確 原因 :參數(shù)設(shè)置錯誤、設(shè)備老化、環(huán)境因素干擾(如泡
    的頭像 發(fā)表于 09-07 11:22 ?2812次閱讀

    圖像處理器是什么意思

    圖像處理器(Image Processor)是一種專門用于圖像處理和計算的硬件設(shè)備或芯片,它通過高速數(shù)據(jù)傳輸、圖像編解碼、濾波、變換等多種技
    的頭像 發(fā)表于 08-14 09:28 ?1984次閱讀