一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

計(jì)算機(jī)視覺(jué)的工作流程與主要應(yīng)用

Dbwd_Imgtec ? 來(lái)源:Imagination Tech ? 作者:Imagination Tech ? 2021-01-08 14:06 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

引言

計(jì)算機(jī)視覺(jué)(Computer Vision)自興起以來(lái)就非常迅速且廣泛應(yīng)用于各個(gè)領(lǐng)域,比如我們熟悉的且每天都會(huì)使用的基于手機(jī)攝像頭的人臉識(shí)別,除此之外,它還可以在自動(dòng)駕駛領(lǐng)域輔助汽車(chē)識(shí)別交通信號(hào)、標(biāo)志和行人;在制造業(yè)輔助工業(yè)機(jī)器人監(jiān)督和指導(dǎo)人工操作。

計(jì)算機(jī)視覺(jué)的主要目的是讓計(jì)算機(jī)能像人類(lèi)一樣甚至比人類(lèi)更好地看見(jiàn)和識(shí)別世界。計(jì)算機(jī)視覺(jué)通常使用C++、PythonMATLAB編程語(yǔ)言,是增強(qiáng)現(xiàn)實(shí)(AR)的一項(xiàng)重要技術(shù)。目前主流的計(jì)算機(jī)視覺(jué)工具有OpenCV、Tensorflow、Gpu、YOLO、Keras等。計(jì)算機(jī)視覺(jué)其實(shí)是一個(gè)復(fù)雜多元的交叉領(lǐng)域,包含了很多來(lái)自數(shù)字信號(hào)處理、神經(jīng)科學(xué)、圖像處理、模式識(shí)別、機(jī)器學(xué)習(xí)(ML)、機(jī)器人人工智能(AI)等領(lǐng)域的概念。

本文將具體介紹一下計(jì)算機(jī)視覺(jué)的工作流程。

什么是計(jì)算機(jī)視覺(jué)(Computer Vision)

一言蔽之,計(jì)算機(jī)視覺(jué)是讓計(jì)算機(jī)理解并標(biāo)記圖像內(nèi)容的技術(shù)領(lǐng)域。

舉個(gè)例子,請(qǐng)看下圖:

對(duì)于人類(lèi)來(lái)說(shuō),你很難向從沒(méi)穿過(guò)衣服的原始人解釋什么是連衣裙或者什么是鞋。計(jì)算機(jī)視覺(jué)也是如此,如果它并沒(méi)有相關(guān)輸入,就不會(huì)理解上圖的東西都是什么。

所以,我們需要收集并標(biāo)記大量關(guān)于衣服、鞋、包包的圖片,輸入進(jìn)計(jì)算機(jī)“告訴”它這些圖片里的東西是什么,在經(jīng)過(guò)不斷的學(xué)習(xí)和訓(xùn)練后,計(jì)算機(jī)將會(huì)識(shí)別出哪個(gè)是連衣裙,哪個(gè)是鞋、哪個(gè)是包包。

計(jì)算機(jī)視覺(jué)的主要應(yīng)用

計(jì)算機(jī)視覺(jué)目前應(yīng)用的領(lǐng)域不勝枚舉,小編就挑出5個(gè)具有代表性的應(yīng)用吧:

物體與行為識(shí)別

自動(dòng)駕駛汽車(chē)

醫(yī)療影像分析與診斷

圖片標(biāo)記

人臉識(shí)別

計(jì)算機(jī)視覺(jué)工作流程

計(jì)算機(jī)視覺(jué)工作流程其實(shí)是大多數(shù)計(jì)算機(jī)視覺(jué)應(yīng)用程序?qū)⒔?jīng)歷的一系列步驟。許多視覺(jué)應(yīng)用程序都是從獲取圖像和數(shù)據(jù)開(kāi)始,然后處理數(shù)據(jù),執(zhí)行一些分析和識(shí)別步驟,最后執(zhí)行一個(gè)動(dòng)作的:

e146bbc4-4f39-11eb-8b86-12bb97331649.png

計(jì)算機(jī)視覺(jué)工作流程 就拿人臉識(shí)別來(lái)說(shuō)吧,它也主要遵循了計(jì)算機(jī)視覺(jué)的工作流程:

e176140a-4f39-11eb-8b86-12bb97331649.png

人臉識(shí)別工作流程 我們可以看到,大部分計(jì)算機(jī)視覺(jué)技術(shù)應(yīng)用其實(shí)都是從數(shù)據(jù)預(yù)處理開(kāi)始的,其實(shí)這也是機(jī)器學(xué)習(xí)的關(guān)鍵。

數(shù)據(jù)標(biāo)準(zhǔn)化

所謂預(yù)處理圖像就是將輸入的圖像數(shù)據(jù)標(biāo)準(zhǔn)化,以便后續(xù)工作流程的順利進(jìn)行。例如,假設(shè)我們創(chuàng)建了一個(gè)簡(jiǎn)單的聚類(lèi)算法來(lái)區(qū)分紅玫瑰和其他花朵:

e1b9ab02-4f39-11eb-8b86-12bb97331649.png

我們將算法設(shè)計(jì)為計(jì)算給定圖像中紅色像素的數(shù)量,如果有足夠多的紅色像素(大于300個(gè)紅色像素)就被歸類(lèi)為紅玫瑰。(這個(gè)例子里我們只提取了顏色特征)

還有一點(diǎn)需要注意的是,輸入圖像的大小、裁切方式都會(huì)影響算法的輸出結(jié)果,因此數(shù)據(jù)預(yù)處理非常重要!

作為數(shù)據(jù)的圖像

圖像中的每一個(gè)像素都是一個(gè)我們可以改變的數(shù)值,比如,我們可以將一個(gè)像素乘以一個(gè)標(biāo)量來(lái)改變圖像亮度,我們也可以將每個(gè)像素值向右移動(dòng)來(lái)改變圖像飽和度等。

e1ecb5ba-4f39-11eb-8b86-12bb97331649.png

將圖像視為數(shù)字網(wǎng)格是許多圖像處理技術(shù)的基礎(chǔ)。一般來(lái)說(shuō),色彩與形狀改變都是通過(guò)數(shù)學(xué)運(yùn)算對(duì)圖像進(jìn)行逐像素變換完成的。

訓(xùn)練神經(jīng)網(wǎng)絡(luò)

為了訓(xùn)練神經(jīng)網(wǎng)絡(luò),我們要提供一組標(biāo)記過(guò)的圖像數(shù)據(jù),然后比較這些輸入圖像與計(jì)算機(jī)預(yù)測(cè)的輸出標(biāo)簽或識(shí)別的測(cè)量值的差異以檢測(cè)算法模型的準(zhǔn)確率?;谏窠?jīng)網(wǎng)絡(luò)的深度學(xué)習(xí)會(huì)監(jiān)督它所犯的錯(cuò)誤(誤差),并通過(guò)修正它發(fā)現(xiàn)的圖像數(shù)據(jù)間的模式與差異來(lái)實(shí)現(xiàn)迭代與擬合。 其中,梯度下降法是一種減少神經(jīng)網(wǎng)絡(luò)誤差的數(shù)學(xué)方法,其中卷積神經(jīng)網(wǎng)絡(luò)是一種特殊類(lèi)型的神經(jīng)網(wǎng)絡(luò),通常用于計(jì)算機(jī)視覺(jué)應(yīng)用。

e21dab48-4f39-11eb-8b86-12bb97331649.png

X =輸入;a = 活化函數(shù);W = 卷積神經(jīng)網(wǎng)絡(luò)中的權(quán)重;J = 損失函數(shù);Alpha = 學(xué)習(xí)率;y = 地面真值;y = 預(yù)測(cè);k = 迭代次數(shù)

責(zé)任編輯:lq

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴

原文標(biāo)題:計(jì)算機(jī)視覺(jué):你必須了解的圖像數(shù)據(jù)底層技術(shù)

文章出處:【微信號(hào):Imgtec,微信公眾號(hào):Imagination Tech】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    自動(dòng)化計(jì)算機(jī)的功能與用途

    工業(yè)自動(dòng)化是指利用自動(dòng)化計(jì)算機(jī)來(lái)控制工業(yè)環(huán)境中的流程、機(jī)器人和機(jī)械,以制造產(chǎn)品或其部件。工業(yè)自動(dòng)化的目的是提高生產(chǎn)率、增加靈活性,并提升制造過(guò)程的質(zhì)量。工業(yè)自動(dòng)化在汽車(chē)制造中體現(xiàn)得最為明顯,其中許多
    的頭像 發(fā)表于 07-15 16:32 ?132次閱讀
    自動(dòng)化<b class='flag-5'>計(jì)算機(jī)</b>的功能與用途

    Arm KleidiCV與OpenCV集成助力移動(dòng)端計(jì)算機(jī)視覺(jué)性能優(yōu)化

    生成式及多模態(tài)人工智能 (AI) 工作負(fù)載的廣泛增長(zhǎng),推動(dòng)了對(duì)計(jì)算機(jī)視覺(jué) (CV) 技術(shù)日益高漲的需求。此類(lèi)技術(shù)能夠解釋并分析源自現(xiàn)實(shí)世界的視覺(jué)信息,并可應(yīng)用于人臉識(shí)別、照片分類(lèi)、濾鏡
    的頭像 發(fā)表于 02-24 10:15 ?570次閱讀

    NX CAD軟件:數(shù)字化工作流程解決方案(CAD工作流程)

    NXCAD——數(shù)字化工作流程解決方案(CAD工作流程)使用西門(mén)子領(lǐng)先的產(chǎn)品設(shè)計(jì)軟件NXCAD加速執(zhí)行基于工作流程的解決方案。我們?cè)诹私庑袠I(yè)需求方面累積了多年的經(jīng)驗(yàn),并據(jù)此針對(duì)各個(gè)行業(yè)的具體需求提供
    的頭像 發(fā)表于 02-06 18:15 ?443次閱讀
    NX CAD軟件:數(shù)字化<b class='flag-5'>工作流程</b>解決方案(CAD<b class='flag-5'>工作流程</b>)

    工業(yè)中使用哪種計(jì)算機(jī)?

    在工業(yè)環(huán)境中,工控機(jī)被廣泛使用。這些計(jì)算機(jī)的設(shè)計(jì)可承受極端溫度、灰塵和振動(dòng)等惡劣條件。它們比標(biāo)準(zhǔn)消費(fèi)類(lèi)計(jì)算機(jī)更耐用、更可靠。工業(yè)計(jì)算機(jī)可控制機(jī)器、監(jiān)控流程并實(shí)時(shí)收集數(shù)據(jù)。其堅(jiān)固的結(jié)構(gòu)和
    的頭像 發(fā)表于 11-29 14:07 ?715次閱讀
    工業(yè)中使用哪種<b class='flag-5'>計(jì)算機(jī)</b>?

    量子計(jì)算機(jī)與普通計(jì)算機(jī)工作原理的區(qū)別

    ? 本文介紹了量子計(jì)算機(jī)與普通計(jì)算機(jī)工作原理的區(qū)別。 量子計(jì)算是一個(gè)新興的研究領(lǐng)域,科學(xué)家們利用量子力學(xué),制造出具有革命性能力的計(jì)算機(jī)。雖然現(xiàn)在的量子
    的頭像 發(fā)表于 11-24 11:00 ?1499次閱讀
    量子<b class='flag-5'>計(jì)算機(jī)</b>與普通<b class='flag-5'>計(jì)算機(jī)工作</b>原理的區(qū)別

    【小白入門(mén)必看】一文讀懂深度學(xué)習(xí)計(jì)算機(jī)視覺(jué)技術(shù)及學(xué)習(xí)路線

    一、什么是計(jì)算機(jī)視覺(jué)?計(jì)算機(jī)視覺(jué),其實(shí)就是教機(jī)器怎么像我們?nèi)艘粯?,用攝像頭看看周?chē)氖澜?,然后理解它。比如說(shuō),它能認(rèn)出這是個(gè)蘋(píng)果,或者那邊有輛車(chē)。除此之外,還能把拍到的照片或者視頻轉(zhuǎn)換
    的頭像 發(fā)表于 10-31 17:00 ?1247次閱讀
    【小白入門(mén)必看】一文讀懂深度學(xué)習(xí)<b class='flag-5'>計(jì)算機(jī)</b><b class='flag-5'>視覺(jué)</b>技術(shù)及學(xué)習(xí)路線

    計(jì)算機(jī)存儲(chǔ)系統(tǒng)的工作原理和功能

    計(jì)算機(jī)存儲(chǔ)系統(tǒng)作為計(jì)算機(jī)系統(tǒng)中至關(guān)重要的組成部分,其原理和功能對(duì)于理解計(jì)算機(jī)的運(yùn)行機(jī)制具有關(guān)鍵意義。以下將詳細(xì)闡述計(jì)算機(jī)存儲(chǔ)系統(tǒng)的原理和功能。
    的頭像 發(fā)表于 09-26 16:42 ?2965次閱讀

    計(jì)算機(jī)系統(tǒng)的硬件組成和主要部件

    計(jì)算機(jī)系統(tǒng)的硬件組成是計(jì)算機(jī)運(yùn)行的基礎(chǔ),它包含了多個(gè)關(guān)鍵部件,這些部件相互協(xié)作,共同實(shí)現(xiàn)計(jì)算機(jī)的各種功能。
    的頭像 發(fā)表于 09-10 11:41 ?6926次閱讀

    簡(jiǎn)述計(jì)算機(jī)總線的分類(lèi)

    計(jì)算機(jī)總線作為計(jì)算機(jī)系統(tǒng)中連接各個(gè)功能部件的公共通信干線,其結(jié)構(gòu)和分類(lèi)對(duì)于理解計(jì)算機(jī)硬件系統(tǒng)的工作原理至關(guān)重要。以下是對(duì)計(jì)算機(jī)總線結(jié)構(gòu)和分類(lèi)
    的頭像 發(fā)表于 08-26 16:23 ?5186次閱讀

    晶體管計(jì)算機(jī)和電子管計(jì)算機(jī)有什么區(qū)別

    晶體管計(jì)算機(jī)和電子管計(jì)算機(jī)作為計(jì)算機(jī)發(fā)展史上的兩個(gè)重要階段,它們?cè)诙鄠€(gè)方面存在顯著的區(qū)別。以下是對(duì)這兩類(lèi)計(jì)算機(jī)在硬件、性能、應(yīng)用以及技術(shù)發(fā)展等方面區(qū)別的詳細(xì)闡述。
    的頭像 發(fā)表于 08-23 15:28 ?3622次閱讀

    計(jì)算機(jī)視覺(jué)有哪些優(yōu)缺點(diǎn)

    計(jì)算機(jī)視覺(jué)作為人工智能領(lǐng)域的一個(gè)重要分支,旨在使計(jì)算機(jī)能夠像人類(lèi)一樣理解和解釋圖像和視頻中的信息。這一技術(shù)的發(fā)展不僅推動(dòng)了多個(gè)行業(yè)的變革,也帶來(lái)了諸多優(yōu)勢(shì),但同時(shí)也伴隨著一些挑戰(zhàn)和局限性。以下是對(duì)
    的頭像 發(fā)表于 08-14 09:49 ?2053次閱讀

    計(jì)算機(jī)視覺(jué)中的圖像融合

    在許多計(jì)算機(jī)視覺(jué)應(yīng)用中(例如機(jī)器人運(yùn)動(dòng)和醫(yī)學(xué)成像),需要將多個(gè)圖像的相關(guān)信息整合到單一圖像中。這種圖像融合可以提供更高的可靠性、準(zhǔn)確性和數(shù)據(jù)質(zhì)量。多視圖融合可以提高圖像分辨率,并恢復(fù)場(chǎng)景的三維表示
    的頭像 發(fā)表于 08-01 08:28 ?1143次閱讀
    <b class='flag-5'>計(jì)算機(jī)</b><b class='flag-5'>視覺(jué)</b>中的圖像融合

    地平線科研論文入選國(guó)際計(jì)算機(jī)視覺(jué)頂會(huì)ECCV 2024

    近日,地平線兩篇論文入選國(guó)際計(jì)算機(jī)視覺(jué)頂會(huì)ECCV 2024,自動(dòng)駕駛算法技術(shù)再有新突破。
    的頭像 發(fā)表于 07-27 11:10 ?1466次閱讀
    地平線科研論文入選國(guó)際<b class='flag-5'>計(jì)算機(jī)</b><b class='flag-5'>視覺(jué)</b>頂會(huì)ECCV 2024

    DRAM在計(jì)算機(jī)中的應(yīng)用

    DRAM(Dynamic Random Access Memory,動(dòng)態(tài)隨機(jī)存取存儲(chǔ)器)在計(jì)算機(jī)系統(tǒng)中扮演著至關(guān)重要的角色。它是一種半導(dǎo)體存儲(chǔ)器,用于存儲(chǔ)和快速訪問(wèn)數(shù)據(jù),是計(jì)算機(jī)主內(nèi)存的主要組成部分。以下是對(duì)DRAM在
    的頭像 發(fā)表于 07-24 17:04 ?3018次閱讀

    計(jì)算機(jī)視覺(jué)技術(shù)的AI算法模型

    計(jì)算機(jī)視覺(jué)技術(shù)作為人工智能領(lǐng)域的一個(gè)重要分支,旨在使計(jì)算機(jī)能夠像人類(lèi)一樣理解和解釋圖像及視頻中的信息。為了實(shí)現(xiàn)這一目標(biāo),計(jì)算機(jī)視覺(jué)技術(shù)依賴(lài)于
    的頭像 發(fā)表于 07-24 12:46 ?1817次閱讀