電子發(fā)燒友網(wǎng)報(bào)道(文/李彎彎)計(jì)算機(jī)視覺(jué)技術(shù)最早開(kāi)始于20世紀(jì)60年代,其主要是模仿人類視覺(jué),讓計(jì)算機(jī)或機(jī)器人看到物體,到如今計(jì)算機(jī)視覺(jué)已經(jīng)取得很大進(jìn)展,不過(guò)就研究和開(kāi)發(fā)來(lái)說(shuō),它還有很大的探索空間。
當(dāng)今的計(jì)算機(jī)視覺(jué)的子領(lǐng)域大概可以包括:場(chǎng)景重建、目標(biāo)檢測(cè)、事件檢測(cè)、視頻跟蹤、目標(biāo)識(shí)別、3D姿態(tài)估計(jì)、運(yùn)動(dòng)估計(jì)、視覺(jué)伺服、3D場(chǎng)景建模、圖像修復(fù)等。
比如目標(biāo)檢測(cè),具有目標(biāo)檢測(cè)的設(shè)備可以找到目標(biāo),在其周圍畫出矩形邊界框,并確定每個(gè)被檢測(cè)目標(biāo)的類別,目標(biāo)檢測(cè)可以應(yīng)用于許多不同的行業(yè),包括零售、體育、醫(yī)療保健、營(yíng)銷、室內(nèi)設(shè)計(jì)、農(nóng)業(yè)、建筑、公共安全、交通等。
目標(biāo)檢測(cè)是一個(gè)復(fù)雜的過(guò)程,其實(shí)現(xiàn)需要經(jīng)歷一定的挑戰(zhàn),比如視角的多樣性、變形、遮擋、光照條件、雜亂或有紋理的背景、多樣性、速度等。具體來(lái)看,比如視角的多樣性,物體檢測(cè)的最大困難之一是從不同的角度看一個(gè)物體,可能看起來(lái)完全不同;
再比如照明對(duì)物體的定義有很大的影響,相同的物體會(huì)因光照條件的不同而看起來(lái)不同,可能照亮的空間越少,物體就越不可見(jiàn),這些都會(huì)影響檢測(cè)器定義目標(biāo)的能力;在視頻方面,探測(cè)器需要經(jīng)過(guò)訓(xùn)練,在不斷變化的環(huán)境中進(jìn)行分析,這意味著目標(biāo)檢測(cè)算法不僅必須準(zhǔn)確地分類重要的目標(biāo),而且還必須在預(yù)測(cè)過(guò)程中具有好的速度,能夠識(shí)別運(yùn)動(dòng)中的目標(biāo)。
從某種意義說(shuō),這幾年計(jì)算機(jī)視覺(jué)已經(jīng)進(jìn)入瓶頸期。以圖像分類、目標(biāo)檢測(cè)、圖像分割為代表的一些基礎(chǔ)技術(shù)經(jīng)過(guò)過(guò)去幾年的發(fā)展,精確度已經(jīng)達(dá)到產(chǎn)業(yè)落地水平,但剩下的一些問(wèn)題比較難攻克,如非常細(xì)粒度的分類,非常小和模糊的目標(biāo)檢測(cè)和分割,以及如何保證在復(fù)雜光照變化下的分割結(jié)果的穩(wěn)定性等。
可以說(shuō)過(guò)去幾年,計(jì)算機(jī)視覺(jué)技術(shù)一直在試圖攻克一些老的難題,如跨年齡、大姿態(tài)、有遮擋的人臉識(shí)別,有一定的進(jìn)展,卻不能算是有很大的突破。
在落地應(yīng)用方面,計(jì)算機(jī)視覺(jué)存在很大的同質(zhì)化問(wèn)題,很多公司扎堆在幾個(gè)熱門場(chǎng)景中,比如安防場(chǎng)景,智能安防是計(jì)算機(jī)視覺(jué)最主要的應(yīng)用場(chǎng)景,而且已經(jīng)持續(xù)很多年,目前來(lái)說(shuō),計(jì)算機(jī)視覺(jué)較為成熟的應(yīng)用場(chǎng)景也是安防領(lǐng)域。
大家熟知的AI初創(chuàng)企業(yè)商湯、曠視、依圖、云從等都在這個(gè)領(lǐng)域有重要布局,另外安防企業(yè)和互聯(lián)網(wǎng)企業(yè)也在這個(gè)領(lǐng)域投入很大力度,包括??低?/u>、大華、宇視、百度等,此外還包括幾百家中小計(jì)算機(jī)視覺(jué)企業(yè)。
不過(guò)除了安防,各企業(yè)也有在其他領(lǐng)域進(jìn)行探索,并逐漸有所進(jìn)展,比如金融、手機(jī)、汽車、工業(yè)、醫(yī)療、零售等領(lǐng)域,比如虹軟科技,在手機(jī)領(lǐng)域、筆記本電腦、智能可穿戴設(shè)備等移動(dòng)終端,以及智能駕駛領(lǐng)域都有布局,再比如格靈深瞳除了城市管理之外,在智慧金融、商業(yè)零售等方面都已經(jīng)取得一定成績(jī)。
整體而言,從上世紀(jì)60年代到現(xiàn)在計(jì)算機(jī)視覺(jué)技術(shù)已經(jīng)取得很大的進(jìn)展,不過(guò)其在實(shí)現(xiàn)上還存在一些難題,發(fā)展也遇到了一些瓶頸,而且在落地應(yīng)用上大多數(shù)企業(yè)扎堆在少數(shù)場(chǎng)景中,不過(guò)從近年來(lái)的情況來(lái)看,計(jì)算機(jī)視覺(jué)企業(yè)在技術(shù)和應(yīng)用上還在持續(xù)尋找突破,目前除了在安防領(lǐng)域應(yīng)用比較成熟以外,在金融、醫(yī)療、工業(yè)、智能駕駛等領(lǐng)域進(jìn)展明顯。
當(dāng)今的計(jì)算機(jī)視覺(jué)的子領(lǐng)域大概可以包括:場(chǎng)景重建、目標(biāo)檢測(cè)、事件檢測(cè)、視頻跟蹤、目標(biāo)識(shí)別、3D姿態(tài)估計(jì)、運(yùn)動(dòng)估計(jì)、視覺(jué)伺服、3D場(chǎng)景建模、圖像修復(fù)等。
比如目標(biāo)檢測(cè),具有目標(biāo)檢測(cè)的設(shè)備可以找到目標(biāo),在其周圍畫出矩形邊界框,并確定每個(gè)被檢測(cè)目標(biāo)的類別,目標(biāo)檢測(cè)可以應(yīng)用于許多不同的行業(yè),包括零售、體育、醫(yī)療保健、營(yíng)銷、室內(nèi)設(shè)計(jì)、農(nóng)業(yè)、建筑、公共安全、交通等。
目標(biāo)檢測(cè)是一個(gè)復(fù)雜的過(guò)程,其實(shí)現(xiàn)需要經(jīng)歷一定的挑戰(zhàn),比如視角的多樣性、變形、遮擋、光照條件、雜亂或有紋理的背景、多樣性、速度等。具體來(lái)看,比如視角的多樣性,物體檢測(cè)的最大困難之一是從不同的角度看一個(gè)物體,可能看起來(lái)完全不同;
再比如照明對(duì)物體的定義有很大的影響,相同的物體會(huì)因光照條件的不同而看起來(lái)不同,可能照亮的空間越少,物體就越不可見(jiàn),這些都會(huì)影響檢測(cè)器定義目標(biāo)的能力;在視頻方面,探測(cè)器需要經(jīng)過(guò)訓(xùn)練,在不斷變化的環(huán)境中進(jìn)行分析,這意味著目標(biāo)檢測(cè)算法不僅必須準(zhǔn)確地分類重要的目標(biāo),而且還必須在預(yù)測(cè)過(guò)程中具有好的速度,能夠識(shí)別運(yùn)動(dòng)中的目標(biāo)。
從某種意義說(shuō),這幾年計(jì)算機(jī)視覺(jué)已經(jīng)進(jìn)入瓶頸期。以圖像分類、目標(biāo)檢測(cè)、圖像分割為代表的一些基礎(chǔ)技術(shù)經(jīng)過(guò)過(guò)去幾年的發(fā)展,精確度已經(jīng)達(dá)到產(chǎn)業(yè)落地水平,但剩下的一些問(wèn)題比較難攻克,如非常細(xì)粒度的分類,非常小和模糊的目標(biāo)檢測(cè)和分割,以及如何保證在復(fù)雜光照變化下的分割結(jié)果的穩(wěn)定性等。
可以說(shuō)過(guò)去幾年,計(jì)算機(jī)視覺(jué)技術(shù)一直在試圖攻克一些老的難題,如跨年齡、大姿態(tài)、有遮擋的人臉識(shí)別,有一定的進(jìn)展,卻不能算是有很大的突破。
在落地應(yīng)用方面,計(jì)算機(jī)視覺(jué)存在很大的同質(zhì)化問(wèn)題,很多公司扎堆在幾個(gè)熱門場(chǎng)景中,比如安防場(chǎng)景,智能安防是計(jì)算機(jī)視覺(jué)最主要的應(yīng)用場(chǎng)景,而且已經(jīng)持續(xù)很多年,目前來(lái)說(shuō),計(jì)算機(jī)視覺(jué)較為成熟的應(yīng)用場(chǎng)景也是安防領(lǐng)域。
大家熟知的AI初創(chuàng)企業(yè)商湯、曠視、依圖、云從等都在這個(gè)領(lǐng)域有重要布局,另外安防企業(yè)和互聯(lián)網(wǎng)企業(yè)也在這個(gè)領(lǐng)域投入很大力度,包括??低?/u>、大華、宇視、百度等,此外還包括幾百家中小計(jì)算機(jī)視覺(jué)企業(yè)。
不過(guò)除了安防,各企業(yè)也有在其他領(lǐng)域進(jìn)行探索,并逐漸有所進(jìn)展,比如金融、手機(jī)、汽車、工業(yè)、醫(yī)療、零售等領(lǐng)域,比如虹軟科技,在手機(jī)領(lǐng)域、筆記本電腦、智能可穿戴設(shè)備等移動(dòng)終端,以及智能駕駛領(lǐng)域都有布局,再比如格靈深瞳除了城市管理之外,在智慧金融、商業(yè)零售等方面都已經(jīng)取得一定成績(jī)。
整體而言,從上世紀(jì)60年代到現(xiàn)在計(jì)算機(jī)視覺(jué)技術(shù)已經(jīng)取得很大的進(jìn)展,不過(guò)其在實(shí)現(xiàn)上還存在一些難題,發(fā)展也遇到了一些瓶頸,而且在落地應(yīng)用上大多數(shù)企業(yè)扎堆在少數(shù)場(chǎng)景中,不過(guò)從近年來(lái)的情況來(lái)看,計(jì)算機(jī)視覺(jué)企業(yè)在技術(shù)和應(yīng)用上還在持續(xù)尋找突破,目前除了在安防領(lǐng)域應(yīng)用比較成熟以外,在金融、醫(yī)療、工業(yè)、智能駕駛等領(lǐng)域進(jìn)展明顯。
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。
舉報(bào)投訴
-
機(jī)器人
+關(guān)注
關(guān)注
213文章
29756瀏覽量
213054 -
計(jì)算機(jī)
+關(guān)注
關(guān)注
19文章
7667瀏覽量
90868 -
AI
+關(guān)注
關(guān)注
88文章
35194瀏覽量
280319
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
熱點(diǎn)推薦
工業(yè)計(jì)算機(jī)如何設(shè)計(jì)用于沖擊和振動(dòng)
工業(yè)計(jì)算機(jī)是為挑戰(zhàn)消費(fèi)級(jí)系統(tǒng)耐用性的環(huán)境而構(gòu)建的。在制造業(yè)、運(yùn)輸業(yè)、國(guó)防和采礦業(yè)等領(lǐng)域,計(jì)算機(jī)面臨著持續(xù)的沖擊、振動(dòng)和其他物理壓力。設(shè)計(jì)這些系統(tǒng)以在這種條件下保持可靠需要卓越的工程和創(chuàng)

Arm KleidiCV與OpenCV集成助力移動(dòng)端計(jì)算機(jī)視覺(jué)性能優(yōu)化
生成式及多模態(tài)人工智能 (AI) 工作負(fù)載的廣泛增長(zhǎng),推動(dòng)了對(duì)計(jì)算機(jī)視覺(jué) (CV) 技術(shù)日益高漲的需求。此類技術(shù)能夠解釋并分析源自現(xiàn)實(shí)世界的視覺(jué)
AR和VR中的計(jì)算機(jī)視覺(jué)
):計(jì)算機(jī)視覺(jué)引領(lǐng)混合現(xiàn)實(shí)體驗(yàn)增強(qiáng)現(xiàn)實(shí)(AR)和虛擬現(xiàn)實(shí)(VR)正在徹底改變我們與外部世界的互動(dòng)方式。即便是在引人入勝的沉浸式

量子計(jì)算機(jī)與普通計(jì)算機(jī)工作原理的區(qū)別
? 本文介紹了量子計(jì)算機(jī)與普通計(jì)算機(jī)工作原理的區(qū)別。 量子計(jì)算是一個(gè)新興的研究領(lǐng)域,科學(xué)家們利用量子力學(xué),制造出具有革命性能力的計(jì)算機(jī)。雖然現(xiàn)在的量子

機(jī)器視覺(jué)要面臨的挑戰(zhàn)及其解決方法
機(jī)器視覺(jué)是指使用計(jì)算機(jī)和圖像處理技術(shù)從圖像中提取信息,并將其轉(zhuǎn)換為機(jī)器可理解的格式。這種方法已經(jīng)被廣泛應(yīng)用于自動(dòng)化生產(chǎn)、質(zhì)量控制、測(cè)量和檢測(cè)等領(lǐng)域。然而,機(jī)器視覺(jué)仍然
【小白入門必看】一文讀懂深度學(xué)習(xí)計(jì)算機(jī)視覺(jué)技術(shù)及學(xué)習(xí)路線
一、什么是計(jì)算機(jī)視覺(jué)?計(jì)算機(jī)視覺(jué),其實(shí)就是教機(jī)器怎么像我們?nèi)艘粯?,用攝像頭看看周圍的世界,然后理解它。比如說(shuō),它能認(rèn)出這是個(gè)蘋果,或者那邊有輛車。除此之外,還能把拍到的照片或者視頻轉(zhuǎn)換

計(jì)算機(jī)接口位于什么之間
計(jì)算機(jī)接口是計(jì)算機(jī)硬件和軟件之間、計(jì)算機(jī)與外部設(shè)備之間以及計(jì)算機(jī)各部件之間傳輸數(shù)據(jù)、控制信息和狀態(tài)信息的硬件設(shè)備和軟件程序。它在計(jì)算機(jī)系統(tǒng)中
計(jì)算機(jī)局域網(wǎng)技術(shù)是什么
計(jì)算機(jī)局域網(wǎng)(Local Area Network,LAN)技術(shù)是指在較小的地理范圍內(nèi)(如一所學(xué)校、一個(gè)公司或一棟大樓內(nèi)),將各種計(jì)算機(jī)、外部設(shè)備和數(shù)據(jù)庫(kù)系統(tǒng)等通過(guò)特定的連接介質(zhì)(如有線電纜、光纖或
初創(chuàng)公司SEA.AI利用NVIDIA邊緣AI和計(jì)算機(jī)視覺(jué)技術(shù)變革航海安全系統(tǒng)
總部位于奧地利林茨的初創(chuàng)公司正在利用 NVIDIA 邊緣 AI 和計(jì)算機(jī)視覺(jué)技術(shù)變革航海安全系統(tǒng),讓每一次出海變得更安全。
晶體管計(jì)算機(jī)和電子管計(jì)算機(jī)有什么區(qū)別
晶體管計(jì)算機(jī)和電子管計(jì)算機(jī)作為計(jì)算機(jī)發(fā)展史上的兩個(gè)重要階段,它們?cè)诙鄠€(gè)方面存在顯著的區(qū)別。以下是對(duì)這兩類計(jì)算機(jī)在硬件、性能、應(yīng)用以及技術(shù)發(fā)展
晶體管計(jì)算機(jī)的誕生和特點(diǎn)
晶體管計(jì)算機(jī)的誕生標(biāo)志著計(jì)算機(jī)技術(shù)的一個(gè)重要里程碑,它不僅推動(dòng)了計(jì)算機(jī)硬件的革新,還促進(jìn)了計(jì)算機(jī)軟件技術(shù)的發(fā)展。以下是對(duì)晶體管計(jì)算機(jī)誕生及其
計(jì)算機(jī)視覺(jué)有哪些優(yōu)缺點(diǎn)
計(jì)算機(jī)視覺(jué)作為人工智能領(lǐng)域的一個(gè)重要分支,旨在使計(jì)算機(jī)能夠像人類一樣理解和解釋圖像和視頻中的信息。這一技術(shù)的發(fā)展不僅推動(dòng)了多個(gè)行業(yè)的變革,也帶來(lái)了諸多優(yōu)勢(shì),但同時(shí)也伴隨著一些
計(jì)算機(jī)視覺(jué)中的圖像融合
在許多計(jì)算機(jī)視覺(jué)應(yīng)用中(例如機(jī)器人運(yùn)動(dòng)和醫(yī)學(xué)成像),需要將多個(gè)圖像的相關(guān)信息整合到單一圖像中。這種圖像融合可以提供更高的可靠性、準(zhǔn)確性和數(shù)據(jù)質(zhì)量。多視圖融合可以提高圖像分辨率,并恢復(fù)場(chǎng)景的三維表示

地平線科研論文入選國(guó)際計(jì)算機(jī)視覺(jué)頂會(huì)ECCV 2024
近日,地平線兩篇論文入選國(guó)際計(jì)算機(jī)視覺(jué)頂會(huì)ECCV 2024,自動(dòng)駕駛算法技術(shù)再有新突破。

計(jì)算機(jī)視覺(jué)技術(shù)的AI算法模型
計(jì)算機(jī)視覺(jué)技術(shù)作為人工智能領(lǐng)域的一個(gè)重要分支,旨在使計(jì)算機(jī)能夠像人類一樣理解和解釋圖像及視頻中的信息。為了實(shí)現(xiàn)這一目標(biāo),計(jì)算機(jī)
評(píng)論