(文章來源:神小無)
自從人工智能誕生之初,計算機科學(xué)家就一直夢想著能制造出可以像人類一樣看到和理解世界的機器。這些努力導(dǎo)致了計算機視覺的出現(xiàn)。計算機視覺是AI和計算機科學(xué)的領(lǐng)域,致力于處理視覺數(shù)據(jù)的內(nèi)容。近年來,由于深度學(xué)習(xí)和人工神經(jīng)網(wǎng)絡(luò)的進步,計算機視覺取得了巨大飛躍。深度學(xué)習(xí)是AI的一個分支,特別擅長處理圖像和視頻等非結(jié)構(gòu)化數(shù)據(jù)。這些技術(shù)上的進步,在現(xiàn)有領(lǐng)域中極大促進了計算機視覺的應(yīng)用,并將其引入新領(lǐng)域?,F(xiàn)如今,計算機視覺算法已成為我們每天使用的應(yīng)用中非常重要的組成部分。
關(guān)于計算機視覺,盡管它已經(jīng)取得了巨大的進步,但它暫時還不能完全像人類一樣理解照片和視頻。深層神經(jīng)網(wǎng)絡(luò)是計算機視覺系統(tǒng)的基礎(chǔ),非常擅長在像素級別匹配模式。它們在分類圖像和定位圖像中的對象方面特別有效。但是,當(dāng)要理解視覺數(shù)據(jù)的上下文,并描述不同對象之間的關(guān)系時,它們卻效果慘淡。
計算機視覺取得巨大進步的領(lǐng)域之一是圖像分類和物體檢測。經(jīng)過足夠多的標記數(shù)據(jù)訓(xùn)練而出的神經(jīng)網(wǎng)絡(luò),將能夠以驚人的精度檢測并標記出各種物體。很少有公司能與Google龐大的用戶數(shù)據(jù)存儲相匹配。該公司一直在使用其幾乎無限多(并且正在不斷增長)的用戶數(shù)據(jù)存儲庫來開發(fā)一些最高效的AI模型。當(dāng)用戶在Google相冊中上傳照片時,它會使用其計算機視覺算法對場景,物體和人物的內(nèi)容信息進行注釋。然后,用戶可以根據(jù)此信息搜索照片。例如,如果用戶搜索“狗”,則Google會自動返回相簿中包含狗的所有照片。
但是,Google的圖像識別效果并不理想。在一次事件中,計算機視覺算法錯誤地將兩張皮膚黝黑的人的照片標記為``大猩猩'',這給該公司帶來了極大的尷尬。
現(xiàn)在,有很多公司正在使用機器學(xué)習(xí)來自動增強照片的質(zhì)量,例如白平衡并添加效果,模糊背景等等。智能計算機變焦是計算機視覺技術(shù)的一大進步。傳統(tǒng)的縮放功能通常會使圖像模糊,因為它們通過在像素之間進行插值來填充放大的區(qū)域?;谟嬎銠C視覺的縮放不是放大像素,而是著重于邊緣,圖案等功能。這種方法可產(chǎn)生清晰的圖像。許多初創(chuàng)公司和歷史悠久的圖形公司已轉(zhuǎn)向深度學(xué)習(xí)來增強圖像和視頻。
直到不久前,面部識別技術(shù)還是一項笨拙且昂貴的技術(shù)。但是近年來,由于計算機視覺算法的進步,面部識別已進入各種智能計算設(shè)備。智能手機引入了FaceID,這是一種身份驗證系統(tǒng),該系統(tǒng)使用設(shè)備上的神經(jīng)網(wǎng)絡(luò)在看到擁有者的臉部時將手機解鎖。
在設(shè)置過程中,F(xiàn)aceID在所有者的臉上訓(xùn)練其AI模型,并在不同的光照條件,面部毛發(fā),理發(fā),帽子和眼鏡下正常工作。在我國,許多商店現(xiàn)在都在使用面部識別技術(shù)為顧客提供更順暢的付款體驗。客戶無需使用信用卡或移動支付應(yīng)用程序,而只需要向配備了計算機視覺的相機展示自己的臉即可。
隨著物聯(lián)網(wǎng)(IoT)的蓬勃發(fā)展,連接互聯(lián)網(wǎng)的家庭安全攝像頭日益普及?,F(xiàn)在,用戶可以隨時輕松地安裝監(jiān)控攝像頭并在線監(jiān)視房屋。每個攝像頭都會向云端發(fā)送大量數(shù)據(jù)。但是安全攝像機記錄的大多數(shù)鏡頭都是無關(guān)緊要的信息,從而導(dǎo)致大量的網(wǎng)絡(luò)、存儲和電力資源浪費。
計算機視覺算法可以使家庭安全攝像頭在使用這些資源時變得更加高效。通常情況下,智能攝像頭會保持空閑狀態(tài),直到它們在視頻源中檢測到物體或物體移動,然后它們才開始將數(shù)據(jù)發(fā)送到云端或向攝像頭所有者發(fā)送警報。但是目前,計算機視覺仍然不能很好地理解上下文環(huán)境。因此,不要指望它能在良性運動(例如,球在房間內(nèi)滾動)和需要注意的事物(例如,小偷闖入房屋)之間區(qū)分開來。
在過去的幾年中,增強現(xiàn)實已經(jīng)成為一個不斷增長的市場。AR的大部分擴展歸功于計算機視覺算法的發(fā)展。AR應(yīng)用程序使用機器學(xué)習(xí)來檢測和跟蹤目標位置和放置虛擬對象。你可以在很多應(yīng)用中看到AR和計算機視覺的結(jié)合。
利用計算機視覺,你可以通過手機攝像頭從現(xiàn)實世界中提取信息。它可以使用計算機視覺算法執(zhí)行各種任務(wù),例如讀取名片,檢測家具和衣服的風(fēng)格,翻譯路牌以及將手機連接到基于路由器的wi-fi網(wǎng)絡(luò)。由于深度學(xué)習(xí)的進步,計算機視覺現(xiàn)在可以解決以前很難解決甚至計算機無法解決的問題。在某些情況下,訓(xùn)練有素的計算機視覺算法可以與經(jīng)驗豐富的工作人員相媲美。
在深度學(xué)習(xí)之前,創(chuàng)建可以處理醫(yī)學(xué)圖像的計算機視覺算法需要軟件工程師和相關(guān)專家付出大量的努力。他們必須合作開發(fā)從放射影像中提取相關(guān)特征的代碼,然后對其進行檢查以進行診斷。深度學(xué)習(xí)算法提供了端到端的解決方案,使該過程變得非常容易。計算機視覺已進入許多醫(yī)學(xué)領(lǐng)域,包括癌癥檢測和預(yù)測、放射學(xué)、糖尿病性視網(wǎng)膜病變。一些AI研究人員甚至說深度學(xué)習(xí)將很快取代放射科醫(yī)生。不過,不要忘了深度學(xué)習(xí)是從像素中提取信息的,所以它不能復(fù)制人類醫(yī)生的所有功能。
教計算機玩游戲一直是AI研究的熱門領(lǐng)域。大多數(shù)游戲程序都使用強化學(xué)習(xí),這是一種AI技術(shù),可以通過反復(fù)試驗來發(fā)展其行為。計算機視覺算法在幫助這些程序解析游戲圖形內(nèi)容方面發(fā)揮著重要作用。但是要注意的一件事是,在許多情況下,圖形會被“簡化”或簡化,以使神經(jīng)網(wǎng)絡(luò)更容易理解它們。此外,目前AI算法需要大量數(shù)據(jù)才能學(xué)習(xí)游戲。例如,OpenAI玩Dota的AI必須經(jīng)歷45,000年的游戲時間才能達到冠軍水平。
2016年,亞馬遜推出了Go,這是一家無人商店,顧客可以走進商店,拿起想要的東西,然后走出去。Go使用各種人工智能系統(tǒng)來消除對收銀員的需求。當(dāng)顧客在商店中走動時,配備了高級計算機視覺算法的攝像頭會監(jiān)控他們的行為,并跟蹤他們拾取或返回貨架的物品。當(dāng)他們離開商店時,他們的購物車會自動從他們的Amazon帳戶中結(jié)賬。
在沒有人類駕駛員的情況下可以在道路上行駛的汽車,一直是AI社區(qū)最長的夢想和最大的挑戰(zhàn)之一。在今天,我們距離能在各種光照和天氣條件下,在道路上任意行駛的自動駕駛汽車這個夢想還很遙遠。但是,由于深度神經(jīng)網(wǎng)絡(luò)的進步,我們?nèi)〉昧嗽S多進步。打造無人駕駛汽車的最大挑戰(zhàn)之一是使他們能夠了解周圍的環(huán)境。
盡管不同的公司以各種方式解決該問題,但它們之間不變的一件事是計算機視覺技術(shù)。車輛周圍安裝的攝像頭可監(jiān)控汽車的環(huán)境。深度神經(jīng)網(wǎng)絡(luò)解析鏡頭并提取有關(guān)周圍物體和人物的信息。該信息與來自其他設(shè)備(如激光雷達)的數(shù)據(jù)相結(jié)合,以創(chuàng)建該區(qū)域的地圖,并幫助汽車在道路上行駛并避免碰撞。
隨著“新基建”風(fēng)口的到來,在5G、物聯(lián)網(wǎng)傳感器、具有AI功能的智能攝像頭和邊緣計算的推動下,計算機視覺領(lǐng)域?qū)⒂瓉砜焖俦l(fā)。鈦靈AI市場是由Google AI技術(shù)推廣伙伴Gravitylink打造的全球化AI算法和解決方案交易市場,致力于幫助來自全球的優(yōu)秀AI解決方案與需求方建立更加高效的直接連接,加速AI技術(shù)在各個領(lǐng)域的落地和應(yīng)用。
(責(zé)任編輯:fqj)
-
AI
+關(guān)注
關(guān)注
88文章
35164瀏覽量
280025 -
面部識別
+關(guān)注
關(guān)注
1文章
375瀏覽量
27220
發(fā)布評論請先 登錄
基于LockAI視覺識別模塊:C++人臉識別


人臉識別門禁攝像機,無感通行人到門開,門禁考勤一體,支持考勤報表導(dǎo)出!#人臉識別#四維慧眼#人臉識別攝像機
【幸狐Omni3576邊緣計算套件試用體驗】人臉識別
人臉識別技術(shù)在智能家居中的應(yīng)用有哪些
人臉識別技術(shù)的優(yōu)勢與劣勢
人臉識別技術(shù)的算法原理解析
人臉識別技術(shù)在安全監(jiān)控中的應(yīng)用
人臉識別技術(shù)的應(yīng)用場景
隧道門禁人臉識別系統(tǒng)是專為隧道安全管理設(shè)計的先進技術(shù)系統(tǒng)

深度識別人臉識別有什么重要作用嗎
深度識別人臉識別在任務(wù)中為什么有很強大的建模能力
隧道人臉識別門禁系統(tǒng)應(yīng)用于隧道工程等場所的智能化安全管理系統(tǒng)

評論