一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

計算機視覺的概念、工作原理及行業(yè)用例

NVIDIA英偉達 ? 來源:NVIDIA英偉達 ? 作者:NVIDIA英偉達 ? 2022-04-29 14:00 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

計算機視覺是一個研究領域,旨在助力計算機使用復雜算法(可以是傳統(tǒng)算法,也可以是基于深度學習的算法)來理解數(shù)字圖像和視頻并提取有用的信息。

什么是計算機視覺?

計算機視覺的主要目標是,先理解視頻和靜止圖像的內(nèi)容,然后從中收集有用的信息,以便解決越來越多的問題。作為人工智能 (AI) 和深度學習的子領域,計算機視覺可訓練卷積神經(jīng)網(wǎng)絡(CNN),以便針對各種應用場合開發(fā)仿人類視覺功能。計算機視覺包括對 CNN 進行特定訓練,以便利用圖像和視頻進行數(shù)據(jù)分割、分類和檢測。

9d4da8d6-c6e0-11ec-bce3-dac502259ad0.png

卷積神經(jīng)網(wǎng)絡 (CNN) 能夠針對多種應用場合執(zhí)行分割、分類和檢測:

分割:圖像分割是指將像素歸類為特定類別,如汽車、道路或行人。它廣泛用于自動駕駛汽車應用(包括 NVIDIA DRIVE 軟件堆棧),用于顯示道路、汽車和人員。您可以將其想象成一種可視化技術,該技術能夠使人們更容易理解計算機的工作。

分類:圖像分類用于確定圖像中的內(nèi)容。例如,神經(jīng)網(wǎng)絡經(jīng)過訓練后能夠識別狗或貓,或者許多其他東西,并且具有高精確度。

檢測:通過圖像檢測,計算機可以定位對象的位置。在許多應用中,CNN 會在相關區(qū)域周圍設置矩形邊界框,將對象完全包含在內(nèi)。檢測器也可以接受訓練,以便檢測圖像中汽車或人員的位置。

分割、分類和檢測

分割 分類 檢測
非常適合用于描述對象 是貓還是狗? 它存在于空間中的什么位置?
在自動駕駛汽車中使用 精確分類 識別關乎安全的事物

計算機視覺為何重要?

在體育、汽車、農(nóng)業(yè)、零售、銀行、施工和保險等行業(yè),計算機視覺應用非常廣泛。得益于目前機器用于識別物體的圖像處理器 – 卷積神經(jīng)網(wǎng)絡 (CNN) ,各種由 AI 驅(qū)動的機器紛紛開始采用仿人眼技術來獲得更多助力。CNN 已成為當今自動駕駛汽車、石油勘探和聚變能源研究領域的“眼睛”。它們還有助于在醫(yī)學成像領域快速發(fā)現(xiàn)疾病并挽救生命。

數(shù)十年來,傳統(tǒng)的計算機視覺和圖像處理技術已經(jīng)應用于眾多應用和研究工作。然而,現(xiàn)代 AI 技術采用人工神經(jīng)網(wǎng)絡,能夠?qū)崿F(xiàn)更高的性能準確性;高性能計算依托 GPU 取得長足進步,實現(xiàn)超人的準確性,從而在運輸、零售、制造、醫(yī)療健康和金融服務等行業(yè)廣泛應用。

在將圖像和視頻分類為精細離散的類別和分類方面,如同醫(yī)學計算機軸向斷層掃描或 CAT 掃描中隨時間推移而產(chǎn)生的微小變化,傳統(tǒng)或基于 AI 的計算機視覺系統(tǒng)遠勝于人類。在這個意義上,計算機視覺將人類有可能完成的任務自動化,但其準確性和速度要高得多。

當前和潛在的應用多種多樣,因此計算機視覺技術和解決方案的增長預測相當驚人,這點不足為奇。一項市場調(diào)研表明,到 2023 年,該市場將以驚人的 47% 的年增長率增長,屆時將在全球達到 250 億美元。在整個計算機科學范疇內(nèi),計算機視覺是熱門、活躍的研發(fā)領域之一。

計算機視覺的工作原理是什么?

計算機視覺分析圖像,然后使用卷積神經(jīng)網(wǎng)絡 (CNN)創(chuàng)建其 “所見” 的數(shù)值表示。CNN 是一類人工神經(jīng)網(wǎng)絡,使用卷積層從輸入中篩選出有用信息。卷積運算需要綜合使用輸入數(shù)據(jù)(特征圖)與卷積內(nèi)核(濾波器),以便生成轉(zhuǎn)換后的特征圖。卷積層濾波器可根據(jù)學習參數(shù)進行修改,以便為特定任務提取最有用的信息。卷積網(wǎng)絡可根據(jù)任務自動調(diào)整,尋找最重要的特征。在執(zhí)行一般的物體識別任務時,CNN 會過濾物體的形狀信息;但在進行識別鳥的任務時,CNN 則會提取鳥的顏色信息。這是由于 CNN 認為,不同類的物體會具有不同的形狀,而對于不同類型的鳥而言,其顏色可能要比形狀的差異性更大。

9d71af88-c6e0-11ec-bce3-dac502259ad0.png

計算機視覺的行業(yè)用例

計算機視覺用例包括圖像識別、圖像分類、視頻標記和虛擬助手。計算機視覺領域中更加流行和突出的用例包括:

醫(yī)學。

醫(yī)學圖像處理需要快速提取重要的圖像數(shù)據(jù)以便對患者進行正確診斷,包括快速檢測腫瘤和動脈硬化。雖然計算機視覺本身無法提供診斷,但它是現(xiàn)代醫(yī)療診斷技術中寶貴的一部分,可以更大程度地弱化醫(yī)生的想法,并且為醫(yī)生提供越來越多的原本無法看到的信息。

自動駕駛汽車。

另一個非常活躍的計算機視覺調(diào)研領域,自動駕駛車輛可以完全由計算機視覺解決方案接管,或者其操作可以得到顯著增強。目前已有的常用應用包括汽車中的早期警報系統(tǒng)。

行業(yè)用途。

制造業(yè)中有很多計算機視覺解決方案的當前和潛在用途,以支持制造流程。目前的用途包括質(zhì)量控制,其中計算機視覺系統(tǒng)會檢查部件和產(chǎn)品成品是否有缺陷。在農(nóng)業(yè)領域,計算機視覺系統(tǒng)使用光學分揀去除食品中不需要的材質(zhì)。

數(shù)據(jù)科學家和計算機視覺

Python機器學習 (ML) 領域的熱門編程語言,許多數(shù)據(jù)科學家都熟悉其易用性及其大型庫(其中大多數(shù)庫都是免費和開源的)。數(shù)據(jù)科學家在 ML 系統(tǒng)中使用 Python 進行數(shù)據(jù)挖掘和數(shù)據(jù)分析,因為 Python 支持各種 ML 模型和算法。鑒于 ML 和計算機視覺之間的關系,數(shù)據(jù)科學家可以利用計算機視覺應用向各類企業(yè)的擴展,從圖像和視頻存儲中提取重要信息,增強數(shù)據(jù)驅(qū)動的決策制定。

借助 GPU 加速卷積神經(jīng)網(wǎng)絡

在架構方面,CPU 僅由幾個具有大緩存內(nèi)存的核心組成,一次只可以處理幾個軟件線程。相比之下,GPU 由數(shù)百個核心組成,可以同時處理數(shù)千個線程。

9d8b3980-c6e0-11ec-bce3-dac502259ad0.jpg

由于神經(jīng)網(wǎng)絡由大量相同的神經(jīng)元構建而成,因此本質(zhì)上具有高度并行性。這種并行性自然地會映射到 GPU ,能夠提供數(shù)據(jù)并行的算術架構,并且相比僅限 CPU 的訓練,計算速度大幅增加。這種類型的架構對一系列圖像數(shù)據(jù)執(zhí)行類似的計算。GPU 的單指令多數(shù)據(jù) (SIMD) 功能使其適合運行計算機視覺任務,這些任務通常涉及對整個圖像進行類似的計算。具體而言,NVIDIA GPU 可顯著加速計算機視覺操作,為其他工作釋放 CPU 。此外,在同一臺機器上可以使用多個 GPU ,創(chuàng)建能夠并行運行多個計算機視覺算法的架構。

NVIDIA GPU 加速的深度學習框架

GPU 加速深度學習框架為 Python 等常用編程語言提供編程接口。其還具備輕松創(chuàng)建和探索自定義 CNN 和 DNN 的靈活性,同時能夠?qū)崿F(xiàn)實驗和工業(yè)部署所需的超高速度。NVIDIA CUDA-X AI 能夠加快 Caffe 、Microsoft Cognitive Toolkit (CNTK) 、TensorFlow 、Theano 和 Torch 等廣泛使用的深度學習框架以及眾多其他機器學習應用的運行速度。深度學習框架在 GPU 上的運行速度更快,并可以在單節(jié)點內(nèi)的多個 GPU 間擴展。要將框架與 GPU 一起用于卷積神經(jīng)網(wǎng)絡的訓練和推理過程,NVIDIA 分別提供 cuDNN 和 TensorRT 。cuDNN 和 TensorRT 可為卷積層、池化層、歸一化和激活層等標準例程實現(xiàn)高度調(diào)整。

單擊此處查看 NVCaffe 安裝步驟和使用指南??稍诖颂幷业骄矸e神經(jīng)網(wǎng)絡 C++/CUDA 快速實施。

為快速開發(fā)和部署視覺模型,NVIDIA 向視覺 AI 開發(fā)者提供 DeepStream SDK 。其中包含 TAO 工具包,可用于為計算機視覺領域創(chuàng)建準確高效的 AI 模型。

9da2bbdc-c6e0-11ec-bce3-dac502259ad0.png

NVIDIA GPU 加速的端到端數(shù)據(jù)科學

建立在 CUDA 基礎上的 NVIDIA RAPIDS開源軟件庫套件使您能夠完全在 GPU 上執(zhí)行端到端數(shù)據(jù)科學和分析流程,同時仍然使用 Pandas 和 Scikit-Learn API 等熟悉的界面。

9dc12aa4-c6e0-11ec-bce3-dac502259ad0.png

原文標題:NVIDIA 大講堂 | 什么是計算機視覺?

文章出處:【微信公眾號:NVIDIA英偉達】歡迎添加關注!文章轉(zhuǎn)載請注明出處。

審核編輯:湯梓紅
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • NVIDIA
    +關注

    關注

    14

    文章

    5299

    瀏覽量

    106304
  • gpu
    gpu
    +關注

    關注

    28

    文章

    4937

    瀏覽量

    131180
  • 計算機視覺
    +關注

    關注

    9

    文章

    1708

    瀏覽量

    46760

原文標題:NVIDIA 大講堂 | 什么是計算機視覺?

文章出處:【微信號:NVIDIA_China,微信公眾號:NVIDIA英偉達】歡迎添加關注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    Arm KleidiCV與OpenCV集成助力移動端計算機視覺性能優(yōu)化

    生成式及多模態(tài)人工智能 (AI) 工作負載的廣泛增長,推動了對計算機視覺 (CV) 技術日益高漲的需求。此類技術能夠解釋并分析源自現(xiàn)實世界的視覺信息,并可應用于人臉識別、照片分類、濾鏡
    的頭像 發(fā)表于 02-24 10:15 ?558次閱讀

    量子計算機與普通計算機工作原理的區(qū)別

    ? 本文介紹了量子計算機與普通計算機工作原理的區(qū)別。 量子計算是一個新興的研究領域,科學家們利用量子力學,制造出具有革命性能力的計算機。雖然現(xiàn)在的量子
    的頭像 發(fā)表于 11-24 11:00 ?1461次閱讀
    量子<b class='flag-5'>計算機</b>與普通<b class='flag-5'>計算機工作原理</b>的區(qū)別

    【小白入門必看】一文讀懂深度學習計算機視覺技術及學習路線

    一、什么是計算機視覺計算機視覺,其實就是教機器怎么像我們?nèi)艘粯樱?b class='flag-5'>用攝像頭看看周圍的世界,然后理解它。比如說,它能認出這是個蘋果,或者那邊有
    的頭像 發(fā)表于 10-31 17:00 ?1215次閱讀
    【小白入門必看】一文讀懂深度學習<b class='flag-5'>計算機</b><b class='flag-5'>視覺</b>技術及學習路線

    云端超級計算機怎么

    云端超級計算機是一種基于云計算的高性能計算服務,它將大量計算資源和存儲資源集中在一起,通過網(wǎng)絡向用戶提供按需的計算服務。
    的頭像 發(fā)表于 10-18 10:14 ?478次閱讀

    信號繼電器在計算機系統(tǒng)中的應用

    信號繼電器在計算機系統(tǒng)中的應用是一個重要且復雜的領域,它作為電氣控制的關鍵元件,在計算機系統(tǒng)中發(fā)揮著信號轉(zhuǎn)換、隔離、放大以及控制等多種作用。以下將從信號繼電器的基本概念、工作原理、特性
    的頭像 發(fā)表于 09-27 16:29 ?925次閱讀

    計算機存儲系統(tǒng)的工作原理和功能

    計算機存儲系統(tǒng)作為計算機系統(tǒng)中至關重要的組成部分,其原理和功能對于理解計算機的運行機制具有關鍵意義。以下將詳細闡述計算機存儲系統(tǒng)的原理和功能。
    的頭像 發(fā)表于 09-26 16:42 ?2931次閱讀

    計算機進行程序控制工作的基本原理是怎樣的

    計算機程序控制是計算機科學中的一個核心概念,它涉及到計算機如何根據(jù)預設的指令序列執(zhí)行任務。 1. 計算機硬件基礎 在深入程序控制之前,我們需
    的頭像 發(fā)表于 09-04 16:57 ?1520次閱讀

    簡述計算機總線的分類

    計算機總線作為計算機系統(tǒng)中連接各個功能部件的公共通信干線,其結構和分類對于理解計算機硬件系統(tǒng)的工作原理至關重要。以下是對計算機總線結構和分類
    的頭像 發(fā)表于 08-26 16:23 ?5151次閱讀

    微處理器如何控制計算機系統(tǒng)

    微處理器,作為計算機系統(tǒng)的核心部件,承擔著控制整個計算機系統(tǒng)運行的重要任務。它不僅是計算機的運算中心,還是控制中心,負責執(zhí)行程序指令、處理數(shù)據(jù)以及協(xié)調(diào)計算機各部件之間的
    的頭像 發(fā)表于 08-22 14:21 ?972次閱讀

    計算機視覺有哪些優(yōu)缺點

    計算機視覺作為人工智能領域的一個重要分支,旨在使計算機能夠像人類一樣理解和解釋圖像和視頻中的信息。這一技術的發(fā)展不僅推動了多個行業(yè)的變革,也帶來了諸多優(yōu)勢,但同時也伴隨著一些挑戰(zhàn)和局限
    的頭像 發(fā)表于 08-14 09:49 ?2025次閱讀

    圖像處理器與計算機視覺有什么關系和區(qū)別

    圖像處理器與計算機視覺是兩個在圖像處理領域緊密相連但又有所區(qū)別的概念。它們之間的關系和區(qū)別可以從多個維度進行探討。
    的頭像 發(fā)表于 08-14 09:36 ?1040次閱讀

    邊沿觸發(fā)器在計算機中的應用

    邊沿觸發(fā)器在計算機中的應用極為廣泛,它們作為數(shù)字電路中的基本單元,對于實現(xiàn)計算機內(nèi)部的時序控制、數(shù)據(jù)存儲與傳輸、以及復雜邏輯功能等方面起著至關重要的作用。以下將從邊沿觸發(fā)器的定義、特點、工作原理及其在
    的頭像 發(fā)表于 08-12 14:20 ?1277次閱讀

    計算機系統(tǒng)的組成和功能

    計算機系統(tǒng)是一個復雜而龐大的概念,它涵蓋了計算機硬件、軟件以及它們之間相互作用的所有元素。為了全面而深入地探討計算機系統(tǒng),本文將從定義、組成、功能、發(fā)展歷程以及未來趨勢等方面進行詳細闡
    的頭像 發(fā)表于 07-24 17:41 ?2379次閱讀

    計算機視覺技術的AI算法模型

    計算機視覺技術作為人工智能領域的一個重要分支,旨在使計算機能夠像人類一樣理解和解釋圖像及視頻中的信息。為了實現(xiàn)這一目標,計算機視覺技術依賴于
    的頭像 發(fā)表于 07-24 12:46 ?1788次閱讀

    機器視覺計算機視覺有什么區(qū)別

    機器視覺計算機視覺是兩個密切相關但又有所區(qū)別的概念。 一、定義 機器視覺 機器視覺,又稱為
    的頭像 發(fā)表于 07-16 10:23 ?1154次閱讀