一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

計(jì)算機(jī)視覺的實(shí)現(xiàn)基本過程

新機(jī)器視覺 ? 來源:新機(jī)器視覺 ? 2020-09-24 10:49 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

如果想要機(jī)器能夠進(jìn)行思考,我們需要先教會它們?nèi)タ础?/p>

李飛飛——Director of Stanford AI Lab and Stanford Vision Lab

計(jì)算機(jī)視覺(Computer vision)是一門研究如何使機(jī)器“看”的科學(xué),更進(jìn)一步的說,就是指用攝影機(jī)和計(jì)算機(jī)代替人眼對目標(biāo)進(jìn)行識別、跟蹤和測量等機(jī)器視覺,并進(jìn)一步做圖像處理,用計(jì)算機(jī)處理成更適合人眼觀察或進(jìn)行儀器檢測的圖像。

學(xué)習(xí)和運(yùn)算能讓機(jī)器能夠更好的理解圖片環(huán)境,并且建立具有真正智能的視覺系統(tǒng)。當(dāng)下環(huán)境中存在著大量的圖片和視頻內(nèi)容,這些內(nèi)容亟需學(xué)者們理解并在其中找出模式,來揭示那些我們以前不曾注意過的細(xì)節(jié)。計(jì)算機(jī)視覺的實(shí)現(xiàn)基本過程為:

計(jì)算機(jī)從圖片中生成數(shù)學(xué)模型

計(jì)算機(jī)圖形在模型中對圖像進(jìn)行繪制,然后在圖像處理過程中將其作為輸入,另外給出處理圖像作為輸出

計(jì)算機(jī)視覺的理念在某些方面其實(shí)與很多概念有部分重疊,包括:人工智能、數(shù)字圖像處理、機(jī)器學(xué)習(xí)、深度學(xué)習(xí)、模式識別、概率圖模型、科學(xué)計(jì)算以及一系列的數(shù)學(xué)計(jì)算等。因此,你可以將本文看成是深入這個(gè)領(lǐng)域研究的第一步。本文將盡量包涵到盡可能多的內(nèi)容,但是可能仍然會存在一些較為復(fù)雜的主題,也有可能存在某些遺漏之處,敬請見諒。

丨第一步——背景

通常來說,你應(yīng)該具有一點(diǎn)相關(guān)的學(xué)術(shù)背景,比如上過有關(guān)概率學(xué)、統(tǒng)計(jì)學(xué)、線性代數(shù)、微積分(微分與積分)等相關(guān)課程,對矩陣計(jì)算有一定了解更好。另外,從我的經(jīng)驗(yàn)來看如果你對數(shù)字信號處理有了解的話,在以后對于概念的理解來說會更加容易。
在實(shí)現(xiàn)層面來說,你最好能夠會用MATLAB或者Python中的一種,一定要記住的是計(jì)算機(jī)視覺幾乎全部與計(jì)算機(jī)編程有關(guān)。

你也可以在Coursera上選修《概率繪圖模型》一課,這門課程相對較難(講得比較深入),你也可以在學(xué)習(xí)一段時(shí)間之后再對其進(jìn)行了解。

丨第二步——數(shù)字圖像處理

觀看來自杜克大學(xué)的Guillermo Sapiro所教授的課程——《圖像和視頻處理:從火星到好萊塢Image and Video Processing: From Mars to Hollywood with a Stop at the Hospital》,該課程所提供的教學(xué)大綱每章都是獨(dú)立的且包涵大量的練習(xí),你可以在coursera和YouTube上找到相關(guān)的課程視頻信息。另外你可以看下Gonzalez與Woods編寫的《數(shù)字圖像處理(Digital Image Processing)》一書,使用MATLAB來運(yùn)行其中所提到的范例,相信一定會有所獲。

丨第三步——計(jì)算機(jī)視覺

一旦學(xué)習(xí)完有關(guān)數(shù)字圖像處理有關(guān)內(nèi)容,接下來應(yīng)該了解相關(guān)的數(shù)學(xué)模型在各種圖像和視頻內(nèi)容中的應(yīng)用方法。來自佛羅里達(dá)大學(xué)的Mubarak Shah教授在計(jì)算機(jī)視覺方面的課程可以作為一門很好的入門課程,其涵蓋了幾乎所有的基礎(chǔ)概念。

觀看這些影片的同時(shí),可以學(xué)習(xí)Gatech的James Hays教授的計(jì)算機(jī)視覺項(xiàng)目課程所使用的概念和算法,這些練習(xí)也都是基于MATLAB的。千萬不要跳過這些練習(xí),只有在真正的練習(xí)過程中才會對這些算法和公式有更深入的了解。

丨第四步——高級計(jì)算機(jī)視覺

如果你認(rèn)真學(xué)習(xí)了前三步中的內(nèi)容,現(xiàn)在可以進(jìn)入到高級計(jì)算機(jī)視覺相關(guān)學(xué)習(xí)了。
來自巴黎中央理工學(xué)院的Nikos Paragios和Pawan Kumar講授了一門人工視覺中的離散推理(Discrete Inference in Artificial Vision)課程,它能提供相關(guān)的概率圖形模型和計(jì)算機(jī)視覺相關(guān)的大量數(shù)學(xué)知識。

到現(xiàn)在這一步來看就比較有趣了,這門課程一定能讓你感受到用簡單模型構(gòu)筑機(jī)器視覺系統(tǒng)有多么復(fù)雜。學(xué)完這門課程的話,在接觸學(xué)術(shù)論文之前又邁進(jìn)一大步。

丨第五步——引入Python和開源框架

這一步我們要接觸到Python編程語言。
就Python而言有許多像 OpenCV、PIL、vlfeat這樣的相關(guān)擴(kuò)展包,現(xiàn)在就是將這些擴(kuò)展包運(yùn)用到你的項(xiàng)目中的最好時(shí)機(jī)。因?yàn)槿绻衅渌拈_源框架存在的話,沒有必要從頭開始來編寫一切內(nèi)容。
如果需要參考資料的話可以考慮《使用Python對計(jì)算機(jī)視覺進(jìn)行編程 Programming Computer Vision with Python》,使用這本書就夠了。你可以動手去嘗試下,看看MATLAB和Python結(jié)合的話如何來實(shí)現(xiàn)你的算法。

丨第六步——機(jī)器學(xué)習(xí)與CovNets(卷積神經(jīng)網(wǎng)絡(luò)

有關(guān)如何從頭開始機(jī)器學(xué)習(xí)的資料實(shí)在太多,你可以從在網(wǎng)上查找到大量相關(guān)教程

從現(xiàn)在開始最好一直使用Python進(jìn)行編程,可以看下《使用Python建立機(jī)器學(xué)習(xí)系統(tǒng)——Building Machine Learning Systems with Python》和《Python機(jī)器學(xué)習(xí)——Python Machine Learning》這兩本書。
目前深度學(xué)習(xí)正大行其道,可以試著學(xué)習(xí)卷積神經(jīng)網(wǎng)絡(luò)在計(jì)算機(jī)視覺中的應(yīng)用( Computer Vision: the use of CovNets),在此推薦斯坦福的CS231n課程:針對視覺識別的卷積神經(jīng)網(wǎng)絡(luò)。

丨第七步——如何才能更進(jìn)一步

行文至此,你可能會覺得已經(jīng)講了太多的內(nèi)容,需要學(xué)的已經(jīng)太多。但是,你還可以進(jìn)一步進(jìn)行探索研究。
其中一個(gè)方法是看看由多倫多大學(xué)的Sanja Fidler和James Hays所舉行的一系列研討會課程,能幫助你對當(dāng)下計(jì)算機(jī)視覺研究方向的最新概念有所理解。
另一種即跟著 CVPR、ICCV、 ECCV、 BMVC這些頂級學(xué)術(shù)會議的相關(guān)學(xué)術(shù)論文,通過會上的研討會、主旨演講以及tutorial等日程一定能學(xué)到不少知識。

總結(jié):如果你按照步驟一步步完成所有的學(xué)習(xí)任務(wù),屆時(shí)你將大概了解計(jì)算機(jī)視覺中有關(guān)濾波器、特征檢測、描述、相機(jī)模型、追蹤器的歷史,另外還學(xué)習(xí)到分割和識別、神經(jīng)網(wǎng)絡(luò)和深度學(xué)習(xí)的最新進(jìn)展。希望本文能幫助你在計(jì)算機(jī)視覺領(lǐng)域走得更遠(yuǎn),學(xué)習(xí)得更加深入。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 圖像處理
    +關(guān)注

    關(guān)注

    27

    文章

    1329

    瀏覽量

    58041
  • 機(jī)器視覺
    +關(guān)注

    關(guān)注

    163

    文章

    4595

    瀏覽量

    122883
  • 計(jì)算機(jī)視覺
    +關(guān)注

    關(guān)注

    9

    文章

    1708

    瀏覽量

    46774

原文標(biāo)題:從計(jì)算機(jī)視覺的小白變?yōu)榇笊瘢阈枰?jīng)歷這七個(gè)階段

文章出處:【微信號:vision263com,微信公眾號:新機(jī)器視覺】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    自動化計(jì)算機(jī)的功能與用途

    工業(yè)自動化是指利用自動化計(jì)算機(jī)來控制工業(yè)環(huán)境中的流程、機(jī)器人和機(jī)械,以制造產(chǎn)品或其部件。工業(yè)自動化的目的是提高生產(chǎn)率、增加靈活性,并提升制造過程的質(zhì)量。工業(yè)自動化在汽車制造中體現(xiàn)得最為明顯,其中許多
    的頭像 發(fā)表于 07-15 16:32 ?107次閱讀
    自動化<b class='flag-5'>計(jì)算機(jī)</b>的功能與用途

    利用邊緣計(jì)算和工業(yè)計(jì)算機(jī)實(shí)現(xiàn)智能視頻分析

    IVA的好處、實(shí)際部署應(yīng)用程序以及工業(yè)計(jì)算機(jī)如何實(shí)現(xiàn)這些解決方案。一、什么是智能視頻分析(IVA)?智能視頻分析(IVA)集成了復(fù)雜的計(jì)算機(jī)視覺,通常與卷積神經(jīng)網(wǎng)
    的頭像 發(fā)表于 05-16 14:37 ?155次閱讀
    利用邊緣<b class='flag-5'>計(jì)算</b>和工業(yè)<b class='flag-5'>計(jì)算機(jī)</b><b class='flag-5'>實(shí)現(xiàn)</b>智能視頻分析

    Arm KleidiCV與OpenCV集成助力移動端計(jì)算機(jī)視覺性能優(yōu)化

    等多種應(yīng)用中。然而,這些計(jì)算機(jī)視覺應(yīng)用可能很難實(shí)現(xiàn)最優(yōu)化的延遲性能和處理速度,特別是在內(nèi)存大小、電池容量和處理能力有限的移動設(shè)備上難度更高。 而 Arm KleidiCV 便能在其中大顯身手。該開源庫利用了最新 Arm CPU
    的頭像 發(fā)表于 02-24 10:15 ?565次閱讀

    AR和VR中的計(jì)算機(jī)視覺

    ):計(jì)算機(jī)視覺引領(lǐng)混合現(xiàn)實(shí)體驗(yàn)增強(qiáng)現(xiàn)實(shí)(AR)和虛擬現(xiàn)實(shí)(VR)正在徹底改變我們與外部世界的互動方式。即便是在引人入勝的沉浸式
    的頭像 發(fā)表于 02-08 14:29 ?1558次閱讀
    AR和VR中的<b class='flag-5'>計(jì)算機(jī)</b><b class='flag-5'>視覺</b>

    量子計(jì)算機(jī)與普通計(jì)算機(jī)工作原理的區(qū)別

    ? 本文介紹了量子計(jì)算機(jī)與普通計(jì)算機(jī)工作原理的區(qū)別。 量子計(jì)算是一個(gè)新興的研究領(lǐng)域,科學(xué)家們利用量子力學(xué),制造出具有革命性能力的計(jì)算機(jī)。雖然現(xiàn)在的量子
    的頭像 發(fā)表于 11-24 11:00 ?1475次閱讀
    量子<b class='flag-5'>計(jì)算機(jī)</b>與普通<b class='flag-5'>計(jì)算機(jī)</b>工作原理的區(qū)別

    【小白入門必看】一文讀懂深度學(xué)習(xí)計(jì)算機(jī)視覺技術(shù)及學(xué)習(xí)路線

    ,幫我們做決定。整個(gè)過程就是為了讓機(jī)器能看懂圖像,然后根據(jù)這些圖像來做出聰明的選擇。二、計(jì)算機(jī)視覺實(shí)現(xiàn)起來難嗎?人類依賴視覺,找輛汽車輕而易
    的頭像 發(fā)表于 10-31 17:00 ?1238次閱讀
    【小白入門必看】一文讀懂深度學(xué)習(xí)<b class='flag-5'>計(jì)算機(jī)</b><b class='flag-5'>視覺</b>技術(shù)及學(xué)習(xí)路線

    計(jì)算機(jī)接口位于什么之間

    計(jì)算機(jī)接口是計(jì)算機(jī)硬件和軟件之間、計(jì)算機(jī)與外部設(shè)備之間以及計(jì)算機(jī)各部件之間傳輸數(shù)據(jù)、控制信息和狀態(tài)信息的硬件設(shè)備和軟件程序。它在計(jì)算機(jī)系統(tǒng)中
    的頭像 發(fā)表于 10-14 14:02 ?1300次閱讀

    計(jì)算機(jī)系統(tǒng)的硬件組成和主要部件

    計(jì)算機(jī)系統(tǒng)的硬件組成是計(jì)算機(jī)運(yùn)行的基礎(chǔ),它包含了多個(gè)關(guān)鍵部件,這些部件相互協(xié)作,共同實(shí)現(xiàn)計(jì)算機(jī)的各種功能。
    的頭像 發(fā)表于 09-10 11:41 ?6859次閱讀

    簡述計(jì)算機(jī)總線的分類

    計(jì)算機(jī)總線作為計(jì)算機(jī)系統(tǒng)中連接各個(gè)功能部件的公共通信干線,其結(jié)構(gòu)和分類對于理解計(jì)算機(jī)硬件系統(tǒng)的工作原理至關(guān)重要。以下是對計(jì)算機(jī)總線結(jié)構(gòu)和分類的詳細(xì)闡述,內(nèi)容將涵蓋總線的基本概念、內(nèi)部結(jié)
    的頭像 發(fā)表于 08-26 16:23 ?5169次閱讀

    晶體管計(jì)算機(jī)和電子管計(jì)算機(jī)有什么區(qū)別

    晶體管計(jì)算機(jī)和電子管計(jì)算機(jī)作為計(jì)算機(jī)發(fā)展史上的兩個(gè)重要階段,它們在多個(gè)方面存在顯著的區(qū)別。以下是對這兩類計(jì)算機(jī)在硬件、性能、應(yīng)用以及技術(shù)發(fā)展等方面區(qū)別的詳細(xì)闡述。
    的頭像 發(fā)表于 08-23 15:28 ?3605次閱讀

    微處理器如何控制計(jì)算機(jī)系統(tǒng)

    微處理器,作為計(jì)算機(jī)系統(tǒng)的核心部件,承擔(dān)著控制整個(gè)計(jì)算機(jī)系統(tǒng)運(yùn)行的重要任務(wù)。它不僅是計(jì)算機(jī)的運(yùn)算中心,還是控制中心,負(fù)責(zé)執(zhí)行程序指令、處理數(shù)據(jù)以及協(xié)調(diào)計(jì)算機(jī)各部件之間的工作。以下將詳細(xì)
    的頭像 發(fā)表于 08-22 14:21 ?975次閱讀

    計(jì)算機(jī)視覺有哪些優(yōu)缺點(diǎn)

    計(jì)算機(jī)視覺作為人工智能領(lǐng)域的一個(gè)重要分支,旨在使計(jì)算機(jī)能夠像人類一樣理解和解釋圖像和視頻中的信息。這一技術(shù)的發(fā)展不僅推動了多個(gè)行業(yè)的變革,也帶來了諸多優(yōu)勢,但同時(shí)也伴隨著一些挑戰(zhàn)和局限性。以下是對
    的頭像 發(fā)表于 08-14 09:49 ?2038次閱讀

    計(jì)算機(jī)視覺中的圖像融合

    在許多計(jì)算機(jī)視覺應(yīng)用中(例如機(jī)器人運(yùn)動和醫(yī)學(xué)成像),需要將多個(gè)圖像的相關(guān)信息整合到單一圖像中。這種圖像融合可以提供更高的可靠性、準(zhǔn)確性和數(shù)據(jù)質(zhì)量。多視圖融合可以提高圖像分辨率,并恢復(fù)場景的三維表示
    的頭像 發(fā)表于 08-01 08:28 ?1140次閱讀
    <b class='flag-5'>計(jì)算機(jī)</b><b class='flag-5'>視覺</b>中的圖像融合

    地平線科研論文入選國際計(jì)算機(jī)視覺頂會ECCV 2024

    近日,地平線兩篇論文入選國際計(jì)算機(jī)視覺頂會ECCV 2024,自動駕駛算法技術(shù)再有新突破。
    的頭像 發(fā)表于 07-27 11:10 ?1463次閱讀
    地平線科研論文入選國際<b class='flag-5'>計(jì)算機(jī)</b><b class='flag-5'>視覺</b>頂會ECCV 2024

    計(jì)算機(jī)視覺技術(shù)的AI算法模型

    計(jì)算機(jī)視覺技術(shù)作為人工智能領(lǐng)域的一個(gè)重要分支,旨在使計(jì)算機(jī)能夠像人類一樣理解和解釋圖像及視頻中的信息。為了實(shí)現(xiàn)這一目標(biāo),計(jì)算機(jī)
    的頭像 發(fā)表于 07-24 12:46 ?1802次閱讀