一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

技術(shù) | 深度學(xué)習(xí)在計算機(jī)視覺領(lǐng)域的瓶頸已至

機(jī)器視覺 ? 來源:YXQ ? 2019-07-05 10:07 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

計算機(jī)視覺奠基者之一,霍金的弟子,約翰霍普金斯大學(xué)教授Alan Yuille提出“深度學(xué)習(xí)在計算機(jī)視覺領(lǐng)域的瓶頸已至。”

人工智能的發(fā)展過程看,深度學(xué)習(xí)是繼專家系統(tǒng)之后人工智能應(yīng)用的又一重要研究領(lǐng)域,也是人工智能和神經(jīng)計算的核心研究課題之一。Alan Yuille認(rèn)為,現(xiàn)在做AI不提神經(jīng)網(wǎng)絡(luò),成果都很難發(fā)表了,這不是一個好勢頭。如果人們只追求神經(jīng)網(wǎng)絡(luò)的潮流,拋棄所有老方法,也不去想如何應(yīng)對深度網(wǎng)絡(luò)的局限性,那么這個領(lǐng)域可能很難有更好的發(fā)展。

深度學(xué)習(xí)確實是一個讓人向往的技術(shù),這無可辯駁。其實,神經(jīng)網(wǎng)絡(luò)這個概念自上個世紀(jì)60年代就已經(jīng)出現(xiàn)了,只是因為最近在大數(shù)據(jù)、計算機(jī)性能上面出現(xiàn)的飛躍,使得它真正變得有用起來,由此也衍生出來一門叫做“深度學(xué)習(xí)”的專業(yè),當(dāng)前國內(nèi)涉及計算機(jī)視覺領(lǐng)域中,越來越多的人工智能公司或者研究機(jī)構(gòu)投身到“深度學(xué)習(xí)”的浪潮中了,國內(nèi)誕生了如曠視科技、商湯科技、極鏈科技Video++、依圖科技等優(yōu)秀的初創(chuàng)AI企業(yè)。旨在將復(fù)雜的神經(jīng)網(wǎng)絡(luò)架構(gòu)應(yīng)用在數(shù)據(jù)建模上,最終帶來前所未有的準(zhǔn)確性。

現(xiàn)在的技術(shù)開發(fā)成果也確實讓人印象深刻。計算機(jī)現(xiàn)在可以辨識圖片和視頻里的東西都是什么,可以將語音轉(zhuǎn)化成為文字,其效率已經(jīng)超過了人力范疇。

Google也將GoogleTranslate服務(wù)中添加了神經(jīng)網(wǎng)絡(luò),現(xiàn)在的機(jī)器學(xué)習(xí)在翻譯水平上已經(jīng)逐步逼近人工翻譯。現(xiàn)實中的一些應(yīng)用也讓人大開眼界,就比如說計算機(jī)可以預(yù)測農(nóng)田作物產(chǎn)量,其準(zhǔn)確性比美國農(nóng)業(yè)部還高。機(jī)器還能更加精準(zhǔn)的診斷癌癥,其準(zhǔn)確度也比從醫(yī)多年的老醫(yī)師還要高。

美國國防部高級研究計劃局的一名負(fù)責(zé)人John Lauchbury形容如今人工智能領(lǐng)域內(nèi)存在著三股浪潮。

第一股浪潮:知識庫,或是類似于IBM所開發(fā)的“深藍(lán)”和Waston專家系統(tǒng)。

第二股浪潮:數(shù)據(jù)學(xué)習(xí),包括了機(jī)器學(xué)習(xí)和深度學(xué)習(xí)。

第三股浪潮:情境適應(yīng),其中涉及通過利用少量數(shù)據(jù),在現(xiàn)實生活中構(gòu)建出一個可靠的,解釋型的模型。

從這三股浪潮中,可以發(fā)現(xiàn)目前深度學(xué)習(xí)算法的研究工作進(jìn)展不錯。

但深度學(xué)習(xí)的成果是建立在極其苛刻的前提條件之上。

不管是“監(jiān)督學(xué)習(xí)”,亦或者是“強化學(xué)習(xí)”,它們都需要大量的數(shù)據(jù)進(jìn)行支撐,而且在提前計劃上面表現(xiàn)的非常差,只能做某些最簡單直接的模式辨認(rèn)工作。

相比之下,人就能夠從極少數(shù)的例子上學(xué)到有價值的信息,并且善于在時間跨度很長的計劃,在針對某個情境上有能力自己建造一個抽象模型,并利用這樣的模型來做站在最高處的歸納總結(jié)。

自動駕駛汽車為例,如果你是采用的“監(jiān)督學(xué)習(xí)路徑”,那么你需要從汽車駕駛的情境中提取海量的數(shù)據(jù),而且還要以明確標(biāo)示出來的“動作標(biāo)簽”進(jìn)行分類挑揀,比如“停止”“行駛”等。再接下來,你還需要訓(xùn)練一個神經(jīng)網(wǎng)絡(luò),使得它能夠從眼下的情景和所與之相對應(yīng)的行動之間構(gòu)建因果聯(lián)系。

如果你是采用的“強化學(xué)習(xí)路徑”,那么你應(yīng)該給算法一個目標(biāo),讓它能夠獨立地判斷當(dāng)下最優(yōu)解是什么,電腦在不同的情境之下,為了實現(xiàn)避免撞車的這個動作,它估計要宕機(jī)上幾千次。

雖然現(xiàn)在已經(jīng)有了比較大的進(jìn)展,一些神經(jīng)網(wǎng)絡(luò)可以從數(shù)據(jù)層面,在相當(dāng)大的樣本數(shù)量上給出一個驚人的成果,但是它們?nèi)绻麊为毮贸鲆粋€出來,還是不可靠的,所犯的錯誤也是人一輩子都不可能犯的。

數(shù)據(jù)質(zhì)量的不穩(wěn)定性帶來的是不可靠、不準(zhǔn)確,以及不公平。同樣,輸出的結(jié)果,還得取決于輸入的數(shù)據(jù)質(zhì)量如何。

神經(jīng)網(wǎng)絡(luò)中如果輸入的數(shù)據(jù)是不準(zhǔn)確的,不完整的,那么結(jié)果也會錯的離譜,有些時候會造成巨大的損失。不要小看這樣的風(fēng)險,錯誤的輸出可能會造成極大的危害,以GAN為例,有一些不軌之徒可以以一種人類肉眼無法識別的方式篡改圖片,讓機(jī)器錯誤的辨識圖片。

篡改的圖片和最初的圖片在我們看來可能是一致的,但是無人駕駛汽車中,汽車就會受到威脅。

深度學(xué)習(xí)依然存在瓶頸,但目前它要發(fā)揮的作用所需要的前置條件太過苛刻,輸入數(shù)據(jù)對其最終的結(jié)果有著決定性的影響。如果要真正達(dá)到理想中的人工智能,這些瓶頸還有待于人們的進(jìn)一步突破。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴

原文標(biāo)題:【研究】深度學(xué)習(xí)“瓶頸”已至 計算機(jī)視覺如何突破困局?

文章出處:【微信號:www_51qudong_com,微信公眾號:機(jī)器視覺】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    英飛凌邊緣AI平臺通過Ultralytics YOLO模型增加對計算機(jī)視覺的支持

    計算機(jī)視覺的支持,擴(kuò)大了當(dāng)前對音頻、雷達(dá)和其他時間序列信號數(shù)據(jù)的支持范圍。增加這項支持后,該平臺將能夠用于開發(fā)低功耗、低內(nèi)存的邊緣AI視覺模型。這將給諸多應(yīng)用
    的頭像 發(fā)表于 03-11 15:11 ?386次閱讀
    英飛凌邊緣AI平臺通過Ultralytics YOLO模型增加對<b class='flag-5'>計算機(jī)</b><b class='flag-5'>視覺</b>的支持

    AR和VR中的計算機(jī)視覺

    ):計算機(jī)視覺引領(lǐng)混合現(xiàn)實體驗增強現(xiàn)實(AR)和虛擬現(xiàn)實(VR)正在徹底改變我們與外部世界的互動方式。即便是引人入勝的沉浸式
    的頭像 發(fā)表于 02-08 14:29 ?1572次閱讀
    AR和VR中的<b class='flag-5'>計算機(jī)</b><b class='flag-5'>視覺</b>

    量子計算機(jī)與普通計算機(jī)工作原理的區(qū)別

    ? 本文介紹了量子計算機(jī)與普通計算機(jī)工作原理的區(qū)別。 量子計算是一個新興的研究領(lǐng)域,科學(xué)家們利用量子力學(xué),制造出具有革命性能力的計算機(jī)。雖然
    的頭像 發(fā)表于 11-24 11:00 ?1481次閱讀
    量子<b class='flag-5'>計算機(jī)</b>與普通<b class='flag-5'>計算機(jī)</b>工作原理的區(qū)別

    【小白入門必看】一文讀懂深度學(xué)習(xí)計算機(jī)視覺技術(shù)學(xué)習(xí)路線

    一、什么是計算機(jī)視覺計算機(jī)視覺,其實就是教機(jī)器怎么像我們?nèi)艘粯?,用攝像頭看看周圍的世界,然后理解它。比如說,它能認(rèn)出這是個蘋果,或者那邊有輛車。除此之外,還能把拍到的照片或者視頻轉(zhuǎn)換
    的頭像 發(fā)表于 10-31 17:00 ?1244次閱讀
    【小白入門必看】一文讀懂<b class='flag-5'>深度</b><b class='flag-5'>學(xué)習(xí)</b><b class='flag-5'>計算機(jī)</b><b class='flag-5'>視覺</b><b class='flag-5'>技術(shù)</b>及<b class='flag-5'>學(xué)習(xí)</b>路線

    計算機(jī)局域網(wǎng)技術(shù)是什么

    計算機(jī)局域網(wǎng)(Local Area Network,LAN)技術(shù)是指在較小的地理范圍內(nèi)(如一所學(xué)校、一個公司或一棟大樓內(nèi)),將各種計算機(jī)、外部設(shè)備和數(shù)據(jù)庫系統(tǒng)等通過特定的連接介質(zhì)(如有線電纜、光纖或
    的頭像 發(fā)表于 10-08 10:23 ?942次閱讀

    信號繼電器計算機(jī)系統(tǒng)中的應(yīng)用

    信號繼電器計算機(jī)系統(tǒng)中的應(yīng)用是一個重要且復(fù)雜的領(lǐng)域,它作為電氣控制的關(guān)鍵元件,計算機(jī)系統(tǒng)中發(fā)揮著信號轉(zhuǎn)換、隔離、放大以及控制等多種作用。
    的頭像 發(fā)表于 09-27 16:29 ?936次閱讀

    晶體管計算機(jī)和電子管計算機(jī)有什么區(qū)別

    晶體管計算機(jī)和電子管計算機(jī)作為計算機(jī)發(fā)展史上的兩個重要階段,它們多個方面存在顯著的區(qū)別。以下是對這兩類計算機(jī)
    的頭像 發(fā)表于 08-23 15:28 ?3610次閱讀

    如何利用ARMxy ARM嵌入式計算機(jī)的NPU進(jìn)行深度學(xué)習(xí)模型的訓(xùn)練和優(yōu)化?

    正文開始前,我們先大致了解鋇錸的ARMxy ARM嵌入式計算機(jī),再來說說我們?nèi)绾卫肁RMxy ARM嵌入式計算機(jī)的NPU來實現(xiàn)深度學(xué)習(xí)
    的頭像 發(fā)表于 08-20 13:43 ?757次閱讀
    如何利用ARMxy ARM嵌入式<b class='flag-5'>計算機(jī)</b>的NPU進(jìn)行<b class='flag-5'>深度</b><b class='flag-5'>學(xué)習(xí)</b>模型的訓(xùn)練和優(yōu)化?

    ARMxy ARM嵌入式計算機(jī)搭載 1 TOPS NPU支持深度學(xué)習(xí)

    ARMxy ARM嵌入式計算機(jī)BL410系列內(nèi)置了1TOPS算力 NPU,它每秒可以執(zhí)行高達(dá)一萬億次的浮點運算,這為復(fù)雜的圖像處理和深度學(xué)習(xí)任務(wù)提供了充足的計算資源。在產(chǎn)品缺陷檢測
    的頭像 發(fā)表于 08-20 11:53 ?849次閱讀
    ARMxy ARM嵌入式<b class='flag-5'>計算機(jī)</b>搭載 1 TOPS NPU支持<b class='flag-5'>深度</b><b class='flag-5'>學(xué)習(xí)</b>

    計算機(jī)視覺有哪些優(yōu)缺點

    計算機(jī)視覺作為人工智能領(lǐng)域的一個重要分支,旨在使計算機(jī)能夠像人類一樣理解和解釋圖像和視頻中的信息。這一技術(shù)的發(fā)展不僅推動了多個行業(yè)的變革,也
    的頭像 發(fā)表于 08-14 09:49 ?2043次閱讀

    圖像處理器與計算機(jī)視覺有什么關(guān)系和區(qū)別

    圖像處理器與計算機(jī)視覺是兩個圖像處理領(lǐng)域緊密相連但又有所區(qū)別的概念。它們之間的關(guān)系和區(qū)別可以從多個維度進(jìn)行探討。
    的頭像 發(fā)表于 08-14 09:36 ?1046次閱讀

    計算機(jī)視覺中的圖像融合

    許多計算機(jī)視覺應(yīng)用中(例如機(jī)器人運動和醫(yī)學(xué)成像),需要將多個圖像的相關(guān)信息整合到單一圖像中。這種圖像融合可以提供更高的可靠性、準(zhǔn)確性和數(shù)據(jù)質(zhì)量。多視圖融合可以提高圖像分辨率,并恢復(fù)場景的三維表示
    的頭像 發(fā)表于 08-01 08:28 ?1141次閱讀
    <b class='flag-5'>計算機(jī)</b><b class='flag-5'>視覺</b>中的圖像融合

    地平線科研論文入選國際計算機(jī)視覺頂會ECCV 2024

    近日,地平線兩篇論文入選國際計算機(jī)視覺頂會ECCV 2024,自動駕駛算法技術(shù)再有新突破。
    的頭像 發(fā)表于 07-27 11:10 ?1465次閱讀
    地平線科研論文入選國際<b class='flag-5'>計算機(jī)</b><b class='flag-5'>視覺</b>頂會ECCV 2024

    DRAM計算機(jī)中的應(yīng)用

    DRAM(Dynamic Random Access Memory,動態(tài)隨機(jī)存取存儲器)計算機(jī)系統(tǒng)中扮演著至關(guān)重要的角色。它是一種半導(dǎo)體存儲器,用于存儲和快速訪問數(shù)據(jù),是計算機(jī)主內(nèi)存的主要組成部分。以下是對DRAM
    的頭像 發(fā)表于 07-24 17:04 ?3006次閱讀

    計算機(jī)視覺技術(shù)的AI算法模型

    計算機(jī)視覺技術(shù)作為人工智能領(lǐng)域的一個重要分支,旨在使計算機(jī)能夠像人類一樣理解和解釋圖像及視頻中的信息。為了實現(xiàn)這一目標(biāo),
    的頭像 發(fā)表于 07-24 12:46 ?1806次閱讀