一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

AI系統(tǒng)存在巨大缺陷 看圖識(shí)物比不上人類幼兒

羅欣 ? 來(lái)源:Quanta Magazine ? 作者:佚名 ? 2018-10-11 14:25 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

人類,1分;AI,0分。

上個(gè)月,來(lái)自約克大學(xué)和多倫多大學(xué)的兩名研究人員合作發(fā)表了一篇論文:The Elephant in the Room,在學(xué)界引起巨大反響。通過(guò)實(shí)驗(yàn),他們發(fā)現(xiàn)現(xiàn)有人工智能系統(tǒng)還存在巨大缺陷,它們?cè)凇翱磮D識(shí)物”這類視覺(jué)任務(wù)上的表現(xiàn)甚至還比不上人類幼兒。

看罷這篇論文,加里·馬庫(kù)斯表達(dá)了對(duì)研究人員的贊許:“這是一篇聰明而重要的論文,它提醒我們所謂的‘深度學(xué)習(xí)’還沒(méi)有那么‘深刻’?!彼羌~約大學(xué)的認(rèn)知心理學(xué)教授,也是優(yōu)步(Uber)人工智能實(shí)驗(yàn)室的負(fù)責(zé)人。

這項(xiàng)成果出現(xiàn)在計(jì)算機(jī)視覺(jué)領(lǐng)域,論文設(shè)計(jì)的任務(wù)很常規(guī):訓(xùn)練一個(gè)機(jī)器學(xué)習(xí)系統(tǒng),讓它學(xué)會(huì)檢測(cè)和分類圖像中的對(duì)象。隨著自動(dòng)駕駛汽車離真正落地越來(lái)越近,學(xué)界對(duì)機(jī)器的視覺(jué)處理技術(shù)一直寄予厚望。為了保障安全,計(jì)算機(jī)必須能從一幅街景圖中準(zhǔn)確分辨哪個(gè)是鳥,哪個(gè)是自行車,即便達(dá)不到超人水平,它們至少也應(yīng)該和被替代的人眼一樣好用。

但是,這個(gè)任務(wù)并不簡(jiǎn)單,它突出了人類視覺(jué)的復(fù)雜性——以及構(gòu)建模仿系統(tǒng)的高難度。在這項(xiàng)研究中,研究人員首先展示了一個(gè)能檢測(cè)、識(shí)別客廳場(chǎng)景下物品的計(jì)算機(jī)視覺(jué)系統(tǒng),它的性能很不錯(cuò),能發(fā)現(xiàn)客廳里有一把椅子、一個(gè)人和書架上的書。之后,他們?cè)谕环鶊D中加入了一個(gè)異常物體——一只大象,這時(shí)系統(tǒng)卻“指鹿為馬”了,它開(kāi)始把椅子稱為沙發(fā),把大象稱為椅子,還忽視了之前能“看”到的其他物品。

對(duì)此,論文作者之一Amir Rosenfeld認(rèn)為:“這些奇怪現(xiàn)象的出現(xiàn),表明了目前的物體檢測(cè)系統(tǒng)是多么脆弱?!彼麄儧](méi)能在論文中解釋為什么會(huì)出現(xiàn)這種脆弱,但提出了一個(gè)破有見(jiàn)地的猜想:

這和人類具備,而AI沒(méi)有的一項(xiàng)能力有關(guān)——人類在看圖識(shí)物時(shí)能理解圖像中是否存在令人困惑的東西,從而讓自己去看第二眼。

房間里的大象

人類視覺(jué)和機(jī)器視覺(jué)很不一樣。

當(dāng)我們睜開(kāi)雙眼時(shí),眼球開(kāi)始收集大量視覺(jué)信息,并把它們輸送給大腦快速處理,這時(shí)我們知道天是藍(lán)的,草是綠的,萬(wàn)物在不斷生長(zhǎng)。

相比之下,機(jī)器在生成“視覺(jué)”上更費(fèi)力。它們看待事物的方式類似用盲文閱讀,其中圖像的像素就是“文字”,通過(guò)在像素上運(yùn)行各類算法,機(jī)器最終能生成關(guān)于目標(biāo)物體的越來(lái)越復(fù)雜的表達(dá)形式。運(yùn)行這一復(fù)雜過(guò)程的系統(tǒng)是神經(jīng)網(wǎng)絡(luò),它由許多“層”構(gòu)成。

輸入一幅圖像后,神經(jīng)網(wǎng)絡(luò)會(huì)逐層提取圖像中的細(xì)節(jié),比如各個(gè)像素的顏色和亮度,層數(shù)越深,它提取到的特征就越抽象。在過(guò)程結(jié)束時(shí),它會(huì)對(duì)根據(jù)這些特征對(duì)其正在觀察的內(nèi)容輸出最佳預(yù)測(cè)。

這個(gè)過(guò)程意味著相比人類,神經(jīng)網(wǎng)絡(luò)能把握更多人眼難辨的細(xì)節(jié)。事實(shí)上,現(xiàn)在基于神經(jīng)網(wǎng)絡(luò)的系統(tǒng)已經(jīng)在許多視覺(jué)處理任務(wù)上超越人類,比如依據(jù)品種對(duì)狗進(jìn)行分類。這些成功應(yīng)用提高了人們對(duì)技術(shù)的期待,研究人員也開(kāi)始著手研究,看計(jì)算機(jī)視覺(jué)系統(tǒng)是否能幫助汽車快速通過(guò)擁擠的街道。

但是,這項(xiàng)技術(shù)的成功也激勵(lì)了一批人去探索它的脆弱性,比如近幾年非常流行的“對(duì)抗樣本”。通過(guò)在原圖上做一些肉眼幾乎看不到的擾動(dòng),新圖像就能欺騙人工智能系統(tǒng),讓它把“虎斑貓”分類成“鱷梨醬”,把3D打印的“烏龜”分類為“步槍”。這些研究不是杞人憂天,試想一下,如果有人惡意在道路標(biāo)志上添加了這種擾動(dòng),致使自動(dòng)駕駛汽車誤讀、漏讀路標(biāo),那車上乘客的生命安全該如何保障?

論文中的研究具有相同的精神。研究人員向機(jī)器展示了一個(gè)普通的客廳生活場(chǎng)景:一名男子正坐在破舊椅子邊緣,前傾身體,聚精會(huì)神地玩著游戲。如下圖所示,在“思考”片刻后,神經(jīng)網(wǎng)絡(luò)正確檢測(cè)到了一系列物體:椅子、手提包、杯子、筆記本電腦、人、書籍、電視機(jī)、瓶子、時(shí)鐘。

但是,當(dāng)他們?cè)趫?chǎng)景中引入了一些不協(xié)調(diào)的東西——一只大象后,神經(jīng)網(wǎng)絡(luò)就被新加入的像素迷惑了。如下圖所示,在幾次試驗(yàn)中,神經(jīng)網(wǎng)絡(luò)開(kāi)始把大象識(shí)別為椅子,把椅子識(shí)別為沙發(fā),它也忽略了靠近大象一側(cè)的一排書。即便是離大象較遠(yuǎn)的物體,系統(tǒng)也存在錯(cuò)漏情況。

這個(gè)發(fā)現(xiàn)之所以令學(xué)界震驚,是因?yàn)閷?shí)驗(yàn)展示的是現(xiàn)在最基礎(chǔ)、最通行的物體檢測(cè)技術(shù),雖然客廳內(nèi)突然出現(xiàn)一頭大象并不現(xiàn)實(shí),但公路上出現(xiàn)一只火雞確實(shí)可能的?,F(xiàn)實(shí)道路上會(huì)發(fā)生很多意料之外的事,根據(jù)論文結(jié)果,我們有理由懷疑,自動(dòng)駕駛汽車會(huì)因?yàn)槁愤呁蝗怀霈F(xiàn)的一只火雞,而無(wú)法檢測(cè)到車前的行人。

正如羅恩菲爾德說(shuō)的:“如果房間里真的有一頭大象,那你肯定會(huì)注意到它,但這個(gè)系統(tǒng)卻甚至沒(méi)能檢測(cè)到它的存在?!?/p>

萬(wàn)事皆有因果

當(dāng)人類看到意想不到的東西時(shí),我們會(huì)先愣一下,然后才恍然大悟。這是一個(gè)具有真實(shí)認(rèn)知意義的常見(jiàn)現(xiàn)象——它恰好揭示了為什么神經(jīng)網(wǎng)絡(luò)無(wú)法處理“怪異”場(chǎng)景。

現(xiàn)如今,最先進(jìn)的物體檢測(cè)神經(jīng)網(wǎng)絡(luò)還是以“前饋”的方式工作,這意味著信息流經(jīng)神經(jīng)網(wǎng)絡(luò)時(shí)是單向的,從輸入細(xì)粒度像素開(kāi)始,到檢測(cè)曲線、檢測(cè)形狀、檢測(cè)場(chǎng)景,再到最后輸出最佳預(yù)測(cè)。為了確保預(yù)測(cè)的準(zhǔn)確性,它必須在整個(gè)過(guò)程中不斷收集“有用”信息,但這種單向性也意味著如果早期信息存在某種錯(cuò)誤,那這些錯(cuò)誤就會(huì)污染預(yù)測(cè)結(jié)果。

論文作者之一Tsotsos表示:“從神經(jīng)網(wǎng)絡(luò)頂部開(kāi)始,我們確實(shí)可以探索和結(jié)果相關(guān)的一切內(nèi)容,但我們也有可能讓每個(gè)位置的每個(gè)特征都對(duì)每一個(gè)可能的輸出作出干擾?!?/p>

舉一個(gè)大家都理解的例子。假設(shè)圖中有一個(gè)圓和一個(gè)正方形,它們顏色各異,一個(gè)是紅的,一個(gè)是藍(lán)的?,F(xiàn)在要求你在短時(shí)間內(nèi)觀察圖片,并迅速答出正方形是什么顏色的。如果注意力夠集中,我們可能一瞥就能給出答案;如果有些頭昏腦脹,我們可能看了一眼后還會(huì)有點(diǎn)迷惑,然后自然而然地會(huì)去重新看一遍。而且當(dāng)我們看第二遍時(shí),注意力是高度集中在觀察正方形顏色上的。

簡(jiǎn)而言之,人類的視覺(jué)系統(tǒng)如果沒(méi)有獲得想要的答案,它會(huì)回頭看看自己在哪里犯了錯(cuò)。而這個(gè)過(guò)程可以用1990年《Behavioral and Brain Sciences》一篇論文中提到的概念——選擇性調(diào)整模型(ST)來(lái)解釋。如上圖所示,那篇論文假設(shè)視覺(jué)處理架構(gòu)在結(jié)構(gòu)上是金字塔形的,該網(wǎng)絡(luò)內(nèi)的節(jié)點(diǎn)接收前饋和反饋連接。當(dāng)刺激輸入視覺(jué)系統(tǒng)時(shí),首先它會(huì)以前饋的方式激活與其連接的金字塔內(nèi)的所有節(jié)點(diǎn);之后,輸出的結(jié)果再以反饋的方式重新回到之前的節(jié)點(diǎn)中,激活倒置子金字塔。

這個(gè)模型的優(yōu)勢(shì)在于人類能依靠前饋和反饋,選擇感興趣的時(shí)空區(qū)域,選擇與當(dāng)前任務(wù)相關(guān)的事物并選擇最佳視點(diǎn),同時(shí),我們也能通過(guò)修剪不相關(guān)的內(nèi)容來(lái)限制任務(wù)相關(guān)的搜索空間,只考慮之前有過(guò)提示信息的位置,用位置/特征信息抑制感受野中的干擾,更簡(jiǎn)單、高效的獲取最佳結(jié)果。

而大多數(shù)神經(jīng)網(wǎng)絡(luò)缺乏這種反饋能力,這也是科研人員一直無(wú)法有所突破的研究難點(diǎn)?,F(xiàn)在使用前饋網(wǎng)絡(luò)的一個(gè)優(yōu)點(diǎn)是容易訓(xùn)練——只需讓輸入通過(guò)一個(gè)6層神經(jīng)網(wǎng)絡(luò),但是,如果我們希望未來(lái)機(jī)器也能“先愣一下,然后才恍然大悟”,它們就必須理解什么時(shí)候該回頭看看,什么時(shí)候該簡(jiǎn)單前饋。

人腦可以在這些過(guò)程之間無(wú)縫切換,但神經(jīng)網(wǎng)絡(luò)還需要一個(gè)新的理論框架才能做同樣的事情。

就在本月,谷歌上線了一個(gè)對(duì)抗樣本挑戰(zhàn)Unrestricted Adversarial Examples Challenge,他們向社區(qū)征集參賽鳥/自行車分類器,要求參賽的“對(duì)抗者”可以在輸入有擾動(dòng)的圖像后,依然準(zhǔn)確分類鳥和自行車;而“攻擊者”的目標(biāo)是生成一張包含鳥的圖像,讓“對(duì)抗者”分類器把它分類成自行車。這離構(gòu)建選擇性調(diào)整模型還有不小距離,但這是通向解決問(wèn)題的第一步——也是不可或缺的一步。

本文來(lái)源:Quanta Magazine

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 神經(jīng)網(wǎng)絡(luò)

    關(guān)注

    42

    文章

    4814

    瀏覽量

    103648
  • AI
    AI
    +關(guān)注

    關(guān)注

    88

    文章

    35164

    瀏覽量

    280023
  • 機(jī)器學(xué)習(xí)

    關(guān)注

    66

    文章

    8503

    瀏覽量

    134635
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    電子元器件知識(shí)大全:看圖識(shí)元件

    ,比如元器件的正確選用等,筆者在此就不逐一列舉了,下面筆者就來(lái)說(shuō)一些非常實(shí)用的電子知識(shí),希望大家都能向高手之路再邁上一步。注:下文內(nèi)容最好結(jié)合圖一和后續(xù)圖片進(jìn)行閱讀。 看圖識(shí)元件"
    發(fā)表于 06-09 16:55

    Nordic nRF54 系列芯片:開(kāi)啟 AI聯(lián)網(wǎng)新時(shí)代?

    在科技飛速發(fā)展的今天,芯片技術(shù)的創(chuàng)新始終是推動(dòng)行業(yè)進(jìn)步的關(guān)鍵力量。Nordic 公司的 nRF54 系列芯片,正以其卓越的性能和獨(dú)特的設(shè)計(jì),為 AI 機(jī)器學(xué)習(xí)和聯(lián)網(wǎng)應(yīng)用帶來(lái)前所未有的變革
    發(fā)表于 04-01 00:18

    Banana Pi 發(fā)布 BPI-AI2N & BPI-AI2N Carrier,助力 AI 計(jì)算與嵌入式開(kāi)發(fā)

    RZ/V2N——近期在嵌入式世界2025上新發(fā)布,為 AI 計(jì)算、嵌入式系統(tǒng)及工自動(dòng)化提供強(qiáng)大支持。這款全新的計(jì)算平臺(tái)旨在滿足開(kāi)發(fā)者和企業(yè)用戶對(duì)高性能、低功耗和靈活擴(kuò)展的需求。 []() 領(lǐng)先的計(jì)算
    發(fā)表于 03-19 17:54

    名單公布!【書籍評(píng)測(cè)活動(dòng)NO.57】芯片通識(shí)課:一本書讀懂芯片技術(shù)

    聯(lián)系,視為放棄本次試用評(píng)測(cè)資格! Part.1 無(wú)處不在的芯片 自人類進(jìn)入信息時(shí)代,從 PC 到互聯(lián)網(wǎng),再到如今的 AI 大潮興起,無(wú)論應(yīng)用形態(tài)如何變化,它們都是由小小的芯片支撐運(yùn)行起來(lái)的??梢哉f(shuō),芯片
    發(fā)表于 02-17 15:43

    AI賦能邊緣網(wǎng)關(guān):開(kāi)啟智能時(shí)代的新藍(lán)海

    的引入徹底改變了這一局面。通過(guò)在邊緣網(wǎng)關(guān)集成AI芯片和算法模型,使其具備了實(shí)時(shí)數(shù)據(jù)分析、智能決策和自主控制能力。在工業(yè)質(zhì)檢場(chǎng)景中,搭載AI算法的邊緣網(wǎng)關(guān)能夠?qū)崟r(shí)識(shí)別產(chǎn)品缺陷,將檢測(cè)效率提升300%以上
    發(fā)表于 02-15 11:41

    有效抑制SiC外延片掉落缺陷生成的方法

    引言 碳化硅(SiC)作為第三代半導(dǎo)體材料,因其出色的物理和化學(xué)特性,在功率電子、高頻通信及高溫環(huán)境等領(lǐng)域展現(xiàn)出巨大的應(yīng)用潛力。然而,在SiC外延生長(zhǎng)過(guò)程中,掉落缺陷(如顆粒脫落、乳凸等)一直是
    的頭像 發(fā)表于 02-10 09:35 ?401次閱讀
    有效抑制SiC外延片掉落<b class='flag-5'>物</b><b class='flag-5'>缺陷</b>生成的方法

    名單公布!【書籍評(píng)測(cè)活動(dòng)NO.55】AI Agent應(yīng)用與項(xiàng)目實(shí)戰(zhàn)

    不需要人類持續(xù)干預(yù)的AI系統(tǒng),它可以根據(jù)當(dāng)前的環(huán)境和背景信息,去自主分析各種遇到的問(wèn)題并做出合理的決策,比如幾年前打敗人類棋手李昌鎬的AlphaGo,它就是一個(gè)典型的
    發(fā)表于 01-13 11:04

    CAD快速看圖

    CAD快速看圖
    發(fā)表于 01-07 13:44 ?4次下載

    馬斯克預(yù)言:AI將全面超越人類智力

    近日,科技巨頭馬斯克作出了一個(gè)關(guān)于人工智能(AI)的大膽預(yù)測(cè)。他斷言,AI的發(fā)展速度將超乎人類的想象,并將在不久的將來(lái)全面超越人類的智力。 馬斯克在X平臺(tái)上明確表示,
    的頭像 發(fā)表于 12-28 14:23 ?760次閱讀

    基于缺陷生成路徑的AI質(zhì)檢新范式

    在全球化的制造業(yè)格局中,產(chǎn)品質(zhì)量問(wèn)題一直是懸在企業(yè)頭頂?shù)囊话堰_(dá)摩克利斯之劍。特別是近年來(lái),隨著消費(fèi)者對(duì)產(chǎn)品質(zhì)量的要求越來(lái)越高,任何微小的缺陷都可能引發(fā)大規(guī)模的產(chǎn)品召回,造成巨大的經(jīng)濟(jì)損失和社會(huì)影響
    的頭像 發(fā)表于 11-15 01:05 ?895次閱讀
    基于<b class='flag-5'>缺陷</b>生成路徑的<b class='flag-5'>AI</b>質(zhì)檢新范式

    莫拉維克悖論與多模態(tài)AI:邁向機(jī)器人認(rèn)知的新時(shí)代

    莫拉維克悖論揭示了人工智能系統(tǒng)在處理高級(jí)推理與基本感知運(yùn)動(dòng)技能上的巨大差異。對(duì)于AI而言,復(fù)雜的邏輯任務(wù)似乎比人類習(xí)以為常的感知運(yùn)動(dòng)技能更容易實(shí)現(xiàn)。這一悖論凸顯了當(dāng)前
    的頭像 發(fā)表于 10-26 15:00 ?1250次閱讀

    60G嬰幼兒呼吸心跳檢測(cè)專用雷達(dá)模塊 感應(yīng)距離0.8-1.5米

    每年因呼吸道疾病死亡的新生兒高達(dá)200萬(wàn)。主要原因是嬰幼兒的呼吸系統(tǒng)和免疫系統(tǒng)尚未沒(méi)有發(fā)育完全,抵抗力能力差,極容易感染呼吸道疾病。除此以外,嬰幼兒在睡眠時(shí)稍不注意,便容易發(fā)生俯臥、墜
    的頭像 發(fā)表于 09-28 08:09 ?833次閱讀
    60G嬰<b class='flag-5'>幼兒</b>呼吸心跳檢測(cè)專用雷達(dá)模塊 感應(yīng)距離0.8-1.5米

    幼兒園分區(qū)廣播系統(tǒng)

    一、 項(xiàng)目背景 某幼兒園,有一棟教學(xué)樓,每層長(zhǎng)約50米,每層有3間教室。樓前有一個(gè)200多平的小操場(chǎng)。具體需求如下: 1、定時(shí)播放 根據(jù)學(xué)校作息時(shí)間表編制廣播播放時(shí)間表,定時(shí)定點(diǎn)自動(dòng)播放音樂(lè)鈴聲
    的頭像 發(fā)表于 09-04 09:41 ?581次閱讀
    <b class='flag-5'>幼兒</b>園分區(qū)廣播<b class='flag-5'>系統(tǒng)</b>

    使用TI Edge AI Studio和AM62A進(jìn)行基于視覺(jué)AI缺陷檢測(cè)

    電子發(fā)燒友網(wǎng)站提供《使用TI Edge AI Studio和AM62A進(jìn)行基于視覺(jué)AI缺陷檢測(cè).pdf》資料免費(fèi)下載
    發(fā)表于 09-03 10:38 ?0次下載
    使用TI Edge <b class='flag-5'>AI</b> Studio和AM62A進(jìn)行基于視覺(jué)<b class='flag-5'>AI</b>的<b class='flag-5'>缺陷</b>檢測(cè)

    基于鴻蒙Next模擬掃圖識(shí)的一個(gè)過(guò)程

    一、功能介紹(基礎(chǔ)) 基于鴻蒙Next模擬掃圖識(shí)的一個(gè)過(guò)程,掃描到圖片,提示出相關(guān)的圖片內(nèi)容,是一個(gè)什么東西。 二、使用場(chǎng)景(大類) 支付、社交、信息獲取、在線調(diào)查、教育學(xué)習(xí)等等。 三、實(shí)現(xiàn)步驟
    發(fā)表于 08-21 15:04