一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

神經(jīng)網(wǎng)絡(luò)技術(shù)解析:手寫數(shù)字識別項(xiàng)目解讀

電子設(shè)計(jì) ? 來源:機(jī)器之心 ? 作者:澤南 張倩 ? 2021-01-13 15:50 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

手寫數(shù)字識別是很多人入門神經(jīng)網(wǎng)絡(luò)時(shí)用來練手的一個(gè)項(xiàng)目,但就是這么簡單的一個(gè)項(xiàng)目,最近在 reddit 上又火了一把,因?yàn)樵?MIT 計(jì)算機(jī)科學(xué)和人工智能實(shí)驗(yàn)室,有人挖到了一個(gè)「祖師爺」級別的視頻……

這段視頻錄制于 1993 年,主人公是圖靈獎(jiǎng)得主 Yann LeCun(楊立昆)。彼時(shí) LeCun 才 32 歲,剛剛進(jìn)入貝爾實(shí)驗(yàn)室工作,而視頻里機(jī)器學(xué)習(xí)識別的第一段數(shù)字 201-949-4038,是 LeCun 在貝爾實(shí)驗(yàn)室里的電話號碼。 從這段視頻中我們可以看到,LeCun 在 90 年代初創(chuàng)造的文本識別系統(tǒng)已經(jīng)達(dá)到了驚人的速度和準(zhǔn)確率,這在當(dāng)時(shí)的條件下是非常難能可貴的。

這段視頻由貝爾實(shí)驗(yàn)室自適應(yīng)系統(tǒng)研究部門主任 Larry Jackel 拍攝(Larry 當(dāng)時(shí)是 LeCun 的 boss,現(xiàn)任英偉達(dá)自動駕駛顧問)。視頻中出鏡的還有實(shí)驗(yàn)室負(fù)責(zé)人 Rich Howard(Larry 的 boss)和研究工程師 Donnie Henderson。Yann LeCun 本人表示:「Donnie Henderson 將整個(gè)演示系統(tǒng)整合在了一起…… 整套系統(tǒng)在算力為 20MFLOPS 的 DSP 版上運(yùn)行。」

幾位工程師在視頻中洋溢的笑容也頗具感染力。

LeCun 表示,1993 年的文字識別系統(tǒng)已經(jīng)用上了卷積神經(jīng)網(wǎng)絡(luò)(CNN),自己在這套系統(tǒng)中編寫了一種網(wǎng)絡(luò)數(shù)據(jù)結(jié)構(gòu)的編譯器,并生成了可編譯的 C 語言代碼,在源代碼中以權(quán)重和網(wǎng)表(netlist)代表文字。 這段視頻的驚艷之處還在于,它比經(jīng)典手寫數(shù)字?jǐn)?shù)據(jù)集 MNIST 的問世還要早 6 年。

pIYBAF_-pMeAMHCAAABq5qkjYcU826.png

其實(shí),早在 1989 年,LeCun 就已經(jīng)發(fā)表了「將反向傳播用于手寫郵政編碼識別」的相關(guān)研究,而且已經(jīng)在美國的郵政系統(tǒng)中成功應(yīng)用。隨后,這一系統(tǒng)的應(yīng)用范圍擴(kuò)展至銀行支票。90 年代末期,該系統(tǒng)已經(jīng)處理了美國 10%-20%的支票識別。

o4YBAF_-pNWAK3ObAALBa2Q5DDU736.png

1999 年,LeCun 等人聯(lián)合發(fā)表了「MNIST」手寫數(shù)字?jǐn)?shù)據(jù)集。這一數(shù)據(jù)集包含數(shù)萬個(gè)樣本,被稱為「計(jì)算機(jī)視覺領(lǐng)域的 hello world 數(shù)據(jù)集」、「機(jī)器學(xué)習(xí)界的果蠅」,如今已經(jīng)作為基準(zhǔn)被使用了二十余年。

pIYBAF_-pOWAejsuAAIT49kFyNQ943.png

在看了這段視頻之后,有研究者感嘆,「不要再抱怨 GPU 算力不夠了」。

o4YBAF_-pPGAYaTEAAByJSj2qWU470.png

深度學(xué)習(xí)先驅(qū) Yann LeCun 說起 Yann LeCun,熟悉人工智能領(lǐng)域的人肯定不會陌生,Yann LeCun 現(xiàn)在是紐約大學(xué)教授、美國工程院院士、Facebook 副總裁和首席 AI 科學(xué)家。 在深度學(xué)習(xí)還未流行的 20 世紀(jì)八九十年代,LeCun 與另兩位先驅(qū)者 Yoshua Bengio、Geoffrey Hinton 一道探索了深度學(xué)習(xí)領(lǐng)域的概念基礎(chǔ),并通過實(shí)驗(yàn)向人們展示了新方法的前景。此外,他們還貢獻(xiàn)了一系列工程進(jìn)展,展示了深度神經(jīng)網(wǎng)絡(luò)的實(shí)用優(yōu)勢。 雖然在二十世紀(jì)八十年代,研究者就開始試用人工神經(jīng)網(wǎng)絡(luò)幫助計(jì)算機(jī)識別模式、模擬人類智能,但直到二十一世紀(jì)的前幾年,這種方式仍未獲得廣泛認(rèn)同,LeCun 等研究者試圖重燃 AI 社區(qū)對神經(jīng)網(wǎng)絡(luò)興趣的努力曾經(jīng)一直被人們質(zhì)疑,但如今他們的想法帶來了重大的技術(shù)進(jìn)步,他們的方法也已成為該領(lǐng)域的主導(dǎo)范式。 自 2012 年以來,深度學(xué)習(xí)方法促進(jìn)計(jì)算機(jī)視覺、語音識別、自然語言處理和機(jī)器人技術(shù)等應(yīng)用領(lǐng)域取得極大突破。 在 2019 年,美國計(jì)算機(jī)協(xié)會 ACM 公布了上一年度的圖靈獎(jiǎng),Yoshua Bengio、Geoffrey Hinton 和 Yann LeCun 三位深度學(xué)習(xí)巨頭同時(shí)獲獎(jiǎng)。

從左至右:Yoshua Bengio、Geoffrey Hinton、Yann LeCun。 ACM 表示,Yann LeCun 主要作出了三大貢獻(xiàn):

  • 提出卷積神經(jīng)網(wǎng)絡(luò)
  • 改進(jìn)反向傳播算法
  • 拓寬神經(jīng)網(wǎng)絡(luò)的視角

20 世紀(jì) 80 年代后期,LeCun 就職于多倫多大學(xué)和貝爾實(shí)驗(yàn)室,也是在這一時(shí)期,他利用手寫數(shù)字圖像訓(xùn)練了第一個(gè)卷積神經(jīng)網(wǎng)絡(luò)系統(tǒng)。如今,卷積神經(jīng)網(wǎng)絡(luò)已成為計(jì)算機(jī)視覺、語音識別、語音合成、圖像合成和自然語言處理領(lǐng)域的行業(yè)標(biāo)準(zhǔn)。卷積神經(jīng)網(wǎng)絡(luò)有著廣泛的應(yīng)用,如自動駕駛、醫(yī)學(xué)圖像分析、語音助手和信息過濾等。 這可不是搞定 MNIST 那么簡單 與我們通常為 MINIST 數(shù)據(jù)集構(gòu)建文字識別系統(tǒng)不同,Yann LeCun 在 1993 年展示的技術(shù)可是用攝像頭直接拍攝的,還需要搞定文字縮放、位置等問題,后來也確實(shí)在郵政系統(tǒng)里獲得了應(yīng)用。 如此看來在當(dāng)年就能實(shí)現(xiàn)這樣的效果確實(shí)不容易,更何況在 20 世紀(jì) 90 年代,研究者們是沒有 TensorFlow 可用的,全靠 C 語言手寫,這個(gè)問題求解的非機(jī)器學(xué)習(xí)部分與其說是困難,不如說是繁瑣。 在社交網(wǎng)絡(luò)中,人們對 LeCun 展示的算法除了感興趣,還有贊譽(yù)和膜拜,有人說道:「這并不是說他們在 1993 年就解決了 MNIST 上的問題,比那還要更進(jìn)一步。」 在深度學(xué)習(xí)被 GPU 帶動開展大規(guī)模應(yīng)用以前,人工智能算法其實(shí)已經(jīng)實(shí)現(xiàn)了相當(dāng)?shù)穆斆鞒潭?。?1993 年的文字識別之后,昨天,人們又挖出了 LeCun 參與的另一項(xiàng)研究:人臉檢測。

在 2003 年,一個(gè)視頻展示了 Rita Osadchy、Matt Miller 以及 Yann LeCun 等人在 NEC 實(shí)驗(yàn)室的研究,使用卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行人臉檢測研究。 雖然只是人臉檢測而不是人臉識別,但這種技術(shù)的意義不言而喻,如今自動駕駛汽車上的障礙物檢測方法使用的就是和它相同的技術(shù)。在推特上,LeCun 也點(diǎn)贊了這段視頻。

看來,如今我們在機(jī)器學(xué)習(xí)領(lǐng)域廣泛使用的方法,早在幾十年前就已完成了整體架構(gòu)。 不過與此同時(shí),也有網(wǎng)友發(fā)出了直擊靈魂的提問:「既然 LeCun 在 1993 年就可以讓 AI 這樣識別文字了,為啥直到今天大多數(shù)網(wǎng)站仍然認(rèn)為文字驗(yàn)證碼是識別機(jī)器人的好辦法?」
編輯:hfy

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    基于LockAI視覺識別模塊:手寫數(shù)字識別

    : 卷積神經(jīng)網(wǎng)絡(luò)(CNN):最流行的方法之一,能夠自動從圖像中學(xué)習(xí)特征。適用于復(fù)雜背景和不同書寫風(fēng)格的手寫數(shù)字識別。 支持向量機(jī)(SVM):一種傳統(tǒng)的機(jī)器學(xué)習(xí)方法,通過提取圖像的特征(
    發(fā)表于 06-30 16:45

    基于LockAI視覺識別模塊:手寫數(shù)字識別

    手寫數(shù)字識別是一種經(jīng)典的模式識別和圖像處理問題,旨在通過計(jì)算機(jī)自動識別用戶手寫
    的頭像 發(fā)表于 06-30 15:44 ?444次閱讀
    基于LockAI視覺<b class='flag-5'>識別</b>模塊:<b class='flag-5'>手寫</b><b class='flag-5'>數(shù)字</b><b class='flag-5'>識別</b>

    基于FPGA搭建神經(jīng)網(wǎng)絡(luò)的步驟解析

    本文的目的是在一個(gè)神經(jīng)網(wǎng)絡(luò)已經(jīng)通過python或者M(jìn)ATLAB訓(xùn)練好的神經(jīng)網(wǎng)絡(luò)模型,將訓(xùn)練好的模型的權(quán)重和偏置文件以TXT文件格式導(dǎo)出,然后通過python程序?qū)xt文件轉(zhuǎn)化為coe文件,(coe
    的頭像 發(fā)表于 06-03 15:51 ?409次閱讀
    基于FPGA搭建<b class='flag-5'>神經(jīng)網(wǎng)絡(luò)</b>的步驟<b class='flag-5'>解析</b>

    BP神經(jīng)網(wǎng)絡(luò)與卷積神經(jīng)網(wǎng)絡(luò)的比較

    BP神經(jīng)網(wǎng)絡(luò)與卷積神經(jīng)網(wǎng)絡(luò)在多個(gè)方面存在顯著差異,以下是對兩者的比較: 一、結(jié)構(gòu)特點(diǎn) BP神經(jīng)網(wǎng)絡(luò) : BP神經(jīng)網(wǎng)絡(luò)是一種多層的前饋神經(jīng)網(wǎng)絡(luò)
    的頭像 發(fā)表于 02-12 15:53 ?667次閱讀

    BP神經(jīng)網(wǎng)絡(luò)在圖像識別中的應(yīng)用

    BP神經(jīng)網(wǎng)絡(luò)在圖像識別中發(fā)揮著重要作用,其多層結(jié)構(gòu)使得網(wǎng)絡(luò)能夠?qū)W習(xí)到復(fù)雜的特征表達(dá),適用于處理非線性問題。以下是對BP神經(jīng)網(wǎng)絡(luò)在圖像識別中應(yīng)
    的頭像 發(fā)表于 02-12 15:12 ?679次閱讀

    人工神經(jīng)網(wǎng)絡(luò)的原理和多種神經(jīng)網(wǎng)絡(luò)架構(gòu)方法

    在上一篇文章中,我們介紹了傳統(tǒng)機(jī)器學(xué)習(xí)的基礎(chǔ)知識和多種算法。在本文中,我們會介紹人工神經(jīng)網(wǎng)絡(luò)的原理和多種神經(jīng)網(wǎng)絡(luò)架構(gòu)方法,供各位老師選擇。 01 人工神經(jīng)網(wǎng)絡(luò) ? 人工神經(jīng)網(wǎng)絡(luò)模型之所
    的頭像 發(fā)表于 01-09 10:24 ?1189次閱讀
    人工<b class='flag-5'>神經(jīng)網(wǎng)絡(luò)</b>的原理和多種<b class='flag-5'>神經(jīng)網(wǎng)絡(luò)</b>架構(gòu)方法

    ElfBoard開源項(xiàng)目|車牌識別項(xiàng)目技術(shù)文檔

    車牌識別項(xiàng)目基于百度智能云平臺,旨在利用其強(qiáng)大的OCR服務(wù)實(shí)現(xiàn)車牌號碼的自動識別。選擇百度智能云的原因是其高效的API接口和穩(wěn)定的服務(wù)質(zhì)量,能夠幫助開發(fā)者快速實(shí)現(xiàn)車牌識別應(yīng)用。這個(gè)開源項(xiàng)目
    的頭像 發(fā)表于 12-06 10:30 ?655次閱讀
    ElfBoard開源<b class='flag-5'>項(xiàng)目</b>|車牌<b class='flag-5'>識別項(xiàng)目</b><b class='flag-5'>技術(shù)</b>文檔

    卷積神經(jīng)網(wǎng)絡(luò)與傳統(tǒng)神經(jīng)網(wǎng)絡(luò)的比較

    在深度學(xué)習(xí)領(lǐng)域,神經(jīng)網(wǎng)絡(luò)模型被廣泛應(yīng)用于各種任務(wù),如圖像識別、自然語言處理和游戲智能等。其中,卷積神經(jīng)網(wǎng)絡(luò)(CNNs)和傳統(tǒng)神經(jīng)網(wǎng)絡(luò)是兩種常見的模型。 1. 結(jié)構(gòu)差異 1.1 傳統(tǒng)
    的頭像 發(fā)表于 11-15 14:53 ?1870次閱讀

    RNN模型與傳統(tǒng)神經(jīng)網(wǎng)絡(luò)的區(qū)別

    神經(jīng)網(wǎng)絡(luò)是機(jī)器學(xué)習(xí)領(lǐng)域中的一種強(qiáng)大工具,它們能夠模擬人腦處理信息的方式。隨著技術(shù)的發(fā)展,神經(jīng)網(wǎng)絡(luò)的類型也在不斷增加,其中循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)和傳統(tǒng)
    的頭像 發(fā)表于 11-15 09:42 ?1126次閱讀

    LSTM神經(jīng)網(wǎng)絡(luò)在語音識別中的應(yīng)用實(shí)例

    語音識別技術(shù)是人工智能領(lǐng)域的一個(gè)重要分支,它使計(jì)算機(jī)能夠理解和處理人類語言。隨著深度學(xué)習(xí)技術(shù)的發(fā)展,特別是長短期記憶(LSTM)神經(jīng)網(wǎng)絡(luò)的引入,語音
    的頭像 發(fā)表于 11-13 10:03 ?1851次閱讀

    關(guān)于卷積神經(jīng)網(wǎng)絡(luò),這些概念你厘清了么~

    隨著人工智能(AI)技術(shù)的快速發(fā)展,AI可以越來越多地支持以前無法實(shí)現(xiàn)或者難以實(shí)現(xiàn)的應(yīng)用。本文基于此解釋了 卷積神經(jīng)網(wǎng)絡(luò) (CNN)及其對人工智能和機(jī)器學(xué)習(xí)的意義。CNN是一種能夠從復(fù)雜數(shù)據(jù)中提
    發(fā)表于 10-24 13:56

    【飛凌嵌入式OK3576-C開發(fā)板體驗(yàn)】RKNN神經(jīng)網(wǎng)絡(luò)-車牌識別

    LPRNet基于深層神經(jīng)網(wǎng)絡(luò)設(shè)計(jì),通過輕量級的卷積神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)車牌識別。它采用端到端的訓(xùn)練方式,不依賴字符分割,能夠直接處理整張車牌圖像,并輸出最終的字符序列。這種設(shè)計(jì)提高了識別的實(shí)時(shí)
    發(fā)表于 10-10 16:40

    matlab 神經(jīng)網(wǎng)絡(luò) 數(shù)學(xué)建模數(shù)值分析

    matlab神經(jīng)網(wǎng)絡(luò) 數(shù)學(xué)建模數(shù)值分析 精通的可以討論下
    發(fā)表于 09-18 15:14

    國產(chǎn)芯上運(yùn)行TinyMaxi輕量級的神經(jīng)網(wǎng)絡(luò)推理庫-米爾基于芯馳D9國產(chǎn)商顯板

    本篇測評由優(yōu)秀測評者“短笛君”提供。本文將介紹基于米爾電子MYD-YD9360商顯板(米爾基于芯馳D9360國產(chǎn)開發(fā)板)的TinyMaxi輕量級的神經(jīng)網(wǎng)絡(luò)推理庫方案測試。 算力測試TinyMaix
    發(fā)表于 08-09 18:26

    FPGA在深度神經(jīng)網(wǎng)絡(luò)中的應(yīng)用

    隨著人工智能技術(shù)的飛速發(fā)展,深度神經(jīng)網(wǎng)絡(luò)(Deep Neural Network, DNN)作為其核心算法之一,在圖像識別、語音識別、自然語言處理等領(lǐng)域取得了顯著成果。然而,傳統(tǒng)的深度
    的頭像 發(fā)表于 07-24 10:42 ?1204次閱讀