一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

特斯拉的圖像識(shí)別原理是什么?

深圳市汽車(chē)電子行業(yè)協(xié)會(huì) ? 來(lái)源:阿寶1990 ? 作者:阿寶1990 ? 2021-06-26 14:04 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

特斯拉利用8個(gè)攝像頭來(lái)識(shí)別現(xiàn)實(shí)世界中的物體。攝像頭獲取的圖像包括行人、其他車(chē)輛、動(dòng)物或障礙物,這不僅對(duì)特斯拉車(chē)輛駕駛員的安全很重要,對(duì)其他人也很重要。專(zhuān)利稱(chēng),重要的是,攝像頭能夠及時(shí)準(zhǔn)確地識(shí)別這些物體。

785551ea-d5b5-11eb-9e57-12bb97331649.png

特斯拉專(zhuān)利框

特斯拉專(zhuān)利演示

算法的代碼層面來(lái)說(shuō),特斯拉把它們的深度學(xué)習(xí)網(wǎng)絡(luò)稱(chēng)為HydraNet。其中,基礎(chǔ)算法代碼是共享的,整個(gè)HydraNet包含48個(gè)不同的神經(jīng)網(wǎng)絡(luò),通過(guò)這48個(gè)神經(jīng)網(wǎng)絡(luò),就能輸出1000個(gè)不同的預(yù)測(cè)張量。理論上來(lái)說(shuō),特斯拉的這個(gè)超級(jí)網(wǎng)絡(luò),能同時(shí)檢測(cè)1000種物體。完成這些運(yùn)算并不簡(jiǎn)單,特斯拉已經(jīng)耗費(fèi)了7萬(wàn)個(gè)GPU小時(shí)進(jìn)行深度學(xué)習(xí)模型訓(xùn)練。

雖然工作量很大,但由于大部分工作由機(jī)器承擔(dān),特斯拉的人工智能團(tuán)隊(duì)僅由幾十人組成,與其他自動(dòng)駕駛公司數(shù)百人甚至數(shù)千人的規(guī)模相比,確實(shí)規(guī)模不大。

完成2D的圖像還不算牛掰的,畢竟云端有超級(jí)計(jì)算機(jī)可以去訓(xùn)練,本地的芯片也是自己開(kāi)發(fā)的,可以很好的匹配算法,特斯拉真正牛掰的地方,通過(guò)視覺(jué)完成3D的深度信息,并可以通過(guò)視覺(jué)建立高精度地圖,完成一些底下停車(chē)場(chǎng)的附件駕駛場(chǎng)景。

特斯拉全車(chē)共配備了8個(gè)攝像頭,一個(gè)毫米波雷達(dá)和12個(gè)超聲波雷達(dá),監(jiān)測(cè)外部環(huán)境,向自動(dòng)駕駛電腦實(shí)時(shí)傳送信息。

特斯拉車(chē)外傳感器

簡(jiǎn)單來(lái)看,特斯拉的攝像頭、毫米波雷達(dá)、超聲波雷達(dá)以及慣性測(cè)量單元記錄下當(dāng)前車(chē)輛所處的環(huán)境數(shù)據(jù),并將數(shù)據(jù)發(fā)送給特斯拉的自動(dòng)駕駛電腦。自動(dòng)駕駛電腦在進(jìn)行算法的計(jì)算之后,將速度和方向信息傳遞給轉(zhuǎn)向舵以及加速、制動(dòng)踏板,實(shí)現(xiàn)對(duì)車(chē)輛的控制。

不過(guò),在日常行駛過(guò)程中,攝像頭作為傳感器捕捉的內(nèi)容都是二維圖像,并沒(méi)有深度信息。

也就是說(shuō),雖然二維圖像已經(jīng)可以區(qū)分公路和路旁的人行道,但并不知道現(xiàn)在車(chē)輛距離“馬路牙子”還有多遠(yuǎn)。由于缺失這樣一個(gè)重要信息,自動(dòng)駕駛的運(yùn)算可能并不準(zhǔn)確,操作可能出錯(cuò)。因此,捕捉或者建立一個(gè)三維的圖景很有必要。

特斯拉使用三目相機(jī)的,它可以通過(guò)比較兩個(gè)攝像頭圖像的差異判斷物體的遠(yuǎn)近,獲得物體的深度信息。通過(guò)中央處理器對(duì)輸入圖像進(jìn)行感知、分割、檢測(cè)、跟蹤等操作,輸出給導(dǎo)航網(wǎng)絡(luò)端進(jìn)行語(yǔ)義建圖及匹配定位,同時(shí)通過(guò)目標(biāo)識(shí)別形成相應(yīng)的ADAS系統(tǒng)目標(biāo)屬性。

特斯拉還有更厲害的地方,那就是算法可以預(yù)測(cè)流媒體視頻中每一個(gè)像素的深度信息。也就是說(shuō),只要算法足夠好,流媒體視頻更加清晰,特斯拉的視覺(jué)傳感器所捕捉的深度信息甚至可以超過(guò)激光雷達(dá)。

在實(shí)際的自動(dòng)駕駛應(yīng)用中,泊車(chē)入位和智能召喚兩個(gè)使用場(chǎng)景下就能充分利用這套算法。在停車(chē)場(chǎng)行駛時(shí),車(chē)輛之間的距離很小,即使是駕駛員駕駛,稍不留神也很容易出現(xiàn)刮蹭事故。對(duì)于機(jī)器來(lái)說(shuō),停車(chē)場(chǎng)場(chǎng)景的行駛更加困難。在預(yù)測(cè)到深度信息之后,車(chē)輛可以在超聲波雷達(dá)的輔助之下,快速完成對(duì)周?chē)h(huán)境的識(shí)別,車(chē)輛泊車(chē)就會(huì)更加順利。

在完成深度信息的預(yù)測(cè)之后,這部分信息會(huì)顯示在車(chē)機(jī)上,同時(shí)也會(huì)直接參與控制轉(zhuǎn)向、加速、制動(dòng)等駕駛動(dòng)作。不過(guò),轉(zhuǎn)向、加速、制動(dòng)這些駕駛策略沒(méi)有固定的規(guī)則,有一定靈活性。因此,自動(dòng)駕駛的駕駛策略沒(méi)有最佳,只有更好。

怎么提高神經(jīng)網(wǎng)絡(luò)的算法效率:

為什么這么多廠家只有百度敢挑戰(zhàn)視覺(jué)為主的輔助駕駛方案,不使用激光雷達(dá),其中很大一個(gè)原因就是神經(jīng)網(wǎng)絡(luò)算法相當(dāng)耗費(fèi)芯片算力和內(nèi)存資源,本地端的芯片要算力足夠強(qiáng)大,對(duì)于神經(jīng)網(wǎng)絡(luò)的算法要有優(yōu)化。

對(duì)于神經(jīng)網(wǎng)絡(luò)來(lái)說(shuō),其實(shí)很多的連接并不是一定要存在的,也就是說(shuō)我去掉一些連接,可能壓縮后的網(wǎng)絡(luò)精度相比壓縮之前并沒(méi)有太大的變化?;谶@樣的理念,很多剪枝的方案也被提了出來(lái),也確實(shí)從壓縮的角度帶來(lái)了很大效果提升。

需要特別提出的是,大家從圖中可以看到,深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)包括卷積層和全連接層兩大塊,剪枝對(duì)全連接層的壓縮效率是最大的。下面柱狀圖的藍(lán)色部分就是壓縮之后的系數(shù)占比,從中可以看到剪枝對(duì)全連接層的壓縮是最大的,而對(duì)卷積層的壓縮效果相比全連接層則差了很多。

所以這也是為什么,在語(yǔ)音的加速上很容易用到剪枝的一些方案,但是在機(jī)器視覺(jué)等需要大量卷積層的應(yīng)用中剪枝效果并不理想。

對(duì)于整個(gè)Deep Learning網(wǎng)絡(luò)來(lái)說(shuō),每個(gè)權(quán)重系數(shù)是不是一定要浮點(diǎn)的,定點(diǎn)是否就能滿足?定點(diǎn)是不是一定要32位的?很多人提出8位甚至1位的定點(diǎn)系數(shù)也能達(dá)到很不錯(cuò)的效果,這樣的話從系數(shù)壓縮來(lái)看就會(huì)有非常大的效果。從下面三張人臉識(shí)別的紅點(diǎn)和綠點(diǎn)的對(duì)比,就可以看到其實(shí)8位定點(diǎn)系數(shù)在很多情況下已經(jīng)非常適用了,和32位定點(diǎn)系數(shù)相比并沒(méi)有太大的變化。所以,從這個(gè)角度來(lái)說(shuō),權(quán)重系數(shù)的壓縮也會(huì)帶來(lái)網(wǎng)絡(luò)模型的壓縮,從而帶來(lái)計(jì)算的加速。

這些都需要非常資深的軟件算法團(tuán)隊(duì)去優(yōu)化,同時(shí)需要懂得底層芯片的資源情況,而百度在人工算法這方面非常具有優(yōu)勢(shì),所以有勇氣去挑戰(zhàn)視覺(jué)為主的自動(dòng)駕駛 Apollo Lite方案。

百度表示,攝像頭是相對(duì)成熟的傳感器,除具備輕巧低成本和符合車(chē)規(guī)的優(yōu)勢(shì)外,高分辨率高幀率(成像頻率)的成像技術(shù)發(fā)展趨勢(shì)意味著圖像內(nèi)蘊(yùn)含的環(huán)境信息更豐富,同時(shí)視頻數(shù)據(jù)也和人眼感知的真實(shí)世界最為相似,但和三維點(diǎn)云數(shù)據(jù)相比,二維圖像中的信息更難挖掘,需要設(shè)計(jì)更強(qiáng)大的算法、大量數(shù)據(jù)的積累和更長(zhǎng)期的研發(fā)投入。

責(zé)任編輯:lq6

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 攝像頭
    +關(guān)注

    關(guān)注

    61

    文章

    4981

    瀏覽量

    98376
  • 特斯拉
    +關(guān)注

    關(guān)注

    66

    文章

    6378

    瀏覽量

    129142

原文標(biāo)題:【行業(yè)資訊】自動(dòng)駕駛傳感器之?dāng)z像頭(十二)特斯拉圖像識(shí)別原理闡述

文章出處:【微信號(hào):qidianxiehui,微信公眾號(hào):深圳市汽車(chē)電子行業(yè)協(xié)會(huì)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    基于FPGA的數(shù)字識(shí)別系統(tǒng)設(shè)計(jì)

    圖像處理領(lǐng)域,圖像識(shí)別是較為困難而關(guān)鍵的技術(shù)。這項(xiàng)技術(shù)被廣泛的應(yīng)用到娛樂(lè)、工業(yè)、軍事等領(lǐng)域。本次設(shè)計(jì)數(shù)字識(shí)別系統(tǒng)已經(jīng)在車(chē)牌識(shí)別、運(yùn)動(dòng)員號(hào)碼識(shí)別
    的頭像 發(fā)表于 07-16 14:28 ?521次閱讀
    基于FPGA的數(shù)字<b class='flag-5'>識(shí)別</b>系統(tǒng)設(shè)計(jì)

    火車(chē)車(chē)號(hào)圖像識(shí)別系統(tǒng)如何應(yīng)對(duì)不同光照條件下的識(shí)別問(wèn)題?

    在鐵路運(yùn)輸管理中,準(zhǔn)確識(shí)別火車(chē)車(chē)號(hào)是實(shí)現(xiàn)自動(dòng)化車(chē)輛管理的關(guān)鍵環(huán)節(jié)。然而,實(shí)際應(yīng)用場(chǎng)景中復(fù)雜多變的光照條件給車(chē)號(hào)識(shí)別帶來(lái)了巨大挑戰(zhàn)?,F(xiàn)代火車(chē)車(chē)號(hào)圖像識(shí)別系統(tǒng)通過(guò)多項(xiàng)技術(shù)創(chuàng)新,有效解決了這一難題。 多
    的頭像 發(fā)表于 07-15 11:37 ?125次閱讀
    火車(chē)車(chē)號(hào)<b class='flag-5'>圖像識(shí)別</b>系統(tǒng)如何應(yīng)對(duì)不同光照條件下的<b class='flag-5'>識(shí)別</b>問(wèn)題?

    想用K230放在無(wú)人機(jī)上做圖像識(shí)別,加裝一個(gè)4G模塊把識(shí)別結(jié)果和畫(huà)面同時(shí)傳輸?shù)牡孛嬲净蛘呤謾C(jī)上,怎么操作?

    我想用K230放在無(wú)人機(jī)上做圖像識(shí)別,然后想加裝一個(gè)4G模塊把識(shí)別結(jié)果和畫(huà)面同時(shí)傳輸?shù)牡孛嬲净蛘呤謾C(jī)上,這個(gè)目前可以如何處理? 你好,目前底層是支持4G模塊得驅(qū)動(dòng),參考https
    發(fā)表于 06-16 07:08

    手持終端集裝箱識(shí)別系統(tǒng)的圖像識(shí)別技術(shù)

    行業(yè)提供了更靈活、精準(zhǔn)的管理工具。 一、技術(shù)核心:OCR+AI深度融合 現(xiàn)代手持終端系統(tǒng)采用多模態(tài)圖像識(shí)別技術(shù),結(jié)合深度學(xué)習(xí)算法,可快速捕捉并解析集裝箱號(hào)碼。其技術(shù)優(yōu)勢(shì)體現(xiàn)在: 1. 復(fù)雜環(huán)境適應(yīng)性:通過(guò)動(dòng)態(tài)曝光補(bǔ)償和圖像增強(qiáng)算
    的頭像 發(fā)表于 04-03 10:49 ?297次閱讀

    岸橋箱號(hào)識(shí)別系統(tǒng)如何工作?揭秘AI圖像識(shí)別技術(shù)!

    在港口自動(dòng)化升級(jí)的浪潮中,AI岸橋識(shí)別系統(tǒng)憑借前沿的圖像識(shí)別技術(shù),成為提升碼頭作業(yè)效率的“智慧之眼”。那么,這套系統(tǒng)如何實(shí)現(xiàn)集裝箱信息的精準(zhǔn)捕捉?又是如何通過(guò)AI技術(shù)替代傳統(tǒng)人工理貨?讓我們一探
    的頭像 發(fā)表于 04-02 09:45 ?255次閱讀

    驚了!這個(gè)“神器”讓樹(shù)莓派秒變智能管家,圖像識(shí)別+無(wú)線投屏,太秀了!

    和BalenaCloud,讓樹(shù)莓派實(shí)現(xiàn)從圖像識(shí)別到智能生活的華麗轉(zhuǎn)身!圖像分類(lèi)項(xiàng)目:用樹(shù)莓派和BalenaOS實(shí)現(xiàn)智能識(shí)別1.項(xiàng)目背景:讓樹(shù)莓派“看懂”世界想象一下,你的
    的頭像 發(fā)表于 03-25 09:23 ?614次閱讀
    驚了!這個(gè)“神器”讓樹(shù)莓派秒變智能管家,<b class='flag-5'>圖像識(shí)別</b>+無(wú)線投屏,太秀了!

    【幸狐Omni3576邊緣計(jì)算套件試用體驗(yàn)】RKNN 推理測(cè)試與圖像識(shí)別

    【幸狐 Omni3576 邊緣計(jì)算套件測(cè)評(píng)】RKNN 推理測(cè)試與圖像識(shí)別 本文介紹了幸狐 Omni3576 邊緣計(jì)算套件實(shí)現(xiàn) RKNN 推理和圖像物體識(shí)別的測(cè)試流程,包括 RKNN 介紹、環(huán)境搭建
    發(fā)表于 03-20 16:14

    BP神經(jīng)網(wǎng)絡(luò)在圖像識(shí)別中的應(yīng)用

    BP神經(jīng)網(wǎng)絡(luò)在圖像識(shí)別中發(fā)揮著重要作用,其多層結(jié)構(gòu)使得網(wǎng)絡(luò)能夠?qū)W習(xí)到復(fù)雜的特征表達(dá),適用于處理非線性問(wèn)題。以下是對(duì)BP神經(jīng)網(wǎng)絡(luò)在圖像識(shí)別中應(yīng)用的分析: 一、BP神經(jīng)網(wǎng)絡(luò)基本原理 BP神經(jīng)網(wǎng)絡(luò),即反向
    的頭像 發(fā)表于 02-12 15:12 ?679次閱讀

    AI模型部署邊緣設(shè)備的奇妙之旅:目標(biāo)檢測(cè)模型

    1簡(jiǎn)介人工智能圖像識(shí)別是人工智能領(lǐng)域的一個(gè)重要分支,它涉及計(jì)算機(jī)視覺(jué)、深度學(xué)習(xí)、機(jī)器學(xué)習(xí)等多個(gè)領(lǐng)域的知識(shí)和技術(shù)。圖像識(shí)別主要是處理具有一定復(fù)雜性的信息。計(jì)算機(jī)采用與人類(lèi)類(lèi)似的圖像識(shí)別原理,即對(duì)
    的頭像 發(fā)表于 12-19 14:12 ?1368次閱讀
    AI模型部署邊緣設(shè)備的奇妙之旅:目標(biāo)檢測(cè)模型

    高幀頻圖像識(shí)別反無(wú)人機(jī) 慧視有辦法!

    無(wú)人機(jī)的迅猛發(fā)展,使得無(wú)人機(jī)的反制技術(shù)也水漲船高,常見(jiàn)的有電子干擾、無(wú)人機(jī)識(shí)別對(duì)抗等。前者通過(guò)發(fā)射特定頻率的無(wú)線電波對(duì)無(wú)人機(jī)的通信鏈路、控制信號(hào)實(shí)施干擾。后者采用圖像識(shí)別技術(shù),通過(guò)在無(wú)人機(jī)微型攝像頭
    的頭像 發(fā)表于 12-04 01:06 ?601次閱讀
    高幀頻<b class='flag-5'>圖像識(shí)別</b>反無(wú)人機(jī)   慧視有辦法!

    AI圖像識(shí)別攝像機(jī)

    隨著科技的迅猛發(fā)展,人工智能(AI)在各個(gè)領(lǐng)域的應(yīng)用越來(lái)越廣泛,其中圖像識(shí)別技術(shù)尤為引人注目。AI圖像識(shí)別攝像機(jī)作為這一技術(shù)的重要應(yīng)用之一,正在逐步改變我們的生活和工作方式。什么是AI圖像識(shí)別攝像機(jī)
    的頭像 發(fā)表于 11-08 10:38 ?873次閱讀
    AI<b class='flag-5'>圖像識(shí)別</b>攝像機(jī)

    AI大模型在圖像識(shí)別中的優(yōu)勢(shì)

    AI大模型在圖像識(shí)別中展現(xiàn)出了顯著的優(yōu)勢(shì),這些優(yōu)勢(shì)主要源于其強(qiáng)大的計(jì)算能力、深度學(xué)習(xí)算法以及大規(guī)模的數(shù)據(jù)處理能力。以下是對(duì)AI大模型在圖像識(shí)別中優(yōu)勢(shì)的介紹: 一、高效性與準(zhǔn)確性 處理速度 :AI
    的頭像 發(fā)表于 10-23 15:01 ?2437次閱讀

    【飛凌嵌入式OK3576-C開(kāi)發(fā)板體驗(yàn)】RKNPU圖像識(shí)別測(cè)試

    和突觸的處理器,特別擅長(zhǎng)處理人工智能任務(wù),能夠大大降低CPU和GPU的負(fù)擔(dān)。 功能 :RKNPU負(fù)責(zé)處理需要高計(jì)算性能的人工智能任務(wù),如圖像識(shí)別、語(yǔ)音識(shí)別、自然語(yǔ)言處理等,從而提升設(shè)備的智能化水平
    發(fā)表于 10-10 09:27

    深度識(shí)別算法包括哪些內(nèi)容

    :CNN是深度學(xué)習(xí)中處理圖像和視頻等具有網(wǎng)格結(jié)構(gòu)數(shù)據(jù)的主要算法。它通過(guò)卷積層、池化層和全連接層等組件,實(shí)現(xiàn)對(duì)圖像特征的自動(dòng)提取和識(shí)別。 應(yīng)用領(lǐng)域 :CNN在圖像識(shí)別、目標(biāo)檢測(cè)、視頻分
    的頭像 發(fā)表于 09-10 15:28 ?842次閱讀

    升降梯人數(shù)統(tǒng)計(jì)識(shí)別攝像機(jī)

    升降梯人數(shù)統(tǒng)計(jì)識(shí)別攝像機(jī)是一種結(jié)合了圖像識(shí)別技術(shù)和智能算法的設(shè)備,旨在監(jiān)測(cè)和統(tǒng)計(jì)升降梯內(nèi)乘客數(shù)量,并實(shí)時(shí)顯示在屏幕上。這種攝像機(jī)可以有效提高建筑物管理的效率,方便管理人員及時(shí)掌握乘客流量情況,從而
    的頭像 發(fā)表于 08-30 11:23 ?569次閱讀
    升降梯人數(shù)統(tǒng)計(jì)<b class='flag-5'>識(shí)別</b>攝像機(jī)