一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

如何讓一輛自動(dòng)駕駛汽車以最完美的速度上路?

DPVg_AI_era ? 來(lái)源:未知 ? 作者:李倩 ? 2018-07-11 09:42 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

劍橋大學(xué)兩位博士創(chuàng)辦的公司使用強(qiáng)化學(xué)習(xí)算法,無(wú)需密集標(biāo)注的3D地圖,無(wú)需人工設(shè)計(jì)的規(guī)則,讓汽車在短短20分鐘內(nèi)學(xué)會(huì)了自動(dòng)駕駛。公司成立不到50天,已經(jīng)拿到了優(yōu)步首席科學(xué)家的投資。

今天的自動(dòng)駕駛汽車雖然已經(jīng)性能不錯(cuò),但大多數(shù)自動(dòng)駕駛汽車都使用大量的攝像頭和傳感器、地圖工具和大量的計(jì)算機(jī)程序,比較不完美。

如何讓一輛自動(dòng)駕駛汽車以最完美的速度上路?有一種做法是增加操作系統(tǒng)智能而不是傳感器。

劍橋大學(xué)工程系的兩位博士創(chuàng)辦的Wayve團(tuán)隊(duì)使用強(qiáng)化學(xué)習(xí)算法,第一次實(shí)現(xiàn)讓計(jì)算機(jī)學(xué)會(huì)像人一樣,通過(guò)練習(xí)來(lái)完成自動(dòng)駕駛。該算法與人類安全駕駛員一起教會(huì)了汽車如何在“15-20分鐘”的時(shí)間內(nèi)保持在一條車道內(nèi)。

Wayve團(tuán)隊(duì)認(rèn)為,自動(dòng)駕駛需要的是一臺(tái)更智能的電腦,而不是更多的傳感器或程序,他們的研究也證明了自己的理論。

DeepMind玩Atari游戲需要數(shù)百萬(wàn)次試驗(yàn),但深度強(qiáng)化學(xué)習(xí)讓汽車20分鐘內(nèi)學(xué)會(huì)自動(dòng)駕駛

DeepMind已經(jīng)證明,深度強(qiáng)化學(xué)習(xí)方法可以在許多游戲中實(shí)現(xiàn)超越人類的表現(xiàn),包括圍棋、象棋和許多電腦游戲,而且?guī)缀蹩偸莿龠^(guò)任何基于規(guī)則的系統(tǒng)。

Wayve團(tuán)隊(duì)深得DeepMind和OpenAI經(jīng)常使用的強(qiáng)化學(xué)習(xí)算法精髓,并且巧妙的用在了自動(dòng)駕駛車上。

為了證明強(qiáng)化學(xué)習(xí)+自動(dòng)駕駛這種方法可行,Wayve團(tuán)隊(duì)配置了一輛雷諾Twizy,它很簡(jiǎn)單,只配備了一個(gè)攝像頭和油箱、剎車和轉(zhuǎn)向控制等裝置。算法使用“深度卷積神經(jīng)網(wǎng)絡(luò)”的模型,該模型接收僅使用一個(gè)GPU處理的單個(gè)圖像的輸入。

視頻中,最初,汽車就像嬰兒邁出了第一步,步履蹣跚。但當(dāng)汽車開始轉(zhuǎn)向車道外時(shí),一名安全駕駛員介入,重新把車轉(zhuǎn)向車道內(nèi)。算法了解到每次修正行駛過(guò)程時(shí)都是在糾錯(cuò),并根據(jù)它在沒有任何干預(yù)的情況下行進(jìn)了多遠(yuǎn)而得到“獎(jiǎng)勵(lì)”。

通過(guò)這種方式,計(jì)算機(jī)能夠在大約20分鐘內(nèi)學(xué)會(huì)如何防止汽車從路上跑偏。在那之后,它可以無(wú)限期地行駛下去。

Wayve團(tuán)隊(duì)的這項(xiàng)研究表明,類似的哲學(xué)在現(xiàn)實(shí)世界中也是可能的,特別是在自動(dòng)駕駛汽車中。而且,DeepMind玩Atari游戲的算法需要數(shù)百萬(wàn)次試驗(yàn)才能解決一個(gè)任務(wù)。而Wayve的團(tuán)隊(duì)在不到20次的試驗(yàn)中就學(xué)會(huì)了讓車始終“沿著單行道行駛”。

無(wú)需密集標(biāo)注的3D地圖,無(wú)需人工設(shè)計(jì)的規(guī)則

大型科技公司做自動(dòng)駕駛通常采用工程思維方法,即設(shè)計(jì)一種基于規(guī)則的系統(tǒng),處理每一個(gè)邊緣問(wèn)題,同時(shí)使用更多的傳感器,獲取更多的數(shù)據(jù)。這可能會(huì)在特定的、狹義的環(huán)境中產(chǎn)生令人鼓舞的結(jié)果,但并不能真正解決自動(dòng)駕駛問(wèn)題。

Wayve的團(tuán)隊(duì)是第一個(gè)自動(dòng)駕駛汽車在線學(xué)習(xí)的例子,每一次嘗試都會(huì)使它變得更好。那么,具體是怎么做到的呢?

他們給出了技術(shù)細(xì)節(jié):

他們采用了一種流行的無(wú)模型深度強(qiáng)化學(xué)習(xí)算法——深度確定性策略梯度(deep deterministic policy gradients,DDPG)來(lái)解決車道跟蹤任務(wù)。模型輸入是來(lái)自單目攝像機(jī)的圖像。系統(tǒng)迭代了3個(gè)過(guò)程:探索,優(yōu)化和評(píng)估。

網(wǎng)絡(luò)架構(gòu)是一個(gè)深度網(wǎng)絡(luò),有4個(gè)卷積層和3個(gè)完全連接層,總共只有不到10k個(gè)參數(shù)。相比之下,目前表現(xiàn)最優(yōu)的圖像分類架構(gòu)有數(shù)百萬(wàn)個(gè)參數(shù)。

所有的處理都在汽車的一個(gè)圖形處理單元(GPU)上進(jìn)行。

機(jī)器人放到危險(xiǎn)的真實(shí)環(huán)境中工作會(huì)帶來(lái)很多新問(wèn)題。為了更好地理解手頭的任務(wù),找到合適的模型架構(gòu)和超參數(shù),他們?cè)?a href="http://www.www27dydycom.cn/analog/" target="_blank">模擬環(huán)境中進(jìn)行了大量的測(cè)試。

上圖是一個(gè)例子,從不同角度展示了車輛在模擬環(huán)境中如何沿著道路行駛。該算法僅看到駕駛員的視角,即上圖中間。在每個(gè)episode,隨機(jī)生成一條彎曲的車道,以及道路的紋理和車道標(biāo)記。agent一直在探索,直到偏離了車道,此時(shí)一個(gè)episode結(jié)束。然后根據(jù)搜集到的數(shù)據(jù)進(jìn)行策略優(yōu)化,一直重復(fù)這個(gè)過(guò)程。

基于任務(wù)的workflow和訓(xùn)練算法的架構(gòu)

團(tuán)隊(duì)使用模擬測(cè)試來(lái)嘗試不同的神經(jīng)網(wǎng)絡(luò)架構(gòu)和超參數(shù),直到找到僅需很少的訓(xùn)練次數(shù)(也就是在只有很少數(shù)據(jù)的情況下),始終能解決車道跟蹤任務(wù)的設(shè)置。例如,一個(gè)發(fā)現(xiàn)是,使用自動(dòng)編碼器重建損失來(lái)訓(xùn)練卷積層,這大大提高了訓(xùn)練的穩(wěn)定性和數(shù)據(jù)效率。

使用DDPG+VAE,極大地提高了從原始像素進(jìn)行DDPG訓(xùn)練的數(shù)據(jù)效率,這表明在實(shí)際系統(tǒng)上應(yīng)用強(qiáng)化學(xué)習(xí)時(shí),state representation是一個(gè)重要的考慮因素。實(shí)驗(yàn)使用的250米行駛路線如右圖所示。

下表是在250米道路上實(shí)現(xiàn)自動(dòng)駕駛車輛的強(qiáng)化學(xué)習(xí)結(jié)果。

團(tuán)隊(duì)報(bào)告了每個(gè)模型的最佳性能。他們觀察到baseline RL智能體可以從頭開始學(xué)習(xí)車道跟蹤,但VAE變體更有效率,僅在11次訓(xùn)練后就成功學(xué)會(huì)沿著車道駕駛。

想象一下,部署一個(gè)自動(dòng)駕駛汽車的車隊(duì),一開始自動(dòng)駕駛算法是人類駕駛員表現(xiàn)的95%。這樣一個(gè)系統(tǒng)不會(huì)像視頻中隨機(jī)初始化的模型那樣搖搖晃晃,而是幾乎能夠處理交通信號(hào)燈、環(huán)形路、十字路口等等各種情況。

經(jīng)過(guò)一天的駕駛和人類安全駕駛員接管提供的反饋,系統(tǒng)能夠在線提升,也許能提升到96%。一個(gè)星期后,提高到98%;一個(gè)月后,達(dá)到人類表現(xiàn)的99%。幾個(gè)月后,這個(gè)系統(tǒng)的表現(xiàn)可能以及超過(guò)了人類,因?yàn)樗軓亩嗝踩{駛員的反饋中獲益。

在20分鐘內(nèi)就學(xué)會(huì)了從零開始沿著車道行駛,那么,想象一下,一整天的話可以學(xué)到什么?

兩位劍橋博士創(chuàng)辦,公司成立不到50天已獲優(yōu)步首席科學(xué)家投資

Wayve于今年5月22日剛剛創(chuàng)立,創(chuàng)始人是兩位來(lái)自英國(guó)劍橋大學(xué)的博士Amar Shah和Alex Kendall。

Wayve團(tuán)隊(duì)現(xiàn)有約10名成員,由來(lái)自劍橋大學(xué)和牛津大學(xué)的機(jī)器人、計(jì)算機(jī)視覺人工智能專家組成,他們之前曾在NASA、谷歌、Facebook、Skydio和微軟等公司工作過(guò)。他們專注于利用深度學(xué)習(xí)解決視覺場(chǎng)景理解、不確定環(huán)境中的自主決策等問(wèn)題。

值得一提的是,劍橋大學(xué)教授、Uber首席科學(xué)家Zoubin Ghahramani是Wayve的投資人之一。

不同于大部分自動(dòng)駕駛車輛的傳統(tǒng)思維,Wayve團(tuán)隊(duì)號(hào)稱要構(gòu)建“端到端的機(jī)器學(xué)習(xí)算法”,將強(qiáng)化學(xué)習(xí)方法用于自動(dòng)駕駛汽車。他們認(rèn)為制造真正的自動(dòng)駕駛汽車的關(guān)鍵在于軟件的自學(xué)能力,它需要的是更好的協(xié)調(diào),這能夠使自主駕駛成為現(xiàn)實(shí)。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 傳感器
    +關(guān)注

    關(guān)注

    2565

    文章

    52971

    瀏覽量

    767182
  • 自動(dòng)駕駛
    +關(guān)注

    關(guān)注

    788

    文章

    14312

    瀏覽量

    170574
  • 強(qiáng)化學(xué)習(xí)

    關(guān)注

    4

    文章

    269

    瀏覽量

    11597

原文標(biāo)題:強(qiáng)化學(xué)習(xí)20分鐘,劍橋博士教汽車學(xué)會(huì)自動(dòng)駕駛!

文章出處:【微信號(hào):AI_era,微信公眾號(hào):新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    福特利用機(jī)器人開發(fā)能"遠(yuǎn)距遙控"的半自動(dòng)駕駛系統(tǒng)

    ` 福特汽車近期展開「遠(yuǎn)距遙控」半自動(dòng)駕駛系統(tǒng)實(shí)測(cè):只要套如電玩游戲般的平價(jià)控制系統(tǒng)、三臺(tái)監(jiān)控螢?zāi)?,車上再安裝幾個(gè)基本硬體設(shè)備,以及 4G LTE 的網(wǎng)路連線,就能把一輛遠(yuǎn)在2400
    發(fā)表于 03-04 14:45

    自動(dòng)駕駛難道還要人工充電?

    ,而這些充電設(shè)備將會(huì)被安裝在停車場(chǎng)和道路上?! erek Aberle認(rèn)為,雖然這項(xiàng)技術(shù)還需要很長(zhǎng)段時(shí)間才能成為現(xiàn)實(shí),但是它能夠自動(dòng)駕駛汽車實(shí)現(xiàn)真正的
    發(fā)表于 03-03 13:54

    【話題】特斯拉首起自動(dòng)駕駛致命車禍,自動(dòng)駕駛的冬天來(lái)了?

    自動(dòng)駕駛致死的車禍。該車禍?zhǔn)墙衲?月7日美國(guó)弗羅里達(dá)洲位名叫Joshua Brown的40歲大哥開著一輛自動(dòng)駕駛模式行駛的Model S
    發(fā)表于 07-05 11:14

    [科普] 谷歌自動(dòng)駕駛汽車發(fā)展簡(jiǎn)史,都來(lái)了解下吧!

    合作協(xié)議,福特獨(dú)立自主地開發(fā)自動(dòng)駕駛汽車。  2016年2月,谷歌自動(dòng)駕駛汽車首次遭遇交通事故:一輛谷歌
    發(fā)表于 10-25 11:08

    因?yàn)椤覆粔虬踩梗覀兙捅仨毦芙^自動(dòng)駕駛汽車上路?

    當(dāng)提及自動(dòng)駕駛汽車,汽車行業(yè)本身在追問(wèn),***的規(guī)則制定者和安全倡導(dǎo)者們都在糾結(jié)個(gè)基礎(chǔ)的問(wèn)題:究竟如何才是足夠安全?這有點(diǎn)像是場(chǎng)發(fā)生在
    發(fā)表于 04-08 11:17

    【威雅利 汽車】蘋果最新專利曝光,要把VR和AR帶進(jìn)自動(dòng)駕駛汽車

    負(fù)責(zé),乘客可以把真實(shí)環(huán)境替換成不同城市的街景,旅程變得更加有趣。在3年前,有報(bào)道稱蘋果正在開發(fā)代號(hào)為Project Titan的自動(dòng)駕駛汽車,隨后也有多名高管隱約證實(shí)了這消息。雖然
    發(fā)表于 04-24 17:05

    自動(dòng)駕駛零排放汽車世界更加綠色

    的通信,集成電路可以使汽車的自主性能更高。TI的傳感器已經(jīng)應(yīng)用于駕駛員輔助和自主泊車系統(tǒng),最終目的是打造一輛自動(dòng)駕駛汽車。相對(duì)于大多數(shù)
    發(fā)表于 03-11 06:45

    車聯(lián)網(wǎng)對(duì)自動(dòng)駕駛的影響

    技能的自動(dòng)駕駛汽車,可以通過(guò)對(duì)上海市所有車主的上下班時(shí)間收集,通過(guò)導(dǎo)航來(lái)統(tǒng)籌規(guī)劃每輛車合適的出發(fā)時(shí)間,行駛路徑,從而達(dá)到交通效率的最優(yōu)解。再或者人類駕駛員無(wú)法看到的視野盲區(qū),突然有一輛
    發(fā)表于 03-19 06:20

    如何自動(dòng)駕駛更加安全?

    了全球范圍對(duì)自動(dòng)駕駛安全性的議論:如何自動(dòng)駕駛更加安全?真正上路前還要做哪些準(zhǔn)備?智能汽車成為全球汽車
    發(fā)表于 05-13 00:26

    自動(dòng)駕駛汽車的處理能力怎么樣?

    對(duì)環(huán)境和擁堵產(chǎn)生積極影響。市場(chǎng)調(diào)研公司ABI Research預(yù)測(cè):到2030年,道路上四分之汽車將會(huì)是自動(dòng)駕駛汽車。行業(yè)專家已經(jīng)為自動(dòng)駕駛
    發(fā)表于 08-07 07:13

    自動(dòng)駕駛的五大傳感器各有千秋

    自動(dòng)駕駛概念想必大家并不陌生,但對(duì)于其中發(fā)揮“眼睛”作用,眼觀六路耳聽八方的各種傳感器,可能大家未必非常熟悉。通常而言,為獲得良好的路況檢測(cè)結(jié)果,一輛自動(dòng)駕駛汽車會(huì)安裝多種傳感器,本文
    發(fā)表于 05-13 08:29

    如何保證自動(dòng)駕駛的安全?

    自動(dòng)駕駛技術(shù)為人們勾勒出了副美好的未來(lái)出行的畫面:坐上沒有方向盤的汽車,覺睡到公司門口;甚至我們可能不再擁有一輛
    發(fā)表于 10-22 07:45

    邊緣計(jì)算在自動(dòng)駕駛汽車的應(yīng)用

    反應(yīng)。處理速度的任何延遲都有可能是致命的。雖然聯(lián)網(wǎng)設(shè)備的數(shù)據(jù)處理現(xiàn)在主要是在云端進(jìn)行的,但在中央服務(wù)器之間來(lái)回傳送數(shù)據(jù)可能需要幾秒鐘的時(shí)間。這時(shí)間跨度太長(zhǎng)了。邊緣計(jì)算則自動(dòng)駕駛
    發(fā)表于 07-12 08:07

    如何從無(wú)到有打造一輛自動(dòng)駕駛車?(硬件篇)精選資料分享

    如何構(gòu)建一輛無(wú)人駕駛車呢?先從無(wú)人駕駛車的硬件開始介紹。1 簡(jiǎn)介無(wú)人駕駛車由車、線控系統(tǒng)、傳感器、計(jì)算單元等組成,如圖2.1所示。車作為無(wú)人...
    發(fā)表于 07-27 08:07

    通用汽車新專利可將任意汽車變成一輛自動(dòng)駕駛汽車的系統(tǒng)

    據(jù)外媒報(bào)道,通用汽車近日推出項(xiàng)新的專利,該專利是個(gè)可將任意汽車變成一輛自動(dòng)駕駛
    發(fā)表于 02-16 11:35 ?1280次閱讀
    通用<b class='flag-5'>汽車</b>新專利可將任意<b class='flag-5'>汽車</b>變成<b class='flag-5'>一輛</b><b class='flag-5'>自動(dòng)駕駛</b><b class='flag-5'>汽車</b>的系統(tǒng)