一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

ICLR 2018和ICRA 2018兩個(gè)會(huì)議進(jìn)行比較

DPVg_AI_era ? 來(lái)源:未知 ? 作者:李倩 ? 2018-07-03 10:37 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

本文作者Alex Irpan是Google Brain機(jī)器人團(tuán)隊(duì)的軟件工程師,他在不到一個(gè)月的時(shí)間里參加了兩個(gè)學(xué)術(shù)會(huì)議:ICLR 2018和ICRA 2018,前者是一個(gè)深度學(xué)習(xí)會(huì)議,后者是機(jī)器人領(lǐng)域的會(huì)議。作者將這兩個(gè)會(huì)議進(jìn)行了比較。

ICLR 2018

從研究的角度來(lái)看,今年ICLR的一大重點(diǎn)是對(duì)抗性學(xué)習(xí)。

深度學(xué)習(xí)領(lǐng)域中最受歡迎的是生成對(duì)抗網(wǎng)絡(luò)。不過(guò),我在這里關(guān)注的更廣,包括對(duì)抗樣本和智能體競(jìng)爭(zhēng)的環(huán)境。實(shí)際上,任何形式的極小極大優(yōu)化問(wèn)題都可以算作對(duì)抗性學(xué)習(xí)。

我不知道GAN是否真的很受歡迎,或者我的記憶帶有選擇性的偏見(jiàn),因?yàn)槲覍?duì)這些方法很感興趣。GAN給人的感覺(jué)很強(qiáng)大。評(píng)估GAN的一種方法是,你通過(guò)使用學(xué)習(xí)隱式成本而不是人為定義的成本來(lái)學(xué)習(xí)生成器。這使你能夠適應(yīng)生成器的能力,并可以定義手動(dòng)解釋可能很麻煩的成本。

當(dāng)然,這會(huì)讓你的問(wèn)題更加復(fù)雜。但是如果你有足夠強(qiáng)的優(yōu)化和建模能力,那么隱式學(xué)習(xí)的成本將比其他方法能提供更清晰的圖像。使用學(xué)習(xí)的組件替換一部分系統(tǒng)的一個(gè)好處是,優(yōu)化和建模能力的進(jìn)步適用于問(wèn)題的更多方面。你正在提高學(xué)習(xí)成本函數(shù)的能力和最小化這些學(xué)習(xí)成本的能力。

從抽象點(diǎn)的觀點(diǎn)來(lái)看,這涉及到具有表現(xiàn)力的、可優(yōu)化的函數(shù)家族的能力,例如神經(jīng)網(wǎng)絡(luò)。Minimax優(yōu)化不是一個(gè)新的想法。它已經(jīng)存在很久了。新的東西是,深度學(xué)習(xí)可以讓你在高維數(shù)據(jù)上建模和學(xué)習(xí)復(fù)雜的成本函數(shù)。對(duì)我來(lái)說(shuō),GAN的有趣之處不是圖像生成,而是它們?cè)趶?fù)雜的數(shù)據(jù)(比如圖像)上的概念證明。這個(gè)框架并不要求使用圖像數(shù)據(jù)。

學(xué)習(xí)過(guò)程中還有其他部分可以用學(xué)習(xí)方法來(lái)替代,而不是用人為定義的方法,深度學(xué)習(xí)就是這樣一種方法。這樣做有意義嗎?也許有。問(wèn)題是,你用深度學(xué)習(xí)方法越多,就越難讓每件事情都可以學(xué)習(xí)(learnable)。

最近Quanta Magazine上有一篇文章,Judea Pearl在上面表達(dá)了他的失望:深度學(xué)習(xí)只是學(xué)習(xí)相關(guān)性和曲線擬合,而這并不涵蓋所有的智能。我同意Judea Pearl的觀點(diǎn),但作為深度學(xué)習(xí)的擁護(hù)者,我認(rèn)為如果你把一個(gè)足夠大的神經(jīng)網(wǎng)絡(luò)足夠好地進(jìn)行優(yōu)化,你可能會(huì)學(xué)到一些看起來(lái)很像因果推理的東西,或者其他可以算作智能的東西。但這就接近哲學(xué)的領(lǐng)域了,所以我就講到這里。

從與會(huì)者的角度來(lái)看,我喜歡這次會(huì)議有很多海報(bào)展示。這是我第一次參加ICLR。我之前參加過(guò)的ML會(huì)議是NIPS,NIPS給我的感覺(jué)是非常大。在NIPS上仔細(xì)閱讀每一張海報(bào)感覺(jué)不太可行。在ICLR閱讀完所有海報(bào)是可能的,盡管你不一定真想這樣做。

我也很欣賞ICLR上企業(yè)招聘不像NIPS那樣荒謬。在NIPS,有些公司會(huì)送奇怪的指尖陀螺和彈簧玩具.......在ICLR,我得到的最奇怪的東西是一雙襪子,雖然奇怪,但也不是特別奇怪。

ICRA 2018

ICRA 2018是我參加的第一個(gè)機(jī)器人會(huì)議。我不知道該期待什么。我一開(kāi)始做的是ML研究,后來(lái)轉(zhuǎn)去研究機(jī)器人,所以我的興趣更接近于學(xué)習(xí)控制,而不是制造新的機(jī)器人。我的理想設(shè)定是,我可以將真實(shí)世界的硬件視為抽象的。

再加上我對(duì)控制理論的貧乏理解,我對(duì)會(huì)議上的許多話題都不熟悉。盡管如此,還是有很多學(xué)習(xí)領(lǐng)域的論文,很高興我去參加了這個(gè)會(huì)。

在我確實(shí)了解的研究中,我很驚訝有這么多的強(qiáng)化學(xué)習(xí)論文??吹剿鼈冎袔缀鯖](méi)有人使用純粹的無(wú)模型的RL,有點(diǎn)有趣。對(duì)于ICRA,如果你的論文提出的模型在真實(shí)世界的機(jī)器人上運(yùn)行過(guò),那么你被接受的可能性會(huì)大得多。這就迫使作者關(guān)注數(shù)據(jù)效率,因此對(duì)只做無(wú)模型的RL有極大的偏見(jiàn)。當(dāng)我四處聽(tīng)演講時(shí),我不斷地聽(tīng)到“我們將無(wú)模型強(qiáng)化學(xué)習(xí)與X結(jié)合在一起”,其中X是基于模型的RL,或者從人類的演示中學(xué)習(xí),或者從運(yùn)動(dòng)規(guī)劃中學(xué)習(xí),或者從任何可以幫助探索問(wèn)題的東西中學(xué)習(xí)。

從更廣泛的層面看,這次會(huì)議是有實(shí)用性的。它雖然是一個(gè)研究會(huì)議,很多內(nèi)容仍然是很推測(cè)性的,但它也覺(jué)得人們可以接受狹窄的、有針對(duì)性的解決方案。我認(rèn)為這是不得不使用真正的硬件造成的另一個(gè)后果。如果需要實(shí)時(shí)運(yùn)行模型,就不能忽略推理時(shí)間。如果需要從真正的機(jī)器人那里收集數(shù)據(jù),就不能忽略數(shù)據(jù)效率。真正的硬件并不關(guān)心你的問(wèn)題是什么。

(1)網(wǎng)絡(luò)必須能夠運(yùn)行。

(2)無(wú)論您做何努力,賦于其何種優(yōu)先級(jí),都無(wú)法提高光的速度。

——RFC 1925

這讓和我交談過(guò)的許多ML研究人員感到驚訝,但這個(gè)機(jī)器人技術(shù)的會(huì)議并沒(méi)有像NIPS / ICLR / ICML的人那樣完全接受ML,部分原因是ML并不總是有效的。機(jī)器學(xué)習(xí)是一個(gè)解決方案,但它不能保證有意義。我的印象是,ICRA中只有少數(shù)人積極地希望ML失敗。只要ML能證明有用,其他人都很樂(lè)意使用ML。在某些領(lǐng)域,它已經(jīng)證明了自己。我看到的每一篇跟感知相關(guān)的論文都以這樣或那樣的方式使用CNN。但是很少有人用深度學(xué)習(xí)來(lái)進(jìn)行控制,因?yàn)榭刂剖怯泻芏嗖淮_定因素的。

像ICLR一樣, ICRA上也有很多公司舉行招聘或擺設(shè)攤位。跟ICLR不同的是,這里的攤位顯得更有趣。大多數(shù)公司都帶了機(jī)器人來(lái)演示,這當(dāng)然比聽(tīng)招聘演說(shuō)更有趣。

在去年的NIPS上,我注意到ML公司的展位讓我想起了Berkeley的職業(yè)招聘會(huì)。每一家科技公司都想招到Berkeley的應(yīng)屆畢業(yè)生。這就像一場(chǎng)軍備競(jìng)賽,看誰(shuí)能提供最好的東西和最好的免費(fèi)食物。感覺(jué)他們的目標(biāo)是盡可能地讓自己看起來(lái)是最酷的公司,而不告訴你他們真正想雇傭你來(lái)做什么。機(jī)器人技術(shù)還沒(méi)有走得很遠(yuǎn)。它在增長(zhǎng),但沒(méi)有太多的宣傳。

我參加了幾個(gè)workshop,在那里人們談?wù)撍麄內(nèi)绾卧诂F(xiàn)實(shí)世界中使用機(jī)器人,都很有趣。研究性會(huì)議傾向于集中討論研究和網(wǎng)絡(luò),這使得人們很容易忘記研究可以有明確的、直接的經(jīng)濟(jì)價(jià)值。有一個(gè)農(nóng)業(yè)機(jī)器人相關(guān)的,談到使用計(jì)算機(jī)視覺(jué)來(lái)檢測(cè)雜草以及噴灑除草劑,這聽(tīng)起來(lái)是好事。使用更少除草劑,殺死更少作物,同時(shí)減緩除草劑抗性的發(fā)生。

Rodney Brooks也有一個(gè)類似的精彩演講,他以Roomba為例,談到了將機(jī)器人技術(shù)轉(zhuǎn)化為消費(fèi)產(chǎn)品所需的東西。他說(shuō),在設(shè)計(jì)Roomba時(shí),他們先定了一個(gè)價(jià)格,然后將所有的功能控制在這個(gè)價(jià)格里面。結(jié)果是,幾百美元的價(jià)格讓你在傳感器和硬件的選擇上只有很小的余地,這就使得在設(shè)備上進(jìn)行推斷的能力有嚴(yán)格的限制。

組織方面,做得很好。會(huì)議中心緊鄰印刷店,所以在注冊(cè)時(shí),組織者說(shuō),如果你在特定期限內(nèi)用電子郵件發(fā)送PDF文件,他們會(huì)處理剩下的所有流程。你所要做的就是在網(wǎng)上為你的海報(bào)付錢,然后在會(huì)議上拿出來(lái)。所有的演示都是在演示室中進(jìn)行的,每個(gè)演示室都配有白板和一個(gè)架子,你可以在上面放置筆記本電腦來(lái)播放視頻

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴

原文標(biāo)題:谷歌大腦工程師給2018學(xué)術(shù)頂會(huì)劃重點(diǎn):對(duì)抗性學(xué)習(xí)+強(qiáng)化學(xué)習(xí)

文章出處:【微信號(hào):AI_era,微信公眾號(hào):新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    西門子TIA Portal如何比較兩個(gè)浮點(diǎn)數(shù)相等

    概述: 由于浮點(diǎn)數(shù)的定義規(guī)則,導(dǎo)致浮點(diǎn)數(shù)不能通過(guò)二進(jìn)制精確表示,所以在浮點(diǎn)數(shù)計(jì)算過(guò)程中,會(huì)出現(xiàn)兩個(gè)值一樣的浮點(diǎn)數(shù)進(jìn)行比較相等計(jì)算時(shí)結(jié)果并不相等的情況。下面先設(shè)計(jì)一個(gè)實(shí)例說(shuō)明該問(wèn)題,并給
    的頭像 發(fā)表于 01-06 10:07 ?768次閱讀
    西門子TIA Portal如何<b class='flag-5'>比較</b><b class='flag-5'>兩個(gè)</b>浮點(diǎn)數(shù)相等

    從時(shí)域和頻域兩個(gè)角度對(duì)信號(hào)進(jìn)行分析

    一般來(lái)說(shuō),我們會(huì)從時(shí)域和頻域兩個(gè)角度,分別對(duì)信號(hào)進(jìn)行分析。 時(shí)域 時(shí)域是真實(shí)世界存在的域,按時(shí)間順序呈現(xiàn)。例如,在某個(gè)時(shí)鐘信號(hào)的時(shí)域圖中,可以觀察到兩個(gè)重要的參數(shù),波形的周期和上升沿: 時(shí)鐘周期即
    的頭像 發(fā)表于 11-19 10:18 ?3383次閱讀
    從時(shí)域和頻域<b class='flag-5'>兩個(gè)</b>角度對(duì)信號(hào)<b class='flag-5'>進(jìn)行</b>分析

    TPA2018D1與TPA2028D1的對(duì)比,有什么區(qū)別?

    我們目前使用 TPA2018D1 作為音頻前置放大器。好像貴公司最近推出了“更新”版的 TPA2028D1。如果我們已經(jīng)具備圍繞 2018 的硬件開(kāi)發(fā)的軟件接口可以使用,那么是否可以在運(yùn)行中直接使用 TPA2028D1,或在音頻緩升特性之外,
    發(fā)表于 11-08 07:52

    NVIDIA在ICRA展示最新機(jī)器人研究

    在 日前舉行的 IEEE 國(guó)際機(jī)器人和自動(dòng)化大會(huì)(ICRA)上,幾何織物(geometric fabrics)成為一個(gè)熱門的討論話題。幾何織物是 NVIDIA 機(jī)器人研究實(shí)驗(yàn)室成員與合作者共同提交的七篇論文的主題之一,并于 ICRA
    的頭像 發(fā)表于 10-10 09:55 ?764次閱讀

    關(guān)斷TPA2028D1的AGC和關(guān)斷TPA2018D1的AGC用的設(shè)置寄存器的命令是否完全相同?

    TPA2018D1是開(kāi)啟EN之后立即放聲音,聲音是一點(diǎn)一點(diǎn)變大的。比較像AGC的現(xiàn)象。而我們已經(jīng)用和關(guān)斷TPA2028D1的AGC一樣的設(shè)置寄存器的命令關(guān)閉TPA2018D1的AGC
    發(fā)表于 10-10 07:37

    紅石比較種模式的作用

    輸入端的兩個(gè)紅石信號(hào)進(jìn)行比較,并根據(jù)比較結(jié)果輸出不同的信號(hào)強(qiáng)度。 1.1 輸入端信號(hào)強(qiáng)度相等 當(dāng)輸入端的兩個(gè)紅石信號(hào)強(qiáng)度相等時(shí),
    的頭像 發(fā)表于 09-05 09:17 ?1721次閱讀

    單相電機(jī)兩個(gè)繞組都在定子上嗎

    單相電機(jī)的兩個(gè)繞組,即起動(dòng)線圈(或稱為輔助繞組、副繞組)和運(yùn)行線圈(或稱為主繞組),都位于定子上 。這兩個(gè)繞組在電機(jī)中起著關(guān)鍵作用,共同協(xié)作以產(chǎn)生旋轉(zhuǎn)磁場(chǎng),從而使電機(jī)能夠運(yùn)轉(zhuǎn)。 單相電機(jī)通常由一個(gè)
    的頭像 發(fā)表于 09-03 15:10 ?2200次閱讀

    ad如何設(shè)置兩個(gè)元器件的距離

    之間應(yīng)保持的最小距離,以確保電路板的電氣性能和制造過(guò)程的可靠性。以下是如何在AD中設(shè)置兩個(gè)元器件之間距離的步驟: 一、進(jìn)入規(guī)則設(shè)置界面 打開(kāi)AD軟件 :首先,確保你已經(jīng)打開(kāi)了Altium Designer軟件,并加載了需要進(jìn)行元器件間距設(shè)置的PCB設(shè)計(jì)文件。 訪問(wèn)規(guī)則設(shè)置
    的頭像 發(fā)表于 09-02 15:31 ?1.7w次閱讀

    功放機(jī)AB兩個(gè)聲道輸出怎么接

    功放機(jī)AB兩個(gè)聲道輸出的接線方式,主要取決于您想要實(shí)現(xiàn)的音頻效果以及音箱的配置。以下將詳細(xì)介紹幾種常見(jiàn)的接線方式,以及它們各自的特點(diǎn)和適用場(chǎng)景。 一、基礎(chǔ)接線方式 在大多數(shù)情況下,功放機(jī)的AB兩個(gè)
    的頭像 發(fā)表于 08-23 10:40 ?9433次閱讀

    觸發(fā)器的兩個(gè)穩(wěn)定狀態(tài)分別是什么

    觸發(fā)器作為數(shù)字電路中的基本邏輯單元,具有兩個(gè)穩(wěn)定狀態(tài),這兩個(gè)狀態(tài)通常用于表示二進(jìn)制數(shù)碼中的0和1。
    的頭像 發(fā)表于 08-12 11:01 ?3088次閱讀

    比較兩個(gè)輸入電位,LM393的偏置電壓有什么影響?

    比較兩個(gè)輸入電位的時(shí)候,LM393的偏置電壓有什么影響
    發(fā)表于 08-12 08:28

    使用比較器TLV7041判斷兩個(gè)信號(hào)的大小,但輸出未按預(yù)期進(jìn)行是怎么回事?

    我現(xiàn)在需要使用比較器判斷兩個(gè)信號(hào)的大小,但輸出未按預(yù)期進(jìn)行(不能比較者大小)。如下圖,U17是比較
    發(fā)表于 08-12 08:20

    雙穩(wěn)態(tài)電路的兩個(gè)穩(wěn)定狀態(tài)是什么

    雙穩(wěn)態(tài)電路是一種具有兩個(gè)穩(wěn)定狀態(tài)的電子電路,廣泛應(yīng)用于數(shù)字電路、通信系統(tǒng)、存儲(chǔ)器等領(lǐng)域。 雙穩(wěn)態(tài)電路的基本概念 雙穩(wěn)態(tài)電路是一種具有兩個(gè)穩(wěn)定狀態(tài)的電路,即在沒(méi)有外部輸入信號(hào)的情況下,電路可以保持在
    的頭像 發(fā)表于 08-11 15:00 ?2660次閱讀

    雙穩(wěn)態(tài)觸發(fā)器的兩個(gè)基本性質(zhì)是什么

    雙穩(wěn)態(tài)觸發(fā)器(Bistable Trigger)是一種具有兩個(gè)穩(wěn)定狀態(tài)的邏輯電路,廣泛應(yīng)用于數(shù)字電路設(shè)計(jì)中。它具有兩個(gè)基本性質(zhì):記憶性和切換性。 一、雙穩(wěn)態(tài)觸發(fā)器的基本概念 1.1 雙穩(wěn)態(tài)觸發(fā)器
    的頭像 發(fā)表于 08-11 10:08 ?1399次閱讀

    LMV7219做過(guò)零比較時(shí),兩個(gè)輸入端需要串聯(lián)電阻嗎?

    請(qǐng)問(wèn)做過(guò)零比較時(shí),兩個(gè)輸入端需要串聯(lián)電阻嗎?我是將反向端直接接到GND,正向端用電源給一個(gè)固定電壓0.1V,不串聯(lián)電阻時(shí),正輸入端要給到0.5V,輸出才不振蕩,不清楚啥原因
    發(fā)表于 07-29 06:35