一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

機(jī)器學(xué)習(xí)領(lǐng)域的強(qiáng)化學(xué)習(xí)技術(shù)有什么用處?

我快閉嘴 ? 來源:教育新聞網(wǎng) ? 作者:教育新聞網(wǎng) ? 2020-08-12 16:21 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

來自查爾默斯大學(xué)和哥德堡大學(xué)的跨學(xué)科研究團(tuán)隊(duì)開發(fā)了一個(gè)框架,用于研究語(yǔ)言如何演變?yōu)槊枋鲂睦砀拍畹挠行Чぞ?。在一篇新論文中,他們表明,人工代理可以學(xué)習(xí)如何以類似于人類語(yǔ)言的人工語(yǔ)言進(jìn)行交流。該結(jié)果已發(fā)表在科學(xué)雜志《PLOS ONE》上。

這項(xiàng)研究位于認(rèn)知科學(xué)和機(jī)器學(xué)習(xí)之間的邊界。認(rèn)知科學(xué)家提出了一個(gè)有影響力的建議,即所有人類語(yǔ)言都可以看作是進(jìn)化成為一種以經(jīng)典信息論的意義以接近最優(yōu)的方式傳達(dá)概念的手段。哥德堡研究人員訓(xùn)練人工代理的方法是基于強(qiáng)化學(xué)習(xí)的,強(qiáng)化學(xué)習(xí)是機(jī)器學(xué)習(xí)的一個(gè)領(lǐng)域,代理通過與環(huán)境交互并獲得反饋逐漸學(xué)習(xí)。在這種情況下,代理人在沒有任何語(yǔ)言知識(shí)的情況下開始學(xué)習(xí),并通過獲取有關(guān)他們?cè)趥鬟_(dá)思想觀念方面的成功程度的反饋來學(xué)習(xí)交流。

重建色彩

“在我們的論文中,我們研究了代理商如何通過打幾輪由發(fā)送者和聽者組成的參考游戲來學(xué)習(xí)命名心理概念和進(jìn)行交流。我們特別關(guān)注了在認(rèn)知科學(xué)中已深入研究的色域。游戲的工作方式如下;發(fā)送方看到一種顏色,并通過從詞匯表向聽眾說出一個(gè)單詞來描述顏色,然后嘗試重建顏色。

根據(jù)收聽者重建的精確程度,這兩個(gè)代理都會(huì)收到共享的獎(jiǎng)勵(lì)。詞匯表中的單詞一開始就沒有意義;在游戲的多個(gè)回合中,由代理商決定單詞的含義。我們看到,從信息論的角度來看,由此產(chǎn)生的人工語(yǔ)言幾乎是最優(yōu)的,并且具有與人類語(yǔ)言相似的特性?!?Sleepcycle研究人員MikaelK?geb?ck說,他在Chalmers的博士學(xué)位論文中包含了一些結(jié)果在論文中提出。

與哥德堡大學(xué)語(yǔ)言理論和概率研究中心(CLASP)計(jì)算機(jī)語(yǔ)言學(xué)研究人員Asad Sayeed以及教授Devdatt Dubhashi和Emil Carlsson博士一起。他是計(jì)算機(jī)科學(xué)與工程系數(shù)據(jù)科學(xué)和AI部門的學(xué)生,現(xiàn)在已經(jīng)發(fā)表了結(jié)果。

Asad Sayeed說:“從實(shí)際的角度來看,這項(xiàng)研究提供了開發(fā)與人類語(yǔ)言進(jìn)行交流的對(duì)話主體(例如Siri和Alexa)的基本原理。”

通過強(qiáng)化學(xué)習(xí)來學(xué)習(xí)交流的基本思想對(duì)于社會(huì)和文化領(lǐng)域的研究也很有趣,例如,由阿薩德·薩耶德(Asad Sayeed)領(lǐng)導(dǎo)的GRIPES項(xiàng)目,該項(xiàng)目研究狗舌政治。

在將來的研究中有用

“認(rèn)知實(shí)驗(yàn)非常耗時(shí),因?yàn)槟?jīng)常需要對(duì)人類志愿者進(jìn)行仔細(xì)的實(shí)驗(yàn)。我們的方法提供了一種非常強(qiáng)大,靈活且廉價(jià)的方法來研究這些基本問題。實(shí)驗(yàn)完全在我們的控制之下,可重復(fù)且完全可靠因此,我們的計(jì)算框架為研究認(rèn)知科學(xué),語(yǔ)言和交互作用中的基本問題提供了一種有價(jià)值的工具。對(duì)于計(jì)算機(jī)科學(xué)家來說,探索各種學(xué)習(xí)機(jī)制的有效性是一個(gè)肥沃的領(lǐng)域。” Devdatt Dubhashi說。

Emil Carlsson說:“將來,我們要調(diào)查代理商是否也可以在其他領(lǐng)域發(fā)展類似于人類語(yǔ)言的交流。一個(gè)例子就是我們的代理商是否能夠重構(gòu)我們?cè)谌祟愓Z(yǔ)言中觀察到的等級(jí)結(jié)構(gòu)?!?/p>

長(zhǎng)期存在的問題

該研究源于認(rèn)知科學(xué)和語(yǔ)言學(xué)一個(gè)長(zhǎng)期存在的中心問題:在人類語(yǔ)言的所有巨大多樣性中,是否存在共同的普遍原則。20世紀(jì)的經(jīng)典作品表明,用不同的語(yǔ)言來描述顏色具有共同的特性。是否有解釋這些共同屬性的基本原則?

認(rèn)知科學(xué)家最近提出的一項(xiàng)有影響力的建議是,從信息論的角度來看,當(dāng)語(yǔ)言被視為一種交流思想概念,最有效地利用資源的手段時(shí),確實(shí)存在著這樣的普遍通用原則。

麻省理工學(xué)院的特德·吉布森(Ted Gibson)于2016年在CLASP上發(fā)表了一系列演講,他在演講中描述了從世界各地不同社會(huì)和文化中選出的人類受試者的實(shí)驗(yàn)結(jié)果,從而引發(fā)了一個(gè)問題:“如果人類受試者被人造計(jì)算機(jī)替代,將會(huì)怎樣代理,他們會(huì)開發(fā)一種具有類似通用屬性的語(yǔ)言嗎?”
責(zé)任編輯:tzh

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 計(jì)算機(jī)
    +關(guān)注

    關(guān)注

    19

    文章

    7663

    瀏覽量

    90820
  • AI
    AI
    +關(guān)注

    關(guān)注

    88

    文章

    35164

    瀏覽量

    280015
  • 機(jī)器學(xué)習(xí)

    關(guān)注

    66

    文章

    8503

    瀏覽量

    134634
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    NVIDIA Isaac Lab可用環(huán)境與強(qiáng)化學(xué)習(xí)腳本使用指南

    Lab 是一個(gè)適用于機(jī)器人學(xué)習(xí)的開源模塊化框架,其模塊化高保真仿真適用于各種訓(xùn)練環(huán)境,Isaac Lab 同時(shí)支持模仿學(xué)習(xí)(模仿人類)和強(qiáng)化學(xué)習(xí)(在嘗試和錯(cuò)誤中進(jìn)行學(xué)習(xí)),為所有
    的頭像 發(fā)表于 07-14 15:29 ?563次閱讀
    NVIDIA Isaac Lab可用環(huán)境與<b class='flag-5'>強(qiáng)化學(xué)習(xí)</b>腳本使用指南

    18個(gè)常用的強(qiáng)化學(xué)習(xí)算法整理:從基礎(chǔ)方法到高級(jí)模型的理論技術(shù)與代碼實(shí)現(xiàn)

    本來轉(zhuǎn)自:DeepHubIMBA本文系統(tǒng)講解從基本強(qiáng)化學(xué)習(xí)方法到高級(jí)技術(shù)(如PPO、A3C、PlaNet等)的實(shí)現(xiàn)原理與編碼過程,旨在通過理論結(jié)合代碼的方式,構(gòu)建對(duì)強(qiáng)化學(xué)習(xí)算法的全面理解。為確保內(nèi)容
    的頭像 發(fā)表于 04-23 13:22 ?414次閱讀
    18個(gè)常用的<b class='flag-5'>強(qiáng)化學(xué)習(xí)</b>算法整理:從基礎(chǔ)方法到高級(jí)模型的理論<b class='flag-5'>技術(shù)</b>與代碼實(shí)現(xiàn)

    詳解RAD端到端強(qiáng)化學(xué)習(xí)后訓(xùn)練范式

    受限于算力和數(shù)據(jù),大語(yǔ)言模型預(yù)訓(xùn)練的 scalinglaw 已經(jīng)趨近于極限。DeepSeekR1/OpenAl01通過強(qiáng)化學(xué)習(xí)后訓(xùn)練涌現(xiàn)了強(qiáng)大的推理能力,掀起新一輪技術(shù)革新。
    的頭像 發(fā)表于 02-25 14:06 ?600次閱讀
    詳解RAD端到端<b class='flag-5'>強(qiáng)化學(xué)習(xí)</b>后訓(xùn)練范式

    DAC1282的正弦波模式什么用處?

    ADS1282增益校準(zhǔn)時(shí),需要外部提供和增益匹配的滿量程電壓,這個(gè)電壓可以由DAC1282提供。我想問的是: 1.DAC1282的正弦波模式什么用處? 2.采用哪種模式提供電壓最好?
    發(fā)表于 12-31 07:03

    傳統(tǒng)機(jī)器學(xué)習(xí)方法和應(yīng)用指導(dǎo)

    用于開發(fā)生物學(xué)數(shù)據(jù)的機(jī)器學(xué)習(xí)方法。盡管深度學(xué)習(xí)(一般指神經(jīng)網(wǎng)絡(luò)算法)是一個(gè)強(qiáng)大的工具,目前也非常流行,但它的應(yīng)用領(lǐng)域仍然有限。與深度學(xué)習(xí)相比
    的頭像 發(fā)表于 12-30 09:16 ?1192次閱讀
    傳統(tǒng)<b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>方法和應(yīng)用指導(dǎo)

    【「具身智能機(jī)器人系統(tǒng)」閱讀體驗(yàn)】+初品的體驗(yàn)

    動(dòng)態(tài)互動(dòng)的。 該理論強(qiáng)調(diào)智能行為源于智能體的物理存在和行為能力,智能體必須具備感知環(huán)境并在其中執(zhí)行任務(wù)的能力。具身智能的實(shí)現(xiàn)涵蓋了機(jī)器學(xué)習(xí)、人工智能、機(jī)器人學(xué)、計(jì)算機(jī)視覺、自然語(yǔ)言處理及強(qiáng)化學(xué)
    發(fā)表于 12-20 19:17

    zeta在機(jī)器學(xué)習(xí)中的應(yīng)用 zeta的優(yōu)缺點(diǎn)分析

    的應(yīng)用(基于低功耗廣域物聯(lián)網(wǎng)技術(shù)ZETA) ZETA作為一種低功耗廣域物聯(lián)網(wǎng)(LPWAN)技術(shù),雖然其直接應(yīng)用于機(jī)器學(xué)習(xí)的場(chǎng)景可能并不常見,但它可以通過提供高效、穩(wěn)定的物聯(lián)網(wǎng)通信支持,
    的頭像 發(fā)表于 12-20 09:11 ?1127次閱讀

    請(qǐng)問TSC2007中的AUX引腳什么用處?

    TSC2007中的AUX 引腳什么用處?
    發(fā)表于 12-13 07:08

    螞蟻集團(tuán)收購(gòu)邊塞科技,吳翼出任強(qiáng)化學(xué)習(xí)實(shí)驗(yàn)室首席科學(xué)家

    領(lǐng)域的研究與發(fā)展。令人矚目的是,邊塞科技的創(chuàng)始人吳翼已正式加入該實(shí)驗(yàn)室,并擔(dān)任首席科學(xué)家一職。 吳翼在其個(gè)人社交平臺(tái)上對(duì)這一變動(dòng)進(jìn)行了回應(yīng)。他表示,自己最近接受了螞蟻集團(tuán)的邀請(qǐng),負(fù)責(zé)大模型強(qiáng)化學(xué)習(xí)領(lǐng)域的研究工
    的頭像 發(fā)表于 11-22 11:14 ?1586次閱讀

    什么是機(jī)器學(xué)習(xí)?通過機(jī)器學(xué)習(xí)方法能解決哪些問題?

    計(jì)算機(jī)系統(tǒng)自身的性能”。事實(shí)上,由于“經(jīng)驗(yàn)”在計(jì)算機(jī)系統(tǒng)中主要以數(shù)據(jù)的形式存在,因此機(jī)器學(xué)習(xí)需要設(shè)法對(duì)數(shù)據(jù)進(jìn)行分析學(xué)習(xí),這就使得它逐漸成為智能數(shù)據(jù)分析技術(shù)的創(chuàng)新源之一,
    的頭像 發(fā)表于 11-16 01:07 ?965次閱讀
    什么是<b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>?通過<b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>方法能解決哪些問題?

    NPU與機(jī)器學(xué)習(xí)算法的關(guān)系

    在人工智能領(lǐng)域機(jī)器學(xué)習(xí)算法是實(shí)現(xiàn)智能系統(tǒng)的核心。隨著數(shù)據(jù)量的激增和算法復(fù)雜度的提升,對(duì)計(jì)算資源的需求也在不斷增長(zhǎng)。NPU作為一種專門為深度學(xué)習(xí)機(jī)
    的頭像 發(fā)表于 11-15 09:19 ?1224次閱讀

    如何使用 PyTorch 進(jìn)行強(qiáng)化學(xué)習(xí)

    強(qiáng)化學(xué)習(xí)(Reinforcement Learning, RL)是一種機(jī)器學(xué)習(xí)方法,它通過與環(huán)境的交互來學(xué)習(xí)如何做出決策,以最大化累積獎(jiǎng)勵(lì)。PyTorch 是一個(gè)流行的開源
    的頭像 發(fā)表于 11-05 17:34 ?1043次閱讀

    人工智能、機(jī)器學(xué)習(xí)和深度學(xué)習(xí)存在什么區(qū)別

    人工智能指的是在某種程度上顯示出類似人類智能的設(shè)備。AI很多技術(shù),但其中一個(gè)很大的子集是機(jī)器學(xué)習(xí)——讓算法從數(shù)據(jù)中學(xué)習(xí)。
    發(fā)表于 10-24 17:22 ?2980次閱讀
    人工智能、<b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>和深度<b class='flag-5'>學(xué)習(xí)</b>存在什么區(qū)別

    谷歌AlphaChip強(qiáng)化學(xué)習(xí)工具發(fā)布,聯(lián)發(fā)科天璣芯片率先采用

    近日,谷歌在芯片設(shè)計(jì)領(lǐng)域取得了重要突破,詳細(xì)介紹了其用于芯片設(shè)計(jì)布局的強(qiáng)化學(xué)習(xí)方法,并將該模型命名為“AlphaChip”。據(jù)悉,AlphaChip有望顯著加速芯片布局規(guī)劃的設(shè)計(jì)流程,并幫助芯片在性能、功耗和面積方面實(shí)現(xiàn)更優(yōu)表現(xiàn)。
    的頭像 發(fā)表于 09-30 16:16 ?705次閱讀

    【《時(shí)間序列與機(jī)器學(xué)習(xí)》閱讀體驗(yàn)】+ 了解時(shí)間序列

    主,包括廣告分析領(lǐng)域應(yīng)用、智能運(yùn)維領(lǐng)域應(yīng)用和金融領(lǐng)域的應(yīng)用。 那什么是時(shí)間序列呢?時(shí)間序列有什么用途呢?經(jīng)過學(xué)習(xí)第一章“時(shí)間序列概述“,我找
    發(fā)表于 08-11 17:55