一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

強(qiáng)化學(xué)習(xí)/機(jī)器學(xué)習(xí)/深度學(xué)習(xí)三者有何區(qū)別?

我快閉嘴 ? 來源:智能制造網(wǎng) ? 作者:智能制造網(wǎng) ? 2020-12-22 15:33 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

人工智能技術(shù)進(jìn)步的速度越來越快,每種細(xì)分技術(shù)所創(chuàng)造的價值正日益得到展現(xiàn)。

2013年,DeepMind發(fā)明了DQN算法,成功將深度學(xué)習(xí)和強(qiáng)化學(xué)習(xí)結(jié)合起來,開啟了深度強(qiáng)化學(xué)習(xí)的新紀(jì)元。此后數(shù)年,強(qiáng)化學(xué)習(xí)的成果日新月異,很多非常困難的問題都被深度強(qiáng)化學(xué)習(xí)算法解決。

2016年,谷歌阿爾法圍棋以4:1戰(zhàn)勝圍棋世界冠軍、職業(yè)九段棋手李世石,不僅讓深度學(xué)習(xí)為人們所知,而且掀起了人工智能的“大眾熱”,大家由此更加關(guān)注強(qiáng)化學(xué)習(xí)這一技術(shù)要點。

使用強(qiáng)化學(xué)習(xí)的一個很好的例子是讓機(jī)器人學(xué)習(xí)如何走路。機(jī)器人首先向前邁出一大步然后跌倒。這一大步和摔倒是強(qiáng)化學(xué)習(xí)系統(tǒng)關(guān)注的響應(yīng)點。由于反饋是負(fù)面的,所以繼續(xù)調(diào)整,系統(tǒng)會根據(jù)多個負(fù)反饋的比對最終確定機(jī)器人應(yīng)該把步子邁的小一點,不停地小,直到機(jī)器人走路不會摔倒為止。

通過強(qiáng)化學(xué)習(xí),Boston Dynamics公司的機(jī)器人已經(jīng)掌握了托舉、后空翻、跳上窗臺的要點。而迪斯尼幻想工程已經(jīng)把這一點帶到了一個新的層面,那就是讓人形機(jī)器人來執(zhí)行玩命的特技。

有業(yè)內(nèi)人士指出,強(qiáng)化學(xué)習(xí)和其他的人工智能技術(shù)有一個很大的差異,那就是它的學(xué)習(xí)范式和其它技術(shù)不太一樣。它不需要我們?nèi)ナ占瘮?shù)據(jù),也不需要我們?nèi)プ鋈魏螛?biāo)記,而是我們把稱之為智能體(Agent),放在一個環(huán)境里,就像動物或者我們自己生存的一個環(huán)境里,它會和環(huán)境自己打交道,自己學(xué)會在環(huán)境里如何完成一個任務(wù),解決一個問題。

強(qiáng)化學(xué)習(xí)主要由智能體(Agent)、環(huán)境(Environment)、狀態(tài)(State)和動作(Action)、獎勵(Reward)組成。智能體將在環(huán)境的當(dāng)前狀態(tài)下,根據(jù)獎勵信號做出動作,從而達(dá)到環(huán)境中的不同狀態(tài)并得到獎勵。

除了強(qiáng)化學(xué)習(xí)外,機(jī)器學(xué)習(xí)也備受關(guān)注。機(jī)器學(xué)習(xí)是AI的一個子集,是通過不同場景中的經(jīng)驗來訓(xùn)練系統(tǒng)的能力。隨著車輛變得越來越自動化,開發(fā)人員可以使用機(jī)器學(xué)習(xí)訓(xùn)練系統(tǒng)來識別對象,并用更少的數(shù)據(jù)更好地解釋其環(huán)境。

再來看一下深度學(xué)習(xí)。深度學(xué)習(xí)就是從有限樣例中通過算法總結(jié)出一般性的規(guī)律,并可以應(yīng)用到新的未知數(shù)據(jù)上。例如,我們可以從一些歷史病例的集合中總結(jié)出癥狀和疾病之間的規(guī)律。這樣,當(dāng)有新的病人到來時,我們可以利用總結(jié)出來的規(guī)律來判斷這個病人得了什么疾病。

那么,強(qiáng)化學(xué)習(xí)、機(jī)器學(xué)習(xí)、深度學(xué)習(xí)三者的區(qū)別是什么?簡單說,人工智能范圍最大,涵蓋機(jī)器學(xué)習(xí)、深度學(xué)習(xí)和強(qiáng)化學(xué)習(xí)。如果把人工智能比喻成孩子大腦,那么機(jī)器學(xué)習(xí)是讓孩子去掌握認(rèn)知能力的過程,而深度學(xué)習(xí)是這種過程中很有效率的一種教學(xué)體系。

由強(qiáng)化學(xué)習(xí)、機(jī)器學(xué)習(xí)等技術(shù)構(gòu)成的人工智能,其良好的發(fā)展前景引人期待。從全國來看,據(jù)艾瑞咨詢測算,2022年國內(nèi)人工智能核心產(chǎn)業(yè)規(guī)模有望達(dá)到1573億元,復(fù)合增速達(dá)58%,產(chǎn)業(yè)將持續(xù)快速增長。如此廣闊的市場空間,吸引著社會各界投資者的關(guān)注。

值得一提的是,發(fā)展“以人為本”的人工智能是全社會的課題,需要政府、商界、學(xué)界及所有利益相關(guān)方共擔(dān)責(zé)任,協(xié)力推動。作為技術(shù)應(yīng)用與推廣的主體,企業(yè)負(fù)有不可推卸的社會責(zé)任。在研究強(qiáng)化學(xué)習(xí)相關(guān)技術(shù)時,企業(yè)要自覺遵守法規(guī)制度和社會公約,以此促進(jìn)其有序、可持續(xù)應(yīng)用。

未來,全球的可持續(xù)發(fā)展越來越依賴于數(shù)據(jù)創(chuàng)造的價值,而人工智能是數(shù)字經(jīng)濟(jì)中應(yīng)用十分廣泛的技術(shù)之一。或許再過幾年,AI將在精準(zhǔn)農(nóng)業(yè)、智能家居、遠(yuǎn)程醫(yī)療、自動駕駛等領(lǐng)域發(fā)揮更加重要的作用。
責(zé)任編輯:tzh

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    88

    文章

    35094

    瀏覽量

    279537
  • 人工智能
    +關(guān)注

    關(guān)注

    1806

    文章

    49008

    瀏覽量

    249315
  • 機(jī)器學(xué)習(xí)

    關(guān)注

    66

    文章

    8501

    瀏覽量

    134582
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    NVIDIA Isaac Lab可用環(huán)境與強(qiáng)化學(xué)習(xí)腳本使用指南

    Lab 是一個適用于機(jī)器人學(xué)習(xí)的開源模塊化框架,其模塊化高保真仿真適用于各種訓(xùn)練環(huán)境,Isaac Lab 同時支持模仿學(xué)習(xí)(模仿人類)和強(qiáng)化學(xué)習(xí)(在嘗試和錯誤中進(jìn)行學(xué)習(xí)),為所有
    的頭像 發(fā)表于 07-14 15:29 ?481次閱讀
    NVIDIA Isaac Lab可用環(huán)境與<b class='flag-5'>強(qiáng)化學(xué)習(xí)</b>腳本使用指南

    18個常用的強(qiáng)化學(xué)習(xí)算法整理:從基礎(chǔ)方法到高級模型的理論技術(shù)與代碼實現(xiàn)

    本來轉(zhuǎn)自:DeepHubIMBA本文系統(tǒng)講解從基本強(qiáng)化學(xué)習(xí)方法到高級技術(shù)(如PPO、A3C、PlaNet等)的實現(xiàn)原理與編碼過程,旨在通過理論結(jié)合代碼的方式,構(gòu)建對強(qiáng)化學(xué)習(xí)算法的全面理解。為確保內(nèi)容
    的頭像 發(fā)表于 04-23 13:22 ?403次閱讀
    18個常用的<b class='flag-5'>強(qiáng)化學(xué)習(xí)</b>算法整理:從基礎(chǔ)方法到高級模型的理論技術(shù)與代碼實現(xiàn)

    傳統(tǒng)機(jī)器學(xué)習(xí)方法和應(yīng)用指導(dǎo)

    用于開發(fā)生物學(xué)數(shù)據(jù)的機(jī)器學(xué)習(xí)方法。盡管深度學(xué)習(xí)(一般指神經(jīng)網(wǎng)絡(luò)算法)是一個強(qiáng)大的工具,目前也非常流行,但它的應(yīng)用領(lǐng)域仍然有限。與深度
    的頭像 發(fā)表于 12-30 09:16 ?1183次閱讀
    傳統(tǒng)<b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>方法和應(yīng)用指導(dǎo)

    螞蟻集團(tuán)收購邊塞科技,吳翼出任強(qiáng)化學(xué)習(xí)實驗室首席科學(xué)家

    近日,專注于模型賽道的初創(chuàng)企業(yè)邊塞科技宣布被螞蟻集團(tuán)收購。據(jù)悉,此次交易完成后,邊塞科技將保持獨立運營,而原投資人已全部退出。 與此同時,螞蟻集團(tuán)近期宣布成立強(qiáng)化學(xué)習(xí)實驗室,旨在推動大模型強(qiáng)化學(xué)習(xí)
    的頭像 發(fā)表于 11-22 11:14 ?1566次閱讀

    什么是機(jī)器學(xué)習(xí)?通過機(jī)器學(xué)習(xí)方法能解決哪些問題?

    來源:Master編程樹“機(jī)器學(xué)習(xí)”最初的研究動機(jī)是讓計算機(jī)系統(tǒng)具有人的學(xué)習(xí)能力以便實現(xiàn)人工智能。因為沒有學(xué)習(xí)能力的系統(tǒng)很難被認(rèn)為是具有智能的。目前被廣泛采用的
    的頭像 發(fā)表于 11-16 01:07 ?962次閱讀
    什么是<b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>?通過<b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>方法能解決哪些問題?

    NPU與機(jī)器學(xué)習(xí)算法的關(guān)系

    在人工智能領(lǐng)域,機(jī)器學(xué)習(xí)算法是實現(xiàn)智能系統(tǒng)的核心。隨著數(shù)據(jù)量的激增和算法復(fù)雜度的提升,對計算資源的需求也在不斷增長。NPU作為一種專門為深度學(xué)習(xí)機(jī)
    的頭像 發(fā)表于 11-15 09:19 ?1211次閱讀

    NPU在深度學(xué)習(xí)中的應(yīng)用

    隨著人工智能技術(shù)的飛速發(fā)展,深度學(xué)習(xí)作為其核心驅(qū)動力之一,已經(jīng)在眾多領(lǐng)域展現(xiàn)出了巨大的潛力和價值。NPU(Neural Processing Unit,神經(jīng)網(wǎng)絡(luò)處理單元)是專門為深度學(xué)習(xí)
    的頭像 發(fā)表于 11-14 15:17 ?1902次閱讀

    如何使用 PyTorch 進(jìn)行強(qiáng)化學(xué)習(xí)

    強(qiáng)化學(xué)習(xí)(Reinforcement Learning, RL)是一種機(jī)器學(xué)習(xí)方法,它通過與環(huán)境的交互來學(xué)習(xí)如何做出決策,以最大化累積獎勵。PyTorch 是一個流行的開源
    的頭像 發(fā)表于 11-05 17:34 ?1038次閱讀

    GPU深度學(xué)習(xí)應(yīng)用案例

    GPU在深度學(xué)習(xí)中的應(yīng)用廣泛且重要,以下是一些GPU深度學(xué)習(xí)應(yīng)用案例: 一、圖像識別 圖像識別是深度學(xué)習(xí)
    的頭像 發(fā)表于 10-27 11:13 ?1344次閱讀

    激光雷達(dá)技術(shù)的基于深度學(xué)習(xí)的進(jìn)步

    維空間信息。這使得激光雷達(dá)在自動駕駛、無人機(jī)、機(jī)器人等領(lǐng)域具有廣泛的應(yīng)用前景。 二、深度學(xué)習(xí)技術(shù)的發(fā)展 深度學(xué)習(xí)
    的頭像 發(fā)表于 10-27 10:57 ?1060次閱讀

    人工智能、機(jī)器學(xué)習(xí)深度學(xué)習(xí)存在什么區(qū)別

    人工智能指的是在某種程度上顯示出類似人類智能的設(shè)備。AI很多技術(shù),但其中一個很大的子集是機(jī)器學(xué)習(xí)——讓算法從數(shù)據(jù)中學(xué)習(xí)。
    發(fā)表于 10-24 17:22 ?2974次閱讀
    人工智能、<b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>和<b class='flag-5'>深度</b><b class='flag-5'>學(xué)習(xí)</b>存在什么<b class='flag-5'>區(qū)別</b>

    AI大模型與深度學(xué)習(xí)的關(guān)系

    AI大模型與深度學(xué)習(xí)之間存在著密不可分的關(guān)系,它們互為促進(jìn),相輔相成。以下是對兩關(guān)系的介紹: 一、深度學(xué)習(xí)是AI大模型的基礎(chǔ) 技術(shù)支撐 :
    的頭像 發(fā)表于 10-23 15:25 ?2878次閱讀

    AI大模型與傳統(tǒng)機(jī)器學(xué)習(xí)區(qū)別

    AI大模型與傳統(tǒng)機(jī)器學(xué)習(xí)在多個方面存在顯著的區(qū)別。以下是對這些區(qū)別的介紹: 一、模型規(guī)模與復(fù)雜度 AI大模型 :通常包含數(shù)十億甚至數(shù)萬億的參數(shù),模型大小可以達(dá)到數(shù)百GB甚至更大。這些模
    的頭像 發(fā)表于 10-23 15:01 ?2562次閱讀

    深度學(xué)習(xí)編譯器和推理引擎的區(qū)別

    深度學(xué)習(xí)編譯器和推理引擎在人工智能領(lǐng)域中都扮演著至關(guān)重要的角色,但它們各自的功能、應(yīng)用場景以及優(yōu)化目標(biāo)等方面存在顯著的差異。以下是對兩區(qū)別的詳細(xì)探討。
    的頭像 發(fā)表于 07-17 18:12 ?1798次閱讀

    PyTorch深度學(xué)習(xí)開發(fā)環(huán)境搭建指南

    PyTorch作為一種流行的深度學(xué)習(xí)框架,其開發(fā)環(huán)境的搭建對于深度學(xué)習(xí)研究和開發(fā)來說至關(guān)重要
    的頭像 發(fā)表于 07-16 18:29 ?2519次閱讀