一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

OpenAI的研究人員開發(fā)了一套基于能量的神經網(wǎng)絡模型

DPVg_AI_era ? 來源:未知 ? 作者:李倩 ? 2018-11-10 10:34 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

OpenAI的研究人員開發(fā)了一套基于能量的神經網(wǎng)絡模型,可以快速學會識別并生成關于概念的實例,比如附近、上方、之間、最近、最遠等,并將這些概念用2D點集來表示。模型可以僅在5次演示之后就學會這類概念,并實現(xiàn)了跨領域的概念遷移。

衡量是否達到人類智能,涉及由有限的經驗,通過抽象推理和規(guī)劃、類比推理、創(chuàng)造性問題解決和語言能力的概括,從而將經驗整合到概念中,將概念作為理解和推理的基本架構。

這款基于能量的新模型,讓智能體能夠從任務中學習和提取概念,并使用這些概念來解決多個領域中的其他任務。比如可以在2D粒子環(huán)境中應用的學習概念,然后在基于3D的機器人環(huán)境中執(zhí)行相同的任務,無需在新環(huán)境中重新訓練。

通過基于能量的模型訓練的模擬機器人,利用不同2D域中學習到的概念,將手臂導航至兩點之間

本研究利用能量函數(shù),讓智能體學習分類和生成簡單的概念,來解決在不同環(huán)境中的兩點之間導航等任務。這些概念包括視覺概念(“紅色”、“正方形”)、空間概念(“內部”、“在...之上”)、時間概念(“慢”、“之后”),社會概念(“積極”、“有用”)等等。

一旦智能體學會了這些概念,就會成為其理解和推理的基本模塊,最近DeepMind和 Vicarious的一些其他研究也表明了這一點。

能量函數(shù)讓系統(tǒng)可以生成(左)并識別(右)基本概念,比如“正方形”的概念。

構建能量函數(shù):基于關系網(wǎng)絡體系結構的神經網(wǎng)絡

為了創(chuàng)建能量函數(shù),需要在數(shù)學上將概念表示為能量模型。

我們根據(jù)以下要素來定義每個概念的能量函數(shù) E(x,a,w):

模型觀察到的世界狀態(tài)(x)

該狀態(tài)下該實體的注意力掩膜(a)。

作為條件的連續(xù)值向量(w),用于指定計算能量的概念

世界上的眾多狀態(tài)由多組實體及其屬性和位置組成(比如下面的點,就具有位置和顏色屬性)。用于“識別”的注意力掩膜表示模型對某些實體集的關注。

能量模型輸出單個正數(shù),表示滿足相應概念(零能量)或不滿足概念(高能量)。當注意力掩模集中在表示概念的一組實體上時,該概念即被滿足,這需要實體處于正確的位置(修改x、生成概念),而且注意力掩膜關注的是正確的實體(修改a、識別概念)。

我們將能量函數(shù)構建為基于關系網(wǎng)絡體系結構的神經網(wǎng)絡,允許其將任意數(shù)量的實體作為輸入。這個能量函數(shù)的參數(shù)是由我們的訓練程序進行優(yōu)化的,其他函數(shù)是從能量函數(shù)中隱式導出的。

這樣,我們能夠使用能量函數(shù)來學習可以執(zhí)行生成和識別的單個網(wǎng)絡,并可以交叉使用從生成到識別的學習概念,反之亦然。(目前已經通過鏡像神經元在動物身上觀察到了這種效應。)

單一網(wǎng)絡的訓練

訓練數(shù)據(jù)由(注意掩膜、狀態(tài))的軌跡組成,提前生成的軌跡用于確認我們希望模型學習的特定概念。我們?yōu)榻o定概念集提供一組演示(通常為5次)來訓練模型,然后將模型置于一個新的環(huán)境(X0),并要求其預測下一個狀態(tài)(X1)和下一個注意力掩膜(a)。

優(yōu)化能量函數(shù),向訓練數(shù)據(jù)中找到的下一個狀態(tài)和下一個注意力掩模分配低能量值。與變分自動編碼器等生成模型類似,激勵模型去學習那些對于壓縮任務方面的有用值。我們使用各種概念來訓練模型,包括視覺,空間,遠近和時間關系,以及二維粒子環(huán)境中的量化。

空間區(qū)域概念:給出2D示例點(左),推斷該點上的能量函數(shù)(中間),然后使用能量上的隨機梯度下降來生成新的點(右)

模型在概念生成和識別訓練中分享經驗,實現(xiàn)遷移學習

我們在一系列任務中對模型進行了評估,旨在測試單一系統(tǒng)識別和生成相同概念下的目標的能力,我們的系統(tǒng)可以學習分類,可以生成特定的空間關系集,還可以以特定方式通過場景對實體進行導航,或者可以對數(shù)量(比如一個、兩個、三個或三個以上)或接近度等概念進行比較準確的判斷。

數(shù)量概念:示例注意力掩膜在一個、兩個、三個或三個以上的目標上的表現(xiàn),可推斷用于生成類似數(shù)量概念的注意力掩模

模型在學習概念的生成(通過在狀態(tài)向量x中移動目標實現(xiàn))和識別(通過在固定狀態(tài)向量上更改注意力掩膜實現(xiàn))之間分享經驗時的表現(xiàn)更好:在我們對共同執(zhí)行這兩類任務的模型進行評估時發(fā)現(xiàn),它們的表現(xiàn)都比僅在各自執(zhí)行單一任務訓練的模型更好。

此外,我們還發(fā)現(xiàn)了遷移學習的跡象。只在概念識別環(huán)境中訓練過的能量函數(shù),也能很好地執(zhí)行概念生成任務,即使其沒有經過明確的訓練。

未來方向:進一步探索概念和語言理解的關系

我們很高興能夠在更豐富的三維環(huán)境中學到的更廣泛的概念,將概念與智能體決策策略相結合(因為到目前為止,我們只是將概念視為從被動體驗中學到的東西),并探索概念和語言理解之間的聯(lián)系。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 機器人
    +關注

    關注

    213

    文章

    29730

    瀏覽量

    212839
  • 神經網(wǎng)絡

    關注

    42

    文章

    4814

    瀏覽量

    103578
  • 智能體
    +關注

    關注

    1

    文章

    303

    瀏覽量

    11078

原文標題:OpenAI概念學習新模型:學會概念僅需5次示范,實現(xiàn)跨領域概念遷移

文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    神經網(wǎng)絡教程(李亞非)

      第1章 概述  1.1 人工神經網(wǎng)絡研究與發(fā)展  1.2 生物神經元  1.3 人工神經網(wǎng)絡的構成  第2章人工神經網(wǎng)絡基本
    發(fā)表于 03-20 11:32

    如何構建神經網(wǎng)絡?

    原文鏈接:http://tecdat.cn/?p=5725 神經網(wǎng)絡種基于現(xiàn)有數(shù)據(jù)創(chuàng)建預測的計算系統(tǒng)。如何構建神經網(wǎng)絡?神經網(wǎng)絡包括:輸入層:根據(jù)現(xiàn)有數(shù)據(jù)獲取輸入的層隱藏層:使用反
    發(fā)表于 07-12 08:02

    隱藏技術: 種基于前沿神經網(wǎng)絡理論的新型人工智能處理器

    隱藏技術: 種基于前沿神經網(wǎng)絡理論的新型人工智能處理器 Copy東京理工大學的研究人員開發(fā)了種名為“ Hiddenite”的新型加速器芯
    發(fā)表于 03-17 19:15

    卷積神經網(wǎng)絡模型發(fā)展及應用

    network,DBN)[24], 從此拉開了深度學習大幕。隨著深度學習理論的研究和發(fā)展,研究人員提 出了系列卷積神經網(wǎng)絡模型。為了比較
    發(fā)表于 08-02 10:39

    OpenAI發(fā)布工具庫 可在GPU上建立更快、更高效、占內存更少的神經網(wǎng)絡

    OpenAI研究人員日前發(fā)布了個工具庫,該工具庫可以幫助研究人員在圖形處理器(graphics-processor-unit,GPU)上建立更快、更高效、占內存更少的
    的頭像 發(fā)表于 01-27 00:34 ?4202次閱讀
    <b class='flag-5'>OpenAI</b>發(fā)布工具庫 可在GPU上建立更快、更高效、占內存更少的<b class='flag-5'>神經網(wǎng)絡</b>

    深度神經決策樹:深度神經網(wǎng)絡和樹模型結合的新模型

    近日,來自愛丁堡大學的研究人員提出了種結合深度神經網(wǎng)絡和樹模型的新型模型——深度神經決策樹(D
    的頭像 發(fā)表于 08-19 09:14 ?1.3w次閱讀

    研究人員開發(fā)解釋多義詞的神經網(wǎng)絡

    艾倫人工智能研究所和華盛頓大學的研究人員正在使用可以根據(jù)上下文來確定英文單詞含義的神經網(wǎng)絡
    的頭像 發(fā)表于 09-12 15:52 ?2463次閱讀

    研究人員開發(fā)了種新穎的機器學習管道

    研究人員通過種特殊的神經網(wǎng)絡模型,它以“基本塊”(計算指令的基本摘要)形式訓練標記的數(shù)據(jù),以自動預測其持續(xù)時間使用給定的芯片執(zhí)行以前看不見的基本塊。結果表明,這種
    的頭像 發(fā)表于 04-15 16:42 ?2012次閱讀

    基于內存的人工智能神經網(wǎng)絡架構

    在過去十年左右的時間里,研究人員已經開發(fā)了多種基于人工神經網(wǎng)絡(ANN)的計算模型。盡管已發(fā)現(xiàn)許多這些模型在特定任務上表現(xiàn)良好,但它們并不總
    的頭像 發(fā)表于 12-18 13:40 ?1786次閱讀

    研究人員開發(fā)“液態(tài)”神經網(wǎng)絡 可適應快速變化的訓練環(huán)境

    設計出了種具有重大改進的“液態(tài)”神經網(wǎng)絡。其特點是能夠在投入訓練階段之后,極大地擴展 AI 技術的靈活性。 通常情況下,研究人員會在訓練階段向神經網(wǎng)絡算法提供大量相關的目標數(shù)據(jù),來磨
    的頭像 發(fā)表于 01-29 10:46 ?1762次閱讀

    OpenAI研究人員開發(fā)出新的機械臂

    近日,兩個由 OpenAI研究人員開發(fā)一模一樣的機械臂愛麗絲和鮑勃,可以在模擬情景中通過對弈互相學習,而不需要人為輸入文本。
    的頭像 發(fā)表于 02-23 10:40 ?2154次閱讀

    cnn卷積神經網(wǎng)絡模型 卷積神經網(wǎng)絡預測模型 生成卷積神經網(wǎng)絡模型

    cnn卷積神經網(wǎng)絡模型 卷積神經網(wǎng)絡預測模型 生成卷積神經網(wǎng)絡模型? 卷積
    的頭像 發(fā)表于 08-21 17:11 ?1603次閱讀

    卷積神經網(wǎng)絡模型搭建

    卷積神經網(wǎng)絡模型搭建 卷積神經網(wǎng)絡模型種深度學習算法。它已經成為了計算機視覺和自然語言處理等各種領域的主流算法,具有很大的應用前景。本篇
    的頭像 發(fā)表于 08-21 17:11 ?1283次閱讀

    PyTorch神經網(wǎng)絡模型構建過程

    PyTorch,作為個廣泛使用的開源深度學習庫,提供了豐富的工具和模塊,幫助開發(fā)者構建、訓練和部署神經網(wǎng)絡模型。在神經網(wǎng)絡
    的頭像 發(fā)表于 07-10 14:57 ?917次閱讀

    pytorch中有神經網(wǎng)絡模型

    處理、語音識別等領域取得了顯著的成果。PyTorch是個開源的深度學習框架,由Facebook的AI研究團隊開發(fā)。它以其易用性、靈活性和高效性而受到廣泛歡迎。在PyTorch中,有許多預訓練的
    的頭像 發(fā)表于 07-11 09:59 ?1838次閱讀