一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

僅需20%信息 AI場景全再現(xiàn)

DPVg_AI_era ? 來源:fqj ? 2019-05-20 16:46 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

近日,Science子刊發(fā)表文章,來自Facebook、加州伯克利分校和德克薩斯奧斯汀大學(xué)的研究人員通過強(qiáng)化學(xué)習(xí)解決了“如何讓智能體獲取信息性的視覺觀察”的問題。具體來說就是,AI智能體對新環(huán)境“瞥上幾眼”,就能快速推斷整個(gè)新環(huán)境的情況。AI的能力越來越接近人類了。

又接近了人類一步。

當(dāng)我們給計(jì)算機(jī)視覺系統(tǒng)輸入一張照片時(shí),它們可以很容易捕獲照片中的信息。但是,自主捕獲信息對于計(jì)算機(jī)視覺系統(tǒng)還是非常困難的。

簡單來說就是,當(dāng)我們?nèi)祟惪吹较聢D左、中兩個(gè)不同方向的獎(jiǎng)杯時(shí),就有可能推測出第三個(gè)方向上獎(jiǎng)杯的樣子。

但對于計(jì)算機(jī)視覺系統(tǒng)或者AI智能體來說,這種能力的實(shí)現(xiàn)是較為困難的。

近日,Science子刊(Sience Robotics)封面發(fā)表了一篇文章,便對這項(xiàng)任務(wù)做了深入研究,并讓智能體的視覺系統(tǒng)取得了突破性進(jìn)展。不得不感嘆AI離人類的距離又拉近了一段!

來自Facebook、加州伯克利分校和德克薩斯奧斯汀大學(xué)的研究人員通過強(qiáng)化學(xué)習(xí)解決了“如何讓智能體獲取信息性的視覺觀察”的問題。具體來說就是,AI智能體對新環(huán)境“瞥上幾眼”,就能快速推斷整個(gè)新環(huán)境的情況。

如上圖所示,AI智能體快速對新環(huán)境不同方向拍攝快照并作為輸入,通過總計(jì)不超過20%場景內(nèi)容的照片即可推測整個(gè)場景內(nèi)容!

“輕輕一瞥”,新場景即刻再現(xiàn)!

對于一個(gè)智能體,環(huán)境的各個(gè)視圖只提供所有相關(guān)信息的一小部分。

例如,一個(gè)智能體如果看到前面的電視屏幕,它可能不知道電視是在客廳還是臥室;智能體從側(cè)面觀察一個(gè)杯子,可能要從上面看才能知道杯子里面是什么。

這項(xiàng)研究的目標(biāo)是學(xué)習(xí)一種控制智能體的攝像機(jī)運(yùn)動策略,這樣它就可以有效地探索新的環(huán)境和對象。

為此,研究人員制定了一個(gè)基于主動觀察完成的無監(jiān)督學(xué)習(xí)目標(biāo)。它的主要思想是支持一系列的攝像機(jī)運(yùn)動,這些運(yùn)動能使智能體周圍看不見的部分更容易預(yù)測。其輸出是一個(gè)查找策略,用于在新環(huán)境中收集新圖像。

主動完成觀測任務(wù)面臨三大挑戰(zhàn):

首先,為了很好地預(yù)測未觀察到的視圖,智能體必須學(xué)會從很少的視圖理解3D關(guān)系。經(jīng)典的幾何解在這些條件下很難求解;

其次,智能行動選擇是這項(xiàng)任務(wù)的關(guān)鍵。鑒于過去的一系列觀察結(jié)果,系統(tǒng)必須根據(jù)可能提供最多信息的新觀點(diǎn)采取行動,即,確定哪些視圖最能改進(jìn)其完整視圖網(wǎng)格的模型。

強(qiáng)調(diào)系統(tǒng)將面對在訓(xùn)練期間從未遇到的對象和場景,但仍然必須智能地選擇下一步看起來有價(jià)值的地方。

作為這些挑戰(zhàn)的核心解決方案,研究人員提出了一種用于主動觀測完成的RL方法,如下圖所示。

僅需20%信息 AI場景全再現(xiàn)

我們的RL方法使用遞歸神經(jīng)網(wǎng)絡(luò)來聚合一系列視圖中的信息; 隨機(jī)神經(jīng)網(wǎng)絡(luò)使用聚合狀態(tài)和當(dāng)前觀察來選擇一系列有用的相機(jī)運(yùn)動。智能體根據(jù)其對未觀察到的視圖的預(yù)測而獲得獎(jiǎng)勵(lì)。因此,它學(xué)會了一種策略來智能地選擇動作(攝像機(jī)動作),以最大限度地提高預(yù)測的質(zhì)量。

在訓(xùn)練期間,完整的viewgrid是已知的,因此允許智能體“自我監(jiān)督”其策略學(xué)習(xí),這意味著它學(xué)習(xí)時(shí)不需要任何人類提供的標(biāo)簽

該模型判斷了像素空間中viewgrid重構(gòu)的質(zhì)量,從而保持通用性:整個(gè)場景(或3D對象)的所有像素都包含了所有對任何任務(wù)都可能有用的視覺信息。

因此,該方法避免使用任何中間語義表示,而采用尋求對許多任務(wù)有用的通用信息的學(xué)習(xí)策略。也就是說,研究人員所提出的方法很容易適應(yīng)更專業(yè)的環(huán)境。例如,如果目標(biāo)任務(wù)只需要語義分割標(biāo)簽,那么預(yù)測可以放在對象標(biāo)簽的空間中。

RL方法往往存在勘探階段成本高和部分狀態(tài)可觀測性差的問題。特別是,一個(gè)活躍的視覺智能體必須完全基于第一人稱視圖中有限的可用信息進(jìn)行一系列的操作。最有效的視點(diǎn)軌跡隱藏在許多平庸的視點(diǎn)軌跡中,阻礙了智能體在復(fù)雜的狀態(tài)-動作空間中的探索。

為了解決這一挑戰(zhàn),作為這項(xiàng)工作的第二個(gè)主要技術(shù)貢獻(xiàn),引入了“sidekick策略學(xué)習(xí)”。

sidekick方法引入了獎(jiǎng)勵(lì)塑造和演示,利用訓(xùn)練期間的完全可觀察性來預(yù)先計(jì)算每個(gè)候選快照的信息內(nèi)容。然后,助手引導(dǎo)智能體訪問環(huán)境中的信息熱點(diǎn)或樣本中信息豐富的軌跡,同時(shí)考慮到在測試過程中可觀察性只是部分的事實(shí)。通過這樣做,助手們可以加快對實(shí)際智能體的訓(xùn)練,提高整體表現(xiàn)。

實(shí)驗(yàn)結(jié)果

數(shù)據(jù)集

為了基準(zhǔn)和重現(xiàn)性,研究人員在兩個(gè)廣泛使用的數(shù)據(jù)集上評估了提出的方法。

SUN360 dataset for scenes

SUN360擁有26個(gè)不同類別的球形全景。數(shù)據(jù)集包括6174個(gè)訓(xùn)練、1013個(gè)驗(yàn)證和1805個(gè)測試示例。viewgrid有32×32像素分辨率的2D圖像。

ModelNet dataset for objects

對于此數(shù)據(jù)集,智能體操縱3D對象以完成從所有查看方向看到的對象的視圖。viewgrid構(gòu)成了一個(gè)隱式的基于圖像的三維形狀模型。ModelNet有兩個(gè)計(jì)算機(jī)輔助設(shè)計(jì)(CAD)模型子集:ModelNet-40(40個(gè)類別)和ModelNet-10 (ModelNet-40的10個(gè)類別子集)。不包括ModelNet-10類,ModelNet-40包含6085個(gè)訓(xùn)練、327個(gè)驗(yàn)證和1310個(gè)測試示例。ModelNet-10包含3991個(gè)訓(xùn)練、181個(gè)驗(yàn)證和727個(gè)測試示例。viewgrid有32×32分辨率的2D圖像。

基線

研究人員測試了主動完成方法,使用/不使用sidekick策略學(xué)習(xí)(分別是lookaround和lookaround+spl)與各種基線進(jìn)行比較:

one-view是用T = 1訓(xùn)練的方法。該基線沒有進(jìn)行信息聚合或動作選擇。

rnd-actions與研究人員的方法相同,只是動作選擇模塊被所有可能動作池中隨機(jī)選擇的動作所取代。

large-actions選擇最大允許動作。 這測試了遠(yuǎn)距離觀點(diǎn)是否足夠豐富。

peek-saliency使用一個(gè)流行的saliency度量,在每個(gè)時(shí)間步長移動到可觸及的最顯著的視圖。

僅需20%信息 AI場景全再現(xiàn)

不同智能體行為下的場景和對象完成精度

(A)隨著獲得更多的一瞥,兩個(gè)數(shù)據(jù)集上的像素級MSE錯(cuò)誤隨時(shí)間的變化。(B)所有T次瞥見后,兩個(gè)數(shù)據(jù)集的平均/對抗性MSE誤差×1000(↓越低越好)和相對于單視圖模型(↑越高越好)的相應(yīng)改進(jìn)(%)。

SUN360(左)和ModelNet(右)的活動觀測完成情況

對于每個(gè)示例,左邊的第一行顯示了ground-truth viewgrid;左邊的后續(xù)行顯示了t = 0,1,t?1 = 3時(shí)的重構(gòu),以及像素方向的MSE錯(cuò)誤(×1000)和代理當(dāng)前的快照(用紅色標(biāo)記)。在右側(cè),每個(gè)時(shí)間步長所采樣的智能體觀察角度顯示在觀察球上。重建質(zhì)量隨著時(shí)間的推移而提高,因?yàn)樗梢钥焖俚丶?xì)化場景結(jié)構(gòu)和對象形狀。

T = 6“瞥見”后的三個(gè)重建例子

適用于SUN360和ModelNet的多種環(huán)境的ground-truth 360全景圖或viewgrid以及最終的GAN-refined重建

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 人工智能
    +關(guān)注

    關(guān)注

    1806

    文章

    49014

    瀏覽量

    249446
  • 計(jì)算機(jī)視覺
    +關(guān)注

    關(guān)注

    9

    文章

    1709

    瀏覽量

    46777

原文標(biāo)題:Science子刊封面:僅需20%信息,AI場景全再現(xiàn)!

文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    HarmonyOS AI輔助編程工具(CodeGenie)代碼續(xù)寫

    利用AI大模型分析并理解開發(fā)者在代碼編輯區(qū)的上下文信息或自然語言描述信息,智能生成符合上下文的ArkTS或C++代碼片段。 一、使用約束 建議在編輯區(qū)內(nèi)已有較豐富上下文,能夠使模型對編程場景
    發(fā)表于 07-15 16:15

    神眸2025春季新品發(fā)布會:五大AI智能新品多場景體驗(yàn)創(chuàng)新,開啟綠色智能新時(shí)代

    神眸品牌創(chuàng)始人楊作興博士首次提出“不是每一款攝像機(jī)都能叫神眸”。這些新品不僅展現(xiàn)了神眸在低功耗芯片與AI技術(shù)上的突破,更通過多場景化應(yīng)用體驗(yàn)創(chuàng)新,重新定義和大幅度拓寬了AI智能攝像
    的頭像 發(fā)表于 05-15 14:10 ?523次閱讀
    神眸2025春季新品發(fā)布會:五大<b class='flag-5'>AI</b>智能新品多<b class='flag-5'>場景</b>體驗(yàn)創(chuàng)新,開啟綠色智能新時(shí)代

    邊緣AI MPU深度盤點(diǎn):品牌、型號與技術(shù)特性解析

    邊緣AI MPU深度盤點(diǎn):品牌、型號與技術(shù)特性解析 隨著邊緣計(jì)算與人工智能的深度融合,邊緣AI MPU(微處理器)已成為支撐物聯(lián)網(wǎng)、智能制造、自動駕駛等場景的核心硬件。本文從品牌、型
    的頭像 發(fā)表于 04-30 17:27 ?2258次閱讀

    大象機(jī)器人攜手進(jìn)迭時(shí)空推出 RISC-V 棧開源六軸機(jī)械臂產(chǎn)品

    RISC-V”六軸機(jī)械臂為教育場景量身定制,具備6個(gè)自由度,280mm臂展,支持250g負(fù)載,整機(jī)重量860克。提供豐富接口,末端兼容樂高/M4拓展接口,可自由替換筆夾、夾爪、吸泵、視覺模塊等多種
    發(fā)表于 04-25 17:59

    RK3588核心板在邊緣AI計(jì)算中的顛覆性優(yōu)勢與場景落地

    推理任務(wù),額外部署GPU加速卡,導(dǎo)致成本與功耗飆升。 擴(kuò)展性受限:老舊接口(如USB 2.0、百兆網(wǎng)口)無法支持5G模組、高速存儲等現(xiàn)代外設(shè),升級困難。 開發(fā)周期長:BSP適配不完善,跨平臺AI
    發(fā)表于 04-15 10:48

    首創(chuàng)開源架構(gòu),天璣AI開發(fā)套件讓端側(cè)AI模型接入得心應(yīng)手

    AI的演進(jìn)正在逼近“終端智能涌現(xiàn)”的拐點(diǎn),從通用模型向場景落地遷移成為關(guān)鍵議題。聯(lián)發(fā)科以“AI隨芯,應(yīng)用無界”為主題召開天璣開發(fā)者大會2025(MDDC 2025),不僅聚合了全球生態(tài)資源,還
    發(fā)表于 04-13 19:52

    志AIOT系列芯片助力AI玩具百花齊放

    近日,由阿里云主辦的“AI火花會——通情達(dá)義智玩共生:玩具行業(yè)的“智”變方程式”在深圳舉行,志科技受邀參會。會上,志科技 模擬互聯(lián)產(chǎn)品中心總經(jīng)理 黃露 深入分享了志科技在
    的頭像 發(fā)表于 04-01 09:16 ?700次閱讀

    華為中國合作伙伴大會2025 | 拓維信息“鴻蒙+AI”產(chǎn)品陣容之智能課程考核平臺

    3月20日-21日,一年一度的華為中國合作伙伴大會將在深圳啟幕。作為華為“鯤鵬/昇騰+行業(yè)大模型+鴻蒙+海思”全方位戰(zhàn)略合作伙伴,拓維信息依托“鴻蒙+AI棧國產(chǎn)化戰(zhàn)略,基于自身在交
    的頭像 發(fā)表于 03-19 18:36 ?562次閱讀
    華為中國合作伙伴大會2025 | 拓維<b class='flag-5'>信息</b>“鴻蒙+<b class='flag-5'>AI</b>”產(chǎn)品陣容之智能課程考核平臺

    Banana Pi 發(fā)布 BPI-AI2N &amp; BPI-AI2N Carrier,助力 AI 計(jì)算與嵌入式開發(fā)

    架構(gòu),賦能多場景應(yīng)用 BPI-AI2N 采用 RZ/V2N 處理器,集成 4 核 Arm? Cortex?-A55(1.8GHz)與 Cortex?-M33(200MHz),提供強(qiáng)勁的計(jì)算能力,同時(shí)兼顧
    發(fā)表于 03-19 17:54

    華為中國合作伙伴大會2025 | 拓維信息 開鴻智谷“鴻蒙+AI”產(chǎn)品陣容搶先看

    3月20日-21日,一年一度的華為中國合作伙伴大會將在深圳啟幕。作為華為“鯤鵬/昇騰+行業(yè)大模型+鴻蒙+海思”全方位戰(zhàn)略合作伙伴,拓維信息及旗下開鴻智谷依托“鴻蒙+AI棧國產(chǎn)化戰(zhàn)略
    的頭像 發(fā)表于 03-14 17:20 ?1215次閱讀
    華為中國合作伙伴大會2025 | 拓維<b class='flag-5'>信息</b> 開鴻智谷“鴻蒙+<b class='flag-5'>AI</b>”產(chǎn)品陣容搶先看

    華為中國合作伙伴大會2025 | 拓維信息“鴻蒙+AI”產(chǎn)品陣容搶先看①

    3月20日-21日,一年一度的華為中國合作伙伴大會將在深圳啟幕。作為華為“鯤鵬/昇騰+行業(yè)大模型+鴻蒙+海思”全方位戰(zhàn)略合作伙伴,拓維信息依托“鴻蒙+AI棧國產(chǎn)化戰(zhàn)略,基于自身在交
    的頭像 發(fā)表于 03-13 18:10 ?1170次閱讀
    華為中國合作伙伴大會2025 | 拓維<b class='flag-5'>信息</b>“鴻蒙+<b class='flag-5'>AI</b>”產(chǎn)品陣容搶先看①

    29.9元,即刻升級產(chǎn)品至AI大模型前沿科技領(lǐng)域

    各行各業(yè)指明了新的發(fā)展方向。在這樣的背景下,啟明智顯推出了29.9元的問答式AI智能體套件,旨在幫助傳統(tǒng)客戶快速升級,打造屬于自己的AI智能產(chǎn)品,迎接即將到來的A
    的頭像 發(fā)表于 12-25 18:05 ?472次閱讀
    <b class='flag-5'>僅</b><b class='flag-5'>需</b>29.9元,即刻升級產(chǎn)品至<b class='flag-5'>AI</b>大模型前沿科技領(lǐng)域

    RISC-V在中國的發(fā)展機(jī)遇有哪些場景

    RISC-V在中國的發(fā)展機(jī)遇廣泛存在于多個(gè)場景,這主要得益于其開源、開放、簡潔、靈活等特性,以及中國作為全球最大的數(shù)據(jù)大國和信息技術(shù)市場的重要地位。以下是一些RISC-V在中國的主要發(fā)展機(jī)遇場景
    發(fā)表于 07-29 17:14

    視頻3--場景自動化AI助手

    AI
    草帽王路飛
    發(fā)布于 :2024年07月22日 11:16:13

    視頻2--場景自動化AI助手

    AI
    草帽王路飛
    發(fā)布于 :2024年07月22日 11:15:34