一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

谷歌TensorFlow Graphics:為3D圖像任務(wù)打造的深度學(xué)習(xí)利器

電子工程師 ? 來源:YXQ ? 2019-05-14 08:35 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

TensorFlow重磅推出一個全新的圖形工具TensorFlow Graphics,結(jié)合計算機圖形學(xué)和計算機視覺技術(shù),以無監(jiān)督的方式解決復(fù)雜3D視覺任務(wù)。

近年來,可插入到神經(jīng)網(wǎng)絡(luò)架構(gòu)中的一種新型可微圖形層(differentiable graphics layers)開始興起。

從空間變換器(spatial transformers)到可微圖形渲染器,這些新型的神經(jīng)網(wǎng)絡(luò)層利用計算機視覺、圖形學(xué)研究獲得的知識來構(gòu)建新的、更高效的網(wǎng)絡(luò)架構(gòu)。它們將幾何先驗和約束顯式地建模到神經(jīng)網(wǎng)絡(luò)中,為能夠以自監(jiān)督的方式進行穩(wěn)健、高效訓(xùn)練的神經(jīng)網(wǎng)絡(luò)架構(gòu)打開了大門。

從高級層面來說,計算機圖形學(xué)的pipeline需要3D物體及其在場景中的絕對位置、構(gòu)成它們的材質(zhì)的描述、光、以及攝像頭。然后,渲染器對這個場景描述進行解釋,生成一個合成渲染。

相比之下,計算機視覺系統(tǒng)是從圖像開始的,并試圖推斷出場景的相關(guān)參數(shù)。也就是說,計算機視覺系統(tǒng)可以預(yù)測場景中有哪些物體,它們由什么材料構(gòu)成,以及它們的3D位置和方向。

訓(xùn)練一個能夠解決這些復(fù)雜的3D視覺任務(wù)的機器學(xué)習(xí)系統(tǒng)通常需要大量的數(shù)據(jù)。由于給數(shù)據(jù)打標(biāo)簽是一個成本高昂而且復(fù)雜的過程,因此設(shè)計能夠理解三維世界、而且無需太多監(jiān)督的機器學(xué)習(xí)模型的機制非常重要。

將計算機視覺和計算機圖形學(xué)技術(shù)結(jié)合起來,我們得以利用大量現(xiàn)成的無標(biāo)記數(shù)據(jù)。

如下圖所示,這個過程可以通過合成分析來實現(xiàn),其中視覺系統(tǒng)提取場景參數(shù),圖形系統(tǒng)根據(jù)這些參數(shù)返回圖像。如果渲染結(jié)果與原始圖像匹配,則說明視覺系統(tǒng)已經(jīng)準確地提取出場景參數(shù)了。

在這種設(shè)置中,計算機視覺和計算機圖形學(xué)相輔相成,形成了一個類似于自動編碼器的機器學(xué)習(xí)系統(tǒng),能夠以一種自監(jiān)督的方式進行訓(xùn)練。

可微圖形層

接下來,我們將探討TensorFlow Graphics的一些功能。更多信息可以訪問GitHub:

變換(Transformations)

物體變換(Object transformations)功能能夠控制物體在空間中的位置。

如下圖所示,利用軸角度可以將立方體旋轉(zhuǎn)起來。旋轉(zhuǎn)軸指向上方,角度為正,則使立方體逆時針旋轉(zhuǎn)。

在下面的Colab示例中,我們展示了如何在一個神經(jīng)網(wǎng)絡(luò)中訓(xùn)練旋轉(zhuǎn)形式,該神經(jīng)網(wǎng)絡(luò)被訓(xùn)練來預(yù)測物體的旋轉(zhuǎn)和平移。

https://colab.sandbox.google.com/github/tensorflow/graphics/blob/master/tensorflow_graphics/notebooks/6dof_alignment.ipynb

這項任務(wù)是許多應(yīng)用程序的核心,比如專注于與環(huán)境交互的機器人。機器人要用機械臂抓取物體,需要精確地估計物體相對于機械臂的位置。

建模相機(Modelling cameras)

相機模型(Camera models)在計算機視覺中有著至關(guān)重要的作用,因為相機會極大地影響投影到圖像平面上的3D物體的外觀。

如下圖所示,立方體看起來是上下縮放的,而實際上發(fā)生這種變化只是由于相機焦距發(fā)生了變化。

下面的Colab示例提供了更多關(guān)于相機模型的細節(jié),以及如何在TensorFlow中使用它們的具體示例。

材料

材料模型(Material models)定義了光和物體交互的方式,賦予它們獨特的外觀。

例如,有些材料,如石膏,能均勻地向所有方向反射光線,而有些材料,如鏡子,則純粹是鏡面反射。

準確地預(yù)測材料屬性是許多視覺任務(wù)的基礎(chǔ)。例如,可以讓用戶將虛擬家具放置在環(huán)境中,家具的照片可以與室內(nèi)環(huán)境逼真地融合在一起,從而讓用戶對這些家具的外觀形成準確的感知。

在下面的Colab筆記本,可以學(xué)習(xí)如何使用Tensorflow Graphics生成如下的渲染。你也可以試驗不同的材料和光的參數(shù),了解它們?nèi)绾蜗嗷プ饔谩?/p>

幾何——3D卷積和池化

近年來,從智能手機的深度傳感器自動駕駛汽車激光雷達,以點云或網(wǎng)格的形式輸出3D數(shù)據(jù)的傳感器越來越常用。由于這類數(shù)據(jù)有著不規(guī)則的結(jié)構(gòu),與提供規(guī)則網(wǎng)格結(jié)構(gòu)的圖像相比,在這些表示上執(zhí)行卷積更難實現(xiàn)。

TensorFlow Graphics提供兩個3D卷積層和一個3D池化層,例如,允許網(wǎng)絡(luò)在網(wǎng)格上執(zhí)行語義部分分類(如下圖所示):

TensorBoard 3d

可視化debug是評估實驗是否朝著正確方向進行的一種很好的方法。為此,TensorFlow Graphics提供了一個TensorBoard插件,可以交互式地對3D網(wǎng)格和點云進行可視化。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 谷歌
    +關(guān)注

    關(guān)注

    27

    文章

    6231

    瀏覽量

    108115
  • 深度學(xué)習(xí)
    +關(guān)注

    關(guān)注

    73

    文章

    5561

    瀏覽量

    122793

原文標(biāo)題:谷歌重磅推出TensorFlow Graphics:為3D圖像任務(wù)打造的深度學(xué)習(xí)利器

文章出處:【微信號:vision263com,微信公眾號:新機器視覺】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    TechWiz LCD 3D應(yīng)用:FFS仿真

    建模任務(wù) 堆棧結(jié)構(gòu) 建模過程 2.1使用TechWiz Layout繪制各層掩模版平面圖 2.2創(chuàng)建堆棧結(jié)構(gòu),并生成3D結(jié)構(gòu) 2.3 使用TechWiz LCD 3D進行各項參數(shù)計算 3
    的頭像 發(fā)表于 07-14 14:08 ?110次閱讀
    TechWiz LCD <b class='flag-5'>3D</b>應(yīng)用:FFS仿真

    中國3D引導(dǎo)類相機市場與競爭分析

    3D技術(shù)區(qū)別于2D技術(shù)的一個顯著特征是,除了顯示對象的X和Y值外,還可以提供記錄場景或?qū)ο蟮?b class='flag-5'>深度值。這解決復(fù)雜任務(wù)提供了全新的可能,特別是
    的頭像 發(fā)表于 06-28 16:27 ?614次閱讀
    中國<b class='flag-5'>3D</b>引導(dǎo)類相機市場與競爭分析

    海伯森3D閃測傳感器,工業(yè)檢測領(lǐng)域的高精度利器

    隨著信息技術(shù)的飛速進步,第四次視覺革命深度融合“人”“機”“物”,基于光學(xué)原理的3D視覺檢測技術(shù)迎來爆發(fā)式發(fā)展,成為工業(yè)生產(chǎn)中更高效的檢測利器。3D視覺技術(shù)通過非接觸性、高速性、數(shù)據(jù)完
    的頭像 發(fā)表于 06-20 17:46 ?855次閱讀
    海伯森<b class='flag-5'>3D</b>閃測傳感器,工業(yè)檢測領(lǐng)域的高精度<b class='flag-5'>利器</b>

    TechWiz LCD 3D應(yīng)用:局部液晶配向

    ,本案例使用TechWiz LCD 3D進行局部摩擦的設(shè)置。 1. 建模任務(wù) 1.1進行局部摩擦配置 2. 建模過程 以下是建模過程中部分重要步驟的說明 2.1在TechWiz Layout中創(chuàng)建結(jié)構(gòu)
    發(fā)表于 06-16 08:46

    安森美這款iToF傳感器讓3D深度測量技術(shù)輕松落地

    現(xiàn)代工業(yè)自動化的成功離不開3D視覺技術(shù)的強大功能。傳統(tǒng)的2D傳感器只能提供平面圖像,這使其在設(shè)備檢測等應(yīng)用中的效能大打折扣。2D傳感器可以讀取包含物品尺寸的條形碼,但無法獨立測量物體的
    的頭像 發(fā)表于 03-28 14:31 ?549次閱讀
    安森美這款iToF傳感器讓<b class='flag-5'>3D</b><b class='flag-5'>深度</b>測量技術(shù)輕松落地

    用樹莓派搞深度學(xué)習(xí)?TensorFlow啟動!

    介紹本頁面將指導(dǎo)您在搭載64位Bullseye操作系統(tǒng)的RaspberryPi4上安裝TensorFlow。TensorFlow是一個專為深度學(xué)習(xí)開發(fā)的大型軟件庫,它消耗大量資源。您可
    的頭像 發(fā)表于 03-25 09:33 ?440次閱讀
    用樹莓派搞<b class='flag-5'>深度</b><b class='flag-5'>學(xué)習(xí)</b>?<b class='flag-5'>TensorFlow</b>啟動!

    一種以圖像中心的3D感知模型BIP3D

    在具身智能系統(tǒng)中,3D感知算法是一個關(guān)鍵組件,它在端側(cè)幫助可以幫助智能體理解環(huán)境信息,在云端可以用來輔助生成3D場景和3D標(biāo)簽,具備重要的研究價值?,F(xiàn)有主流算法主要依賴于點云作為輸入
    的頭像 發(fā)表于 03-17 13:44 ?468次閱讀
    一種以<b class='flag-5'>圖像</b><b class='flag-5'>為</b>中心的<b class='flag-5'>3D</b>感知模型BIP<b class='flag-5'>3D</b>

    ?超景深3D檢測顯微鏡技術(shù)解析

    方案的制定提供依據(jù)。 在工業(yè)檢測領(lǐng)域,超景深3D檢測顯微鏡的高精度成像能力使其成為質(zhì)量控制的利器。無論是電子元器件的檢測,還是精密機械零件的表面分析,這種顯微鏡都能夠提供清晰、立體的圖像,幫助工程師快速
    發(fā)表于 02-25 10:51

    TechWiz LCD 3D應(yīng)用:局部液晶配向

    ,本案例使用TechWiz LCD 3D進行局部摩擦的設(shè)置。 1. 建模任務(wù) 1.1進行局部摩擦配置 2. 建模過程 以下是建模過程中部分重要步驟的說明 2.1在TechWiz Layout中創(chuàng)建結(jié)構(gòu)
    發(fā)表于 02-08 08:52

    多維精密測量:半導(dǎo)體微型器件的2D&amp;3D視覺方案

    精密視覺檢測技術(shù)有效提升了半導(dǎo)體行業(yè)的生產(chǎn)效率和質(zhì)量保障。友思特自研推出基于深度學(xué)習(xí)平臺和視覺掃描系統(tǒng)的2D3D視覺檢測方案,通過9種深度
    的頭像 發(fā)表于 01-10 13:54 ?698次閱讀
    多維精密測量:半導(dǎo)體微型器件的2<b class='flag-5'>D</b>&amp;<b class='flag-5'>3D</b>視覺方案

    AN-1249:使用ADV8003評估板將3D圖像轉(zhuǎn)換成2D圖像

    電子發(fā)燒友網(wǎng)站提供《AN-1249:使用ADV8003評估板將3D圖像轉(zhuǎn)換成2D圖像.pdf》資料免費下載
    發(fā)表于 01-08 14:28 ?0次下載
    AN-1249:使用ADV8003評估板將<b class='flag-5'>3D</b><b class='flag-5'>圖像</b>轉(zhuǎn)換成2<b class='flag-5'>D</b><b class='flag-5'>圖像</b>

    3D深度感測的原理和使用二極管激光來實現(xiàn)深度感測的優(yōu)勢

    ? 本文介紹了3D深度感測的原理和使用二極管激光來實現(xiàn)深度感測的優(yōu)勢。 世界是三維的。這句話如此容易理解,以至于大多數(shù)人從未懷疑過自己感知世界的方式。但事實上,人的每只眼睛每次可捕獲一幅平面
    的頭像 發(fā)表于 01-07 09:54 ?605次閱讀
    <b class='flag-5'>3D</b><b class='flag-5'>深度</b>感測的原理和使用二極管激光來實現(xiàn)<b class='flag-5'>深度</b>感測的優(yōu)勢

    TechWiz LCD 3D應(yīng)用:局部液晶配向

    ,本案例使用TechWiz LCD 3D進行局部摩擦的設(shè)置。 1. 建模任務(wù) 1.1進行局部摩擦配置 2. 建模過程 以下是建模過程中部分重要步驟的說明 2.1在TechWiz Layout中創(chuàng)建結(jié)構(gòu)
    發(fā)表于 01-03 08:58

    發(fā)掘3D文件格式的無限潛力:打造沉浸式虛擬世界

    在當(dāng)今數(shù)字化時代,3D技術(shù)的應(yīng)用范圍日益廣泛,涵蓋電影后期制作、產(chǎn)品原型設(shè)計、虛擬現(xiàn)實(VR)、增強現(xiàn)實(AR)、游戲等眾多領(lǐng)域。而3D文件格式作為3D技術(shù)的核心組成部分,對于實現(xiàn)3D
    的頭像 發(fā)表于 09-26 18:14 ?1870次閱讀
    發(fā)掘<b class='flag-5'>3D</b>文件格式的無限潛力:<b class='flag-5'>打造</b>沉浸式虛擬世界

    3D 建模:塑造未來的無限可能

    的原子結(jié)構(gòu)要求真實的物理存在需要所有三個維度,盡管我們大腦將電影和照片解釋二維(2D)。在數(shù)字計算中,3D圖像指的是具有深度信息、類似于真
    的頭像 發(fā)表于 08-16 18:24 ?1940次閱讀