一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

谷歌發(fā)明的由2D圖像生成3D圖像技術(shù)解析

我快閉嘴 ? 來源:愛集微 ? 作者:嘉德IPR ? 2020-12-24 12:55 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

谷歌發(fā)明的由2D圖像生成3D圖像的技術(shù),利用3D估計(jì)神經(jīng)網(wǎng)絡(luò)圖像信息的補(bǔ)全以及預(yù)測,融合了拍攝角度、光照等信息,讓生成的3D圖像看起來更加逼真,這種技術(shù)對于三維建模以及工業(yè)應(yīng)用都具有極大的指導(dǎo)意義。

谷歌研究人員制作的一個(gè)AI工具,可以把涂鴉變成奇怪的怪物。這款工具名為Chimera Painter,使用機(jī)器學(xué)習(xí)來根據(jù)用戶的粗略草圖生成圖像。

Chimera Painter背后的團(tuán)隊(duì)在一篇博客文章中解釋了他們的方法和動機(jī),稱他們的想法是創(chuàng)造一種 “畫筆,它的行為不像工具,而更像助手”。Chimera Painter只是一個(gè)原型,但如果這樣的軟件變得普遍,它可以減少創(chuàng)造高質(zhì)量藝術(shù)所需的時(shí)間。

這種圖像生成技術(shù),其實(shí)在三維渲染方面有著非常廣泛的應(yīng)用,其中最具有代表性的工作之一,就是由2D圖像生成3D圖像。我們知道,3D圖像相比于2D圖像多了深度信息這一個(gè)維度,但也就是這一個(gè)差別,導(dǎo)致了3D圖像相比于2D圖像所多出的信息不是一星半點(diǎn)。因此,倘若想要從2D圖像生成3D圖像,其難度之大可想而知。

為此,谷歌在18年10月18日申請了一項(xiàng)名為“通過渲染許多3D視圖來學(xué)習(xí)重構(gòu)3D形狀”的發(fā)明專利(申請?zhí)枺?01880030823.5),申請人為谷歌有限責(zé)任公司。

根據(jù)該專利目前公開的資料,讓我們一起來看看這項(xiàng)從2D圖像到3D圖像的生成方法吧。

谷歌發(fā)明的由2D圖像生成3D圖像技術(shù)解析

該技術(shù)中,主要使用了3D估計(jì)器神經(jīng)網(wǎng)絡(luò),如上圖,為使用3D估計(jì)器神經(jīng)網(wǎng)絡(luò)來估計(jì)圖像中描繪的面部的3D形狀和紋理,并基于估計(jì)的3D形狀和紋理生成替身的系統(tǒng)示意圖。用戶通過上傳面部圖像105,系統(tǒng)100可以對照片進(jìn)行處理后生成替身115,這里所說的替身也就是用戶的3D畫像。

在具體的過程中,照片首先由面部識別引擎110進(jìn)行處理,從而生成用戶的面部圖像特征112,該特征在3D估計(jì)神經(jīng)網(wǎng)絡(luò)中被處理,基于圖像特征估計(jì)照片中描繪的用戶面部的3D形狀和紋理,從而生成形狀紋理數(shù)據(jù)122。

最后,數(shù)據(jù)122被發(fā)送到3D渲染引擎130中,基于用戶獨(dú)特的面部形狀、紋理特征來生成用戶的3D畫像,并且為了做到更加真實(shí),渲染引擎可以給出特定的視圖,視圖中融合了相機(jī)角度、光照以及視場的估計(jì)信息,可以讓生成的圖像質(zhì)量更加逼真。

谷歌發(fā)明的由2D圖像生成3D圖像技術(shù)解析

如上圖,為用于用戶3D渲染圖像生成的3D估計(jì)器神經(jīng)網(wǎng)絡(luò)220的系統(tǒng)框圖,整個(gè)系統(tǒng)的結(jié)構(gòu)還是相當(dāng)復(fù)雜的,從圖中我們可以看到這種神經(jīng)網(wǎng)絡(luò)是如何工作的。根據(jù)目前的技術(shù)來看,訓(xùn)練3D估計(jì)器神經(jīng)網(wǎng)絡(luò)通常有兩個(gè)困難:第一,由3D對象的圖像和那些3D對象的3D形狀和紋理組成的訓(xùn)練對通常是有限的并且難以獲得;第二,訓(xùn)練3D估計(jì)器神經(jīng)網(wǎng)絡(luò)可能經(jīng)常導(dǎo)致3D估計(jì)器神經(jīng)網(wǎng)絡(luò)的網(wǎng)絡(luò)欺騙。

因此,該專利發(fā)明的整個(gè)網(wǎng)絡(luò)分為了監(jiān)督訓(xùn)練回路以及無監(jiān)督訓(xùn)練回路,通過二者相結(jié)合的方式,在完全訓(xùn)練階段期間,僅利用無監(jiān)督訓(xùn)練回路,從而允許估計(jì)神經(jīng)網(wǎng)絡(luò)輸出更快地收斂。

因?yàn)闊o監(jiān)督訓(xùn)練回路可以在預(yù)訓(xùn)練階段和完全訓(xùn)練階段兩者期間使用,所以從無監(jiān)督訓(xùn)練回路開始,在預(yù)訓(xùn)練之后,完全訓(xùn)練可以對大量迭代和大量樣本單獨(dú)利用無監(jiān)督訓(xùn)練回路,來改進(jìn)3D估計(jì)神經(jīng)網(wǎng)絡(luò)估計(jì)圖像中的對象的3D形狀和紋理的能力。

谷歌發(fā)明的由2D圖像生成3D圖像技術(shù)解析

最后,是這種無監(jiān)督訓(xùn)練回路訓(xùn)練的流程圖,系統(tǒng)首先需要獲取對象圖像的第一圖像特征,該特征就是上述所說用戶面部信息的原始數(shù)據(jù),其次,將這種第一圖像特征提供給3D估計(jì)器神經(jīng)網(wǎng)絡(luò)并獲取3D形狀和紋理。

根據(jù)這些形狀和紋理進(jìn)行3D渲染,并從多個(gè)3D視圖中導(dǎo)出第二圖像特征,基于圖像特征的損失函數(shù)計(jì)算損失,以知道神經(jīng)網(wǎng)絡(luò)進(jìn)行反向傳播以得到更加良好的效果以及減少圖像生成的損失。

以上就是谷歌發(fā)明的利用2D圖像生成3D圖像的專利技術(shù),從2D到3D圖像的轉(zhuǎn)換過程中,由于2D圖像缺少了很多信息,因此該技術(shù)利用3D估計(jì)神經(jīng)網(wǎng)絡(luò)進(jìn)行信息的補(bǔ)全以及預(yù)測,并融合了拍攝角度、光照等信息,讓生成的3D圖像看起來更加逼真,這種技術(shù)對于三維建模以及工業(yè)應(yīng)用都具有極大的指導(dǎo)意義。

關(guān)于嘉德

深圳市嘉德知識產(chǎn)權(quán)服務(wù)有限公司由曾在華為等世界500強(qiáng)企業(yè)工作多年的知識產(chǎn)權(quán)專家、律師、專利代理人組成,熟悉中歐美知識產(chǎn)權(quán)法律理論和實(shí)務(wù),在全球知識產(chǎn)權(quán)申請、布局、訴訟、許可談判、交易、運(yùn)營、標(biāo)準(zhǔn)專利協(xié)同創(chuàng)造、專利池建設(shè)、展會知識產(chǎn)權(quán)、跨境電商知識產(chǎn)權(quán)、知識產(chǎn)權(quán)海關(guān)保護(hù)等方面擁有豐富的經(jīng)驗(yàn)。
責(zé)任編輯:tzh

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 3D
    3D
    +關(guān)注

    關(guān)注

    9

    文章

    2959

    瀏覽量

    110752
  • 谷歌
    +關(guān)注

    關(guān)注

    27

    文章

    6231

    瀏覽量

    108134
  • 神經(jīng)網(wǎng)絡(luò)

    關(guān)注

    42

    文章

    4814

    瀏覽量

    103606
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    TechWiz LCD 3D應(yīng)用:FFS仿真

    建模任務(wù) 堆棧結(jié)構(gòu) 建模過程 2.1使用TechWiz Layout繪制各層掩模版平面圖 2.2創(chuàng)建堆棧結(jié)構(gòu),并生成3D結(jié)構(gòu) 2.3 使用TechWiz LCD 3D進(jìn)行各項(xiàng)參數(shù)計(jì)算 3
    的頭像 發(fā)表于 07-14 14:08 ?123次閱讀
    TechWiz LCD <b class='flag-5'>3D</b>應(yīng)用:FFS仿真

    TechWiz LCD 3D應(yīng)用:局部液晶配向

    我們所說的局部摩擦是指給液晶盒中不同區(qū)域(可自定義區(qū)域)進(jìn)行不同的液晶配向,所以也可以稱之為局部掩膜、局部配向等。TechWiz LCD 2D和TechWiz LCD 3D都可以對液晶盒設(shè)置局部摩擦
    發(fā)表于 06-16 08:46

    利用NVIDIA 3D引導(dǎo)生成式AI Blueprint控制圖像生成

    AI 賦能的圖像生成技術(shù)突飛猛進(jìn),從早期模型會生成手指過多的人類圖像,到現(xiàn)在能創(chuàng)造出令人驚嘆的逼真視覺效果。即使取得了如此飛躍,仍然存在一個(gè)
    的頭像 發(fā)表于 06-05 09:24 ?387次閱讀

    HT 可視化監(jiān)控頁面的 2D3D 連線效果

    的連線效果是如何實(shí)現(xiàn)的。我們將從 基本概念、實(shí)現(xiàn)步驟、關(guān)鍵代碼 多個(gè)維度,逐步剖析這個(gè)效果的具體實(shí)現(xiàn)過程,為你提供全面的知識和實(shí)踐指導(dǎo)。 盡管 2D3D 連線效果看起來復(fù)雜,其本質(zhì)仍然是二維節(jié)點(diǎn)之間的連接。只需要通過一些巧妙的
    的頭像 發(fā)表于 04-09 11:28 ?554次閱讀
    HT 可視化監(jiān)控頁面的 <b class='flag-5'>2D</b> 與 <b class='flag-5'>3D</b> 連線效果

    安森美這款iToF傳感器讓3D深度測量技術(shù)輕松落地

    現(xiàn)代工業(yè)自動化的成功離不開3D視覺技術(shù)的強(qiáng)大功能。傳統(tǒng)的2D傳感器只能提供平面圖像,這使其在設(shè)備檢測等應(yīng)用中的效能大打折扣。2D傳感器可以讀
    的頭像 發(fā)表于 03-28 14:31 ?556次閱讀
    安森美這款iToF傳感器讓<b class='flag-5'>3D</b>深度測量<b class='flag-5'>技術(shù)</b>輕松落地

    一種以圖像為中心的3D感知模型BIP3D

    在具身智能系統(tǒng)中,3D感知算法是一個(gè)關(guān)鍵組件,它在端側(cè)幫助可以幫助智能體理解環(huán)境信息,在云端可以用來輔助生成3D場景和3D標(biāo)簽,具備重要的研究價(jià)值?,F(xiàn)有主流算法主要依賴于點(diǎn)云作為輸入
    的頭像 發(fā)表于 03-17 13:44 ?469次閱讀
    一種以<b class='flag-5'>圖像</b>為中心的<b class='flag-5'>3D</b>感知模型BIP<b class='flag-5'>3D</b>

    ?超景深3D檢測顯微鏡技術(shù)解析

    技術(shù)的核心在于其能夠?qū)崿F(xiàn)比傳統(tǒng)顯微鏡更廣闊的景深范圍,同時(shí)保持高分辨率的成像能力,從而為用戶提供更為清晰和立體的微觀世界視圖。 超景深3D檢測顯微鏡的實(shí)現(xiàn)依賴于先進(jìn)的光學(xué)設(shè)計(jì)和復(fù)雜的圖像處理算法。傳統(tǒng)
    發(fā)表于 02-25 10:51

    TechWiz LCD 3D應(yīng)用:局部液晶配向

    我們所說的局部摩擦是指給液晶盒中不同區(qū)域(可自定義區(qū)域)進(jìn)行不同的液晶配向,所以也可以稱之為局部掩膜、局部配向等。TechWiz LCD 2D和TechWiz LCD 3D都可以對液晶盒設(shè)置局部摩擦
    發(fā)表于 02-08 08:52

    AN-1249:使用ADV8003評估板將3D圖像轉(zhuǎn)換成2D圖像

    電子發(fā)燒友網(wǎng)站提供《AN-1249:使用ADV8003評估板將3D圖像轉(zhuǎn)換成2D圖像.pdf》資料免費(fèi)下載
    發(fā)表于 01-08 14:28 ?0次下載
    AN-1249:使用ADV8003評估板將<b class='flag-5'>3D</b><b class='flag-5'>圖像</b>轉(zhuǎn)換成<b class='flag-5'>2D</b><b class='flag-5'>圖像</b>

    技術(shù)前沿:半導(dǎo)體先進(jìn)封裝從2D3D的關(guān)鍵

    技術(shù)前沿:半導(dǎo)體先進(jìn)封裝從2D3D的關(guān)鍵 半導(dǎo)體分類 集成電路封測技術(shù)水平及特點(diǎn)?? ? 1. 發(fā)展概述 ·自20世紀(jì)90年代以來,集成電路封裝
    的頭像 發(fā)表于 01-07 09:08 ?1682次閱讀
    <b class='flag-5'>技術(shù)</b>前沿:半導(dǎo)體先進(jìn)封裝從<b class='flag-5'>2D</b>到<b class='flag-5'>3D</b>的關(guān)鍵

    借助谷歌Gemini和Imagen模型生成高質(zhì)量圖像

    在快速發(fā)展的生成式 AI 領(lǐng)域,結(jié)合不同模型的優(yōu)勢可以帶來顯著的成果。通過利用谷歌的 Gemini 模型來制作詳細(xì)且富有創(chuàng)意的提示,然后使用 Imagen 3 模型根據(jù)這些提示生成高質(zhì)
    的頭像 發(fā)表于 01-03 10:38 ?897次閱讀
    借助<b class='flag-5'>谷歌</b>Gemini和Imagen模型<b class='flag-5'>生成</b>高質(zhì)量<b class='flag-5'>圖像</b>

    TechWiz LCD 3D應(yīng)用:局部液晶配向

    我們所說的局部摩擦是指給液晶盒中不同區(qū)域(可自定義區(qū)域)進(jìn)行不同的液晶配向,所以也可以稱之為局部掩膜、局部配向等。TechWiz LCD 2D和TechWiz LCD 3D都可以對液晶盒設(shè)置局部摩擦
    發(fā)表于 01-03 08:58

    使用NVIDIA Edify助力的服務(wù)創(chuàng)建3D資產(chǎn)和虛擬環(huán)境照明

    使用 NVIDIA Edify 助力的服務(wù)創(chuàng)建 3D 資產(chǎn)和虛擬環(huán)境照明,或是減半生成圖像時(shí)間。
    的頭像 發(fā)表于 08-02 15:22 ?1030次閱讀

    3D封裝熱設(shè)計(jì):挑戰(zhàn)與機(jī)遇并存

    隨著半導(dǎo)體技術(shù)的不斷發(fā)展,芯片封裝技術(shù)也在持續(xù)進(jìn)步。目前,2D封裝和3D封裝是兩種主流的封裝技術(shù)。這兩種封裝
    的頭像 發(fā)表于 07-25 09:46 ?2095次閱讀
    <b class='flag-5'>3D</b>封裝熱設(shè)計(jì):挑戰(zhàn)與機(jī)遇并存

    歡創(chuàng)播報(bào) 騰訊元寶首發(fā)3D生成應(yīng)用

    App。 騰訊元寶APP發(fā)布時(shí),就圍繞工作效率場景、日常生活等場景提供了豐富的應(yīng)用,并有創(chuàng)建個(gè)人智能體等個(gè)性化體驗(yàn),“3D角色夢工廠”則將大模型生成技術(shù)3D應(yīng)用結(jié)合,進(jìn)一步創(chuàng)新了元寶
    的頭像 發(fā)表于 07-18 11:39 ?1229次閱讀
    歡創(chuàng)播報(bào) 騰訊元寶首發(fā)<b class='flag-5'>3D</b><b class='flag-5'>生成</b>應(yīng)用