一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

NVIDIA提出Magic3D:高分辨率文本到3D內(nèi)容創(chuàng)建

CVer ? 來源:機器之心 ? 作者:機器之心 ? 2022-11-25 11:33 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

英偉達進入 AI 生成模型領(lǐng)域的研究,直接比別人多一個次元:一句描述生成 3D 模型。

我們生活在三維的世界里,盡管目前大多數(shù)應(yīng)用程序是 2D 的,但人們一直對 3D 數(shù)字內(nèi)容有很高的需求,包括游戲、娛樂、建筑和機器人模擬等應(yīng)用。

然而,創(chuàng)建專業(yè)的 3D 內(nèi)容需要很高的藝術(shù)與審美素養(yǎng)和大量 3D 建模專業(yè)知識。人工完成這項工作需要花費大量時間和精力來培養(yǎng)這些技能。

需求大又是「勞動密集型行業(yè)」,那么有沒有可能交給 AI 來做?上周五,英偉達提交到預(yù)印版論文平臺 arXiv 的論文引起了人們的關(guān)注。

和現(xiàn)在流行的 NovelAI 差不多,人們只需要輸入一段文字比如「一只坐在睡蓮上的藍色箭毒蛙」,AI 就能給你生成個紋理造型俱全的 3D 模型出來。

d643de04-6c11-11ed-8abf-dac502259ad0.gif

Magic3D 還可以執(zhí)行基于提示的 3D 網(wǎng)格編輯:給定低分辨率 3D 模型和基本提示,可以更改文本從而修改生成的模型內(nèi)容。此外,作者還展示了保持畫風,以及將 2D 圖像樣式應(yīng)用于 3D 模型的能力。

d6bb92e6-6c11-11ed-8abf-dac502259ad0.gif

Stable Diffusion 的論文在 2022 年 8 月才首次提交,幾個月就已經(jīng)進化到這樣的程度,不禁讓人感嘆科技發(fā)展的速度。

英偉達表示,你只需要在這個基礎(chǔ)上稍作修改,生成的模型就可以當做游戲或 CGI 藝術(shù)場景的素材了。

3D 生成模型的方向并不神秘,其實在 9 月 29 日,谷歌曾經(jīng)發(fā)布過一款文本到 3D 的生成模型 DreamFusion,英偉達在 Magic3D 的研究中直接對標該方法。

d7690e3a-6c11-11ed-8abf-dac502259ad0.gif

類似于 DreamFusion 用文本生成 2D 圖像,再將其優(yōu)化為體積 NeRF(神經(jīng)輻射場)數(shù)據(jù)的流程,Magic3D 使用兩階段生成法,用低分辨率生成的粗略模型再優(yōu)化到更高的分辨率。

英偉達的方法首先使用低分辨率擴散先驗獲得粗糙模型,并使用稀疏 3D 哈希網(wǎng)格結(jié)構(gòu)進行加速。用粗略表示作為初始,再進一步優(yōu)化了帶紋理的 3D 網(wǎng)格模型,該模型具有與高分辨率潛在擴散模型交互的高效可微分渲染器。

Magic3D 可以在 40 分鐘內(nèi)創(chuàng)建高質(zhì)量的 3D 網(wǎng)格模型,比 DreamFusion 快 2 倍(后者平均需要 1.5 小時),同時還實現(xiàn)了更高的分辨率。統(tǒng)計表明相比 DreamFusion,61.7% 的人更喜歡英偉達的新方法。

連同圖像調(diào)節(jié)生成功能,新技術(shù)為各種創(chuàng)意應(yīng)用開辟了新途徑。

d7cec5cc-6c11-11ed-8abf-dac502259ad0.png

論文鏈接:https://arxiv.org/abs/2211.10440

技術(shù)細節(jié)

Magic3D 可以在較短的計算時間內(nèi)根據(jù)文本 prompt 合成高度詳細的 3D 模型。Magic3D 通過改進 DreamFusion 中的幾個主要設(shè)計選擇來使用文本 prompt 合成高質(zhì)量的 3D 內(nèi)容。

具體來說,Magic3D 是一種從粗到精的優(yōu)化方法,其中使用不同分辨率下的多個擴散先驗來優(yōu)化 3D 表征,從而生成視圖一致的幾何形狀以及高分辨率細節(jié)。Magic3D 使用監(jiān)督方法合成 8 倍高分辨率的 3D 內(nèi)容,速度也比 DreamFusion 快 2 倍。

Magic3D 的整個工作流程分為兩個階段:在第一階段,該研究優(yōu)化了類似于 DreamFusion 的粗略神經(jīng)場表征,以實現(xiàn)具有基于哈希網(wǎng)格(hash grid)的內(nèi)存和計算的高效場景表征。

在第二階段該方法切換到優(yōu)化網(wǎng)格表征。這個步驟很關(guān)鍵,它允許該方法在高達 512 × 512 的分辨率下利用擴散先驗。由于 3D 網(wǎng)格適用于快速圖形渲染,可以實時渲染高分辨率圖像,因此該研究利用基于光柵化的高效微分渲染器和相機特寫來恢復(fù)幾何紋理中的高頻細節(jié)。

d803fd1e-6c11-11ed-8abf-dac502259ad0.png

基于上述兩個階段,該方法可以生成高保真的 3D 內(nèi)容,并且很容易在標準圖形軟件中導入和可視化。

此外,該研究展示了用文本 prompt 對 3D 合成過程的創(chuàng)造性控制能力,如下圖 1 所示。

d84e0954-6c11-11ed-8abf-dac502259ad0.png

為了對比實際應(yīng)用效果,英偉達的研究人員把 Magic3D 和 DreamFusion 在 397 個文本提示生成的內(nèi)容上進行了比較。平均的粗略模型生成階段花費 15 分鐘,精細階段訓練了 25 分鐘,所有運行時間均在 8 塊英偉達 A100 GPU 上測得。

d898c886-6c11-11ed-8abf-dac502259ad0.png

d8d9953c-6c11-11ed-8abf-dac502259ad0.png

雖然論文和 demo 只是第一步,但英偉達已經(jīng)為 Magic3D 想好了未來的應(yīng)用方向:給游戲和元宇宙世界提供制作海量 3D 模型的工具,而且讓所有人都可以上手使用。

當然,最早上線這項功能的可能會是英偉達自己的 Omniverse。

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 3D
    3D
    +關(guān)注

    關(guān)注

    9

    文章

    2959

    瀏覽量

    110709
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5304

    瀏覽量

    106325
  • AI
    AI
    +關(guān)注

    關(guān)注

    88

    文章

    35065

    瀏覽量

    279343

原文標題:一句話生成3D模型!NVIDIA提出Magic3D:高分辨率文本到3D內(nèi)容創(chuàng)建

文章出處:【微信號:CVer,微信公眾號:CVer】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    ADI 100 萬像素高分辨率ToF傳感器ADTF3175的三大核心優(yōu)勢與應(yīng)用解析

    高分辨率 3D 景深測量和視覺系統(tǒng)。該模塊具備 100 萬像素的高分辨率特性,可直接集成各種設(shè)備中。使用高性能、多功能 ToF 傳感器模塊可提高應(yīng)用的性能。ADTF3175 ToF
    的頭像 發(fā)表于 06-13 11:47 ?696次閱讀
    ADI 100 萬像素<b class='flag-5'>高分辨率</b>ToF傳感器ADTF3175的三大核心優(yōu)勢與應(yīng)用解析

    LT8722如何實現(xiàn)高分辨率的脈沖?

    resolution should be 333/2^(24)=0.00002 ns. 如何實現(xiàn)如此高分辨率的脈沖? PWM 是否由模擬比較器產(chǎn)生?芯片中是否有真正的 DAC 來產(chǎn)生比較器電壓? What
    發(fā)表于 04-28 06:08

    高分辨率示波器的功能與作用:以麥科信MHO6為例

    一、高分辨率示波器的定義與重要性 高分辨率示波器是一種能夠以高精度捕捉和分析信號的電子測量儀器,它通過增加垂直分辨率(通常為12bit或更高)和采樣,能夠更清晰地顯示信號的細節(jié),從而
    發(fā)表于 02-28 17:39

    GD32G5x3系列高分辨率定時器使用指南

    電子發(fā)燒友網(wǎng)站提供《GD32G5x3系列高分辨率定時器使用指南.pdf》資料免費下載
    發(fā)表于 01-22 17:32 ?0次下載
    GD32G5x<b class='flag-5'>3</b>系列<b class='flag-5'>高分辨率</b>定時器使用指南

    光場新科技——12.1英寸2.5K分辨率裸眼3D平板電腦

    在科技日新月異的今天,我們總是期待著那些能夠改變生活方式的新產(chǎn)品。而今天,我們非常榮幸地向大家介紹一款顛覆傳統(tǒng)視覺體驗的創(chuàng)新產(chǎn)品——12.1英寸裸眼3D平板電腦。這款平板電腦不僅擁有2.5K高清分辨率
    的頭像 發(fā)表于 01-14 10:08 ?712次閱讀
    光場新科技——12.1英寸2.5K<b class='flag-5'>分辨率</b>裸眼<b class='flag-5'>3D</b>平板電腦

    24位或者說高分辨率的AD到底有什么用呢?

    的AD,如24位的AD,其分辨率達到很低的uV級別,我們?nèi)绾慰季科渚??而且AD的精度受到諸多因素的影響,其中參考源的穩(wěn)定度和供電電源的穩(wěn)定度對精度影響很大,參考源最低0.05%的精度,那么24位的分辨率所可以達到的精度卻是要大打折扣的,請問在這樣的情況下,24位或者說
    發(fā)表于 01-07 06:49

    使用DM642 DSP和THS8200驅(qū)動器的高分辨率視頻

    電子發(fā)燒友網(wǎng)站提供《使用DM642 DSP和THS8200驅(qū)動器的高分辨率視頻.pdf》資料免費下載
    發(fā)表于 10-17 11:43 ?0次下載
    使用DM642 DSP和THS8200驅(qū)動器的<b class='flag-5'>高分辨率</b>視頻

    高分辨率風速計

    電子發(fā)燒友網(wǎng)站提供《高分辨率風速計.pdf》資料免費下載
    發(fā)表于 09-24 11:30 ?0次下載
    <b class='flag-5'>高分辨率</b>風速計

    利用高分辨率捕獲(HRCAP)進行單線數(shù)據(jù)傳輸

    電子發(fā)燒友網(wǎng)站提供《利用高分辨率捕獲(HRCAP)進行單線數(shù)據(jù)傳輸.pdf》資料免費下載
    發(fā)表于 09-14 09:56 ?0次下載
    利用<b class='flag-5'>高分辨率</b>捕獲(HRCAP)進行單線數(shù)據(jù)傳輸

    高分辨率音頻和傳統(tǒng)音頻區(qū)別

    高分辨率音頻通過更高的采樣和比特深度,提供了更高的音質(zhì)和更豐富的聽覺體驗,而傳統(tǒng)音頻則可能在音質(zhì)和細節(jié)上有所妥協(xié)。
    的頭像 發(fā)表于 09-04 16:20 ?1634次閱讀
    <b class='flag-5'>高分辨率</b>音頻和傳統(tǒng)音頻區(qū)別

    鼎陽科技|高分辨率產(chǎn)品增長39.42%,引領(lǐng)高端市場新浪潮!

    20%以上,高端化進程再加速;高分辨率數(shù)字示波器產(chǎn)品境內(nèi)收入同比增長39.42%,競爭優(yōu)勢明顯。 ? 一、高分辨率示波器增長39.42%,核心產(chǎn)品優(yōu)勢突出 當前,示波器高分辨率化已成趨勢。報告期內(nèi),鼎陽科技共發(fā)布了4款新產(chǎn)品,其
    發(fā)表于 08-30 16:46 ?580次閱讀
    鼎陽科技|<b class='flag-5'>高分辨率</b>產(chǎn)品增長39.42%,引領(lǐng)高端市場新浪潮!

    什么是高分辨率示波器?它有哪些優(yōu)勢?

    高分辨率示波器是一種在信息與系統(tǒng)科學相關(guān)工程與技術(shù)領(lǐng)域中廣泛應(yīng)用的科學儀器,其設(shè)計旨在提供更高的信號分辨率和更精細的信號分析能力。以下是對高分辨率示波器的詳細解析,包括其定義、優(yōu)勢以及可能涉及的多個方面。
    的頭像 發(fā)表于 08-08 11:49 ?1824次閱讀

    使用NVIDIA Edify助力的服務(wù)創(chuàng)建3D資產(chǎn)和虛擬環(huán)境照明

    使用 NVIDIA Edify 助力的服務(wù)創(chuàng)建 3D 資產(chǎn)和虛擬環(huán)境照明,或是減半生成圖像時間。
    的頭像 發(fā)表于 08-02 15:22 ?1023次閱讀

    Moritex 5X 高分辨率遠心鏡頭 助力晶圓檢測

    5X高分辨率遠心鏡頭工業(yè)鏡頭相當于機器視覺系統(tǒng)中的眼睛,它能將目標成像在圖像傳感器的光敏面上,對視覺圖像成像發(fā)揮著重要作用。今天我們來看看Moritex的5X高分辨率遠心鏡頭
    的頭像 發(fā)表于 07-27 10:00 ?666次閱讀
    Moritex 5X <b class='flag-5'>高分辨率</b>遠心鏡頭 助力晶圓檢測

    ADS1283高分辨率模數(shù)轉(zhuǎn)換器數(shù)據(jù)表

    電子發(fā)燒友網(wǎng)站提供《ADS1283高分辨率模數(shù)轉(zhuǎn)換器數(shù)據(jù)表.pdf》資料免費下載
    發(fā)表于 07-16 10:38 ?0次下載
    ADS1283<b class='flag-5'>高分辨率</b>模數(shù)轉(zhuǎn)換器數(shù)據(jù)表