一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

2張圖2秒鐘完成3D建模!3D內(nèi)容生成工具DUSt3R爆火,國產(chǎn)廠商有哪些機會?

Felix分析 ? 來源:電子發(fā)燒友 ? 作者:吳子鵬 ? 2024-03-06 00:10 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

電子發(fā)燒友網(wǎng)報道(文/吳子鵬)近日,一款名為DUSt3R的AI新工具在GitHub上爆火。DUSt3R能夠在短短2秒鐘內(nèi)通過僅有2張圖片完成3D 重建,讓許多網(wǎng)友大呼驚奇,甚至認為這比之前熱門的Sora更加實用。


有考古從業(yè)者稱,在考古現(xiàn)場,構(gòu)建3D模型是非常必要且難度很大的工作,通過DUSt3R快速重建出土文物的3D形狀,是一個非常高效的方式。同時,DUSt3R在游戲和建筑等領(lǐng)域也有非常多的應(yīng)用場景。

目前,DUSt3R在GitHub上的熱度非常高,已經(jīng)排名在GitHub熱榜的第二名。根據(jù)網(wǎng)友實測,只需要拍攝兩張照片,DUSt3R就可以完成家庭廚房或者摩托車的3D建模,并且除了3D圖,還有深度圖、置信度圖和點云圖。

wKgZomXm79aAetP8AAfqVxwPFNo039.png

圖源:naverlabs.com

wKgZomXm7-WAbDDhAAizHJFCnOE951.png
圖源:naverlabs.com

DUSt3R突破3D建模技術(shù)屏障

實際上,早在一兩年前GPT剛剛興起的時候,就有人討論過通過AI模型工具來完成3D建模,不過當時的試驗結(jié)果表明,這是一項非常難的工作。

根據(jù)當時的討論,AIGC用于3D內(nèi)容生成,主要有三個方面的挑戰(zhàn)。其一是原始訓練素材庫需要比較高質(zhì)量的2D圖片,且需要的數(shù)量比較大,并輔助大量的計算資源來配合。不過,受限于當時的算法模型,最終出來的效果都不太好。

其二是算法模型本身,在GPT熱潮初期,文生文,以及文生圖,都是2D層面的探索,生成復(fù)雜的3D模型需要更加復(fù)雜的算法。有算法工程師指出,這是完全不一樣的算法模型,需要從底層重新梳理。

其三是質(zhì)量缺陷。基于當時的算法和算力設(shè)施,生成3D模型并非不能完成的任務(wù),不過完成的質(zhì)量是非常糟糕的,需要進行大量的后期處理和優(yōu)化,往往這個修復(fù)的工作量是超出傳統(tǒng)建模的工作量的。

隨后產(chǎn)業(yè)界也有很多嘗試,比如GET3D和3D-GAN等工具可以生成網(wǎng)格(Mesh)的3D模型,這些工具大部分在 ShapeNet等3D數(shù)據(jù)集上進行訓練,具有一定的質(zhì)量,不過基本是單體建模,且復(fù)雜度不高。目前,有很多3D工具是基于differentiable rasterizer基礎(chǔ)算法的。

在OpenAI的工具體系中,OpenAI Point·E其實也是一款3D生成工具,不過并不是原生的3D,而是從2D升維到3D,也就是先通過文字提示借助2D diffusion 模型生成2D圖像,然后用3D點云的diffusion模型對圖片進行升維。谷歌的DreamFusion和英偉達的Magic3D也是屬于這個類型。

當然,上述工具都有一個通病,那就是幾乎都需要半小時以上的時間才能夠完成復(fù)雜3D模型的建立,和DUSt3R之間有很大的差距。

據(jù)悉,DUSt3R帶來了一個3D模型生成的新范式,不需要任何相機校準或視點姿勢的先驗信息,就可完成任意圖像的密集或無約束3D重建。傳統(tǒng)的3D AI工具,通常需要MVS估計相機參數(shù),并在3D空間中對相應(yīng)的像素進行三角測量。不過,DUSt3R并不需要這些。如下圖所示,DUSt3R能夠基于一組具有未知相機姿態(tài)和內(nèi)在特征的照片,生成對應(yīng)的一組點圖,并給出相機參數(shù)、像素對應(yīng)關(guān)系、深度圖等重要參數(shù)。因此這款工具不僅降低了輸入數(shù)據(jù)的門檻,同時讓輸出數(shù)據(jù)質(zhì)量大幅提升,輸出數(shù)據(jù)需要的時間大幅縮短。

wKgZomXm8CSAa8PEAAH2D2uixMs083.png
圖源:naverlabs.com

DUSt3R論文作者表示,DUSt3R統(tǒng)一了單圖3D生成和雙圖3D生成的技術(shù)路徑,在提供兩個以上圖像的情況下,DUSt3R帶來了更加有效的全局對齊策略,該策略在一個共同的參考框架中展現(xiàn)出所有成對的點云圖。

綜合而言,DUSt3R具備以下幾個特點:支持多視圖立體重建,無需相機校準信息,支持更加有效的全局對齊策略,提供3D模型和深度信息,并可以恢復(fù)像素匹配和相機信息,無疑這是一款強大的3D AI工具。

更重要的是,DUSt3R基于標準的變壓器編碼器和解碼器就可以工作,讓用戶能夠更加容易地利用這個強大的3D AI工具。如果DUSt3R能夠順利落地,那么醫(yī)療、游戲、影視、建筑、產(chǎn)品設(shè)計和虛擬現(xiàn)實等領(lǐng)域?qū)⒋蟠笫芤妗?br />

國產(chǎn)公司在3D AI中的機會

DUSt3R強大的性能讓很多網(wǎng)友直呼:忘掉Sora吧,DUSt3R才是未來。實際上,這確實也是AI大模型一個迭代的方向。從ChatGPT代表的文生文,到DALL?E代表的文生圖,再到Sora代表的文生視頻,多模態(tài)大模型的發(fā)展方向就是不斷挖掘多模態(tài)大模型的潛力,生成更加復(fù)雜的信息。中泰證券在相關(guān)文章中直言,繼文本、代碼、圖片、視頻之后,下一個有可能實現(xiàn)突破的模態(tài)大概率是3D,“SORA之后的下一步:文生3D”。

那么,面對市場大趨勢,國內(nèi)公司該如何捕捉商機呢?匯總多份3D AI研報可以發(fā)現(xiàn),國內(nèi)目前在文生3D方面具有一定的技術(shù)儲備,也有一些代表公司。

比如掌趣科技,該公司是一家提供3D引擎的公司。2023年11月,掌趣科技與LAYABOX達成戰(zhàn)略合作協(xié)議。雙方將共同致力于打造一款具有創(chuàng)新意義的AI游戲引擎,為廣大游戲開發(fā)者提供更加智能、自動化的解決方案,推動游戲產(chǎn)業(yè)技術(shù)革新,共建高質(zhì)量的AIGC開發(fā)生態(tài)體系。而游戲是3D模型重要的應(yīng)用領(lǐng)域。

還有凡拓數(shù)創(chuàng)、絲路視覺、風語筑等3D內(nèi)容提供商,也有一定的技術(shù)儲備。以凡拓數(shù)創(chuàng)為例,該公司以“AI+3D”為方向,致力于展館數(shù)字化革新,結(jié)合數(shù)字技術(shù)與文化創(chuàng)意, 以總體設(shè)計、3D數(shù)字內(nèi)容制作、軟件開發(fā)、系統(tǒng)集成等數(shù)字展館一體化服務(wù),未來AIGC、AI算法、BI大數(shù)據(jù)、WEB3D等前沿技術(shù)是凡拓數(shù)創(chuàng)的技術(shù)方向,數(shù)字孿生、虛擬人、知識圖譜等產(chǎn)品則是產(chǎn)品方向。

另外,像恒信東方已經(jīng)開始嘗試將GPT、擴散模型應(yīng)用與2D概念設(shè)計和分鏡工作流、3D引擎和其他制作工具API融入3D內(nèi)容創(chuàng)作,也有文生3D方面的技術(shù)儲備。

除了上述有望直接參與文生3D落地的,國內(nèi)在CAX領(lǐng)域、BIM領(lǐng)域的相關(guān)公司也有望從潮流中受益,比如中望軟件、索辰科技、浩辰軟件等CAX工具服務(wù)商,可以給相關(guān)產(chǎn)品帶來專業(yè)的技術(shù)支持。

結(jié)語

DUSt3R驚艷的面世,讓我們進一步見識了多模態(tài)大模型的實力,繼文本、代碼、圖片、視頻之后,文生3D是重要的產(chǎn)業(yè)發(fā)展方向,賦能醫(yī)療、游戲、影視、建筑、產(chǎn)品設(shè)計和虛擬現(xiàn)實等領(lǐng)域發(fā)展。對于國內(nèi)公司而言,目前基本處于市場外圍,還需要進一步實現(xiàn)核心技術(shù)攻關(guān)。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 3D
    3D
    +關(guān)注

    關(guān)注

    9

    文章

    2959

    瀏覽量

    110789
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    TechWiz LCD 3D應(yīng)用:FFS仿真

    建模任務(wù) 堆棧結(jié)構(gòu) 建模過程 2.1使用TechWiz Layout繪制各層掩模版平面 2.2創(chuàng)建堆棧結(jié)構(gòu),并生成3D結(jié)構(gòu) 2.3 使用T
    的頭像 發(fā)表于 07-14 14:08 ?129次閱讀
    TechWiz LCD <b class='flag-5'>3D</b>應(yīng)用:FFS仿真

    TechWiz LCD 3D應(yīng)用:局部液晶配向

    ,本案例使用TechWiz LCD 3D進行局部摩擦的設(shè)置。 1. 建模任務(wù) 1.1進行局部摩擦配置 2. 建模過程 以下是建模過程中部分重
    發(fā)表于 06-16 08:46

    TechWiz LCD 3D應(yīng)用:微液晶分子摩擦排布

    ) 結(jié)構(gòu)創(chuàng)建完成后在TechWiz LCD 3D中加載并進行相關(guān)參數(shù)設(shè)置 2.2在TechWiz LCD 3D軟件中設(shè)置微擾方式為用戶自定義,并設(shè)置微擾角度 2.3其它設(shè)置 此例僅對比使用微擾方式
    發(fā)表于 06-10 08:44

    3D AD庫文件

    3D庫文件
    發(fā)表于 05-28 13:57 ?5次下載

    TechWiz LCD 3D應(yīng)用:撓曲電效用仿真

    完成后在TechWiz LCD 3D中加載并進行相關(guān)參數(shù)設(shè)置 2.2在TechWiz LCD 3D軟件中開啟應(yīng)用撓曲電效應(yīng)的功能 2.3其它設(shè)置 液晶設(shè)置 電壓條件設(shè)置 光學分析部分,添加偏振片 結(jié)果查看 3.1 V-T
    發(fā)表于 05-14 08:55

    NVIDIA助力影眸科技3D生成工具Rodin升級

    AI、計算機視覺技術(shù)在大眾娛樂市場的推廣應(yīng)用,其 3D 生成工具 Rodin(Hyper3d.ai)去年 6 月發(fā)布后迅速突破了百萬用戶量級,背后技術(shù)論文 CLAY 還提名了 SIG
    的頭像 發(fā)表于 04-27 15:09 ?535次閱讀

    TechWiz LCD 3D應(yīng)用:微液晶分子摩擦排布

    ) 結(jié)構(gòu)創(chuàng)建完成后在TechWiz LCD 3D中加載并進行相關(guān)參數(shù)設(shè)置 2.2在TechWiz LCD 3D軟件中設(shè)置微擾方式為用戶自定義,并設(shè)置微擾角度 2.3其它設(shè)置 此例僅對比使用微擾方式
    發(fā)表于 04-01 08:59

    TechWiz LCD 3D應(yīng)用:局部液晶配向

    發(fā)表于 02-08 08:52

    SciChart 3D for WPF圖表庫

    DirectX 支持的 WPF 3D 圖表和廣泛的 API 完成工作。 WPF 3D 圖表性能 我們傳奇的 WPF 3D 圖表性能由廣泛的端到端性能優(yōu)化、不安全代碼、C++ 互操作、
    的頭像 發(fā)表于 01-23 13:49 ?628次閱讀
    SciChart <b class='flag-5'>3D</b> for WPF圖表庫

    騰訊混元3D AI創(chuàng)作引擎正式發(fā)布

    的AI技術(shù),能夠根據(jù)用戶提供的提示詞或圖片,直接生成高質(zhì)量的3D模型。這一功能極大地降低了3D內(nèi)容創(chuàng)作的門檻,使得即使是缺乏專業(yè)3D
    的頭像 發(fā)表于 01-23 10:33 ?598次閱讀

    騰訊混元3D AI創(chuàng)作引擎正式上線

    近日,騰訊公司宣布其自主研發(fā)的混元3D AI創(chuàng)作引擎已正式上線。這一創(chuàng)新性的創(chuàng)作工具,標志著騰訊在3D內(nèi)容生成領(lǐng)域邁出了重要一步。 混元
    的頭像 發(fā)表于 01-22 10:26 ?593次閱讀

    TechWiz LCD 3D應(yīng)用:局部液晶配向

    ,本案例使用TechWiz LCD 3D進行局部摩擦的設(shè)置。 1. 建模任務(wù) 1.1進行局部摩擦配置 2. 建模過程 以下是建模過程中部分重
    發(fā)表于 01-03 08:58

    TechWiz LCD 3D應(yīng)用:撓曲電效用仿真

    完成后在TechWiz LCD 3D中加載并進行相關(guān)參數(shù)設(shè)置 2.2在TechWiz LCD 3D軟件中開啟應(yīng)用撓曲電效應(yīng)的功能 2.3其它設(shè)置 液晶設(shè)置 電壓條件設(shè)置 光學分析部分,添加偏振片 結(jié)果查看 3.1 V-T
    發(fā)表于 12-10 13:43

    透明塑料件噴粉3D掃描CAV全尺寸檢測逆向3D建模設(shè)計服務(wù)-CASAIM

    3D建模
    中科院廣州電子
    發(fā)布于 :2024年08月30日 10:04:53

    安寶特產(chǎn)品 安寶特3D Analyzer:智能的3D CAD高級分析工具

    安寶特3D Analyzer包含多種實用的3D CAD高級分析工具,包括自動比對模型、碰撞檢測、間隙檢查、壁厚檢查,以及拔模和底切分析,能夠有效提升3D CAD模型檢測分析的效率,讓模
    的頭像 發(fā)表于 08-07 10:13 ?785次閱讀
    安寶特產(chǎn)品  安寶特<b class='flag-5'>3D</b> Analyzer:智能的<b class='flag-5'>3D</b> CAD高級分析<b class='flag-5'>工具</b>