一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

香港大學(xué)最新提出!實(shí)現(xiàn)超現(xiàn)實(shí)的人類圖像生成:HyperHuman

3D視覺工坊 ? 來源:3DCV ? 2023-11-27 16:03 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

1、導(dǎo)讀

盡管大規(guī)模文本到圖像模型取得了重大進(jìn)展,但實(shí)現(xiàn)超現(xiàn)實(shí)的人類圖像生成仍然是一項(xiàng)理想但尚未解決的任務(wù)?,F(xiàn)有模型(例如穩(wěn)定擴(kuò)散和DALL·E2)往往會(huì)生成部分不連貫或姿勢不自然的人體圖像。為了應(yīng)對這些挑戰(zhàn),我們的主要見解是,人類圖像本質(zhì)上具有多個(gè)粒度的結(jié)構(gòu),從粗粒度的身體骨骼到細(xì)粒度的空間幾何。因此,在一個(gè)模型中捕獲顯式外觀和潛在結(jié)構(gòu)之間的這種相關(guān)性對于生成連貫且自然的人類圖像至關(guān)重要。為此,我們提出了一個(gè)統(tǒng)一的框架HyperHuman,它可以生成高度真實(shí)和多樣化布局的野外人類圖像。具體來說:

我們首先構(gòu)建一個(gè)以人類為中心的大規(guī)模數(shù)據(jù)集,名為HumanVerse,它由3.4億張圖像組成,具有人體姿勢、深度和表面法線等全面注釋。

接下來,我們提出了一種潛在結(jié)構(gòu)擴(kuò)散模型,該模型可以同時(shí)對深度和表面法線以及合成的 RGB 圖像進(jìn)行去噪。我們的模型在統(tǒng)一網(wǎng)絡(luò)中強(qiáng)制執(zhí)行圖像外觀、空間關(guān)系和幾何形狀的聯(lián)合學(xué)習(xí),其中模型中的每個(gè)分支在結(jié)構(gòu)意識和紋理豐富性方面相互補(bǔ)充。

最后,為了進(jìn)一步提高視覺質(zhì)量,我們提出了一種結(jié)構(gòu)引導(dǎo)細(xì)化器來組合預(yù)測條件,以更詳細(xì)地生成更高分辨率。大量的實(shí)驗(yàn)表明,我們的框架具有最先進(jìn)的性能,可以在不同的場景下生成超逼真的人類圖像。

2、介紹

8792ce62-8cce-11ee-939d-92fbcf53809c.png

所提出的HyperHuman同時(shí)生成以文本和骨架為條件的粗略 RGB、深度、法線和高分辨率圖像??梢詣?chuàng)建逼真的圖像和風(fēng)格化的渲染。

87a5bbda-8cce-11ee-939d-92fbcf53809c.png

我們與最近的T2I模型進(jìn)行比較,顯示出更好的真實(shí)性、質(zhì)量、多樣性和可控性。請注意,在每個(gè)2x2網(wǎng)格(左)中,左上角是輸入骨架,而其他部分是聯(lián)合去噪的法線、深度和512x512的粗略 RGB。對于完整模型,我們合成的圖像高達(dá) 1024x1024(右)

3、方法

87b31f6e-8cce-11ee-939d-92fbcf53809c.png

在潛在結(jié)構(gòu)擴(kuò)散模型(紫色)中,圖像x、深度d和表面法線n對標(biāo)題c和姿勢骨架p進(jìn)行聯(lián)合去噪調(diào)節(jié)。在結(jié)構(gòu)引導(dǎo)精煉器(藍(lán)色)中,我們構(gòu)建了更高分辨率生成的預(yù)測條件。請注意,灰色圖像是指隨機(jī)丟棄條件,以實(shí)現(xiàn)更穩(wěn)健的訓(xùn)練。

4、實(shí)驗(yàn)

MS-COCO 2014 驗(yàn)證人類的零樣本評估

87c22f7c-8cce-11ee-939d-92fbcf53809c.png

我們將我們的模型與最近的 SOTA 通用 T2I 模型(Stable Diffusion v1.5、v2.0、v2.1;SDXL;DeepFloyd-IF)和可控方法(ControlNet;T2I-Adapter;HumanSD)進(jìn)行比較。請注意,SDXL 生成 512x512 的藝術(shù)風(fēng)格,而 IF 僅創(chuàng)建固定大小的圖像,我們首先生成 1024x1024 結(jié)果,然后針對這兩種方法將大小調(diào)整回 512x512。

MS-COCO 2014 驗(yàn)證人類子集的評估曲線

87c6311c-8cce-11ee-939d-92fbcf53809c.png

我們展示了所有方法的FID-CLIP(左)和FID CLIP -CLIP(右曲線,CFG比例范圍為4.0至20.0。

用戶偏好比較

87e9f944-8cce-11ee-939d-92fbcf53809c.png

我們報(bào)告了用戶更喜歡我們的模型而不是基線的比率

5、結(jié)論

我們提出了一種新穎的框架HyperHuman來生成高質(zhì)量的野外人體圖像。為了在統(tǒng)一網(wǎng)絡(luò)中加強(qiáng)圖像外觀、空間關(guān)系和幾何形狀的聯(lián)合學(xué)習(xí),我們提出了潛在結(jié)構(gòu)擴(kuò)散模型,該模型可同時(shí)對深度和法線以及RGB進(jìn)行去噪。然后我們設(shè)計(jì)了結(jié)構(gòu)引導(dǎo)優(yōu)化器來構(gòu)建詳細(xì)生成的預(yù)測條件。大量的實(shí)驗(yàn)證明我們的框架具有卓越的性能,可以在不同的場景下生成逼真的人類。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 框架
    +關(guān)注

    關(guān)注

    0

    文章

    404

    瀏覽量

    17904
  • 數(shù)據(jù)集
    +關(guān)注

    關(guān)注

    4

    文章

    1224

    瀏覽量

    25463
  • 圖像生成
    +關(guān)注

    關(guān)注

    0

    文章

    25

    瀏覽量

    7040

原文標(biāo)題:香港大學(xué)最新提出!實(shí)現(xiàn)超現(xiàn)實(shí)的人類圖像生成:HyperHuman

文章出處:【微信號:3D視覺工坊,微信公眾號:3D視覺工坊】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    香港大學(xué)首創(chuàng)光熱電統(tǒng)一理論可解決LED燈泡發(fā)光不均與壽命問題

    目前LED照明市場急速擴(kuò)增,預(yù)估在2018年可達(dá)到312億美元,隨著這股商機(jī),更多的LED技術(shù)應(yīng)運(yùn)而生,香港大學(xué)首創(chuàng)“光熱電統(tǒng)一”理論并研發(fā)新型LED驅(qū)動(dòng)器與變壓器,聲稱可以解決LED燈泡因長久使用而發(fā)光不均的問題,且LED燈泡的壽命也可延長到10年。
    的頭像 發(fā)表于 12-27 10:40 ?5880次閱讀

    香港大學(xué)借助基因工程造出世界首個(gè)人造心臟

    近日,一則世界首個(gè)人造心臟引發(fā)關(guān)注消息給人類帶來福音,據(jù)報(bào)道稱,世界首個(gè)人造心臟是由香港大學(xué)李登偉教授花費(fèi)20年時(shí)間研發(fā)出來的。 香港大學(xué)研究人員使用干細(xì)胞,借助基因工程等技術(shù),只需要幾升血液,就能
    發(fā)表于 02-28 04:20 ?766次閱讀

    一場探索人類與太陽關(guān)系的VR舞蹈體驗(yàn)

    作為一款被稱為“Celestial Moon(天體月亮)”的VR舞蹈體驗(yàn),它結(jié)合了真人視頻和計(jì)算機(jī)生成圖像。它的特點(diǎn)是幾個(gè)舞蹈演員,在一個(gè)探索人類與太陽關(guān)系的常規(guī)中表演于超現(xiàn)實(shí)的宇宙
    發(fā)表于 04-19 10:16 ?1842次閱讀

    清華大學(xué)將與香港大學(xué)合作進(jìn)行AI研究

    為了實(shí)現(xiàn)這一目標(biāo),趙汝恒教授說,香港大學(xué)和清華大學(xué)一直計(jì)劃推出他們的第一個(gè)計(jì)算機(jī)科學(xué)雙學(xué)士學(xué)位(dual undergraduate degree),最早將在2020年實(shí)施,該專業(yè)的學(xué)生將在
    的頭像 發(fā)表于 12-03 09:55 ?4254次閱讀

    香港大學(xué)發(fā)布新冠肺炎AI成果,準(zhǔn)確率高達(dá)88%

    近日,香港大學(xué)統(tǒng)計(jì)與精算學(xué)系系主任尹國圣教授聯(lián)合其他多位學(xué)者發(fā)表一篇最新論文,介紹了一個(gè)最新的新冠肺炎在線診斷系統(tǒng)。
    的頭像 發(fā)表于 05-22 22:05 ?3936次閱讀

    人體圖像合成制作可信和逼真的人類圖像

    技術(shù)和算法的開發(fā)和精進(jìn)讓AI換臉、AI克隆都成了可實(shí)現(xiàn)的事情。近日,上??萍?b class='flag-5'>大學(xué)團(tuán)隊(duì)的一項(xiàng)新研究,再一擴(kuò)展了這一領(lǐng)域,其開發(fā)建立了人體圖像合成——人體圖像合成的目的是制作可信和逼真
    的頭像 發(fā)表于 12-14 11:17 ?3691次閱讀

    香港大學(xué)實(shí)現(xiàn)機(jī)器人觸覺傳感器的自解耦和超分辨率

    生物醫(yī)學(xué)工程系申亞京教授課題組、香港大學(xué)計(jì)算機(jī)系潘佳教授課題組及其合作者,共同提出了一種基于磁性薄膜、類人類皮膚功能的觸覺傳感器,結(jié)合深度學(xué)習(xí)算法,實(shí)現(xiàn)了機(jī)器人觸覺傳感器的自解耦和超分
    的頭像 發(fā)表于 03-03 17:49 ?3019次閱讀

    香港大學(xué)機(jī)器魚創(chuàng)下吉尼斯世界紀(jì)錄

    Saad Shahid Anwel,下稱薩德)告訴 DeepTech。 SNAPP 由香港大學(xué)機(jī)械工程系研發(fā),目前還保持著一項(xiàng)于 2020 年創(chuàng)下的吉尼斯世界紀(jì)錄:游完 50m 的水下路線只需耗時(shí)
    的頭像 發(fā)表于 05-07 10:10 ?2094次閱讀
    <b class='flag-5'>香港大學(xué)</b>機(jī)器魚創(chuàng)下吉尼斯世界紀(jì)錄

    基于殘差生成對抗網(wǎng)絡(luò)的人圖像復(fù)原方法

    使用人臉輪廓直接生成人臉圖像。然而,使用這些技術(shù)復(fù)原后的人圖像在定性和定量分析時(shí)效果不夠理想,并且復(fù)原時(shí)存在諸多的條件限制。因此,文中提出
    發(fā)表于 06-16 16:04 ?9次下載

    中科院&香港大學(xué):使用新方法進(jìn)行多任務(wù)學(xué)習(xí)的可穿戴傳感器內(nèi)儲層計(jì)算

    。此外,訓(xùn)練傳統(tǒng)的深度學(xué)習(xí)模型在邊緣設(shè)備上既不可擴(kuò)展也不可負(fù)擔(dān)。 在這里,中科院和香港大學(xué)的研究團(tuán)隊(duì)提出了一種材料算法協(xié)同設(shè)計(jì)來模擬人類視網(wǎng)膜的學(xué)習(xí)范例,并且低開銷。基于具有有效激子解離和貫穿空間電荷傳輸特性的瓶
    的頭像 發(fā)表于 02-09 01:21 ?944次閱讀

    上海人工智能實(shí)驗(yàn)室發(fā)布自動(dòng)駕駛視頻生成模型GenAD

    上海人工智能實(shí)驗(yàn)室近日取得重大技術(shù)突破,聯(lián)合香港科技大學(xué)、德國圖賓根大學(xué)香港大學(xué)共同研發(fā)并發(fā)布了大規(guī)模自動(dòng)駕駛視頻生成模型——GenAD。
    的頭像 發(fā)表于 03-26 10:40 ?880次閱讀

    香港大帶寬服務(wù)器連接失敗怎么辦?

    香港大帶寬服務(wù)器連接失敗是一個(gè)多方面的問題,它可能涉及到網(wǎng)絡(luò)問題、服務(wù)器故障、配置錯(cuò)誤等多種因素。在全球化的互聯(lián)網(wǎng)環(huán)境中,海外大帶寬服務(wù)器成為企業(yè)和個(gè)人數(shù)據(jù)傳輸和業(yè)務(wù)需求的重要工具。然而,當(dāng)遇到連接
    的頭像 發(fā)表于 09-04 10:11 ?425次閱讀

    華為攜手香港大學(xué)建設(shè)新一代智慧校園

    華為攜手香港大學(xué)(以下簡稱“港大”)舉辦“全球智慧校園網(wǎng)絡(luò)創(chuàng)新中心發(fā)布儀式”,標(biāo)志著雙方在校園智慧網(wǎng)絡(luò)聯(lián)接及基礎(chǔ)設(shè)施建設(shè)方面合作建立新的里程碑,雙方將致力于打造全球智慧校園網(wǎng)絡(luò)創(chuàng)新示范項(xiàng)目,助力港大校園數(shù)字化、智慧化轉(zhuǎn)型升級,為全球更多院校提供優(yōu)秀借鑒和經(jīng)驗(yàn)。
    的頭像 發(fā)表于 12-13 15:24 ?670次閱讀

    華為與香港大學(xué)共建智慧校園,推動(dòng)教育數(shù)字化轉(zhuǎn)型

    近日,華為攜手香港大學(xué)共同舉辦了“全球智慧校園網(wǎng)絡(luò)創(chuàng)新中心發(fā)布儀式”,標(biāo)志著雙方在校園智慧網(wǎng)絡(luò)聯(lián)接及基礎(chǔ)設(shè)施建設(shè)方面邁出了重要一步,合作開啟了新的里程碑。 此次合作,雙方將致力于共同打造全球智慧
    的頭像 發(fā)表于 12-24 11:10 ?643次閱讀

    利用NVIDIA 3D引導(dǎo)生成式AI Blueprint控制圖像生成

    AI 賦能的圖像生成技術(shù)突飛猛進(jìn),從早期模型會(huì)生成手指過多的人類圖像,到現(xiàn)在能創(chuàng)造出令人驚嘆的逼真視覺效果。即使取得了如此飛躍,仍然存在一個(gè)
    的頭像 發(fā)表于 06-05 09:24 ?394次閱讀