一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

JD和OPPO的研究人員們提出了一種姿勢引導的時尚圖像生成模型

nlfO_thejiangme ? 來源:lq ? 2019-08-02 14:50 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

時尚總在引領潮流。

人工智能、增強現(xiàn)實、可穿戴、虛擬試妝等技術的加持下,時尚行業(yè)特別是在線時尚行業(yè)獲得了飛速的發(fā)展。為了吸引客戶更多的目光、更棒的視覺體驗、更好地展現(xiàn)商品,高清大圖、模特多角度擺拍已經成了服裝、箱包、鞋類、美妝等線上商家的宣傳標配。在網上購物時,大家都想看看模特衣服在各種角度姿勢下的樣子,但是越多越全面的姿勢擺拍也就意味著越大的投入。為了降低宣傳成本,很多研究開始聚焦于如何合成高質量的逼真圖像。

在這篇文章中來自北卡羅來納大學、JD和OPPO的研究人員們提出了一種姿勢引導的時尚圖像生成模型,可以基于模特當前姿勢,生成出其他各種不同姿勢下的相同著裝的新圖像!也許在這樣技術的幫助下,模特再也不用辛苦一分鐘拍二十個動作了~

生成新姿勢下的時尚圖像

研究人員的主要目的在于訓練一個生成模型,將模特在當前姿勢上的圖像遷移到其他的目標姿勢上去,實現(xiàn)對于衣著等商品的全面展示。

這一模型主要由生成器和判別器構成,與先前工作不同的是這一模型架構中包含了兩個不同的判別器!其中生成器由兩個編碼器構成,分別用于從圖像和對應的動作關鍵點特征圖進行編碼,而解碼器則用于從動作和衣著的特征中合成目標圖像。對于判別器來說,除了判定生成圖像是否逼真外、還需要判定動作與生成圖像的連續(xù)性以保證生成圖像動作的連續(xù)性和魯棒性。

模型的主要架構,生成器的編碼器包含了對于圖像的編碼器Ei和對動作的編碼器Ep,基于U-Net和bi-LSTM共同構建而成,而兩個判別器分別用于判定圖像的真?zhèn)尾⒈WC生成圖像與動作間的連續(xù)性。

時尚圖像生成器

生成器中主要包含了兩個編碼器和一個解碼器用于處理圖像和對應姿勢,生成器探索了輸入圖像的視覺語義特征和位姿信息,并生成對應姿勢下的新圖像。圖像編碼器:圖像編碼器的目標是從單張或多張圖像中湖區(qū)語義編碼信息。研究人員首先使用了ResNet作為主干網絡抽取不同尺度的特征,包括紋理、顏色、邊緣線條信息等。隨后將這些特征輸入到雙邊長短時記憶網絡(bc-LSTM)中用于從相同衣著不同視角的模特圖像中抽取共同的特征,將不同種類的圖像特征進行轉換,同時對不同特征下的背景和噪聲進行處理。最終得到了可以表達圖像視覺語義信息的編碼Ci,用于后續(xù)圖像的生成。位姿編碼器:模型同時需要位姿數(shù)據(jù)來為生成圖像進行引導,研究人員利用了18個關鍵點來表示人體位姿,用不同顏色的直線相連并以RGB的格式進行表示。通過U-Net的架構和3*3的卷積從位姿圖中抽取高層次語義特征Cp并在解碼過程中通過跳接層連接進行特征共享。解碼器:其主要目的是通過圖像編碼Ci 和動作編碼Cp重建出逼真的圖像。首先將圖像編碼與位姿編碼的編碼拼接在一起,并基于U-Net架構和跳接層將視覺語義信息與動作編碼信息匹配起來,進行有效的圖像生成。判別器:其主要目標是引導模型生成比先前模型更逼真圖像。在訓練過程中研究人員利用兩個判別器來同時進行對抗訓練,主要采用了與PatchGAN類似的實現(xiàn)。其中Di用于判別生成圖像是否逼真,與先前的模型類似;而Dp則用于判定生成圖像與對應動作的連續(xù)性。Dp的輸出是真實圖像與對應位姿和這一位姿下生成的圖像,用于判定圖像是否與位姿匹配,它對于生成與位姿對應的時尚圖像具有重要的作用,能幫助網絡生成更為復雜的動作姿勢,同時保持連續(xù)性和魯棒性。

結果展示

通過DeepFashion和Market-1501數(shù)據(jù)的訓練后研究人員得到了不錯的結果。

Deep Fasion 數(shù)據(jù)集

Market-1501數(shù)據(jù)集

生成的結果與先前方法的比較,其中S和M代表了單張和多張圖像輸入的生成結果:

在數(shù)據(jù)集上的表現(xiàn)還不錯,從源圖像生成了新的姿勢:

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 解碼器
    +關注

    關注

    9

    文章

    1176

    瀏覽量

    41980
  • 圖像
    +關注

    關注

    2

    文章

    1094

    瀏覽量

    41247
  • 模型
    +關注

    關注

    1

    文章

    3520

    瀏覽量

    50419

原文標題:從姿勢到圖像——基于人體姿勢引導的時尚圖像生成算法

文章出處:【微信號:thejiangmen,微信公眾號:將門創(chuàng)投】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    一種圖像語義分層處理框架,可以實現(xiàn)像素級別的圖像語義理解和操縱

    這多虧了密歇根大學和谷歌大腦的研究人員,他們提出了一種新的圖像語義處理分層框架,首先根據(jù)圖像中給定對象的邊界框,學習
    的頭像 發(fā)表于 08-27 08:52 ?7385次閱讀

    美國普渡大學和哈佛大學的研究人員出了項新發(fā)明 新...

    據(jù)物理學家組織網報道,美國普渡大學和哈佛大學的研究人員出了項極為應景的新發(fā)明:一種外形如同顆圣誕樹
    發(fā)表于 02-03 20:30

    研究人員提出了一種柔性可拉伸擴展的多功能集成傳感器陣列

    研究人員提出了一種柔性可拉伸擴展的多功能集成傳感器陣列,成功將電子皮膚的探測能力擴展到7,實現(xiàn)溫度、濕度、紫外光、磁、應變、壓力和接近等多種外界刺激的實時同步監(jiān)測。
    的頭像 發(fā)表于 01-24 15:15 ?7622次閱讀
    <b class='flag-5'>研究人員</b><b class='flag-5'>提出了</b><b class='flag-5'>一種</b>柔性可拉伸擴展的多功能集成傳感器陣列

    特倫托大學與Inria合作:使用GAN生成人體的新姿勢圖像

    使用GAN(對抗生成網絡)生成人體的新姿勢圖像研究人員提出的可變形跳躍連接和最近鄰損失函數(shù),更
    的頭像 發(fā)表于 01-29 16:34 ?9976次閱讀
    特倫托大學與Inria合作:使用GAN<b class='flag-5'>生成</b>人體的新<b class='flag-5'>姿勢</b><b class='flag-5'>圖像</b>

    OpenAI的研究提出了一種新的生成模型,能快速輸出高清、真實的圖像

    為下游任務提供了有用的隱藏空間。自回歸模型的隱藏層有著位置的邊緣分布,使其更難對數(shù)據(jù)進行正確操作。在GAN中,數(shù)據(jù)點經常不能直接表現(xiàn)在隱藏空間中,因為它們沒有編碼器,可能無法支持數(shù)據(jù)分布。在可逆生成模型和VAE上就沒有這種情況。
    的頭像 發(fā)表于 07-12 08:43 ?8563次閱讀

    以色列研究人員開發(fā)出了一種能夠識別不同刺激的新型傳感系統(tǒng)

    據(jù)麥姆斯咨詢報道,海法以色列理工學院的研究人員開發(fā)出了一種能夠識別并區(qū)分不同刺激的創(chuàng)新型傳感系統(tǒng)。該系統(tǒng)基于折紙藝術,結合了以色列理工學院開發(fā)的智能墨水材料。
    發(fā)表于 05-21 08:45 ?1042次閱讀

    研究人員提出了系列新的點云處理模塊

    為了探索這些問題的解決辦法、來自倫敦大學學院的研究人員提出了系列新的點云處理模塊,從效率、信息共享和點云卷積操作等方面進行了研究,得到了
    的頭像 發(fā)表于 08-02 14:44 ?3323次閱讀
    <b class='flag-5'>研究人員</b><b class='flag-5'>們</b><b class='flag-5'>提出了</b><b class='flag-5'>一</b>系列新的點云處理模塊

    Facebook的研究人員提出了Mesh R-CNN模型

    研究的目標是通過單張圖像輸入,對圖像中的物體進行檢測、獲取不同物體的類別、掩膜和對應的三維網格,并對真實世界中的復雜模型進行有效處理。在
    的頭像 發(fā)表于 08-02 15:51 ?4265次閱讀
    Facebook的<b class='flag-5'>研究人員</b><b class='flag-5'>提出了</b>Mesh R-CNN<b class='flag-5'>模型</b>

    研究人員出了一種新的基于深度學習的策略

    蘇黎世聯(lián)邦理工學院的研究人員最近推出了一種新的基于深度學習的策略,該策略可以在不需要大量真實數(shù)據(jù)的情況下在機器人中實現(xiàn)觸覺傳感。在arXiv上預先發(fā)表的篇論文中概述了他們的方法,該方
    的頭像 發(fā)表于 03-26 15:47 ?2868次閱讀

    研究人員開發(fā)出了一種稱為LB-WayPtNav-DH的機器人導航新框架

    加州大學伯克利分校的研究人員最近開發(fā)了一種新的框架,該框架可以增強辦公室,房屋或博物館等室內環(huán)境中人類的機器人導航能力。他們的模型在arXiv上預先發(fā)表的篇論文中
    發(fā)表于 04-09 11:18 ?1054次閱讀

    研究人員開發(fā)了一種新穎的機器學習管道

    研究人員通過一種特殊的神經網絡模型,它以“基本塊”(計算指令的基本摘要)形式訓練標記的數(shù)據(jù),以自動預測其持續(xù)時間使用給定的芯片執(zhí)行以前看不見的基本塊。結果表明,這種神經網絡模型的性能要
    的頭像 發(fā)表于 04-15 16:42 ?2012次閱讀

    微軟亞洲研究院的研究提出了一種模型壓縮的新思路

    近日,來自微軟亞洲研究院自然語言計算組的研究提出了一種與顯式地利用蒸餾損失函數(shù)來最小化教師模型
    的頭像 發(fā)表于 11-24 09:48 ?1931次閱讀

    一種基于改進的DCGAN生成SAR圖像的方法

    針對SAR圖像識別軟件,通過改進 DCGAN模型生成器與單判別器對抗的結構,采用多生成器與單判別器進行對抗,設計了控制各生成
    發(fā)表于 04-23 11:01 ?21次下載
    <b class='flag-5'>一種</b>基于改進的DCGAN<b class='flag-5'>生成</b>SAR<b class='flag-5'>圖像</b>的方法

    MIT研究人員提出了一種制造軟氣動執(zhí)行器的新方法

    麻省理工學院 (MIT) 的研究人員創(chuàng)造了一種新的制造技術,可以制造出更具成本效益的軟氣動執(zhí)行器。
    的頭像 發(fā)表于 05-06 16:38 ?1957次閱讀
    MIT<b class='flag-5'>研究人員</b><b class='flag-5'>提出了</b><b class='flag-5'>一種</b>制造軟氣動執(zhí)行器的新方法

    生成式 AI 研究通過引導圖像結構控制為創(chuàng)作者賦能

    新的研究正在通過個文本引導圖像編輯工具來提升生成式 AI 的創(chuàng)造性潛能。這項創(chuàng)新性的研究
    的頭像 發(fā)表于 07-24 19:30 ?787次閱讀