一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

能創(chuàng)造出有逼真紋理和形狀的一個生成式AI系統(tǒng)

電子工程師 ? 來源:lq ? 2018-12-06 10:17 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

AI 生成逼真三維物體模型并不像人們以為的那么困難。

近日,在 NeurIPS 2018 會議上接收的論文“視覺對象網(wǎng)絡(luò):圖像生成與分離式的3D表示”中,麻省理工學(xué)院計算機科學(xué)與人工智能實驗室(MIT CSAIL)和 Google 的研究人員介紹了能創(chuàng)造出有逼真紋理和形狀的一個生成式 AI 系統(tǒng)。

該系統(tǒng)是視覺對象網(wǎng)絡(luò)(VON)系統(tǒng),不僅可以生成比某些最先進(jìn)的方法更真實的圖像,還可以進(jìn)行形狀和紋理編輯、視點轉(zhuǎn)換以及其他三維調(diào)整。

“現(xiàn)代深層生成模型學(xué)會了合成逼真的圖像,”研究人員寫道,“但大多數(shù)計算模型只專注于生成 2D 圖像,而忽略了 3D 世界的美好......這種視角不可避免地限制了它們在許多領(lǐng)域的實際應(yīng)用,例如合成數(shù)據(jù)生成、機器人學(xué)習(xí)、虛擬現(xiàn)實和游戲行業(yè)?!?/p>

視覺對象網(wǎng)絡(luò)系統(tǒng)則可以通過合成三維形狀和二維圖像來解決這個問題,類似于研究人員所稱的“分離式的對象表示”。圖像生成模型被分解為三種因素:形狀、視點和紋理,另外,在計算“2.5 D”草圖和添加紋理之前,它需要學(xué)習(xí)合成三維形狀。

重要的是,由于這三個因素是條件獨立的,所以模型不需要二維和三維形狀之間的配對數(shù)據(jù)。這使得團隊能夠在大規(guī)模的二維圖像和三維形狀集上進(jìn)行訓(xùn)練,如 Pix3D,Google 圖像搜索和ShapeNet,后者包含 55 個對象類別的數(shù)千個 CAD 模型。

為了讓 VON 系統(tǒng)學(xué)習(xí)如何生成自己的形狀,該團隊在上述三維形狀數(shù)據(jù)集上訓(xùn)練了一個生成式對抗網(wǎng)絡(luò)(GAN) 。而紋理生成被歸類了到另一個基于 GAN 的神經(jīng)網(wǎng)絡(luò)。

經(jīng)過大約兩到三天的訓(xùn)練,AI 系統(tǒng)始終如一地生成了令人信服的 128 x 128 x 128 模型,具有優(yōu)異的反射率、環(huán)境照明和反照率(一種漫射光的度量)。

為了評估圖像生成模型,團隊計算了用于生成三維模型的 Fréchet Inception Distance(弗雷歇初始距離,F(xiàn)ID)——一種與人類感知相關(guān)的度量。此外,他們還向亞馬遜 Mechanical Turk 上的五名測試者展示了由 VON 和其他最先進(jìn)模型生成的 200 對圖像,這些受試者需要在這些圖像中選擇更真實的結(jié)果。

VON 的表現(xiàn)非常出色。它與所有 AI 模型相比具有最低的 FID 值,并且 Mechanical Turk 的受訪者表示更喜歡 VON 生成的 74% 到 85%的圖像。

研究人員未來將專注于從粗糙到精細(xì)化的建模,以產(chǎn)生更高分辨率的生成形狀和圖像,并將紋理分解為光照和外觀(lighting and appearance),并合成自然場景。

“我們的主要想法是將圖像生成過程分解為形狀、視點和紋理三種因素,”Google 團隊寫道,“這種分離式 3D 表示使我們能夠在對抗學(xué)習(xí)框架下從 3D 和 2D 視覺數(shù)據(jù)集合中學(xué)習(xí)模型。與現(xiàn)有的 2D 生成模型相比,我們的模型合成了更逼真的圖像,它還可以做到以前的 2D 方法也無法實現(xiàn)的各種 3D 操作?!?/p>

近年來,GAN 的研究突飛猛進(jìn),特別是在機器視覺領(lǐng)域。

Google 的 DeepMind 子公司在 10 月推出了一個基于 GAN 的系統(tǒng),以此創(chuàng)建出令人信服的食物、風(fēng)景、肖像和動物照片。9 月,Nvidia 的研究人員開發(fā)了一種 AI 模型,可以生成腦癌的合成掃描圖像,8 月,卡內(nèi)基梅隆大學(xué)的一個團隊演示了 AI 可以將人們已存的動作和面部表情轉(zhuǎn)換成另一張照片或視頻中的目標(biāo)對象。最近,愛丁堡大學(xué)感知研究所和天文學(xué)研究所的科學(xué)家設(shè)計了一種至少可以產(chǎn)生高分辨率星系圖像的 GAN。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 人工智能
    +關(guān)注

    關(guān)注

    1806

    文章

    49008

    瀏覽量

    249321
  • GaN
    GaN
    +關(guān)注

    關(guān)注

    19

    文章

    2207

    瀏覽量

    76772
  • 計算機科學(xué)
    +關(guān)注

    關(guān)注

    1

    文章

    144

    瀏覽量

    11632
  • 生成式AI
    +關(guān)注

    關(guān)注

    0

    文章

    531

    瀏覽量

    811

原文標(biāo)題:AI做不了“真”3D圖像?試試Google的新生成模型

文章出處:【微信號:rgznai100,微信公眾號:rgznai100】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    谷歌新生成AI媒體模型登陸Vertex AI平臺

    我們在 Vertex AI 上推出新生成 AI 媒體模型: Imagen 4、Veo 3 和 Lyria 2。
    的頭像 發(fā)表于 06-18 09:56 ?353次閱讀

    利用NVIDIA 3D引導(dǎo)生成AI Blueprint控制圖像生成

    AI的圖像生成技術(shù)突飛猛進(jìn),從早期模型會生成手指過多的人類圖像,到現(xiàn)在創(chuàng)造出令人驚嘆的
    的頭像 發(fā)表于 06-05 09:24 ?379次閱讀

    AI Agent 應(yīng)用與項目實戰(zhàn)》閱讀心得2——客服機器人、AutoGen框架 、生成代理

    及時處理。 第5章的斯坦福AI小鎮(zhèn)項目對生成代理技術(shù)做出了開創(chuàng)性的探索。該項目的核心是將LLM與計算交互代理相結(jié)合,構(gòu)建了具有記憶、反
    發(fā)表于 02-25 21:59

    富士通如何解鎖生成AI紅利 從人才進(jìn)化到業(yè)務(wù)賦

    正面臨道必答題:您準(zhǔn)備好駕馭這場生產(chǎn)力革命了嗎? 生成AI有望帶來巨大的經(jīng)濟價值。然而現(xiàn)實當(dāng)中,許多企業(yè)陷入“工具先行,人才掉隊”的困境,采購最貴的
    的頭像 發(fā)表于 02-25 17:32 ?816次閱讀

    聚云科技獲亞馬遜云科技生成AI能力認(rèn)證

    近日,云管理服務(wù)提供商聚云科技成功獲得亞馬遜云科技生成AI能力認(rèn)證。此次認(rèn)證標(biāo)志著聚云科技在利用亞馬遜云科技全托管的生成
    的頭像 發(fā)表于 02-19 10:33 ?487次閱讀

    聚云科技榮獲亞馬遜云科技生成AI能力認(rèn)證

    助力企業(yè)加速生成AI應(yīng)用落地 北京2025年2月14日?/美通社/ -- 云管理服務(wù)提供商聚云科技獲得亞馬遜云科技生成
    的頭像 發(fā)表于 02-14 16:07 ?392次閱讀

    聚云科技榮獲亞馬遜云科技生成AI能力認(rèn)證 助力企業(yè)加速生成AI應(yīng)用落地

    北京 ——2025 年 2 月 14 日 云管理服務(wù)提供商聚云科技獲得亞馬遜云科技生成AI能力認(rèn)證,利用亞馬遜云科技全托管的生成
    發(fā)表于 02-14 13:41 ?151次閱讀

    生成AI工具好用嗎

    當(dāng)下,生成AI工具正以其強大的內(nèi)容生成能力,為用戶帶來了前所未有的便捷與創(chuàng)新。那么,生成
    的頭像 發(fā)表于 01-17 09:54 ?454次閱讀

    國內(nèi)生成AI備案數(shù)量突破300款

    截至2024年底,我國生成人工智能服務(wù)領(lǐng)域取得了顯著進(jìn)展,國家互聯(lián)網(wǎng)信息辦公室備案的生成AI服務(wù)總數(shù)已達(dá)到302款,標(biāo)志著該領(lǐng)域正以前所
    的頭像 發(fā)表于 01-09 11:14 ?864次閱讀

    Google兩款先進(jìn)生成AI模型登陸Vertex AI平臺

    新的 AI 模型,包括最先進(jìn)的視頻生成模型Veo以及最高品質(zhì)的圖像生成模型Imagen 3。近日,我們在 Google Cloud 上進(jìn)步推動這
    的頭像 發(fā)表于 12-30 09:56 ?614次閱讀

    奇異摩爾將亮相中國生成AI大會

    ? ? ? ? 12月5-6日,2024中國生成AI大會(上海站)“GenAICon 2024”將在上海中星鉑爾曼大酒店盛大舉辦。大會由上海市人工智能行業(yè)協(xié)會指導(dǎo),由智科技旗下智能
    的頭像 發(fā)表于 12-03 10:05 ?902次閱讀

    NVIDIA推出全新生成AI模型Fugatto

    NVIDIA 開發(fā)了全新的生成 AI 模型。利用輸入的文本和音頻,該模型可以創(chuàng)作出包含任意的音樂、人聲和聲音組合的作品。
    的頭像 發(fā)表于 11-27 11:29 ?812次閱讀

    生成AI工具作用

    生成AI工具是指那些能夠自動生成文本、圖像、音頻、視頻等多種類型數(shù)據(jù)的人工智能技術(shù)。在此,petacloud.ai小編為您整理
    的頭像 發(fā)表于 10-28 11:19 ?745次閱讀

    2024學(xué)習(xí)生成AI的最佳路線圖

    本文深入探討了2024年最佳生成AI路線圖的細(xì)節(jié),引領(lǐng)我們穿越動態(tài)進(jìn)展、新興趨勢以及定義這尖端領(lǐng)域的變革應(yīng)用。引言在日新月異的人工智能領(lǐng)域,生成
    的頭像 發(fā)表于 07-26 08:28 ?1155次閱讀
    2024學(xué)習(xí)<b class='flag-5'>生成</b><b class='flag-5'>式</b><b class='flag-5'>AI</b>的最佳路線圖

    人手AI是如何誕生的?

    2023年是AI大語言模型爆發(fā)的年,以O(shè)penAI推出的GPT大模型為起始,整個行業(yè)開始從“推理式AI”向“生成
    的頭像 發(fā)表于 07-23 10:33 ?469次閱讀