一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

DeepMind發(fā)布VQ-VAE-2算法,將AI換臉的技術(shù)提升到了真假難辯的高度

WpOh_rgznai100 ? 來源:YXQ ? 2019-06-19 09:57 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

近日DeepMind發(fā)布VQ-VAE-2算法,也就是之前VQ-VAE算法2代,這個算法從感觀效果上來看比生成對抗神經(jīng)網(wǎng)絡(luò)(GAN)的來得更加真實(shí),堪稱AI換臉界的大殺器,如果我不說,相信讀者也很難想象到上面幾幅人臉圖像都是AI自動生成出來的。

不過如此重要的論文,筆者還沒看到專業(yè)性很強(qiáng)的解讀,那么筆者就將VQ-VAE-2算法分為VQ,VAE,VQVAE2三部分來介紹原理,權(quán)當(dāng)拋磚引玉。

什么是VQ

VQ是vector quantisationk(一般譯作矢量量化)的縮寫,他的主要思想是通過k-means算法進(jìn)行聚類,將相近的點(diǎn)全部近似點(diǎn)簇的重心,從而在不損失太多信息的情況下對輸入進(jìn)行壓縮。

k-means聚類算法:我在之前博客《終于把軟微BING搜索-SPTAG算法的原理搞清了(https://blog.csdn.net/BEYONDMA/article/details/90578111)

也曾經(jīng)介紹過k-means算法。算法先隨機(jī)指定選取K個點(diǎn)做為初始聚集的簇心,分別計算每個樣本點(diǎn)到 K個簇核心的余弦距離,找到距離最近的核心點(diǎn),將它歸屬到對應(yīng)的簇,所有點(diǎn)都?xì)w屬到簇之后, M個點(diǎn)就分為了 K個簇。之后重新計算每個簇的重心,將其定為新的“核心”,重復(fù)上述步驟直到新核心不再改變?yōu)橹够蛘吒淖兙嚯x達(dá)到一定值后中止。那么最終的K個簇就是最終的聚類結(jié)果。

k-means算法試圖最小化失真,其定義為每個觀測向量與其主質(zhì)心之間距離的平方之和。通過迭代地將觀測結(jié)果重新分類為星系團(tuán),并重新計算中心體,直到得到一個中心體穩(wěn)定的構(gòu)型,從而達(dá)到最小值。

那么VQ實(shí)際就是先把輸入的圖像進(jìn)行-means聚類,完成后只保留最終留下的K個簇質(zhì)心,簇上的其它點(diǎn)全部近似化為質(zhì)心來進(jìn)行存儲,用這樣的方式來進(jìn)行壓縮。

什么是VAE

VAE是variational auto encoding(一般譯作變分自動編碼),不過筆者感覺譯為隱變更自動編碼可能更貼切。VAE的主要思想是他認(rèn)為圖像、聲音等信息是由多個隱變量(latent arrtibute),比如對于人的面部圖像來說就由笑容,膚色、發(fā)色、發(fā)型等變量決定,那么VAE網(wǎng)絡(luò)就先把圖像中的笑容,膚色、發(fā)色、發(fā)型等變量識別出來,然后將這些變量傳遞給解碼器生成圖像。具體工作原理圖如下:

VQ-VAE1代算法整體的工作方式

簡單來講VQ-VAE1代算法,在Encoder層計算latent arrtibute(隱向量)的向量族z,然后傳遞給隱層,在隱層按照剛剛所述的VQ算法進(jìn)行壓縮,然后輸出給Decoder進(jìn)行生成,其具體原理見下圖。

如果要進(jìn)行換臉,那么只要將人臉A的Encoder進(jìn)行編碼計算latent arrtibute(隱向量),然后輸出給FaceB的Decoder進(jìn)行生成即可完成。

VQ-VAE2代算法的更新

VQ-VAE2代其實(shí)總體和1代差別不大,主要將latent arrtibute(隱向量)分為top和bottom兩層,其中top層記錄整體細(xì)節(jié)主要是明亮度、色調(diào)等信息,而bottom層主要記錄細(xì)節(jié)信息,從實(shí)際效果上看甚至包括了發(fā)絲、瞳孔等超級細(xì)微的層面。具體原理圖如下:

VQ-VAE-2將AI換臉的技術(shù)提升到了真假難辯的高度

我在之前的博客《終于把AI換臉的原理搞清了》(https://blog.csdn.net/BEYONDMA/article/details/88365203)曾經(jīng)介紹過deepfakes等項目的原理,不過之前那些換臉?biāo)惴▽τ诩?xì)節(jié)的把握程度遠(yuǎn)遠(yuǎn)達(dá)不到VQ-VAE-2的程度,從DeepMind的論文中可以看到,其生成效果之好、分辨率之高已經(jīng)到達(dá)了刷新了筆者的認(rèn)知極限。所以筆者最后也再次呼吁,不要將AI換臉技術(shù)用在歪路上。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    88

    文章

    35147

    瀏覽量

    279830
  • DeepMind
    +關(guān)注

    關(guān)注

    0

    文章

    131

    瀏覽量

    11576

原文標(biāo)題:AI換臉技術(shù)再創(chuàng)新高度,DeepMind發(fā)布的VQ-VAE二代算法有多厲害?

文章出處:【微信號:rgznai100,微信公眾號:rgznai100】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    AlphaEvolve有望革新AI玩具芯片設(shè)計,算法進(jìn)化驅(qū)動能效與成本雙突破

    電子發(fā)燒友網(wǎng)綜合報道,近期,谷歌?DeepMind發(fā)布了一款A(yù)lphaEvolve,是一款通用科學(xué)AI代理,基于大語言模型Gemini系列與進(jìn)化計算框架,專注于算法發(fā)現(xiàn)與優(yōu)化。可以支持
    的頭像 發(fā)表于 06-18 00:09 ?2983次閱讀

    DevEco Studio AI輔助開發(fā)工具兩大升級功能 鴻蒙應(yīng)用開發(fā)效率再提升

    : 1、 實(shí)時檢索驗證:在生成階段,系統(tǒng)首先從官方語料庫中檢索與用戶輸入最相關(guān)的片段,形成上下文約束。 主要實(shí)現(xiàn)技術(shù): (1) 向量搜索:查詢和文檔嵌入到高維向量空間,通過計算相似度進(jìn)行檢索。 (2
    發(fā)表于 04-18 14:43

    首創(chuàng)開源架構(gòu),天璣AI開發(fā)套件讓端側(cè)AI模型接入得心應(yīng)手

    套件2.0全面支持 DeepSeek四大關(guān)鍵技術(shù):混合專家模型(MoE)、多Token預(yù)測(MTP)多頭潛在注意力(MLA)、FP8推理(FP8 Inferencing),實(shí)現(xiàn)Token產(chǎn)生速度提升2倍以上
    發(fā)表于 04-13 19:52

    《DNESP32S3使用指南-IDF版_V1.6》第六十章 貓檢測實(shí)驗

    驗證 60.1 硬件設(shè)計1. 例程功能本章實(shí)驗功能簡介:使用樂鑫官方的ESP32-WHO AI庫對OV2640和OV5640攝像頭輸出的數(shù)據(jù)進(jìn)行貓檢測。2. 硬件資源1)LED燈 LED-IO12
    發(fā)表于 04-01 09:28

    Banana Pi 發(fā)布 BPI-AI2N & BPI-AI2N Carrier,助力 AI 計算與嵌入式開發(fā)

    和 Renesas一直致力于推動開源生態(tài)的發(fā)展,并積極合作打造高效、開放的計算平臺。BPI-AI2N & BPI-AI2N Carrier 的發(fā)布,不僅為開發(fā)者提供了強(qiáng)大的硬件支持,也
    發(fā)表于 03-19 17:54

    在英特爾酷睿Ultra AI PC上用NPU部署YOLOv11與YOLOv12

    最新的英特爾 酷睿 Ultra 處理器(第二代)讓我們能夠在臺式機(jī)、移動設(shè)備和邊緣中實(shí)現(xiàn)大多數(shù) AI 體驗, AI 加速提升到新水平,在 AI
    的頭像 發(fā)表于 03-03 15:32 ?1663次閱讀
    在英特爾酷睿Ultra <b class='flag-5'>AI</b> PC上用NPU部署YOLOv11與YOLOv12

    FPGA+AI王炸組合如何重塑未來世界:看看DeepSeek東方神秘力量如何預(yù)測......

    ),設(shè)計定制化的FPGA架構(gòu),以優(yōu)化性能和功耗。 2.提升跨領(lǐng)域技能? AI知識儲備:掌握深度學(xué)習(xí)算法、模型量化和優(yōu)化技術(shù),以便更好地
    發(fā)表于 03-03 11:21

    農(nóng)村污水處理站遠(yuǎn)程監(jiān)控智慧運(yùn)維系統(tǒng)方案

    隨著鄉(xiāng)村振興戰(zhàn)略的穩(wěn)步推進(jìn),農(nóng)村生態(tài)環(huán)境建設(shè)被提升到了前所未有的高度。農(nóng)村污水處理作為改善農(nóng)村人居環(huán)境、提升鄉(xiāng)村生態(tài)質(zhì)量的重要一環(huán),受到了廣泛關(guān)注。
    的頭像 發(fā)表于 03-01 11:01 ?362次閱讀
    農(nóng)村污水處理站遠(yuǎn)程監(jiān)控智慧運(yùn)維系統(tǒng)方案

    AI賦能邊緣網(wǎng)關(guān):開啟智能時代的新藍(lán)海

    的引入徹底改變了這一局面。通過在邊緣網(wǎng)關(guān)集成AI芯片和算法模型,使其具備了實(shí)時數(shù)據(jù)分析、智能決策和自主控制能力。在工業(yè)質(zhì)檢場景中,搭載AI算法的邊緣網(wǎng)關(guān)能夠?qū)崟r識別產(chǎn)品缺陷,
    發(fā)表于 02-15 11:41

    谷歌加速AI部門整合:AI Studio團(tuán)隊并入DeepMind

    近日,谷歌正緊鑼密鼓地推進(jìn)其人工智能(AI)部門的整合工作。據(jù)谷歌AI Studio主管Logan Kilpatrick在領(lǐng)英頁面上的透露,谷歌已將AI Studio團(tuán)隊整體轉(zhuǎn)移至DeepMi
    的頭像 發(fā)表于 01-13 14:40 ?713次閱讀

    SOLIDWORKS 2025:顯著增強(qiáng)的智能自動化功能

    SOLIDWORKS作為3D CAD設(shè)計軟件,一直以來都在不斷探索和創(chuàng)新,以提升設(shè)計師的工作效率和設(shè)計質(zhì)量。其新版本——SOLIDWORKS 2025,更是智能自動化功能提升到了一個全新的
    的頭像 發(fā)表于 12-04 15:46 ?908次閱讀

    ADS1298SPI提升到更高頻率無法讀取任何信息,為什么?

    ,通過DRDY引腳的外部中斷中能正確的讀取測量的數(shù)據(jù)。最多能實(shí)現(xiàn)2KHz的數(shù)據(jù)采集。 現(xiàn)在要將數(shù)據(jù)采集率設(shè)置為8KHz,1MHz的SPI不夠用了。我嘗試SPI的時鐘頻率提升到2,4
    發(fā)表于 11-18 06:25

    NPU技術(shù)如何提升AI性能

    隨著人工智能技術(shù)的飛速發(fā)展,深度學(xué)習(xí)作為AI領(lǐng)域的核心驅(qū)動力,對計算能力的需求日益增長。NPU技術(shù)應(yīng)運(yùn)而生,為AI性能的提升提供了強(qiáng)大的硬件
    的頭像 發(fā)表于 11-15 09:11 ?1452次閱讀

    AI for Science:人工智能驅(qū)動科學(xué)創(chuàng)新》第二章AI for Science的技術(shù)支撐學(xué)習(xí)心得

    的物理可信度,還為科學(xué)研究提供了新的視角和方法。 5. 挑戰(zhàn)與未來展望 第二章也提到了AI for Science面臨的挑戰(zhàn)和未來展望。盡管AI技術(shù)在科學(xué)研究中取得了顯著進(jìn)展,但仍存在
    發(fā)表于 10-14 09:16

    探索機(jī)器人快技術(shù)的未來之路:智能化與協(xié)作的革新

    機(jī)器人快技術(shù)正經(jīng)歷變革,AI、機(jī)器學(xué)習(xí)、傳感器、機(jī)器視覺及協(xié)作技術(shù)推動其智能化、高效化、靈活化發(fā)展,
    的頭像 發(fā)表于 09-26 11:26 ?533次閱讀