一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

英偉達開發(fā)新AI算法,視頻通話的流量最高壓縮90%以上

工程師鄧生 ? 來源:量子位 ? 作者:凹非寺 ? 2020-12-02 14:29 ? 次閱讀

為了讓網(wǎng)速慢的用戶用上高清通話,英偉達可謂絞盡腦汁。他們開發(fā)的新AI算法,可以將視頻通話的流量最高壓縮90%以上。

和其他視頻相比,通話的場景比較單一,基本上只有人的頭部在運動。因此只要能把頭像數(shù)據(jù)大規(guī)模壓縮,就能大大節(jié)約流量。

英偉達的新算法face vid2vid正是從這一點出發(fā)。只要一張圖片,就能實現(xiàn)重建各種頭部姿勢圖片。

H.264視頻所需的帶寬是這種新算法的2~12倍,從前面的演示也能看出,如果讓二者使用相同比特率,那么H.264視頻幾乎不可用。

轉(zhuǎn)動面部不扭曲

英偉達提供了一個試用Demo,可以在Pitch(俯仰角)、Yaw(偏航角)、Roll(翻滾角)三個方向上任意旋轉(zhuǎn)。

輸入一張人臉,最多可以在每個方向上最多旋轉(zhuǎn)30度。以下是三個方向上旋轉(zhuǎn)到最大角度生成的圖片。

與相比之前的方法,英偉達的這種技術(shù)即使在面部轉(zhuǎn)動幅度較大時,人臉也不會扭曲變形。

然而,圖片終究是不動的,要把生成的人臉放在運動的視頻中還要多一個步驟。

合成面部視頻

我們把上傳的清晰照片作為源圖像,從中獲取外貌特征。然后把視頻中一幀幀畫面作為重構(gòu)視頻的依據(jù),從中提取出面部表情和頭部姿勢等信息。

而表情和姿勢這兩個數(shù)據(jù)可以通過關(guān)鍵點進行編碼,這樣就分離了人物身份信息和運動信息。在傳輸視頻時只要有運動信息即可,從而節(jié)約了流量。

從源圖像s中,我們得到了兩組數(shù)據(jù):關(guān)鍵點坐標x和雅可比矩陣J。這兩組參數(shù)與面部的具體特征無關(guān),只包含人的幾何特征。

其中,雅可比矩陣表示如何通過仿射變換將關(guān)鍵點周圍的局部補丁轉(zhuǎn)換為另一幅圖像中的補丁。如果是恒等雅可比矩陣,則補丁將直接復制并粘貼到新位置。

下圖展示了計算前5個關(guān)鍵點的流程。給定源圖像以及模型預(yù)測的規(guī)范關(guān)鍵點。

從運動視頻估計的旋轉(zhuǎn)和平移應(yīng)用于關(guān)鍵點,帶動頭部姿勢的變化。然后可以感知表情的變形將關(guān)鍵點調(diào)整為目標表情。

接下來開始合成視頻。使用源和運動的關(guān)鍵點與其雅可比矩陣來估計流wk,從生成流組合成掩碼m,將這兩組進行線性組合即可產(chǎn)生合成流場w。

接著輸入人臉面部特征f,即可生成輸出圖像y。

這種方法不僅能用于視頻通話,也有其他“新玩法”。

比如覺得人物頭像有點歪,可以手動輸入糾正后的數(shù)據(jù),從而將面部轉(zhuǎn)正。

又或者是,把一個人的面部特征點和雅可比矩陣用于另一個人,實現(xiàn)面部視頻動作的遷移。

團隊簡介

這篇文章的第一作者是來自英偉達的高級研究員Ting-Chun Wang。

文章的通訊作者是英偉達的著名研究員劉洺堉。

如果你長期關(guān)注CV領(lǐng)域,一定對這兩位作者非常熟悉。他們在圖像風格遷移、GAN等方面做出了大量的工作。

△ GauGAN

兩人之前已經(jīng)有過多次合作。比如。無監(jiān)督圖像遷移網(wǎng)絡(luò)(NIPS 2017),還有從涂鴉生成照片的GauGAN(CVPR 2019),都是出自這二位之手。

責任編輯:PSY

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 算法
    +關(guān)注

    關(guān)注

    23

    文章

    4684

    瀏覽量

    94394
  • 開發(fā)
    +關(guān)注

    關(guān)注

    0

    文章

    372

    瀏覽量

    41265
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    33628

    瀏覽量

    274365
  • 視頻通話
    +關(guān)注

    關(guān)注

    0

    文章

    49

    瀏覽量

    11974
  • 英偉達
    +關(guān)注

    關(guān)注

    22

    文章

    3902

    瀏覽量

    92934
收藏 人收藏

    評論

    相關(guān)推薦
    熱點推薦

    IBM攜手英偉AI數(shù)據(jù)平臺推動企業(yè)級AI創(chuàng)新

    近日,IBM(紐約證券交易所:IBM)宣布與英偉(納斯達克股票代碼:NVDA)開展全新合作,雙方將基于英偉 AI 數(shù)據(jù)平臺參考架構(gòu)(re
    發(fā)表于 03-24 19:20 ?145次閱讀

    英偉收購AI初創(chuàng)公司Run:ai

    :ai作為一家專注于AI云計算軟件平臺開發(fā)的初創(chuàng)公司,其產(chǎn)品以高效利用高性能GPU資源為核心,致力于為用戶提供更快速、更便捷的機器學習加速方案。通過此次收購,英偉
    的頭像 發(fā)表于 12-31 10:46 ?413次閱讀

    英偉與軟銀攜手共建日本AI基礎(chǔ)設(shè)施

    近日,英偉創(chuàng)始人兼CEO黃仁勛宣布,英偉將與軟銀集團合作,在日本共同建設(shè)AI基礎(chǔ)設(shè)施,其中包括日本最大的
    的頭像 發(fā)表于 11-13 14:41 ?622次閱讀

    英偉超越蘋果成為市值最高 英偉取代英特爾加入道指

    蘋果公司的市值,重新成為全球市值最高的公司。 在AI領(lǐng)域,英偉正瘋狂奔跑,我們看到有外媒報道英偉
    的頭像 發(fā)表于 11-05 15:22 ?669次閱讀

    英偉與阿聯(lián)酋G42合作開發(fā)天氣預(yù)測AI模型

    英偉近期宣布與阿聯(lián)酋的領(lǐng)先AI應(yīng)用開發(fā)企業(yè)G42達成戰(zhàn)略合作,共同探索天氣預(yù)測技術(shù)的新前沿。雙方將整合各自的技術(shù)優(yōu)勢,依托英偉
    的頭像 發(fā)表于 09-24 15:41 ?427次閱讀

    英偉投資日本AI公司Sakana AI

    英偉現(xiàn)身日本人工智能研發(fā)初創(chuàng)公司Sakana AI的A輪融資名單中;據(jù)悉;Sakana AI的A輪融資而完成超過1億美元,此次融資由New Enterprise Associates
    的頭像 發(fā)表于 09-05 15:46 ?831次閱讀

    英偉Blackwell架構(gòu)揭秘:下一個AI計算里程碑?# 英偉# 英偉Blackwell

    英偉行業(yè)資訊
    jf_02331860
    發(fā)布于 :2024年08月26日 10:58:09

    英偉Cosmos AI項目曝光:構(gòu)建先進視頻模型

    近日,英偉內(nèi)部一項名為Cosmos的AI項目浮出水面,引起了業(yè)界的廣泛關(guān)注。該項目尚處于保密階段,未向公眾正式發(fā)布,但其雄心勃勃的目標已初露端倪。Cosmos旨在構(gòu)建一個集光傳輸、物理和智能模擬
    的頭像 發(fā)表于 08-07 16:51 ?728次閱讀

    英偉TITAN AI顯卡曝光,性能狂超RTX 409063%!# 英偉# 顯卡

    顯卡英偉
    jf_02331860
    發(fā)布于 :2024年07月24日 17:18:28

    英偉推出AI模型推理服務(wù)NVIDIA NIM

    英偉近日宣布推出一項革命性的AI模型推理服務(wù)——NVIDIA NIM。這項服務(wù)將極大地簡化AI模型部署過程,為全球的2800萬英偉
    的頭像 發(fā)表于 06-04 09:15 ?874次閱讀

    英偉首席執(zhí)行官黃仁勛:AI模型推動英偉AI芯片需求

    近來,以ChatGPT為代表的AI聊天機器人已經(jīng)導致英偉AI芯片供應(yīng)緊張。然而,隨著能夠創(chuàng)造視頻并進行近似人類交流的新型
    的頭像 發(fā)表于 05-24 10:04 ?747次閱讀

    英偉業(yè)績飆升,AI熱潮持續(xù)

    AI芯片領(lǐng)域,英偉(NVDA)持續(xù)領(lǐng)跑,最新財報再次證明了這一點。英偉發(fā)布的2025財年第一財季財報顯示,公司營收和凈利潤均實現(xiàn)大幅增
    的頭像 發(fā)表于 05-24 09:43 ?548次閱讀

    進一步解讀英偉 Blackwell 架構(gòu)、NVlink及GB200 超級芯片

    AI 超級計算和量子計算服務(wù)方面的最新進展。 **10.NVIDIA NIM **軟件棧和 OVX 計算系統(tǒng) 推出新的軟件和計算系統(tǒng),加速企業(yè)級 AI 應(yīng)用的開發(fā)和部署。 英偉
    發(fā)表于 05-13 17:16

    聯(lián)發(fā)科或?qū)⑴c英偉開發(fā)Arm架構(gòu)AI PC處理器

    據(jù)悉,聯(lián)發(fā)科正與英偉合作,共同開發(fā)基于Arm架構(gòu)的AI PC處理器。這款新芯片預(yù)計將在第三季度完成設(shè)計定案,第四季度進入驗證階段。
    的頭像 發(fā)表于 05-13 10:18 ?716次閱讀

    研華與英偉深化合作,成為NVIDIA AI Enterprise軟件全球分銷商

    近日,研華宣布擴大與英偉的合作,未來將通過工業(yè)級邊緣計算和英偉 AI Enterprise 軟件平臺提升全球企業(yè)的
    的頭像 發(fā)表于 05-10 10:25 ?642次閱讀