一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

AI提供更好的視頻溝通體驗(yàn),GAN消除視頻通話中的抖動(dòng)

火花 ? 來源:IT專家網(wǎng) ? 作者:火花 ? 2020-10-22 12:07 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

NVIDIA Maxine是一款云AI視頻流平臺(tái),將使用GAN來提高帶寬性能

Ming-Yu Liu 和Arun Mallya 正在進(jìn)行視頻通話,其中一個(gè)人的畫面開始出現(xiàn)卡頓,直至畫面定格。這是一種常見且令人反感的情況。但與大多數(shù)人不同的是,Liu和Mallya可以做出一些改變。他們是NVIDIA的AI研究人員,專攻計(jì)算機(jī)視覺。在與Ting-Chun Wang共事中,他們意識(shí)到可以使用神經(jīng)網(wǎng)絡(luò)來替代被稱為視頻編解碼器的軟件,這種軟件通常用于視頻在網(wǎng)絡(luò)傳輸過程中的壓縮和解壓縮。

迄今為止,他們的工作成果將用戶在視頻通話時(shí)所需的網(wǎng)絡(luò)帶寬壓縮至原來的十分之一,還有望將帶寬消耗降低數(shù)個(gè)數(shù)量級(jí)。Mallya表示:“我們希望通過AI提供更好的視頻溝通體驗(yàn),即使在帶寬極低的情況下,也可以從語音升級(jí)到視頻通話?!?/span>

GAN讓連接質(zhì)量更佳

即使用戶的面部有遮擋(比如戴著帽子、眼鏡、耳機(jī)或口罩),這項(xiàng)技術(shù)同樣適用。為了增加趣味性,他們?cè)谘菔局惺褂昧艘恍┭b飾物,這樣用戶可以在線上更改其發(fā)型或衣服或者創(chuàng)建頭像。更重要的是,如上圖所示,借助神經(jīng)網(wǎng)絡(luò)定位,無需再盯著顯示器上方攝像頭才能與對(duì)方對(duì)視,這增強(qiáng)了面對(duì)面對(duì)話的感覺。Wang表示:“借助計(jì)算機(jī)視覺技術(shù),我們可以從多個(gè)角度來定位頭部。我們認(rèn)為這將幫助人們更自然地進(jìn)行對(duì)話。”迎接最前沿的AI技術(shù),讓虛擬生活更真實(shí)。

AI賦能視頻通話的原理

AI輔助視頻通話的工作機(jī)制十分簡(jiǎn)單。與目前使用壓縮的視頻流的系統(tǒng)類似,參考圖像發(fā)送后,僅用戶眼睛、鼻子和嘴巴周圍幾個(gè)關(guān)鍵點(diǎn)的位置數(shù)據(jù)被發(fā)送,而非發(fā)送大量壓縮過像素的圖像。接收端的生成式對(duì)抗網(wǎng)絡(luò)通過初始圖像和面部關(guān)鍵點(diǎn),在本地GPU上重構(gòu)后續(xù)圖像。因此,通過網(wǎng)絡(luò)傳輸?shù)臄?shù)據(jù)要比之前少得多。

Liu在GAN領(lǐng)域的工作成果GauGAN曾引發(fā)關(guān)注。GauGAN是一種可以將涂鴉轉(zhuǎn)化為寫實(shí)藝術(shù)作品的AI工具,目前已經(jīng)創(chuàng)建了超過一百萬張圖像。該工具可在AI Playground中獲取。Liu表示:“疫情期間頻繁的視頻會(huì)議啟發(fā)了我們,因此我們開始探索突破帶寬瓶頸的方式,讓供應(yīng)商可以同時(shí)為更多人提供服務(wù)?!?/span>

GPU突破帶寬瓶頸

這一方法順應(yīng)當(dāng)前行業(yè)趨勢(shì),將網(wǎng)絡(luò)瓶頸轉(zhuǎn)化為計(jì)算任務(wù),從而借助本地或云端資源更輕松地解決此類問題。NVIDIA媒體集團(tuán)高級(jí)產(chǎn)品總監(jiān)Andrew Page表示:“如今,許多公司希望將帶寬問題轉(zhuǎn)化為計(jì)算問題,這是因?yàn)閹捯话愫茈y增加,而增強(qiáng)算力則相對(duì)容易?!?/span>

NVIDIA Maxine搭配了一套視頻會(huì)議和流媒體服務(wù)工具

AI 工具優(yōu)化視頻服務(wù)

GAN視頻壓縮是NVIDIA Maxine即將推出的幾個(gè)功能之一,這是一個(gè)云AI視頻流平臺(tái),用于增強(qiáng)視頻會(huì)議和電話質(zhì)量。它將音頻、視頻和對(duì)話式AI功能整合在一個(gè)工具包中,并支持多種設(shè)備。在上周的GTC大會(huì)上,NVIDIA宣布推出了Maxine平臺(tái)?;谠撈脚_(tái),服務(wù)提供商能夠在提供超高分辨率的視頻的同時(shí),實(shí)現(xiàn)實(shí)時(shí)翻譯、噪聲消除和情景感知的閉路字幕。用戶可以享受到人臉校正、虛擬助手和化身逼真的動(dòng)畫角色等功能。

Page表示:“視頻會(huì)議正在經(jīng)歷一場(chǎng)復(fù)興。疫情期間,它的缺點(diǎn)給所有人帶來了不愉快的使用體驗(yàn),但回歸視覺動(dòng)物的屬性,視頻終將成為人們今后生活中的一部分?!?span style="text-indent: 2em;">通過利用基于Tensor Core核心的NVIDIA GPU,Maxine可運(yùn)行如NVIDIA Jarvis的軟件。NVIDIA Jarvis是用于對(duì)話式AI的SDK,提供了一套語音和文本功能。 它們共同提供了當(dāng)今有用的AI功能,并成為未來視頻產(chǎn)品和服務(wù)的基石。

fqj

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    88

    文章

    35136

    瀏覽量

    279786
  • 視頻通話
    +關(guān)注

    關(guān)注

    0

    文章

    49

    瀏覽量

    12078
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    神經(jīng)網(wǎng)絡(luò)AI降噪回音消除模塊 A-29說明書

    A-29P 是一款高性能的 DSP 數(shù)字語音處理模塊,針對(duì)所有免提全雙工通話設(shè)備的回音 問題進(jìn)行消除(AEC),并具有超強(qiáng)的 AI 環(huán)境噪音壓制(
    發(fā)表于 06-18 15:23 ?0次下載

    A-29P AI智能降噪回音消除模塊說明書

    通話設(shè)備獲得更好的語音品質(zhì)。在同類型模塊,主芯片的處理能力,及算法差異,在外形結(jié)構(gòu)比較小,喇叭音量又很大的通話產(chǎn)品,回音
    發(fā)表于 05-26 16:51 ?1次下載

    鯤云科技提供智慧高速AI視頻分析解決方案

    鯤云科技響應(yīng)國家及地方的高速公路信息化、智能化政策,提供“算力+算法+平臺(tái)”一體化的智慧高速 AI 視頻分析解決方案,滿足交警部門和高速集團(tuán)日常運(yùn)營和管理需求,通過智能化的手段,提高工作效率。
    的頭像 發(fā)表于 03-27 14:53 ?498次閱讀

    AI Agent 應(yīng)用與項(xiàng)目實(shí)戰(zhàn)》----- 學(xué)習(xí)如何開發(fā)視頻應(yīng)用

    學(xué)習(xí)、自然語言處理(NLP)、計(jì)算機(jī)視覺(CV)等先進(jìn)技術(shù)提供的強(qiáng)大的數(shù)據(jù)處理和分析能力。 在視頻應(yīng)用開發(fā),AI Agent可以用于視頻內(nèi)
    發(fā)表于 03-05 19:52

    怎樣才能更好享受到8K視頻帶來的優(yōu)勢(shì)

    觀看4K現(xiàn)在已經(jīng)非常普遍了,隨著對(duì)音視頻要求的不斷提高,各大設(shè)備也在著力發(fā)展8K視頻。本期我們將從觀看8K的工具入手,來聊聊怎樣才能更好享受到8K視頻帶來的優(yōu)勢(shì)。
    的頭像 發(fā)表于 02-21 09:30 ?812次閱讀

    訊維AI視頻行為分析系統(tǒng):打造全方位智能安防解決方案

    在當(dāng)今科技迅猛發(fā)展的時(shí)代,視頻監(jiān)控系統(tǒng)已經(jīng)成為各行各業(yè)安全防范的重要手段。然而,傳統(tǒng)的視頻監(jiān)控系統(tǒng)往往依賴人工監(jiān)控,不僅效率低下,還容易遺漏關(guān)鍵信息。為了解決這一難題,訊維推出了結(jié)合AI檢測(cè)、
    的頭像 發(fā)表于 01-16 09:33 ?1300次閱讀
    訊維<b class='flag-5'>AI</b><b class='flag-5'>視頻</b>行為分析系統(tǒng):打造全方位智能安防解決方案

    AI賦能新通話構(gòu)筑智能業(yè)務(wù)入口

    話音作為聯(lián)結(jié)全球80億人口的紐帶,承載著人與人之間最基本、最可靠的溝通需求。在科技發(fā)展日新月異的當(dāng)下,各行各業(yè)迎來前所未有的革新契機(jī)。特別是AI技術(shù)的蓬勃興起,推動(dòng)話音業(yè)務(wù)從傳統(tǒng)音視頻向多模態(tài)
    的頭像 發(fā)表于 01-06 10:49 ?639次閱讀
    <b class='flag-5'>AI</b>賦能新<b class='flag-5'>通話</b>構(gòu)筑智能業(yè)務(wù)入口

    Luma AI Ray 2視頻模型即將發(fā)布

    能夠在短短10秒內(nèi),根據(jù)用戶提供的文本和圖像提示,生成高質(zhì)量的視頻內(nèi)容。 Luma AI Ray 2視頻模型是Luma AI
    的頭像 發(fā)表于 12-20 11:37 ?710次閱讀

    OpenAI推出AI視頻生成模型Sora

    近日,備受期待的OpenAI再次推出了其創(chuàng)新之作——AI視頻生成模型Sora。這一新品的發(fā)布,無疑為AI技術(shù)注入了新的活力。 據(jù)悉,Sora與OpenAI旗下的AI工具DALL-E有著
    的頭像 發(fā)表于 12-12 09:40 ?713次閱讀

    Ambarella SoC的 CVflow? 高級(jí)AI引擎驅(qū)動(dòng) 360° 視頻會(huì)議體驗(yàn)提升

    全球大流行催化了視頻會(huì)議的繁榮,隨著公司采用混合工作模式并尋求更可持續(xù)的業(yè)務(wù)溝通方法,減少差旅,視頻會(huì)議的繁榮繼續(xù)增長。現(xiàn)在,隨著視頻會(huì)議成為現(xiàn)代商業(yè)實(shí)踐的基石,系統(tǒng)開發(fā)人員的任務(wù)是改
    的頭像 發(fā)表于 11-29 13:54 ?980次閱讀

    可靈AI全球首發(fā)視頻模型定制功能,助力AI視頻創(chuàng)作

    近日,快手旗下的可靈AI在全球范圍內(nèi)率先推出了視頻模型定制功能,這一創(chuàng)新之舉成功解決了AI視頻生成過程中人物IP穩(wěn)定性不足的難題。 據(jù)了解,用戶現(xiàn)在可以在可靈
    的頭像 發(fā)表于 11-26 14:02 ?1249次閱讀

    AIGC在視頻內(nèi)容制作的應(yīng)用前景

    AIGC技術(shù)能夠顯著縮短視頻內(nèi)容的制作周期。通過AI算法,可以快速生成視頻剪輯、特效、字幕和配樂等,減少人工操作的時(shí)間。例如,在短視頻制作
    的頭像 發(fā)表于 10-25 15:44 ?1820次閱讀

    LMK0480x低噪聲時(shí)鐘抖動(dòng)消除器數(shù)據(jù)表

    電子發(fā)燒友網(wǎng)站提供《LMK0480x低噪聲時(shí)鐘抖動(dòng)消除器數(shù)據(jù)表.pdf》資料免費(fèi)下載
    發(fā)表于 08-22 11:16 ?0次下載
    LMK0480x低噪聲時(shí)鐘<b class='flag-5'>抖動(dòng)</b><b class='flag-5'>消除</b>器數(shù)據(jù)表

    CDCM7005高性能時(shí)鐘同步器和抖動(dòng)消除器數(shù)據(jù)表

    電子發(fā)燒友網(wǎng)站提供《CDCM7005高性能時(shí)鐘同步器和抖動(dòng)消除器數(shù)據(jù)表.pdf》資料免費(fèi)下載
    發(fā)表于 08-21 11:44 ?0次下載
    CDCM7005高性能時(shí)鐘同步器和<b class='flag-5'>抖動(dòng)</b><b class='flag-5'>消除</b>器數(shù)據(jù)表

    FPGA如何消除時(shí)鐘抖動(dòng)

    在FPGA(現(xiàn)場(chǎng)可編程門陣列)設(shè)計(jì)消除時(shí)鐘抖動(dòng)是一個(gè)關(guān)鍵任務(wù),因?yàn)闀r(shí)鐘抖動(dòng)會(huì)直接影響系統(tǒng)的時(shí)序性能、穩(wěn)定性和可靠性。以下將詳細(xì)闡述FPGA
    的頭像 發(fā)表于 08-19 17:58 ?2789次閱讀