一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

新版NVIDIA Maxine為實(shí)時(shí)音頻和視頻通信鋪平道路

NVIDIA英偉達(dá) ? 來源:NVIDIA英偉達(dá) ? 作者:NVIDIA英偉達(dá) ? 2022-09-26 09:19 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

搶先體驗(yàn) AI 微服務(wù)在云端提供的優(yōu)質(zhì)通信

新版NVIDIA Maxine為實(shí)時(shí)音頻視頻通信鋪平了道路。無論是參加視頻會(huì)議、致電客戶服務(wù)中心,還是進(jìn)行直播,Maxine 都能夠助您實(shí)現(xiàn)清晰明確的溝通,增強(qiáng)虛擬交互的效果。

NVIDIA Maxine 是一套由 GPU 加速的 AI 軟件開發(fā)套件 (SDK) 和云原生微服務(wù),用于部署經(jīng)過優(yōu)化和加速的 AI 功能,可達(dá)到實(shí)時(shí)增強(qiáng)音頻、視頻和增強(qiáng)現(xiàn)實(shí) (AR) 效果的目的。

借助 Maxine 的先進(jìn)模型,最終用戶無需使用昂貴的設(shè)備即可改進(jìn)音頻和視頻質(zhì)量?;?NVIDIA AI 的技術(shù)使標(biāo)準(zhǔn)的麥克風(fēng)和攝像頭設(shè)備也能夠達(dá)到這些高質(zhì)量的效果。

在 GTC 上,NVIDIA 宣布為云原生微服務(wù)重新構(gòu)建 Maxine,并推出了 Maxine 音頻效果微服務(wù)的搶先體驗(yàn)版。此外,還推出了新的 Maxine SDK 功能,包括發(fā)言者聚焦和人臉表情估計(jì),并正式推出了眼神交流功能。NVIDIA Maxine 現(xiàn)在還包含現(xiàn)有 SDK 功能的增強(qiáng)版。

Maxine 實(shí)現(xiàn)云原生

Maxine 的云原生微服務(wù)允許開發(fā)者構(gòu)建實(shí)時(shí) AI 應(yīng)用。微服務(wù)可以獨(dú)立管理,并在云端進(jìn)行無縫部署,從而縮短開發(fā)周期。

搶先體驗(yàn)版的 Audio Effects 微服務(wù)中包含四種先進(jìn)的音頻功能:

背景噪音消除:使用 AI 模型消除多種常見的背景噪音,同時(shí)保留說話者的自然聲音。

房間回聲消除:使用 AI 模型消除音頻中的混響,恢復(fù)說話者聲音的清晰度。

音頻超高分辨率:提高音頻信號(hào)的時(shí)間分辨率,改善音頻質(zhì)量。該功能目前支持 8 kHz 到 16 kHz 以及 16 kHz 到 48 kHz 的上采樣。

聲學(xué)回聲消除:消除輸入音頻流中的實(shí)時(shí)聲學(xué)設(shè)備回聲,從而去除不匹配的聲對(duì)和雙聲。借助基于 AI 的技術(shù),Maxine 實(shí)現(xiàn)了比傳統(tǒng)數(shù)字信號(hào)處理算法更有效的回聲消除。

Pexip 是一家領(lǐng)先的企業(yè)視頻會(huì)議和協(xié)作解決方案提供商,正在利用 NVIDIA 的 AI 技術(shù)將虛擬會(huì)議提升到更高水平,為現(xiàn)代員工隊(duì)伍提供先進(jìn)的功能。

Pexip 戰(zhàn)略聯(lián)盟高級(jí)副總裁 Eddie Clifton 表示:“隨著 Maxine 向云原生微服務(wù)的轉(zhuǎn)化,我們能夠更加輕松地將 NVIDIA 的先進(jìn) AI 技術(shù)與我們獨(dú)特的服務(wù)器端架構(gòu)結(jié)合起來。這使我們的 Pexip 團(tuán)隊(duì)能夠?yàn)樘摂M會(huì)議提供更強(qiáng)的體驗(yàn)?!?/p>

探索 SDK 的增強(qiáng)功能

Maxine 提供了三款由 GPU 加速的 SDK,能夠通過 AI 重塑實(shí)時(shí)通信的音頻、視頻和 AR 效果。

音頻效果 SDK 可提供多效果、低延遲,以及基于 AI 的音頻質(zhì)量增強(qiáng)算法。發(fā)言者聚焦是搶先體驗(yàn)版中的新功能,該功能能夠分離前景和背景發(fā)言者的音軌,使聽眾能夠更加輕松地識(shí)別每種聲音。此外,還更新了音頻超高分辨率SDK 功能,使其具備更高的質(zhì)量。

視頻效果 SDK 會(huì)使用標(biāo)準(zhǔn)網(wǎng)絡(luò)攝像頭輸入創(chuàng)建基于 AI 的視頻效果。虛擬背景功能已獲得更新,增強(qiáng)了時(shí)間穩(wěn)定性,該功能能夠分割個(gè)人形象并應(yīng)用由 AI 驅(qū)動(dòng)的背景去除、替換或模糊功能。

AR SDK 基于標(biāo)準(zhǔn)網(wǎng)絡(luò)攝像頭饋送,提供基于 AI 的實(shí)時(shí) 3D 面部追蹤和身體姿態(tài)估計(jì)。新功能包括:

眼神交流:通過預(yù)估和將視線與攝像頭對(duì)齊來模擬眼神交流。

人臉表情估計(jì):追蹤人臉并推斷主體所呈現(xiàn)的表情。

更新了以下 AR 功能:

身體姿態(tài)估計(jì):以 2D 和 3D 形式預(yù)測(cè)和追蹤人體的 34 個(gè)關(guān)鍵點(diǎn),并且現(xiàn)已支持多人追蹤。

面部特征點(diǎn)追蹤:使用 126 個(gè)關(guān)鍵點(diǎn)來識(shí)別面部特征和輪廓?,F(xiàn)已可使用“畫質(zhì)”模式來追蹤由于頭部運(yùn)動(dòng)和表情造成的頭部姿勢(shì)和面部變形(實(shí)時(shí)追蹤的自由度為 3 度),實(shí)現(xiàn)了更高質(zhì)量的跟蹤效果。

人臉網(wǎng)格:以高達(dá) 3000 個(gè)頂點(diǎn)和 6 個(gè)自由度的 3D 網(wǎng)格表示人臉,并且現(xiàn)在包括USC 創(chuàng)意技術(shù)研究所的 3D 可變形模型。

直接體驗(yàn) Maxine 的驚艷效果。

體驗(yàn)由 AI 的強(qiáng)大功能帶來的先進(jìn)效果

Maxine SDK 和微服務(wù)可為您提供一套低延遲的 AI 效果,且可與現(xiàn)有的客戶基礎(chǔ)設(shè)施進(jìn)行集成。由于 Maxine 的尖端 AI 功能的構(gòu)建以 NVIDIA AI 平臺(tái)為基礎(chǔ),并且擁有領(lǐng)先的預(yù)訓(xùn)練模型,所以開發(fā)者用戶可利用其來創(chuàng)建、定制和部署優(yōu)質(zhì)的音頻和視頻質(zhì)量功能。

Maxine 也是NVIDIA Omniverse Avatar Cloud Engine的一部分,NVIDIA Omniverse Avatar Cloud Engine 是一系列基于云的 AI 模型和服務(wù),可供開發(fā)者構(gòu)建、定制和部署交互式虛擬形象。Maxine 的可定制云原生微服務(wù)允許您在 AI 效果制作流程中進(jìn)行獨(dú)立部署。而且,您可以在本地、云端或邊緣部署 Maxine。

審核編輯:湯梓紅

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5299

    瀏覽量

    106290
  • AI
    AI
    +關(guān)注

    關(guān)注

    88

    文章

    35041

    瀏覽量

    279072
  • 云原生
    +關(guān)注

    關(guān)注

    0

    文章

    260

    瀏覽量

    8265

原文標(biāo)題:GTC22 | 全新 NVIDIA Maxine 云原生架構(gòu)可大規(guī)模實(shí)現(xiàn)突破性影音質(zhì)量

文章出處:【微信號(hào):NVIDIA_China,微信公眾號(hào):NVIDIA英偉達(dá)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    樂鑫ESP-RTC實(shí)時(shí)視頻通信方案

    ESP-RTC樂鑫科技推出ESP-RTC(Real-TimeCommunication)音視頻通信方案,能夠?qū)崿F(xiàn)穩(wěn)定流暢、超低延時(shí)的語(yǔ)音和視頻實(shí)時(shí)
    的頭像 發(fā)表于 05-26 18:07 ?264次閱讀
    樂鑫ESP-RTC<b class='flag-5'>實(shí)時(shí)</b>音<b class='flag-5'>視頻</b><b class='flag-5'>通信</b>方案

    羅德與施瓦茨和高通合作加速下一代無線通信發(fā)展

    羅德與施瓦茨(以下簡(jiǎn)稱“R&S”)與高通成功驗(yàn)證了13 GHz頻段的5G NR連接的高吞吐量性能,該頻段屬于擬議的FR3頻率范圍。雙方在MWC 2025大會(huì)上聯(lián)合展示這一里程碑技術(shù)成果,下一代無線網(wǎng)絡(luò)的發(fā)展鋪平道路。
    的頭像 發(fā)表于 03-05 16:26 ?536次閱讀

    哈佛新技術(shù)為先進(jìn)機(jī)器視覺鋪平道路

    了在醫(yī)療、AR和智能手機(jī)技術(shù)中的應(yīng)用,增強(qiáng)了實(shí)時(shí)和機(jī)器學(xué)習(xí)集成成像能力。 想想我們根據(jù)物體與光波長(zhǎng)的相互作用(又稱顏色)獲得的所有信息。顏色可以告訴我們食物是否可以安全食用,或者一塊金屬是否發(fā)熱。在醫(yī)學(xué)上,顏色是一種重要的診斷工具,可以幫
    的頭像 發(fā)表于 02-06 06:27 ?380次閱讀
    哈佛新技術(shù)為先進(jìn)機(jī)器視覺<b class='flag-5'>鋪平道路</b>

    車載氣象監(jiān)測(cè)站:實(shí)時(shí)監(jiān)測(cè)道路風(fēng)速風(fēng)向溫濕度氣壓揚(yáng)塵等

    在復(fù)雜多變的道路環(huán)境中,駕駛者需要時(shí)刻關(guān)注天氣變化,以確保行車安全。車載氣象監(jiān)測(cè)站應(yīng)運(yùn)而生,它集成了高精度傳感器,能夠實(shí)時(shí)監(jiān)測(cè)道路的風(fēng)速、風(fēng)向、溫濕度、氣壓以及揚(yáng)塵等關(guān)鍵氣象參數(shù)。 通過實(shí)時(shí)
    的頭像 發(fā)表于 01-22 13:32 ?452次閱讀

    NVIDIA技術(shù)助力Pantheon Lab數(shù)字人實(shí)時(shí)交互解決方案

    本案例中,Pantheon Lab(萬(wàn)想科技)專注于數(shù)字人技術(shù)解決方案,通過 NVIDIA 技術(shù)實(shí)現(xiàn)數(shù)字人實(shí)時(shí)對(duì)話與客戶互動(dòng)交流。借助 NVIDIA GPU、NVIDIA Tensor
    的頭像 發(fā)表于 01-14 11:19 ?622次閱讀

    聯(lián)發(fā)科與NVIDIA合作 NVIDIA 個(gè)人AI超級(jí)計(jì)算機(jī)設(shè)計(jì)NVIDIA GB10超級(jí)芯片

    ,各類采用Arm架構(gòu)SoC的設(shè)備提供卓越的AI、通信、多媒體與高能效用戶體驗(yàn)。聯(lián)發(fā)科將豐富的專業(yè)技術(shù)帶入此次與NVIDIA的合作中,以共同打造業(yè)界先進(jìn)的平臺(tái)。 聯(lián)發(fā)科副董事
    的頭像 發(fā)表于 01-07 16:26 ?591次閱讀

    如何在播放視頻過程中插入音頻

    ZDP14x0是一款基于開源GUI引擎的圖像顯示專用驅(qū)動(dòng)芯片,可以通過串口或者SPI與其他芯片通信,且能播放視頻。本文將介紹如何在播放視頻過程中插入音頻。
    的頭像 發(fā)表于 12-26 11:13 ?1068次閱讀
    如何在播放<b class='flag-5'>視頻</b>過程中插入<b class='flag-5'>音頻</b>

    蘋果預(yù)訂M5芯片,預(yù)計(jì)2025年底投產(chǎn)

    據(jù)最新媒體報(bào)道,蘋果公司已經(jīng)向臺(tái)積電預(yù)訂了下一代M5芯片,未來的設(shè)備生產(chǎn)開發(fā)鋪平道路。這款M5系列芯片預(yù)計(jì)將采用增強(qiáng)型ARM架構(gòu),并借助臺(tái)積電先進(jìn)的3納米制程技術(shù)進(jìn)行制造。
    的頭像 發(fā)表于 12-03 10:44 ?724次閱讀

    高清視頻線與音頻線的連接方式

    隨著家庭娛樂系統(tǒng)的不斷升級(jí),高清視頻和高質(zhì)量音頻成為了現(xiàn)代家庭影院系統(tǒng)的重要組成部分。 1. 了解不同類型的連接線 在開始連接之前,了解不同類型的連接線是非常重要的。常見的高清視頻線包括HDMI
    的頭像 發(fā)表于 10-30 16:11 ?2020次閱讀

    想通過手機(jī)音頻口實(shí)現(xiàn)與MCU的實(shí)時(shí)通信,有沒有體積較小,開發(fā)起來難度較小的音頻解碼芯片?

    想通過手機(jī)音頻口實(shí)現(xiàn)與MCU的實(shí)時(shí)通信,有沒有體積較小,開發(fā)起來難度較小的音頻解碼芯片?
    發(fā)表于 10-25 07:44

    NVIDIA Parabricks v4.3.1版本的新功能

    會(huì)(ESHG)上發(fā)布,其加入了新的體細(xì)胞數(shù)據(jù)變異檢測(cè)功能,并將業(yè)內(nèi)領(lǐng)先的工具升級(jí)到最新版本。這個(gè)版本是繼在 NVIDIA GTC 2024 大會(huì)上發(fā)布 Parabricks v4.3 之后推出的新版本。
    的頭像 發(fā)表于 09-10 10:22 ?801次閱讀
    <b class='flag-5'>NVIDIA</b> Parabricks v4.3.1版本的新功能

    IB Verbs和NVIDIA DOCA GPUNetIO性能測(cè)試

    NVIDIA DOCA GPUNetIO 是 NVIDIA DOCA SDK 中的一個(gè)庫(kù),專門實(shí)時(shí)在線 GPU 數(shù)據(jù)包處理而設(shè)計(jì)。它結(jié)合了 GPUDirect RDMA 和 GPUD
    的頭像 發(fā)表于 08-23 17:03 ?1328次閱讀
    IB Verbs和<b class='flag-5'>NVIDIA</b> DOCA GPUNetIO性能測(cè)試

    英偉達(dá)發(fā)布新版NVIDIAApp

    英偉達(dá)推出了 NVIDIA App 測(cè)試版?10.0.2 版本,?NVIDIA App新版本新增功能包括顯示設(shè)置、RTX 視頻增強(qiáng)控制、應(yīng)用排序,以及面向其他國(guó)家 / 地區(qū)用戶的應(yīng)用翻
    的頭像 發(fā)表于 08-07 16:16 ?1147次閱讀

    可以使用esp8266處理實(shí)時(shí)視頻音頻流到服務(wù)器到移動(dòng)設(shè)備?

    各位專家,您好: 我是 esp8266 的新手,我正在做一個(gè)項(xiàng)目,我需要使用 esp8266 使用服務(wù)器到移動(dòng)設(shè)備處理實(shí)時(shí)視頻音頻流??梢允褂?esp8266 處理實(shí)時(shí)
    發(fā)表于 07-19 08:40

    【新品】隔離型一轉(zhuǎn)多路RS485中繼器,高速傳輸,穩(wěn)定通信必備

    隨著電動(dòng)汽車的普及,智能電網(wǎng)正在構(gòu)建兼容的充電網(wǎng)絡(luò),實(shí)現(xiàn)能源的高效分配和管理。融合了傳統(tǒng)電網(wǎng)與先進(jìn)的通信技術(shù)的智能電網(wǎng)構(gòu)建更加高效、環(huán)保和可靠的能源體系鋪平道路。RS485中繼器能夠?qū)F(xiàn)代先進(jìn)
    的頭像 發(fā)表于 07-19 08:21 ?782次閱讀
    【新品】隔離型一轉(zhuǎn)多路RS485中繼器,高速傳輸,穩(wěn)定<b class='flag-5'>通信</b>必備