電子發(fā)燒友網(wǎng)報(bào)道(文/李彎彎)日前,在華為云數(shù)字文娛AI創(chuàng)新峰會(huì)2023上,華為云全球Marketing與銷售服務(wù)總裁石冀琳表示,在人工智能的加持下,每個(gè)人有望實(shí)現(xiàn)“數(shù)字人”自由。華為云后續(xù)將推出盤(pán)古數(shù)字人大模型,可幫助用戶12小時(shí)完成數(shù)字人生成。
數(shù)字人是指以數(shù)字形式存在于數(shù)字空間中,具有擬人或真人的外貌、行為和特點(diǎn)的虛擬人物。數(shù)字人的核心技術(shù)主要包括計(jì)算機(jī)圖形學(xué)、動(dòng)作捕捉、圖像渲染等。在互聯(lián)網(wǎng)、金融、電商、汽車出行等領(lǐng)域,相關(guān)企業(yè)紛紛推出數(shù)字人,用于品牌營(yíng)銷、智能客服等方向。
用戶可以結(jié)合個(gè)人數(shù)據(jù)對(duì)數(shù)字人進(jìn)行訓(xùn)練
盤(pán)古數(shù)字人大模型由華為云 MetaStudio 數(shù)字內(nèi)容生產(chǎn)線構(gòu)建而成。數(shù)字人基于華為云盤(pán)古基礎(chǔ)大模型能力、渲染引擎和實(shí)時(shí)音視頻能力,并使用 PB 級(jí)的音視頻數(shù)據(jù)進(jìn)行訓(xùn)練構(gòu)建。
盤(pán)古數(shù)字人大模型包含數(shù)字人形象、動(dòng)作、表情、口型、聲音等要素,每個(gè)用戶可以結(jié)合個(gè)人數(shù)據(jù)對(duì)數(shù)字人進(jìn)行訓(xùn)練,構(gòu)建自己的數(shù)字人個(gè)性化大模型。
用戶可通過(guò)多種方式生成數(shù)字人模型。1、輸入文本生成數(shù)字人:輸入文本,描述希望生成的數(shù)字人樣子,10秒生成模型,比如通過(guò)Prompt文本輸入,目前支持可選50多項(xiàng)參數(shù)來(lái)生成數(shù)字人形象,生成時(shí)間僅需10秒,而行業(yè)的一些大模型需要30秒或者更長(zhǎng)的時(shí)間。
2、通過(guò)上傳圖片生成數(shù)字人:只需要上傳一張照片,根據(jù)照片中的個(gè)人特征,生成不同類型的數(shù)字人,比如風(fēng)格化和美型數(shù)字人,這個(gè)時(shí)間僅需30秒。
3、用戶只需要拍攝一段5分鐘的視頻,也能生成個(gè)性化數(shù)字人模型,包含用戶自己的表情、口型、動(dòng)作特征,整個(gè)模型訓(xùn)練過(guò)程只需要1個(gè)小時(shí)。而業(yè)界一般需要訓(xùn)練12個(gè)小時(shí)以上?;趥€(gè)性化模型生成的數(shù)字人,將保留用戶的個(gè)性化形象、表情、動(dòng)作、聲音和口型信息。生成數(shù)字人后,可以通過(guò)對(duì)話完成對(duì)數(shù)字人的二次編輯和背景融合,比如發(fā)型、配飾、服裝等,真正做到每個(gè)人的數(shù)字人都獨(dú)一無(wú)二。
數(shù)字人生成后,預(yù)訓(xùn)練模型對(duì)輸入的驅(qū)動(dòng)方式進(jìn)行分析,從多模態(tài)信息中通過(guò)深度編碼器提取特征向量信息,驅(qū)動(dòng)生成數(shù)字人的表情、口型、肢體動(dòng)作參數(shù),并最終生成高清視頻。
通過(guò)盤(pán)古大模型,華為云數(shù)字人生產(chǎn)平臺(tái)全新升級(jí)
華為云早前就已經(jīng)推出數(shù)字人“云笙”,該數(shù)字人在2021年華為全聯(lián)接大會(huì)上就以華為數(shù)字員工的身份首次亮相。今年3月,在深圳?星河雙子塔發(fā)布會(huì),數(shù)字人“云笙”擔(dān)任主持,與真人主持人互動(dòng),帶來(lái)了非常好的營(yíng)銷效果。
作為被世界高層建筑與都市人居學(xué)會(huì)(CTBUH)授予“中國(guó)最高的等高雙子塔”認(rèn)證的地標(biāo)性建筑,星河產(chǎn)業(yè)集團(tuán)希望能夠在雙子塔發(fā)布時(shí)來(lái)一場(chǎng)與眾不同的呈現(xiàn)形式,因此就有了數(shù)字人“云笙”搭檔真人主持的方式,成了這場(chǎng)發(fā)布會(huì)的最大亮點(diǎn)。
據(jù)悉,數(shù)字人“云笙”搭檔真人主持的方式,使得深圳?星河雙子塔發(fā)布會(huì)線上直播點(diǎn)擊量達(dá)到40萬(wàn),為雙子塔發(fā)布會(huì)現(xiàn)場(chǎng)帶來(lái)了富有創(chuàng)新性的交互效果,活躍了會(huì)場(chǎng)的氛圍,提升了發(fā)布會(huì)曝光度,較星河先前項(xiàng)目發(fā)布會(huì)曝光增加不少。
不僅僅是星河產(chǎn)業(yè)集團(tuán)有這樣的訴求,很多企業(yè)都希望在品牌活動(dòng)上,通過(guò)數(shù)字人的創(chuàng)新,來(lái)增強(qiáng)科技元素,吸引更多關(guān)注。當(dāng)前,數(shù)字人在諸如這種營(yíng)銷領(lǐng)域已經(jīng)有很多成功案例。
在今年7月的華為開(kāi)發(fā)者大會(huì)2023上,華為云媒體服務(wù)部部長(zhǎng)呂陽(yáng)明發(fā)表“MetaStudio重塑數(shù)字內(nèi)容生產(chǎn),讓人人擁有個(gè)性化數(shù)字人”演講,并發(fā)布MetaStudio數(shù)字人生產(chǎn)平臺(tái)全新升級(jí)。華為云通過(guò)盤(pán)古基礎(chǔ)大模型,賦能MetaStudio數(shù)字內(nèi)容生產(chǎn)線全新升級(jí),提供模型生成和模型驅(qū)動(dòng)兩大服務(wù)。
基于以上模型生成和模型驅(qū)動(dòng)兩大服務(wù),開(kāi)發(fā)者可以快速生成和驅(qū)動(dòng)數(shù)字人模型,從“0101的比特傳輸”走向“有溫度的模型交互”??梢钥吹皆诒P(pán)古基礎(chǔ)大模型的助力下,將能夠提供更強(qiáng)大更智慧的數(shù)字人服務(wù)。
近年來(lái),數(shù)字人的應(yīng)用范圍越來(lái)越普遍,從娛樂(lè)、直播、虛擬偶像、綜藝、形象代言等市場(chǎng),逐漸輻射至體育、金融、醫(yī)療、教育等更加廣闊的服務(wù)領(lǐng)域。
據(jù)介紹,中影年年依托華為云MetaStudio數(shù)字內(nèi)容生產(chǎn)平臺(tái),結(jié)合其自身在數(shù)字內(nèi)容領(lǐng)域強(qiáng)大的技術(shù)能力及創(chuàng)作經(jīng)驗(yàn),并依托自身儲(chǔ)備的上千萬(wàn)套同標(biāo)準(zhǔn)且高品質(zhì)的數(shù)字資產(chǎn)為豐富的AIGC數(shù)據(jù)訓(xùn)練集賦能,從而推出了云上數(shù)字人生產(chǎn)平臺(tái)AI-BOX。
通過(guò)1張照片在1分鐘內(nèi)快速生成數(shù)字人的現(xiàn)場(chǎng)演示,展示3D數(shù)字人從自動(dòng)化建模、自動(dòng)綁定、智能驅(qū)動(dòng)、高精度渲染到最終視頻合成的一站式生產(chǎn)服務(wù)能力。
小結(jié)
近幾年來(lái),數(shù)字人已經(jīng)在越來(lái)越多領(lǐng)域展現(xiàn)出應(yīng)用優(yōu)勢(shì)。如今,在大模型的支持下,數(shù)字人也表現(xiàn)出更高的生產(chǎn)效率,更智慧的互動(dòng)效果,比如,盤(pán)古大數(shù)字人大模型,通過(guò)對(duì)音視頻數(shù)據(jù)進(jìn)行訓(xùn)練,數(shù)字人的生產(chǎn)效率極大提升。在如此背景下,數(shù)字人的發(fā)展將更值得期待。
數(shù)字人是指以數(shù)字形式存在于數(shù)字空間中,具有擬人或真人的外貌、行為和特點(diǎn)的虛擬人物。數(shù)字人的核心技術(shù)主要包括計(jì)算機(jī)圖形學(xué)、動(dòng)作捕捉、圖像渲染等。在互聯(lián)網(wǎng)、金融、電商、汽車出行等領(lǐng)域,相關(guān)企業(yè)紛紛推出數(shù)字人,用于品牌營(yíng)銷、智能客服等方向。
用戶可以結(jié)合個(gè)人數(shù)據(jù)對(duì)數(shù)字人進(jìn)行訓(xùn)練
盤(pán)古數(shù)字人大模型由華為云 MetaStudio 數(shù)字內(nèi)容生產(chǎn)線構(gòu)建而成。數(shù)字人基于華為云盤(pán)古基礎(chǔ)大模型能力、渲染引擎和實(shí)時(shí)音視頻能力,并使用 PB 級(jí)的音視頻數(shù)據(jù)進(jìn)行訓(xùn)練構(gòu)建。
盤(pán)古數(shù)字人大模型包含數(shù)字人形象、動(dòng)作、表情、口型、聲音等要素,每個(gè)用戶可以結(jié)合個(gè)人數(shù)據(jù)對(duì)數(shù)字人進(jìn)行訓(xùn)練,構(gòu)建自己的數(shù)字人個(gè)性化大模型。
用戶可通過(guò)多種方式生成數(shù)字人模型。1、輸入文本生成數(shù)字人:輸入文本,描述希望生成的數(shù)字人樣子,10秒生成模型,比如通過(guò)Prompt文本輸入,目前支持可選50多項(xiàng)參數(shù)來(lái)生成數(shù)字人形象,生成時(shí)間僅需10秒,而行業(yè)的一些大模型需要30秒或者更長(zhǎng)的時(shí)間。
2、通過(guò)上傳圖片生成數(shù)字人:只需要上傳一張照片,根據(jù)照片中的個(gè)人特征,生成不同類型的數(shù)字人,比如風(fēng)格化和美型數(shù)字人,這個(gè)時(shí)間僅需30秒。
3、用戶只需要拍攝一段5分鐘的視頻,也能生成個(gè)性化數(shù)字人模型,包含用戶自己的表情、口型、動(dòng)作特征,整個(gè)模型訓(xùn)練過(guò)程只需要1個(gè)小時(shí)。而業(yè)界一般需要訓(xùn)練12個(gè)小時(shí)以上?;趥€(gè)性化模型生成的數(shù)字人,將保留用戶的個(gè)性化形象、表情、動(dòng)作、聲音和口型信息。生成數(shù)字人后,可以通過(guò)對(duì)話完成對(duì)數(shù)字人的二次編輯和背景融合,比如發(fā)型、配飾、服裝等,真正做到每個(gè)人的數(shù)字人都獨(dú)一無(wú)二。
數(shù)字人生成后,預(yù)訓(xùn)練模型對(duì)輸入的驅(qū)動(dòng)方式進(jìn)行分析,從多模態(tài)信息中通過(guò)深度編碼器提取特征向量信息,驅(qū)動(dòng)生成數(shù)字人的表情、口型、肢體動(dòng)作參數(shù),并最終生成高清視頻。
通過(guò)盤(pán)古大模型,華為云數(shù)字人生產(chǎn)平臺(tái)全新升級(jí)
華為云早前就已經(jīng)推出數(shù)字人“云笙”,該數(shù)字人在2021年華為全聯(lián)接大會(huì)上就以華為數(shù)字員工的身份首次亮相。今年3月,在深圳?星河雙子塔發(fā)布會(huì),數(shù)字人“云笙”擔(dān)任主持,與真人主持人互動(dòng),帶來(lái)了非常好的營(yíng)銷效果。
作為被世界高層建筑與都市人居學(xué)會(huì)(CTBUH)授予“中國(guó)最高的等高雙子塔”認(rèn)證的地標(biāo)性建筑,星河產(chǎn)業(yè)集團(tuán)希望能夠在雙子塔發(fā)布時(shí)來(lái)一場(chǎng)與眾不同的呈現(xiàn)形式,因此就有了數(shù)字人“云笙”搭檔真人主持的方式,成了這場(chǎng)發(fā)布會(huì)的最大亮點(diǎn)。
據(jù)悉,數(shù)字人“云笙”搭檔真人主持的方式,使得深圳?星河雙子塔發(fā)布會(huì)線上直播點(diǎn)擊量達(dá)到40萬(wàn),為雙子塔發(fā)布會(huì)現(xiàn)場(chǎng)帶來(lái)了富有創(chuàng)新性的交互效果,活躍了會(huì)場(chǎng)的氛圍,提升了發(fā)布會(huì)曝光度,較星河先前項(xiàng)目發(fā)布會(huì)曝光增加不少。
不僅僅是星河產(chǎn)業(yè)集團(tuán)有這樣的訴求,很多企業(yè)都希望在品牌活動(dòng)上,通過(guò)數(shù)字人的創(chuàng)新,來(lái)增強(qiáng)科技元素,吸引更多關(guān)注。當(dāng)前,數(shù)字人在諸如這種營(yíng)銷領(lǐng)域已經(jīng)有很多成功案例。
在今年7月的華為開(kāi)發(fā)者大會(huì)2023上,華為云媒體服務(wù)部部長(zhǎng)呂陽(yáng)明發(fā)表“MetaStudio重塑數(shù)字內(nèi)容生產(chǎn),讓人人擁有個(gè)性化數(shù)字人”演講,并發(fā)布MetaStudio數(shù)字人生產(chǎn)平臺(tái)全新升級(jí)。華為云通過(guò)盤(pán)古基礎(chǔ)大模型,賦能MetaStudio數(shù)字內(nèi)容生產(chǎn)線全新升級(jí),提供模型生成和模型驅(qū)動(dòng)兩大服務(wù)。
基于以上模型生成和模型驅(qū)動(dòng)兩大服務(wù),開(kāi)發(fā)者可以快速生成和驅(qū)動(dòng)數(shù)字人模型,從“0101的比特傳輸”走向“有溫度的模型交互”??梢钥吹皆诒P(pán)古基礎(chǔ)大模型的助力下,將能夠提供更強(qiáng)大更智慧的數(shù)字人服務(wù)。
近年來(lái),數(shù)字人的應(yīng)用范圍越來(lái)越普遍,從娛樂(lè)、直播、虛擬偶像、綜藝、形象代言等市場(chǎng),逐漸輻射至體育、金融、醫(yī)療、教育等更加廣闊的服務(wù)領(lǐng)域。
據(jù)介紹,中影年年依托華為云MetaStudio數(shù)字內(nèi)容生產(chǎn)平臺(tái),結(jié)合其自身在數(shù)字內(nèi)容領(lǐng)域強(qiáng)大的技術(shù)能力及創(chuàng)作經(jīng)驗(yàn),并依托自身儲(chǔ)備的上千萬(wàn)套同標(biāo)準(zhǔn)且高品質(zhì)的數(shù)字資產(chǎn)為豐富的AIGC數(shù)據(jù)訓(xùn)練集賦能,從而推出了云上數(shù)字人生產(chǎn)平臺(tái)AI-BOX。
通過(guò)1張照片在1分鐘內(nèi)快速生成數(shù)字人的現(xiàn)場(chǎng)演示,展示3D數(shù)字人從自動(dòng)化建模、自動(dòng)綁定、智能驅(qū)動(dòng)、高精度渲染到最終視頻合成的一站式生產(chǎn)服務(wù)能力。
小結(jié)
近幾年來(lái),數(shù)字人已經(jīng)在越來(lái)越多領(lǐng)域展現(xiàn)出應(yīng)用優(yōu)勢(shì)。如今,在大模型的支持下,數(shù)字人也表現(xiàn)出更高的生產(chǎn)效率,更智慧的互動(dòng)效果,比如,盤(pán)古大數(shù)字人大模型,通過(guò)對(duì)音視頻數(shù)據(jù)進(jìn)行訓(xùn)練,數(shù)字人的生產(chǎn)效率極大提升。在如此背景下,數(shù)字人的發(fā)展將更值得期待。
聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。
舉報(bào)投訴
-
大模型
+關(guān)注
關(guān)注
2文章
2941瀏覽量
3683
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
2 分鐘生成數(shù)字人視頻!華為云 Flexus 數(shù)字人助力中小企業(yè)高效創(chuàng)作
彌補(bǔ),現(xiàn)在只需幾分鐘的真人視頻就可以生成逼真的數(shù)字人,極大地降低了制作門(mén)檻,讓中小企業(yè)也得以享受數(shù)字人技術(shù)發(fā)展的紅利。 站在中小企業(yè)的角度上,如果也想體驗(yàn)低門(mén)檻的數(shù)字人技術(shù),不如試試全

盤(pán)古信息IMS:引領(lǐng)PCB行業(yè)數(shù)字化轉(zhuǎn)型與決策升級(jí)的新引擎
盤(pán)古信息IMS數(shù)字化解決方案成功打破了傳統(tǒng)模式中各系統(tǒng)獨(dú)立運(yùn)作的壁壘,讓企業(yè)在復(fù)雜多變的市場(chǎng)環(huán)境中實(shí)現(xiàn)“彎道超車”。通過(guò)系統(tǒng)的高效集成,企業(yè)能夠迅速響應(yīng)市場(chǎng)變化,優(yōu)化資源配置,實(shí)現(xiàn)上下協(xié)同發(fā)展的智能化、高效化運(yùn)營(yíng)。

【「具身智能機(jī)器人系統(tǒng)」閱讀體驗(yàn)】2.具身智能機(jī)器人大模型
近年來(lái),人工智能領(lǐng)域的大模型技術(shù)在多個(gè)方向上取得了突破性的進(jìn)展,特別是在機(jī)器人控制領(lǐng)域展現(xiàn)出了巨大的潛力。在“具身智能機(jī)器人大模型”部分,作者研究并探討了大模型如何提升機(jī)器人的能力,大
發(fā)表于 12-29 23:04
ADS553模擬量是怎么轉(zhuǎn)換成數(shù)字量的?
您好!請(qǐng)問(wèn)ADS553這個(gè)AD芯片,它的輸入是差分輸入,有兩個(gè)參考電壓,輸出是14位二進(jìn)制補(bǔ)碼格式,我想問(wèn):對(duì)于差分輸入的AD,模擬量是怎么轉(zhuǎn)換成數(shù)字量的,比如:當(dāng)輸出為14個(gè)1時(shí),我的AD差分
發(fā)表于 12-27 06:10
如何在不使用ADC的情況下,將模擬電壓轉(zhuǎn)換成數(shù)字電壓?
為了使系統(tǒng)隔離想把模擬電源轉(zhuǎn)換成數(shù)字電源,但不想通過(guò)ADC實(shí)現(xiàn)。有沒(méi)有可以參考的電路設(shè)計(jì)或者芯片
發(fā)表于 11-28 08:39
科大訊飛發(fā)布星火超擬人數(shù)字人
了語(yǔ)義貫穿的“口唇-表情-動(dòng)作”的超擬人數(shù)字人生成。這一技術(shù)的突破,使得數(shù)字人在表達(dá)情感和動(dòng)作時(shí)更加真實(shí)、自然,如同在和真人進(jìn)行對(duì)話一般。 在科大訊飛的演示中,我們可以看到由大模型
TLV320AIC3204音頻采集后模擬量變成數(shù)字量是否經(jīng)過(guò)了編碼?
aic3204音頻采集后模擬量變成數(shù)字量是否經(jīng)過(guò)了編碼,還是說(shuō)就是模擬量電壓的對(duì)應(yīng)賦值,
我輸出了一個(gè)1KHz的正弦信號(hào),示波器里顯示的正弦波形,而程序里數(shù)字量形成的波形根本不是,請(qǐng)知道原因的朋友解答一下
發(fā)表于 10-18 07:59
生成式AI模型推進(jìn)數(shù)字生物學(xué)發(fā)展
Meta 的開(kāi)放大語(yǔ)言模型(已優(yōu)化并可作為 NVIDIA NIM 下載)為數(shù)字健康和生命科學(xué)工作流提供動(dòng)力支持。
如影數(shù)字人生成平臺(tái)SenseAvatar上線微軟全球云市場(chǎng)
近日,如影數(shù)字人生成平臺(tái)SenseAvatar正式在微軟全球云市場(chǎng)Microsoft Azure Marketplace上線,為客戶提供高質(zhì)量的數(shù)字人內(nèi)容制作服務(wù)。
聲智完成多項(xiàng)生成式算法和大模型服務(wù)備案
2024年7月20日,北京聲智科技有限公司依據(jù)國(guó)家《生成式人工智能服務(wù)管理暫行辦法》,順利完成了壹元大模型的生成式人工智能(大語(yǔ)言模型)服務(wù)

華為HDC 2024看點(diǎn) 華為云盤(pán)古大模型5.0正式發(fā)布
在華為開(kāi)發(fā)者大會(huì)2024(HDC 2024)上,華為常務(wù)董事、華為云CEO張平安正式發(fā)布盤(pán)古大模型5.0,在全系列、多模態(tài)、強(qiáng)思維三個(gè)方面全新升級(jí);張平安還分享了盤(pán)古大模型在自動(dòng)駕駛、

【紫光同創(chuàng)盤(pán)古PGX-Nano教程】——(盤(pán)古PGX-Nano開(kāi)發(fā)板/PG2L50H_MBG324第九章)數(shù)字鐘實(shí)驗(yàn)例程
按鍵用于時(shí)鐘校準(zhǔn)。
K0用于切換正常計(jì)時(shí),校準(zhǔn)小時(shí)和分鐘
K1用于時(shí)鐘的“+”
K2用于時(shí)鐘的“-”
校準(zhǔn)相應(yīng)的刻度,該數(shù)碼管閃爍。
四:實(shí)驗(yàn)原理
從上述的實(shí)驗(yàn)要求分析可得到此數(shù)字鐘我們實(shí)現(xiàn)
發(fā)表于 06-21 18:48
數(shù)字信號(hào)發(fā)生器頻率調(diào)整方式有幾種
數(shù)字信號(hào)發(fā)生器(Digital Signal Generator,簡(jiǎn)稱DSG)是一種用于生成數(shù)字信號(hào)的設(shè)備,廣泛應(yīng)用于通信、電子測(cè)量、自動(dòng)測(cè)試等領(lǐng)域。數(shù)字信號(hào)發(fā)生器的頻率調(diào)整方式對(duì)于信號(hào)的精確度
模擬信號(hào)可以通過(guò)什么變成數(shù)字信號(hào)
轉(zhuǎn)換(Analog-to-Digital Conversion,簡(jiǎn)稱ADC)。本文將詳細(xì)介紹模擬信號(hào)如何通過(guò)ADC變成數(shù)字信號(hào),包括ADC的基本原理、主要類型、性能指標(biāo)以及應(yīng)用場(chǎng)景。 一、模擬信號(hào)與數(shù)字信號(hào)的區(qū)別 在討論模擬信號(hào)如何轉(zhuǎn)換為
【大語(yǔ)言模型:原理與工程實(shí)踐】大語(yǔ)言模型的應(yīng)用
類任務(wù)上表現(xiàn)出色,甚至在零樣本條件下也能取得良好效果。另一類則需要逐步推理才能完成的任務(wù),類似于人類的系統(tǒng)2,如數(shù)字推理等。然而,隨著參數(shù)量的增加,大語(yǔ)言模型在這類任務(wù)上并未出現(xiàn)質(zhì)的飛躍,除非有精心
發(fā)表于 05-07 17:21
評(píng)論