AI數(shù)字人的底層邏輯主要基于兩種操作機(jī)制。一種是智能驅(qū)動(dòng)型數(shù)字人,這種類型的數(shù)字人通過智能系統(tǒng)自動(dòng)讀取和解析外界輸入信息,然后根據(jù)解析結(jié)果決策數(shù)字人后續(xù)的輸出文本,最后驅(qū)動(dòng)人物模型生成相應(yīng)的語音與動(dòng)作,實(shí)現(xiàn)與用戶的互動(dòng)。這個(gè)人物模型是通過AI技術(shù)預(yù)先訓(xùn)練得到的,能夠通過文本驅(qū)動(dòng)生成語音和對應(yīng)動(dòng)畫,業(yè)內(nèi)將此模型稱為 TTSA(Text To Speech & Animation)人物模型。
另一種是真人驅(qū)動(dòng)型數(shù)字人,其核心原理是由真人根據(jù)視頻監(jiān)控系統(tǒng)傳來的用戶視頻,與用戶進(jìn)行實(shí)時(shí)語音交流,同時(shí)通過動(dòng)作捕捉采集系統(tǒng)將真人的表情、動(dòng)作呈現(xiàn)在虛擬數(shù)字人形象上,從而實(shí)現(xiàn)與用戶的交互。
從技術(shù)角度來看,AI數(shù)字人的本質(zhì)是人工智能的一種進(jìn)化。它整合了人物形象模擬、人物聲音克隆、自然語言處理、知識圖譜解析等眾多世界領(lǐng)先的人工智能技術(shù),提供了一種可以隨時(shí)隨地與真人進(jìn)行準(zhǔn)確交互性對話的方式。背后的技術(shù)原理涉及到符號主義、聯(lián)結(jié)主義和行為主義等多種研究視角。
隨著新技術(shù)浪潮的推動(dòng),虛擬數(shù)字人的制作過程得到有效簡化,性能也得到飛躍式提升,開始從外觀的數(shù)字化逐漸深入到行為的交互化、思想的智能化?,F(xiàn)在,以虛擬主播、虛擬員工等為代表的數(shù)字人已經(jīng)開始在影視、游戲、傳媒、文旅、金融等眾多領(lǐng)域大放異彩。
審核編輯 黃宇
-
AI
+關(guān)注
關(guān)注
88文章
35194瀏覽量
280235 -
人工智能
+關(guān)注
關(guān)注
1807文章
49035瀏覽量
249739 -
數(shù)字人
+關(guān)注
關(guān)注
0文章
153瀏覽量
2296
發(fā)布評論請先 登錄
從底層邏輯到架構(gòu)設(shè)計(jì):聚徽解析MES看板的技術(shù)實(shí)現(xiàn)路徑
地平線余凱稱輔助駕駛的底層邏輯正在改寫
生成式人工智能認(rèn)證:重塑AI職業(yè)生態(tài)的底層邏輯
OBOO鷗柏丨AI數(shù)字人觸摸屏查詢觸控人臉識別語音交互一體機(jī)上市

邏輯推理AI智能體的實(shí)際應(yīng)用
鴻道Intewell操作系統(tǒng):人形機(jī)器人底層操作系統(tǒng)
大象機(jī)器人攜手進(jìn)迭時(shí)空推出 RISC-V 全棧開源六軸機(jī)械臂產(chǎn)品
SMA 接頭與 PCB 原理圖連接的底層邏輯

【「零基礎(chǔ)開發(fā)AI Agent」閱讀體驗(yàn)】+初品Agent
鴻道AI機(jī)器人操作系統(tǒng)亮相中關(guān)村論壇

一文讀懂:SMA插頭與PCB原理圖連接的底層邏輯

雙十一百元投入即可擁有數(shù)字人!華為云 Flexus 數(shù)字人輕松上手

評論