美國專利商標(biāo)局(USPTO)授予Microsoft的一項新專利表明,該公司正在開發(fā)能夠反映用戶對話風(fēng)格和/或面部表情的對話代理。專利- 語言風(fēng)格匹配代理 -于2020年9月3日授予Microsoft,并以發(fā)明者Daniel J McDuff,Kael R. Rowan,Mary P Czerwinski,Deepali Aneja和Rens Hoegen稱號。
隨著語音識別和生成對話模型的發(fā)展,諸如聊天機器人和虛擬代理之類的對話界面正變得越來越流行。盡管這種自然語言的交互導(dǎo)致了人機交互的發(fā)展,但這種交流大多是單調(diào)的且受約束的。因此,這些對話最終只是事務(wù)性的,并不是很自然。
這項新的專利技術(shù)旨在帶來一種基于端到端基于語音的對話代理,該對話代理可以進行更自然,多輪回的對話,從而與用戶的對話風(fēng)格和面部表情保持一致。
被實現(xiàn)為僅語音的代理或用臉部體現(xiàn)的會話代理可以與用戶的語音和面部表情匹配??梢酝ㄟ^識別用戶語音的韻律特征并為具有相同或相似特征的虛擬代理合成語音來實現(xiàn)會話代理的語言樣式匹配。用戶的面部表情可以通過具體化的對話代理的臉部來識別和模仿。虛擬代理的發(fā)言可以基于預(yù)定的腳本響應(yīng)和由機器學(xué)習(xí)技術(shù)生成的開放式響應(yīng)的組合。與用戶的會話風(fēng)格和面部表情保持一致的會話代理可能會被認(rèn)為更值得信賴,更容易理解,
對話代理可以是純音頻的,也可以是體現(xiàn)的,這意味著它具有看起來像在說話的“臉”。在這兩種實現(xiàn)方式中,代理可以使用機器學(xué)習(xí)技術(shù),并以自然且可理解的方式響應(yīng)用戶的話語,從而整體上改善人機交互。
-
人機交互
+關(guān)注
關(guān)注
12文章
1246瀏覽量
56430 -
語音識別
+關(guān)注
關(guān)注
39文章
1780瀏覽量
114220 -
聊天機器人
+關(guān)注
關(guān)注
0文章
348瀏覽量
12795
發(fā)布評論請先 登錄
一文帶你厘清自動駕駛端到端架構(gòu)差異

小米汽車端到端智駕技術(shù)介紹

端到端自動駕駛技術(shù)研究與分析
端到端在自動泊車的應(yīng)用

階躍星辰發(fā)布國內(nèi)首個千億參數(shù)端到端語音大模型
準(zhǔn)確性超Moshi和GLM-4-Voice,端到端語音雙工模型Freeze-Omni

連接視覺語言大模型與端到端自動駕駛

評論