一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

騰訊數(shù)字生態(tài)大會上AI語音助手+X的無限可能 人機(jī)交互的下一站

腦極體 ? 來源:腦極體 ? 作者:腦極體 ? 2020-09-14 17:31 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

日本聲優(yōu)(配音演員)花澤香菜官宣結(jié)婚的那一天,不少宅男都直呼“爺青結(jié)”(爺?shù)那啻航Y(jié)束了)?;ヂ?lián)網(wǎng)上被奉為“大眾情人”的男神/女神,哪個不是聲形并茂的存在?

“顏控”如人類的情感就是如此不講道理。所以盡管科技廠商們都努力將AI助手的聲音“打扮”得親切可人,但距離真正進(jìn)入用戶心扉還遠(yuǎn)遠(yuǎn)不夠。尤其是對于智能家居、養(yǎng)老照護(hù)等重要語音落地場景來說,情感色彩的缺位就更加顯現(xiàn)出不足了。

而近期,許多能說會道的AI人物,也逐步進(jìn)入我們的視野。比如《時代周刊》刊發(fā)了一張馬丁·路德·金的“肖像照片”,“他”還會在沉浸式展覽《游行》中,重現(xiàn)馬丁·路德·金的經(jīng)典演講《我有一個夢想》。

在許多崗位上,AI語音助手也開始被賦予真人一樣的外貌,能夠通過眼神、表情、動作進(jìn)行自然流暢的表達(dá)。比如疫情期間許多辦公樓里,都引入了數(shù)字人來執(zhí)行測溫任務(wù),讓這一行為更具溫情,不再是機(jī)器語音例行公事一般冷冰冰的提醒。

騰訊全球數(shù)字生態(tài)大會上,一位來自《鏡雙城》動畫番劇里的女主角那笙,就跟現(xiàn)場觀眾打起了招呼——“原本我只能出現(xiàn)在動漫世界里,現(xiàn)在的我能夠讀懂你、聽懂你,還有自己的小個性、小脾氣哦~”

一副嬌俏少女的模樣,讓這樣的“女神”成為自己的導(dǎo)游、助理、客服、老師等等,聽起來就十分令人神往,是騰訊云小微和AI lab共同打造的數(shù)字虛擬人,也成為騰訊云小微“數(shù)字助手”解決方案的“顏值擔(dān)當(dāng)”。

當(dāng)然,讓人類與數(shù)字助理自然相處,其中既受限于理性的技術(shù)發(fā)展周期因素,也會受到人類虛無縹緲的情感左右。那么作為一種另辟蹊徑的實現(xiàn)方式,騰訊云小微所打造的形象化AI助手,其想象空間到底來自哪里?又將把AI語音技術(shù)引向怎樣的下一站?

“顏控”企業(yè)的出現(xiàn),折射出哪些現(xiàn)實需求

智能語音助手早已在許多商業(yè)場景中落地,比如撥打客服電話時的語音服務(wù),亦或是會為兒童朗讀繪本的智能音箱。那為什么大家突然又開始“看臉”了呢?

其實,從智能語音助手中廣泛存在的手機(jī)/音箱等產(chǎn)品的交互尷尬,就可以解開這個問題。

首先是打開頻率。許多主打智能語音功能的硬件(比如音箱),只有在剛拿到手的新鮮勁里,或者是網(wǎng)絡(luò)上又出現(xiàn)了“調(diào)戲”語音助手的段子,才會想起來跟它們對話。背后的關(guān)鍵原因是語音助理所能承載的工具性需求,大部分都已經(jīng)被智能手機(jī)等設(shè)備完成的很好了,只能作為“備胎”被偶爾提起。

二是情感聯(lián)系。語音交互是即忘形式的,這就決定了它無法承載更具私密性、情感性的交互活動。我們會讓語音助手幫我們打開電視、啟動掃地機(jī)器人,但跟它進(jìn)行充滿情緒色彩、大段大段地閑聊?估計大部分用戶都會產(chǎn)生抵觸心理。就算自己不介意,被其他人撞到抱著一個音箱喃喃自語也很難不引起誤會不是……

三是技術(shù)瓶頸。伴隨著NLP技術(shù)的進(jìn)步,語音助手已經(jīng)能很不錯地完成聲紋識別、多輪對話、語義理解等復(fù)雜任務(wù)了,但距離自然交流顯然還有一定的差距。動不動就“我聽不懂”“難倒我了”,娛樂消費(fèi)產(chǎn)品會被棄之高閣,萬一企業(yè)不小心聘用了這種“智障型”AI助理為消費(fèi)者提供服務(wù),難以達(dá)到普通用戶期盼的準(zhǔn)確無誤、近似真人的交互效果,帶來的就可能是訂單的損失和品牌口碑的下跌。

針對這些AI語音助手在產(chǎn)業(yè)端、市場端的落地尷尬,存不存在可能的解決之道呢?從“工具人”轉(zhuǎn)變?yōu)椤皵?shù)字人”,讓用戶從“聲控”轉(zhuǎn)變?yōu)椤邦伩亍保褪球v訊數(shù)字生態(tài)大會上給出的一個十分吸睛的解題思路。

讓用戶跟AI多聊兩句,數(shù)字助理需要具備哪些超能力?

“如果那笙哪里做的不對,主人不要嫌棄我我有在努力呢”——試問聽到這種對話,你還會吐槽語音助手偶爾出現(xiàn)的小失誤,甚至還有點(diǎn)想反思自己是不是過于吹毛求疵了呢?

沿著這個思路,我們可以看到形象化之后,騰訊云小微在數(shù)字助手領(lǐng)域都打造出了哪些超能力:

1.語音+視覺交互,借助騰訊系海量IP打造出各種形象、生動、貼近現(xiàn)實需求的形象,提升交互頻率,從而真正有效地減輕人類工作負(fù)擔(dān)。比如疫情期間,就有老師表示希望有分身到每個學(xué)生身邊指導(dǎo)他們,而數(shù)字助理的擬人化交互恰好可以完成這一任務(wù);

2.豐富的知識體系,利用知識圖譜與深度學(xué)習(xí)技術(shù),數(shù)字助手可以快速調(diào)用海量信息,完成問答、資訊等服務(wù),再通過擬人化的形象輸出給用戶,人們會在服務(wù)過程中對技術(shù)產(chǎn)生一定的包容和理解。為故宮打造的清朝內(nèi)閣大學(xué)士“福大人”,就擔(dān)任起了知識淵博的游覽助手;

3.個性化情感關(guān)系:智能語音助手等新鮮事物的核心受眾群以年輕人為主,而隨著國漫崛起,年輕人對標(biāo)新立異的虛擬形象更感興趣。而對于渴求增長與變化的企業(yè)來說,與其按部就班地在聲音世界里打轉(zhuǎn), 尤其是在線上化業(yè)務(wù)增多,用戶的交互頻率和方式增長的情況下,年輕市場也需要新的服務(wù)形態(tài)來被重新激活;

此外,伴隨著產(chǎn)業(yè)數(shù)字化程度的推進(jìn),企業(yè)想要在數(shù)據(jù)洪潮中傳達(dá)出具象的品牌形象,新的視覺載體是不可或缺的。消費(fèi)者的行為和決策鏈路也在數(shù)字世界中變得更加隱蔽、復(fù)雜,如何保持黏性,建立用戶與品牌的情感連接也成為應(yīng)有之義……

上述種種,或許都可以通過一個人格化、陪伴式的“數(shù)字助理”,來觸發(fā)全新的可能性。

AI語音的下一站,開啟人機(jī)交互的“寧靜時代”

技術(shù)領(lǐng)域有個名詞叫“寧靜技術(shù)”,簡單來說就是通過對用戶的情景感知能力,最小化用戶的注意力,讓人機(jī)交互變得隱匿和不可見(invisible)。

就像進(jìn)入電梯間之后按下樓層鍵一樣,已經(jīng)成為現(xiàn)代人潛移默化的慣性動作,誰還記得曾經(jīng)按電梯也是一種職業(yè),甚至需要考證呢。

而人機(jī)之間的語音交互,也正在從“好像有點(diǎn)尷尬”進(jìn)入到自然而然地喚起階段。接下來,就是要讓這種已經(jīng)在一些場景(比如客廳)成為習(xí)慣的事,隱匿到更大的社會空間之中,讓AI助手能夠在更廣闊的商業(yè)世界里與人們自然順暢地進(jìn)行交流。

這既是技術(shù)發(fā)展的必然趨勢,也離不開科技企業(yè)們的不斷努力。以騰訊云小微AI語音助手為例,就已經(jīng)在出行、文旅、教育等等領(lǐng)域開始落地。

之所以能達(dá)成這一成就,首先來自于騰訊在語音技術(shù)上核心技術(shù)鏈的深耕。

通過ASR、NLP、TTS等技術(shù),對聲音進(jìn)行降噪、文本轉(zhuǎn)化、語義理解,這一才能讓AI助手能夠在復(fù)雜環(huán)境中依然能夠識別不同的方言或者口音。

想要達(dá)成和真人一樣的交流,機(jī)器還需要聽得懂,才能避免“所答非所問”的情況,來真正幫助用戶解決問題,成為一個業(yè)務(wù)能力強(qiáng)大的“數(shù)字員工”。因此騰訊除了在語義技術(shù)方面發(fā)力之外,還十分重視知識圖譜的建構(gòu)。等于為AI搭建了一個先驗的知識庫,讓它能夠及時調(diào)動龐大的知識儲備,更好地理解用戶言語的意圖,來顯示出“智商很高”的樣子。

除此之外,數(shù)字員工的“情商”也很重要。利用利用個性化、沉浸式的TTS語音合成技術(shù),再結(jié)合虛擬人技術(shù),將對話內(nèi)容以多模態(tài)、多層次的形式表達(dá)出來,就能很好地通過表情、動作傳達(dá)出語言的情緒,讓用戶更加可感、可知。

而這一整個技術(shù)體系要真正落地,一方面需要打通數(shù)據(jù)閉環(huán),從而訓(xùn)練出更可靠、精準(zhǔn)的對話模型。因此騰訊云小微團(tuán)隊也建構(gòu)了一套系統(tǒng)工程。從沒有數(shù)據(jù)怎么辦開始,系統(tǒng)地鉆研數(shù)據(jù)如何打通,推動數(shù)據(jù)共享,到缺失數(shù)據(jù)的采集,系統(tǒng)化地為客戶規(guī)劃了基于數(shù)據(jù)智能化目標(biāo)的數(shù)據(jù)采集和信息化建設(shè)方案。

另外,數(shù)字助理的最終目標(biāo)不是“賣萌”,而是幫助企業(yè)提質(zhì)增效,推動數(shù)字生產(chǎn)力變革,達(dá)成體驗/服務(wù)到業(yè)績/留存的真實轉(zhuǎn)化。因此要具備統(tǒng)籌全局、貫穿業(yè)務(wù)周期的能力。所以也需要對企業(yè)的全業(yè)務(wù)場景進(jìn)行覆蓋,來保證無論是簡單的問題咨詢,還是復(fù)雜的業(yè)務(wù)流程辦理,抑或只是想跟數(shù)字員工閑聊談心,背后的語音技術(shù)解決方案都能夠通過正確響應(yīng)來滿足用戶所需、企業(yè)所想。在這一點(diǎn)上,騰訊云小微也通過流式語義+語義VAD技術(shù),讓AI在極低時延的情況下也能邊聽邊思考。

也正是“數(shù)據(jù)+業(yè)務(wù)”的雙重閉環(huán),形成了數(shù)字助理進(jìn)入產(chǎn)業(yè)規(guī)?;哪芰ψV系,得以為企業(yè)智能化轉(zhuǎn)型全程護(hù)航。

AI語音助手+X=無限可能

毫無疑問,數(shù)字化、智能化潮流的全面噴發(fā),未來會有更多的數(shù)字助理、AI助手被納入到人類的工作環(huán)境當(dāng)中。對于廣大普通人來說,數(shù)字助理的能力蝶變真的有現(xiàn)實意義嗎?

答案是肯定的??梢灶A(yù)期的是,至少有幾種社會生活會被革新:

一是文旅導(dǎo)游。一場疫情讓旅游行業(yè)元?dú)獯髠?,而防疫的“持久?zhàn)”也決定了限人限流會成為一段時期依賴的常態(tài),如何在這樣的情況下依然保持甚至超越原有的服務(wù)質(zhì)量,將基礎(chǔ)講解工作交給數(shù)字員工,就是一個不錯的選擇。未來走進(jìn)景區(qū),打開手機(jī),也許就是一個數(shù)字導(dǎo)游引領(lǐng)我們游覽,實時講解,互動答疑;

二是家居場景。你的家里有多少智能音箱在等著落灰?年邁的父母呼喚語音助手的名字時是否還是會感到一絲尷尬?而一旦語音助手有了數(shù)字形象,被賦予擬人化色彩之后,一切可能都會變得不同。從原本的一問一答,到有情感、更自然的交流,大概率會有不少人開始發(fā)帖“我覺得家里的AI助理才是我爸媽親生的”。

三是教育產(chǎn)業(yè)。一進(jìn)九月臨近教師節(jié),家長群們總少不了“送禮物擔(dān)心老師不收,不送禮物擔(dān)心孩子得不到關(guān)照”的年度討論,而現(xiàn)實中,確實存在老師無法針對學(xué)生進(jìn)行一對一特定輔導(dǎo)、難以記住所有學(xué)生的學(xué)情狀況、教學(xué)壓力大等情況。能化身虛擬老師的“數(shù)字助手”,無疑就是妥妥的多贏,老師們得以從機(jī)械工作中解放出來,學(xué)生們也能得到實時、個性化的輔導(dǎo),而家長們也不用發(fā)愁怎樣才能在AI眼里刷存在感了。

三是智能營銷。對于企業(yè)來說,數(shù)字助手不僅僅是一位德智體美勞全面發(fā)展的優(yōu)秀員工,還可以是輔助商業(yè)營銷決策的“超級智囊”。舉個例子,一些汽車小白用戶,通過互聯(lián)網(wǎng)的消費(fèi)行為偏好分析,進(jìn)而設(shè)計出一些“傻瓜式”產(chǎn)品功能,比如一鍵詢問維修、一鍵呼叫客戶、智能導(dǎo)航、輔助駕駛等等,而這些用戶洞察,基于騰訊云小微所處的數(shù)字生態(tài)都可以轉(zhuǎn)化為車機(jī)企業(yè)爭取潛在用戶好感度的關(guān)鍵武器。

一個能聽會說、知識全面,又善于表達(dá)、喜怒形于色的數(shù)字員工,擁有的可能性還有很多。不難發(fā)現(xiàn),不僅企業(yè)需要重新認(rèn)知數(shù)字助理所帶來的價值紅利,想要擴(kuò)大數(shù)字助理的商業(yè)價值與應(yīng)用邊界,還需要一套體系化的平臺性技術(shù)解決方案,來降低各行各業(yè)引入數(shù)字員工的門檻及成本。

從這一點(diǎn)來看,數(shù)字生態(tài)大會上所展示的人機(jī)交互技術(shù)前景與商業(yè)宏圖,不是一種偶然,而是騰訊云小微從長期實戰(zhàn)與技術(shù)研發(fā)中生長出來的確定性。

騰訊云小微扳動了一下技術(shù)齒輪,人與機(jī)器如同精密儀器適配一樣,在某個瞬間發(fā)出“咔”的一聲,于是我們知道,一個全新的產(chǎn)業(yè)世界大門,開啟了……

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 人機(jī)交互
    +關(guān)注

    關(guān)注

    12

    文章

    1246

    瀏覽量

    56411
  • AI
    AI
    +關(guān)注

    關(guān)注

    88

    文章

    35041

    瀏覽量

    279218
  • 騰訊
    +關(guān)注

    關(guān)注

    7

    文章

    1678

    瀏覽量

    50278
  • 騰訊云
    +關(guān)注

    關(guān)注

    0

    文章

    221

    瀏覽量

    17099
  • 語音助手
    +關(guān)注

    關(guān)注

    7

    文章

    241

    瀏覽量

    27153
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    聲智科技全球首發(fā)新一代人機(jī)交互框架

    Moore與Anish Acharya在深度訪談中系統(tǒng)闡釋了"語音交互將成為AI應(yīng)用最具突破潛力的核心接口"這戰(zhàn)略判斷,明確指出在消費(fèi)級市場,
    的頭像 發(fā)表于 05-12 10:28 ?402次閱讀
    聲智科技全球首發(fā)新<b class='flag-5'>一代人機(jī)交互</b>框架

    聲學(xué)技術(shù)如何重構(gòu)人機(jī)交互生態(tài)

    人機(jī)交互的底層邏輯。隨著非線性聲學(xué)計算與強(qiáng)化學(xué)習(xí)的深度融合,聲音交互正從“聽得見”邁向“聽得懂”,并逐漸成為 AI 時代的重要接口。
    的頭像 發(fā)表于 04-14 13:50 ?388次閱讀

    首創(chuàng)開源架構(gòu),天璣AI開發(fā)套件讓端側(cè)AI模型接入得心應(yīng)手

    科正將AI能力體系化并賦能終端生態(tài)。 大會上,聯(lián)發(fā)科定義了“智能體化用戶體驗”的五大特征:主動及時、知你懂你、互動協(xié)作、學(xué)習(xí)進(jìn)化和專屬隱私信息守護(hù)。這五大特征需要跨越從芯片、模型、應(yīng)用、終端乃至整個
    發(fā)表于 04-13 19:52

    硅基覺醒已至前夜,聯(lián)發(fā)科攜手生態(tài)加速智能體化用戶體驗時代到來

    推動AI從“能用”到“好用”,關(guān)鍵不只是算力升級,更在于工具鏈與生態(tài)的協(xié)同完善。在MDDC 2025大會上,聯(lián)發(fā)科首度集成發(fā)布AI+游戲全場景支持平臺:Neuron Studio聚焦
    發(fā)表于 04-13 19:51

    零知開源——ESP32語音交互系統(tǒng)(AI小智)開發(fā)教程

    小智AI聊天機(jī)器人是個基于嵌入式硬件與人工智能技術(shù)深度融合的智能交互系統(tǒng)。該項目以ESP32開發(fā)板為核心,結(jié)合語音喚醒、自然語言處理、音頻解碼播放及圖形化
    的頭像 發(fā)表于 03-29 15:33 ?6922次閱讀
    零知開源——ESP32<b class='flag-5'>語音</b><b class='flag-5'>交互</b>系統(tǒng)(<b class='flag-5'>AI</b>小智)開發(fā)教程

    RTC實時語音對話:開啟人機(jī)交互生態(tài)AI大模型智能聯(lián)動

    在當(dāng)今科技飛速發(fā)展的時代,AI大模型技術(shù)的爆發(fā)讓語音交互成為了人機(jī)協(xié)同的關(guān)鍵入口。就像Gartner預(yù)測的那樣,到2028年,15%的日常工作決策將由AIAgent自主完成。但傳統(tǒng)基于
    的頭像 發(fā)表于 02-26 18:23 ?1547次閱讀
    RTC實時<b class='flag-5'>語音</b>對話:開啟<b class='flag-5'>人機(jī)交互</b>新<b class='flag-5'>生態(tài)</b>,<b class='flag-5'>AI</b>大模型智能聯(lián)動

    人工智能的下一站在哪里

    DeepSeek的爆發(fā)進(jìn)步推動了AI行業(yè)的發(fā)展速度,這讓人們不得不想象AI下一站在哪里?維智科技所深耕的時空大模型與AI發(fā)展的邏輯軌跡又
    的頭像 發(fā)表于 02-14 10:27 ?437次閱讀

    啟英泰倫新推出多意圖自然說,重塑離線人機(jī)交互新標(biāo)準(zhǔn)!

    智能語音識別技術(shù)作為人機(jī)交互領(lǐng)域的場革命性突破,正逐步重塑我們與智能設(shè)備的交互方式。近期,啟英泰倫新推出了多意圖自然說技術(shù),進(jìn)步增強(qiáng)了
    的頭像 發(fā)表于 01-03 16:01 ?536次閱讀
    啟英泰倫新推出多意圖自然說,重塑離線<b class='flag-5'>人機(jī)交互</b>新標(biāo)準(zhǔn)!

    曠視亮相2024數(shù)字科技生態(tài)大會

    2024數(shù)字科技生態(tài)大會上,曠視展示了多項視聯(lián)網(wǎng)領(lǐng)域的前沿技術(shù)及應(yīng)用成果,包括大模型、行業(yè)場景方案以及創(chuàng)新智能終端。
    的頭像 發(fā)表于 12-06 10:34 ?724次閱讀

    新的人機(jī)交互入口?大模型加持、AI眼鏡賽道開啟百鏡大戰(zhàn)

    電子發(fā)燒友網(wǎng)報道(文/莫婷婷)隨著智能眼鏡的出現(xiàn),加之AI技術(shù)的應(yīng)用,AI智能眼鏡被認(rèn)為是下一代人機(jī)交互的入口。在今年,不少品牌廠商都推出了AI智能眼鏡新品,包括李未可推出的Meta
    的頭像 發(fā)表于 11-21 00:57 ?3964次閱讀
    新的<b class='flag-5'>人機(jī)交互</b>入口?大模型加持、<b class='flag-5'>AI</b>眼鏡賽道開啟百鏡大戰(zhàn)

    騰訊申請注冊多枚“騰訊AI助手”商標(biāo)

    近日,根據(jù)愛企查App的最新數(shù)據(jù)顯示,騰訊科技(深圳)有限公司在商標(biāo)領(lǐng)域有了新動作,該公司已經(jīng)正式申請注冊了多枚“騰訊AI助手”商標(biāo)。這
    的頭像 發(fā)表于 11-19 11:01 ?794次閱讀

    雷諾下一代車載語音助手Reno將引入生成式AI技術(shù)

    11月1日,賽輪思軟件技術(shù)公司與雷諾公司宣布深化合作,旨在將生成式AI技術(shù)和類人交互功能融入雷諾下一代多模態(tài)虛擬車載助手Reno中。   雷諾推出的虛擬
    的頭像 發(fā)表于 11-01 16:39 ?1768次閱讀

    具身智能對人機(jī)交互的影響

    在人工智能的發(fā)展歷程中,人機(jī)交互直是研究的核心領(lǐng)域之。隨著技術(shù)的進(jìn)步,人機(jī)交互的方式也在不斷演變。從最初的命令行界面,到圖形用戶界面,再到現(xiàn)在的自然語言處理和
    的頭像 發(fā)表于 10-27 09:58 ?947次閱讀

    英特爾與騰訊攜手共繪AI與云計算新藍(lán)圖

    在召開的2024騰訊全球數(shù)字生態(tài)大會上,英特爾與騰訊的深度合作成果成為全場矚目的焦點(diǎn)。雙方不僅在AI
    的頭像 發(fā)表于 09-06 16:31 ?1283次閱讀

    基于傳感器的人機(jī)交互技術(shù)

    基于傳感器的人機(jī)交互技術(shù)是現(xiàn)代科技發(fā)展的重要領(lǐng)域之,它極大地推動了人機(jī)交互的便捷性、自然性和智能性。本文將詳細(xì)探討基于傳感器的人機(jī)交互技術(shù),包括其基本原理、關(guān)鍵技術(shù)、應(yīng)用領(lǐng)域以及未來
    的頭像 發(fā)表于 07-17 16:52 ?1699次閱讀