一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

關(guān)于聲智穿透式遠(yuǎn)場語音技術(shù)介紹

聲智科技 ? 來源:djl ? 作者:聲智科技 ? 2019-08-13 09:01 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

2018年11月1日,騰訊全球合作伙伴大會(huì),以“開放·共生”為主題,在南京開幕。聲智科技聯(lián)合創(chuàng)始人兼首席知識(shí)官常樂受邀出席,并與來自全球的科技、文化與商業(yè)領(lǐng)域數(shù)百位國際大咖和萬名行業(yè)精英,以及騰訊微信、QQ、騰訊云、騰訊開放平臺(tái)、騰訊企鵝號(hào)、騰訊應(yīng)用寶、騰訊AI Lab、騰訊車聯(lián)、騰訊自動(dòng)駕駛、騰訊微瓴互聯(lián)、騰訊動(dòng)漫等業(yè)務(wù)條線的合作伙伴,共商未來人機(jī)互聯(lián)戰(zhàn)略布局與發(fā)展之道。

聲智科技聯(lián)合創(chuàng)始人兼首席知識(shí)官常樂表示:“未來,我們將置身于人工智能語音交互時(shí)代,繼續(xù)朝著‘語音即搜索,語言即服務(wù)’方向演進(jìn)。物理世界與數(shù)字世界的有機(jī)融合會(huì)進(jìn)一步加速,日益形成更加智能化的萬物互聯(lián)的人機(jī)世界。實(shí)現(xiàn)這一美好智能圖景的關(guān)鍵在于,實(shí)現(xiàn)智能語音交互在更多真實(shí)復(fù)雜場景中的應(yīng)用與落地。聲智科技,自2017年初成為騰訊人工智能生態(tài)合作伙伴以來,依托聲智科技自主研發(fā)的軟硬件一體的遠(yuǎn)場語音交互技術(shù)勢(shì)能,先后為騰訊打造了騰訊智能音箱、智能車機(jī)系統(tǒng)以及全球首款王者榮耀智能機(jī)器人等產(chǎn)品,助力騰訊深化在家居、車載和機(jī)器人三大領(lǐng)域的人工智能布局與落地?!?/p>

全球首創(chuàng)的穿透式遠(yuǎn)場語音交互解決方案

王者榮耀智能機(jī)器人,游戲人物戰(zhàn)神呂布為原型,是國內(nèi)首款人工智能與游戲結(jié)合的智能機(jī)器人。搭載聲智科技為騰訊獨(dú)家定制的全球首創(chuàng)的穿透式遠(yuǎn)場語音交互解決方案,采用全球首款人偶型音腔結(jié)構(gòu)設(shè)計(jì),由獨(dú)立的人偶和底座兩部分構(gòu)成,底座裝有旋轉(zhuǎn)裝置,人偶可以追隨玩家用戶的聲源,并且旋轉(zhuǎn)定位;通過獨(dú)家的6麥環(huán)形倒置麥克風(fēng)陣列(Inverse Array)設(shè)計(jì),內(nèi)置穿透式波達(dá)方向估計(jì)(Penetrated DOA),動(dòng)態(tài)聲場的回聲消除(Vibrated AEC)等獨(dú)家定制的AI聲學(xué)算法,成就了具備“聽”、“說”感知能力的AI游戲達(dá)人——王者榮耀智能機(jī)器人!在騰訊全球合作伙伴大會(huì)上,王者榮耀智能機(jī)器人驚艷亮相展區(qū),為現(xiàn)場觀眾帶來了真實(shí)不凡的語音交互體驗(yàn)。

(1)6麥環(huán)形倒置麥克風(fēng)陣列(InverseArray)

為了戰(zhàn)斗時(shí),給游戲玩家身臨其境的聽覺享受,王者榮耀機(jī)器人將揚(yáng)聲器設(shè)置于人偶的頭部。區(qū)別于常規(guī)智能語音設(shè)備(比如音箱、機(jī)頂盒)麥克風(fēng)陣列置于頂端、揚(yáng)聲器位于底部的“上聽下說”且“聽說一體”的圓柱或立方體的中空音腔結(jié)構(gòu),王者榮耀智能機(jī)器人的麥克風(fēng)陣列設(shè)計(jì)位置只能置于底座,從而形成獨(dú)特的“下聽上說”且“聽說分離”的不規(guī)則非中空音腔結(jié)構(gòu)。這樣的結(jié)構(gòu)設(shè)計(jì),也給麥克風(fēng)陣列的結(jié)構(gòu)設(shè)計(jì)與聲學(xué)AI算法適配帶來了巨大的難度。

同時(shí),為了讓王者榮耀機(jī)器人可以隨時(shí)定位玩家位置,底盤設(shè)置了旋轉(zhuǎn)電機(jī)裝置,電機(jī)極為靠近麥克風(fēng)陣列,當(dāng)人偶被喚醒后進(jìn)行大角度旋轉(zhuǎn)時(shí),會(huì)產(chǎn)生電機(jī)噪音,影響麥克風(fēng)陣列的準(zhǔn)確拾音。

為此,聲智科技為騰訊的王者榮耀機(jī)器人量身研制了“倒置麥克風(fēng)陣列(Inverse Array)”技術(shù)。基于聲智科技定制研發(fā)的6麥環(huán)形的倒置麥克風(fēng)陣列,進(jìn)一步加強(qiáng)麥克風(fēng)陣列的聲音信號(hào)處理能力,對(duì)抗人偶機(jī)器人對(duì)于麥克風(fēng)陣列的遮擋,以及其產(chǎn)生的聲反射和聲衍射的干擾,有效抑制自噪聲和其他外部噪音。在真實(shí)的環(huán)境中,王者榮耀智能機(jī)器人可拾取3-5米遠(yuǎn)場距離聲音,并實(shí)現(xiàn)的360度全方位的語音喚醒與識(shí)別。

(2)穿透式波達(dá)方向估計(jì)(PenetratedDOA)

王者榮耀智能機(jī)器人獨(dú)特的設(shè)計(jì),使人偶身體處在麥克風(fēng)陣列正上方,成為直接障礙物,形成了大量因不規(guī)則外形的人偶身體產(chǎn)生的聲反射和聲衍射,導(dǎo)致了多徑傳播情況的普遍發(fā)生,極大影響了王者榮耀智能機(jī)器人的準(zhǔn)確定位功能。

為了應(yīng)對(duì)這些結(jié)構(gòu)性挑戰(zhàn),進(jìn)一步加強(qiáng)麥克風(fēng)陣列的聲音信號(hào)處理,有效抑制自噪聲和其他外部噪音,提高聲源測(cè)向的準(zhǔn)確度,聲智科技最新研發(fā)了穿透式波達(dá)方向估計(jì)(Penetrated DOA)技術(shù)。即使在噪音干擾大,強(qiáng)混響,強(qiáng)反射面的條件下,王者榮耀智能機(jī)器人可實(shí)現(xiàn)360度全方位的測(cè)向,定位誤差在10度以內(nèi),隨時(shí)響應(yīng)“主公”的呼喚。

(3)動(dòng)態(tài)聲場的回聲消除(VibratedAEC)

傳統(tǒng)智能音箱等產(chǎn)品的設(shè)計(jì)揚(yáng)聲器在底部,而王者榮耀智能機(jī)器人的揚(yáng)聲器位于頭部兩側(cè),一側(cè)指向性的揚(yáng)聲器為全頻段發(fā)聲器件,承擔(dān)主動(dòng)發(fā)聲功能,另一側(cè)為低頻共振被動(dòng)膜片被動(dòng)發(fā)聲,以達(dá)到較佳的低音效果。而這樣的特殊設(shè)計(jì),導(dǎo)致位于揚(yáng)聲器垂直下方的環(huán)形麥克風(fēng)陣列單元拾取到的揚(yáng)聲器系統(tǒng)自噪聲直達(dá)聲信號(hào)不一致,這無疑增大了語音喚醒與識(shí)別的難度。

而且,主動(dòng)揚(yáng)聲器的聲音會(huì)干擾麥克風(fēng)陣列進(jìn)行聲源側(cè)向,進(jìn)一步影響人偶旋轉(zhuǎn)角度的準(zhǔn)確性。同時(shí),旋轉(zhuǎn)裝置的電機(jī),極為靠近麥克風(fēng)陣列,當(dāng)人偶被喚醒后進(jìn)行大角度旋轉(zhuǎn)時(shí),產(chǎn)生的電機(jī)噪音影響麥克風(fēng)陣列的拾音。

為此,聲智科技研發(fā)了最新的動(dòng)態(tài)聲場回聲消除(Vibrated AEC)技術(shù),可有效提升音樂狀態(tài)或語音合成(TTS)狀態(tài)下的喚醒率,以及在5米內(nèi)的噪音環(huán)境下的遠(yuǎn)場語音喚醒和識(shí)別率。搭配聲智科技自主知識(shí)產(chǎn)權(quán)的混響消除、寬場景高靈敏語音喚醒等專屬聲學(xué)AI算法,可在保護(hù)主方向語音不失真的前提下,去除環(huán)境中的語音等非穩(wěn)態(tài)噪聲以及空調(diào)等其他平穩(wěn)噪聲的干擾,自適應(yīng)計(jì)算混響的能量,予以抑制,去除由于房間混響造成的語音拖尾,增強(qiáng)語音清晰度,同時(shí)解決弱參考信號(hào)或者無參考信號(hào)等復(fù)雜場景中的回聲抵消(自噪聲抑制)問題,在雙工語音交互(Double Talk)的情況下仍然魯棒。

所以,王者榮耀智能機(jī)器人在保證高喚醒率的同時(shí),能有力降低誤喚醒率,實(shí)現(xiàn)輕松喚醒,隨時(shí)打斷、隨時(shí)喚醒,無懼環(huán)境,想說就說,聲隨心動(dòng),為用戶打造完美的遠(yuǎn)場語音交互的體驗(yàn)。

語音交互技術(shù)的創(chuàng)新,只有依托真實(shí)的場景,才能真正釋放技術(shù)的潛能,發(fā)揮技術(shù)的應(yīng)用價(jià)值,推動(dòng)人工智能朝著普惠化方向發(fā)展,讓更多人切實(shí)地感受到科技的智能、快捷與便利。聲智科技,將繼續(xù)堅(jiān)持引領(lǐng)技術(shù)服務(wù)場景的創(chuàng)新路線,攜手生態(tài)合作伙伴,為不同的垂直行業(yè)打造適配多元場景的遠(yuǎn)場語音交互系統(tǒng)方案。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 機(jī)器人
    +關(guān)注

    關(guān)注

    213

    文章

    29736

    瀏覽量

    212860
  • 人工智能
    +關(guān)注

    關(guān)注

    1806

    文章

    49014

    瀏覽量

    249454
  • 語音交互
    +關(guān)注

    關(guān)注

    3

    文章

    307

    瀏覽量

    28615
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    遠(yuǎn)智睿SSD2351開發(fā)板:語音機(jī)器人領(lǐng)域的變革力量

    在人工智能快速發(fā)展的今天,語音機(jī)器人逐漸成為人們生活和工作中的得力助手。明遠(yuǎn)智睿SSD2351開發(fā)板憑借強(qiáng)大性能與豐富功能,為語音機(jī)器人的發(fā)展注入新動(dòng)力,成為該領(lǐng)域的變革力量。 SSD2351開發(fā)板
    發(fā)表于 05-28 11:36

    智能語音新風(fēng)尚:WTK6900語音識(shí)別芯片賦能未來家居,讓涼爽觸“”可及

    在人工智能技術(shù)飛速發(fā)展的今天,語音交互正以顛覆性的方式重塑我們的生活體驗(yàn)。WTK6900系列語音識(shí)別芯片憑借其離線高性能、抗噪遠(yuǎn)識(shí)別、毫秒
    的頭像 發(fā)表于 04-08 08:43 ?516次閱讀
    智能<b class='flag-5'>語音</b>新風(fēng)尚:WTK6900<b class='flag-5'>語音</b>識(shí)別芯片賦能未來家居,讓涼爽觸“<b class='flag-5'>聲</b>”可及

    芯知識(shí)|廣州唯創(chuàng)電子語音芯片電流問題解析與解決方案

    語音芯片在播放音頻時(shí)出現(xiàn)電流是嵌入音頻系統(tǒng)開發(fā)中的常見問題,直接影響用戶體驗(yàn)。廣州唯創(chuàng)電子WT系列語音芯片在智能家居、工業(yè)控制等領(lǐng)域廣泛應(yīng)用,本文將從PWM直推輸出與DAC+功放輸
    的頭像 發(fā)表于 03-28 08:44 ?481次閱讀
    芯知識(shí)|廣州唯創(chuàng)電子<b class='flag-5'>語音</b>芯片電流<b class='flag-5'>聲</b>問題解析與解決方案

    離線語音模組VC系列出廠固件使用教程——SDK開源?

    安信可VC系列離線語音模組,采用云知方案,在語音識(shí)別技術(shù)上不斷優(yōu)化和創(chuàng)新算法,離線識(shí)別算法與芯片架構(gòu)深度融合,為客戶提供超低成本的離線語音
    的頭像 發(fā)表于 02-26 14:14 ?491次閱讀
    離線<b class='flag-5'>語音</b>模組VC系列出廠固件使用教程——SDK開源?

    OptiFDTD應(yīng)用:二進(jìn)制光柵建模及近場和遠(yuǎn)模擬

    入射光束。 檢測(cè)采樣波長的傳輸光束(對(duì)于圖案1) 傳輸功率譜 遠(yuǎn)轉(zhuǎn)換 (1)FDTD主要進(jìn)行近場模擬,更長距離的模擬要求更多CPU時(shí)間和內(nèi)存使用。 (2)然而,OptiFDTD提供遠(yuǎn)
    發(fā)表于 02-20 08:56

    OptiFDTD案例:二進(jìn)制光柵建模及近場和遠(yuǎn)模擬

    入射光束。 檢測(cè)采樣波長的傳輸光束(對(duì)于圖案1) 傳輸功率譜 遠(yuǎn)轉(zhuǎn)換 (1)FDTD主要進(jìn)行近場模擬,更長距離的模擬要求更多CPU時(shí)間和內(nèi)存使用。 (2)然而,OptiFDTD提供遠(yuǎn)
    發(fā)表于 01-20 10:26

    NRK3603語音識(shí)別芯片控制IC在按摩椅中的應(yīng)用介紹

    按摩椅市場蓬勃發(fā)展,NRK3603語音識(shí)別芯片為按摩椅帶來智能化體驗(yàn),支持語音指令控制,具有精準(zhǔn)識(shí)別、遠(yuǎn)降噪等優(yōu)勢(shì),封裝小且支持多種外設(shè),滿足個(gè)性化需求,實(shí)現(xiàn)智能化升級(jí)并控制成本。
    的頭像 發(fā)表于 01-09 13:14 ?1321次閱讀
    NRK3603<b class='flag-5'>語音</b>識(shí)別芯片控制IC在按摩椅中的應(yīng)用<b class='flag-5'>介紹</b>

    空調(diào)語音控制方案NRK3501語音識(shí)別芯片-讓智能生活觸手可及!

    NRK3501語音識(shí)別芯片支持離線語音控制空調(diào),精準(zhǔn)識(shí)別,遠(yuǎn)降噪,最多支持200條離線指令,5米內(nèi)識(shí)別率92%,讓智能家居更便捷舒適。
    的頭像 發(fā)表于 01-07 11:40 ?713次閱讀
    空調(diào)<b class='flag-5'>語音</b>控制方案NRK3501<b class='flag-5'>語音</b>識(shí)別芯片-讓智能生活觸手可及!

    離線語音識(shí)別技術(shù)引領(lǐng)智能語音燈具市場——NRK3502

    智能語音燈具集高科技與人性化設(shè)計(jì),內(nèi)置NRK3502離線語音識(shí)別芯片,支持遠(yuǎn)識(shí)別與自定義指令,提供便捷智能體驗(yàn),推動(dòng)智能家居行業(yè)發(fā)展。
    的頭像 發(fā)表于 12-30 15:04 ?760次閱讀
    離線<b class='flag-5'>語音</b>識(shí)別<b class='flag-5'>技術(shù)</b>引領(lǐng)智能<b class='flag-5'>語音</b>燈具市場——NRK3502

    EVS103智能純離線語音識(shí)別芯片介紹

    EVS103是一顆亞毫瓦級(jí)超低功耗面向帶電池和便攜產(chǎn)品,以及對(duì)功耗有嚴(yán)苛要求的各類產(chǎn)品推出的智能純離線語音識(shí)別芯片。依托于POROSVOC在語音識(shí)別技術(shù)上的積累和算法的不斷優(yōu)化和創(chuàng)新
    的頭像 發(fā)表于 11-11 11:34 ?903次閱讀
    EVS103智能純離線<b class='flag-5'>語音</b>識(shí)別芯片<b class='flag-5'>介紹</b>

    語音識(shí)別ic賦能烤箱,離線對(duì)話操控,引領(lǐng)智能廚房新體驗(yàn)

    智能烤箱融入語音識(shí)別技術(shù),提升使用體驗(yàn),實(shí)現(xiàn)便捷操作與智能反饋。NRK3502芯片支持離線遠(yuǎn)識(shí)別,助力烤箱創(chuàng)新升級(jí)。未來,智能烤箱將成為家庭必備,開啟智能廚房新篇章。
    的頭像 發(fā)表于 11-05 10:30 ?588次閱讀

    半導(dǎo)體激光器的遠(yuǎn)特性

    人們通常將半導(dǎo)體激光器輸出的光分布分別用近場與遠(yuǎn)特性來描述。
    的頭像 發(fā)表于 10-30 10:45 ?966次閱讀
    半導(dǎo)體激光器的<b class='flag-5'>遠(yuǎn)</b><b class='flag-5'>場</b>特性

    請(qǐng)問有移動(dòng)設(shè)備上用的2.1道的語音功放芯片嗎?

    請(qǐng)問有移動(dòng)設(shè)備上用的2.1道的語音功放芯片嗎?前端是左右聲道差分音頻輸入。電源電壓 大概3~5V。
    發(fā)表于 10-15 07:54

    遠(yuǎn)應(yīng)用中的模擬麥克風(fēng)和ADC系統(tǒng)

    電子發(fā)燒友網(wǎng)站提供《遠(yuǎn)應(yīng)用中的模擬麥克風(fēng)和ADC系統(tǒng).pdf》資料免費(fèi)下載
    發(fā)表于 08-28 09:39 ?0次下載
    <b class='flag-5'>遠(yuǎn)</b><b class='flag-5'>場</b>應(yīng)用中的模擬麥克風(fēng)和ADC系統(tǒng)

    樂鑫聲學(xué)前端算法:打造智能語音交互新體驗(yàn),ESP32-S3 SOC技術(shù)方案

    隨著人工智能技術(shù)的不斷進(jìn)步,智能語音設(shè)備正逐漸成為我們生活中不可或缺的一部分。然而,在嘈雜的現(xiàn)實(shí)環(huán)境中,如何實(shí)現(xiàn)清晰、準(zhǔn)確的語音交互,一直是業(yè)界面臨的一大挑戰(zhàn)。今天,我們要介紹的是樂鑫
    的頭像 發(fā)表于 08-03 08:04 ?2198次閱讀
    樂鑫聲學(xué)前端算法:打造智能<b class='flag-5'>語音</b>交互新體驗(yàn),ESP32-S3 SOC<b class='flag-5'>技術(shù)</b>方案