一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

語音控制不是魔術(shù),而是設(shè)計

efwedfd ? 來源:efwedfd ? 作者:efwedfd ? 2022-07-14 16:10 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

由于硬件和軟件的進(jìn)化突破,語音用戶界面或各種尺寸和價格點的支持 VUI 的產(chǎn)品現(xiàn)在都可以推向市場。與直到今天定義語音控制體驗的“對著麥克風(fēng)說話并等待”模型不同,新系統(tǒng)現(xiàn)在可以以最終用戶謹(jǐn)慎甚至不可見的方式嵌入到產(chǎn)品中,并具有即時響應(yīng)時間,而不是“ t 體驗云延遲。

在評估智能揚聲器和云的語音控制替代方案時,產(chǎn)品開發(fā)人員面臨著新的機(jī)遇和挑戰(zhàn)。開發(fā)人員必須考慮尺寸和位置,因為高度微型化的設(shè)備被嵌入到家具和電器中。將語音應(yīng)用程序與邊緣機(jī)器學(xué)習(xí)相結(jié)合對于讓產(chǎn)品隨著時間的推移變得更加智能是必要的。同時,設(shè)備也越來越依賴電池供電,需要開發(fā)人員進(jìn)行工程設(shè)計以實現(xiàn)最佳能源管理。最后,開發(fā)人員必須考慮用戶對功能的期望。對于消費者來說,精心設(shè)計的語音控制感覺無處不在,能夠聽到角落和穿墻的聲音。所有這些以及更多內(nèi)容匯集了在構(gòu)建支持 VUI 的產(chǎn)品時必須考慮的幾個設(shè)計元素。

語音控制 2.0 更自由的方面之一是可以自由地說出語音命令,而無需附近的智能揚聲器。集成在智能家居設(shè)備中的語音可以使整個家庭成為一個可聽區(qū)域,在識別喚醒詞或其他可定義的聲音時隨時可用。專門的硬件和軟件用于產(chǎn)生準(zhǔn)確的遠(yuǎn)場音頻捕獲。

設(shè)計技巧

為了在遠(yuǎn)場環(huán)境中有效地捕捉聲音,一些設(shè)計技術(shù)開始發(fā)揮作用,包括:端口方向:聲學(xué)端口是可以在沒有物理障礙的情況下接受音頻信號的地方。端口的位置(頂部或底部)由單個設(shè)備的外形尺寸決定。為了簡化設(shè)計,聲學(xué)端口通常位于麥克風(fēng)附近,如下所示。但是,端口孔應(yīng)與揚聲器和其他聲學(xué)噪聲源(例如電機(jī)放大器)足夠遠(yuǎn),以最大限度地減少麥克風(fēng)輸入處的不需要的信號。

pYYBAGLOlHGAf4-SAADGbhu2oQE285.png

pYYBAGLOlHGAf4-SAADGbhu2oQE285.png

圖 1. 頂部和底部加載聲學(xué)端口配置的橫截面(來源:Knowles)

麥克風(fēng)陣列和波束成形:使用多個麥克風(fēng)稱為“陣列”。在任何給定時刻,麥克風(fēng)陣列都會同時聽到來自各個方向的聲音。除了口頭命令外,他們還會聽到家中的其他聲音和動作。通過一種稱為波束成形的技術(shù),可以對麥克風(fēng)陣列進(jìn)行編程,以選擇性地捕獲來自一個方向的聲音,同時拒絕來自其他方向的聲音。波束成形算法的最終結(jié)果是選擇性地調(diào)諧出來自所需方向的信號以外的信號。波束成形是數(shù)字信號處理鏈中的第一步。

數(shù)字信號處理 (DSP) 算法:DSP 是任何語音控制系統(tǒng)的基石。這就是想要的音頻信息的意義——捕捉它、聚焦它、凈化它、放大它——這樣音素就可以發(fā)出文字、命令和噪音,而不會破壞這個過程。DSP 幾乎用于語音交互的所有階段,從音頻捕獲和語音增強(qiáng)到語音處理。

poYBAGLOlHeABH1RAAD6ke5lWrg712.png

poYBAGLOlHeABH1RAAD6ke5lWrg712.png

圖 2. 遠(yuǎn)場語音拾取(來源:Jerry Lu)

以便利為設(shè)計理念

除了針對功能進(jìn)行設(shè)計之外,支持 VUI 的設(shè)備還需要針對便利性和可用性進(jìn)行設(shè)計。喚醒詞的兩個主要設(shè)計考慮圍繞能源管理和處理能力。由于 VUI 必須始終處于“偵聽”模式以等待喚醒詞,因此電池供電的 VUI 和 VCD 必須設(shè)計用于極低的能量消耗以及立即喚醒。此外,設(shè)備在過濾掉不需要的聲音的同時區(qū)分想要的語音命令的能力需要不可忽視的處理能力,這需要準(zhǔn)確性和即時性。包含強(qiáng)大音頻邊緣處理器的產(chǎn)品現(xiàn)在可以提供計算能力和低功耗、低延遲操作,從而實現(xiàn)即時用戶體驗。

即使在今天的早期階段,語音控制的爆炸式增長也充分證明了智能家居中語音控制的市場機(jī)會。智能家居的支柱任務(wù),包括安全、能源管理、娛樂和高級安全,都通過語音控制變得更簡單、更容易訪問。語音最終可以作為整個智能家居的統(tǒng)一控制器,從房子的任何房間發(fā)出命令……如果它們的設(shè)計考慮到用戶并利用語音控制技術(shù)的重大進(jìn)步。

審核編輯 黃昊宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 設(shè)計方法
    +關(guān)注

    關(guān)注

    0

    文章

    12

    瀏覽量

    9174
  • 語音控制
    +關(guān)注

    關(guān)注

    5

    文章

    497

    瀏覽量

    28788
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    語音控制模塊工作原理

    語音控制芯片或者說模塊的應(yīng)用前景越來越廣泛,無論是設(shè)計方案還是廠家生產(chǎn)的產(chǎn)品在越來越多越來越頻繁的使用語音控制芯片。當(dāng)然行業(yè)內(nèi)更多的是稱呼為語音
    的頭像 發(fā)表于 06-17 11:49 ?226次閱讀
    <b class='flag-5'>語音</b><b class='flag-5'>控制</b>模塊工作原理

    你失去工作不是因為AI,而是因為使用AI的人

    當(dāng)算法能精準(zhǔn)預(yù)測消費者需求時,當(dāng)AI生成的文案比人類更懂傳播心理學(xué)時,當(dāng)自動化系統(tǒng)開始取代基礎(chǔ)決策崗位時,真正的危機(jī)已悄然降臨—— 不是AI在搶奪你的工作,而是那些比你更早掌握AI、更懂得如何駕馭
    的頭像 發(fā)表于 05-13 12:05 ?222次閱讀
    你失去工作<b class='flag-5'>不是</b>因為AI,<b class='flag-5'>而是</b>因為使用AI的人

    為什么dlp4710evm投射出來的條紋不是顯示的導(dǎo)入的圖片,而是每幅圖片都會產(chǎn)生漸變?

    我使用 internal patterns的方式投射圖片,我的投影儀參數(shù)如下圖所示, 為什么投射出來的條紋不是顯示的導(dǎo)入的圖片,而是每幅圖片都會產(chǎn)生漸變。
    發(fā)表于 02-26 06:35

    TTS語音播報控制器能做什么?

    TTS(Text-to-Speech)語音播報控制器,作為一種能夠?qū)⑽谋拘畔⑥D(zhuǎn)換為語音輸出的技術(shù)設(shè)備,在現(xiàn)代社會的各個領(lǐng)域中展現(xiàn)出了廣泛的應(yīng)用前景。TTS技術(shù)的出現(xiàn),豐富人機(jī)交互的方式,提高信息傳播
    的頭像 發(fā)表于 02-20 18:18 ?677次閱讀

    網(wǎng)絡(luò)語音控制器的原理與應(yīng)用

    隨著科技的飛速發(fā)展,網(wǎng)絡(luò)語音控制器作為一種新興的技術(shù)產(chǎn)品,已經(jīng)在各個領(lǐng)域展現(xiàn)出了其巨大的應(yīng)用潛力和價值。網(wǎng)絡(luò)語音控制器是一種人機(jī)系統(tǒng)中以語言驅(qū)動的
    的頭像 發(fā)表于 02-20 18:16 ?470次閱讀

    網(wǎng)絡(luò)語音控制器是什么設(shè)備

    網(wǎng)絡(luò)語音控制器,作為一種能夠通過語音識別技術(shù)接收并執(zhí)行用戶語音指令的智能設(shè)備,結(jié)合計算機(jī)、人工智能、物聯(lián)網(wǎng)、網(wǎng)絡(luò)通信、語音處理等技術(shù),使用戶
    的頭像 發(fā)表于 02-19 17:42 ?489次閱讀

    在DLP2021-Q1參考設(shè)計中,DMD與投影鏡頭不是平行的而是成一定的夾角,這樣的目的是什么?

    在DLP2021-Q1參考設(shè)計中,non-telecentric design 非遠(yuǎn)心設(shè)計方案里,DMD與投影鏡頭不是平行的而是成一定的夾角,這樣的目的是什么,不會引起畸變嗎?
    發(fā)表于 02-19 08:03

    在做導(dǎo)聯(lián)脫落檢測時,ADS1294的輸出不是77,而是63,為什么?

    我的ECG是用ADS1294作為AFE,ECG為三導(dǎo)聯(lián),CH1:LARA,CH2:LL RA, CH3:LLLA, 在做導(dǎo)聯(lián)脫落檢測時,ADS1294的輸出不是77,而是63,為什么?
    發(fā)表于 02-13 08:13

    空調(diào)語音控制方案NRK3501語音識別芯片-讓智能生活觸手可及!

    NRK3501語音識別芯片支持離線語音控制空調(diào),精準(zhǔn)識別,遠(yuǎn)場降噪,最多支持200條離線指令,5米內(nèi)識別率92%,讓智能家居更便捷舒適。
    的頭像 發(fā)表于 01-07 11:40 ?684次閱讀
    空調(diào)<b class='flag-5'>語音</b><b class='flag-5'>控制</b>方案NRK3501<b class='flag-5'>語音</b>識別芯片-讓智能生活觸手可及!

    ADS7841發(fā)送控制字節(jié)0x97的時候,ADOUT引腳不是一直保持低電平,而是會發(fā)送0x07呢?

    為什么我在用ADS7841,發(fā)送控制字節(jié)0x97的時候,ADOUT引腳不是一直保持低電平,而是會發(fā)送0x07呢?
    發(fā)表于 12-30 06:54

    請問TMP117的出廠溫度校準(zhǔn)不是線性校準(zhǔn)的而是分檔校準(zhǔn)的嗎?

    買了5個TMP117AI芯片,在高低溫箱做溫度精度實驗,發(fā)現(xiàn)TMP117測量-10度時溫度會從-11.99度跳變到-8.2度,測量零度的時候也會,我想請問TMP117的出廠溫度校準(zhǔn)不是線性校準(zhǔn)的而是分檔校準(zhǔn)的嗎?
    發(fā)表于 11-29 12:07

    ADS1293空采或者拔掉心電導(dǎo)聯(lián)線的時候,不是直線而是雜波?

    我們的產(chǎn)品在檢驗時遇到這樣一個問題,用生物信號器給信號的時候波形正常無雜波,但是為什么空采或者拔掉心電導(dǎo)聯(lián)線的時候,不是直線而是雜波?
    發(fā)表于 11-29 07:35

    智能語音開關(guān):離線控制,守護(hù)隱私的新選擇

    智能家居依賴網(wǎng)絡(luò),智能音箱成入口。但隱私泄露成問題,離線智能產(chǎn)品應(yīng)運而生。九芯電子采用NRK3502離線語音芯片,實現(xiàn)精準(zhǔn)語音控制,守護(hù)用戶隱私,操作便捷安全。
    的頭像 發(fā)表于 11-22 13:37 ?948次閱讀
    智能<b class='flag-5'>語音</b>開關(guān):離線<b class='flag-5'>控制</b>,守護(hù)隱私的新選擇

    基于語音識別技術(shù)的智能家居控制系統(tǒng)

    語音識別的智能控制系統(tǒng)是智能家居的重要組成部分,相比傳統(tǒng)的遙控或觸控方式,基于語音識別控制的智能家居系統(tǒng)通過人機(jī)語音交互的方式,實現(xiàn)對家居
    的頭像 發(fā)表于 11-19 17:25 ?1224次閱讀
    基于<b class='flag-5'>語音</b>識別技術(shù)的智能家居<b class='flag-5'>控制</b>系統(tǒng)

    為什么Gain=1對應(yīng)的默認(rèn)值不是16位二進(jìn)制補(bǔ)碼的中間數(shù)而是最小數(shù)?

    十進(jìn)制的-32768,7FFFh為十進(jìn)制的32767;分別對應(yīng)最大碼和最小碼,為什么Gain=1對應(yīng)的默認(rèn)值不是16位二進(jìn)制補(bǔ)碼的中間數(shù)而是最小數(shù)?
    發(fā)表于 11-18 08:12