一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

語音喚醒技術(shù)的對比,語音喚醒技術(shù)哪家強

語音技術(shù)智能匯 ? 來源:語音技術(shù)智能匯 ? 作者:語音技術(shù)智能匯 ? 2022-03-23 10:54 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

編輯導(dǎo)語:

隨著語音交互技術(shù)的日漸成熟,越來越多的智能硬件都選擇增加語音能力作為產(chǎn)品賣點之一。但是,設(shè)備在進入語音交互工作狀態(tài)的時候,需要先進行喚醒操作。

常見的喚醒語音交互的操作有按鍵或者觸屏形式,但是,為了進一步降低學(xué)習(xí)成本和操作復(fù)雜度,也有不少的智能硬件選擇通過語音喚醒的方式來激活交互功能。

本文將綜合對比市面上各家提供的語音喚醒技術(shù)相關(guān)指標(biāo),可以幫助你快速掌握語音喚醒技術(shù)的情況。

一、語音喚醒技術(shù)的相關(guān)核心指標(biāo)

1、喚醒率

語音喚醒的主要目的既然是激活設(shè)備進入交互工作狀態(tài),那么,喚醒率的高低就顯得額外重要了。理論上,最好的狀態(tài)就是我只要說一次喚醒詞,設(shè)備就能立即響應(yīng)。不過,受說話人與設(shè)備距離、發(fā)音標(biāo)準(zhǔn)、噪聲等各種各樣的因素,實際工作中比較難達到次次響應(yīng)的完美工作狀態(tài)。

一般來說,在近距離的安靜場景下,市面上的技術(shù)都能夠做到喚醒率在95%以上。

不過,消費者的實際使用場景是較復(fù)雜的,因此,需要模擬不同的應(yīng)用場景進行實測,才能得到最后的喚醒率指標(biāo)。

2、誤喚醒率

指設(shè)備被非喚醒詞喚醒的概率,誤喚醒率越高,效果越不好。

大家在日常生活中可能會經(jīng)常碰到,放在家里的智能音箱,大晚上莫名其妙答一句“我在”,把人嚇個半死;還有如果家里用的智能電視,喚醒手機語音助手的時候,不是同一個喚醒詞,電視也會蹦出一句“我在”。

這就是典型的誤喚醒場景,一般用24小時被誤喚醒多少次來衡量。

3、響應(yīng)時長

主要是指用戶說完喚醒詞后,設(shè)備給出反饋的耗時,一般越短越好。

而反饋的形式則比較多樣,可以通過語音應(yīng)答響應(yīng)、也可以通過亮屏或者指示燈閃爍響應(yīng)。統(tǒng)計來看,如果是亮屏或者指示燈閃爍響應(yīng),控制在200ms以內(nèi)用戶體驗較好;如果是語音應(yīng)答響應(yīng),太快反而體驗不好,一般控制在500ms左右更佳。

4、功耗

主要是針對電池供電設(shè)備,理論上越低越好,這樣,設(shè)備的使用時長不會受到太大的影響。

因為喚醒的工作原理是會持續(xù)檢測聲音中是否包含喚醒詞的特定片段,所以,會持續(xù)耗電。

為了進一步降低功耗,部分產(chǎn)品也會采取DSP來完成語音喚醒,再通過AP層兜底的模式,保證喚醒和功耗的均衡。

總結(jié):語音喚醒的技術(shù)指標(biāo),除了與算法相關(guān)之外,還與智能硬件的結(jié)構(gòu)設(shè)計、芯片算力、使用場景等息息相關(guān)。最后的實際效果,則應(yīng)以實際測試效果為準(zhǔn),參考下圖:

二、語音喚醒技術(shù)對比

該對比信息均從互聯(lián)網(wǎng)公開渠道獲取,相關(guān)信息來源于提供商官網(wǎng)公開信息,如其官網(wǎng)有更新,請以更新信息為準(zhǔn)。(PS:百度搜索關(guān)鍵詞“語音喚醒”)

poYBAGI6i66AIXdTAAn5A2rKJxY710.png

三、喚醒詞的區(qū)別

喚醒詞的定義實際是比較廣泛,至少包含了四種使用場景:品牌喚醒詞(如,小飛小飛)、離線命令詞(如,我要聽周杰倫的歌)、云端命令詞(如,我要聽周杰倫的歌)、免喚醒詞(如,下一首、暫停)。這些使用場景,實際上都是使用了喚醒詞的原理,只是喚醒后執(zhí)行不同的動作。

四、語音喚醒項目實施要點

1、喚醒詞評估

大部分服務(wù)商都提供了喚醒詞評估服務(wù),不過,有部分服務(wù)商對喚醒詞有一定的限制。因此,在選擇喚醒詞的時候,需要充分考慮品牌、發(fā)音特點、詞語等因素,綜合確定最終的喚醒詞。

2、確認(rèn)測試環(huán)境和工具

以以往交付的喚醒項目來看,主要測試的環(huán)境包括:外噪場景測試、自噪場景測試、安靜場景測試和誤喚醒測試。

3、聲音采集

根據(jù)產(chǎn)品主要面向的使用人群,采集真人發(fā)音音頻。

示例:【某某投影儀音頻采集需求】

  • 采集人數(shù)200人,總音頻2000句
  • 男女比=1:1
  • 一人10句
  • 語速快:中:慢=1:3:1
  • 年齡兒童:青年:中年=1:3:1
  • 區(qū)域:北上廣深
  • 普通話

4、測試音頻處理

包括去除破音的音頻、去除時長>1.7s的測試音頻、音頻幅度歸一化。

5、數(shù)據(jù)記錄表

根據(jù)實測結(jié)果,如實填寫表格中對應(yīng)測試結(jié)果,完成項目驗收。

如果需要更深入地咨詢了解,可添加筆者V:HolaAI,詳細(xì)交流。

審核編輯:符乾江

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 語音控制
    +關(guān)注

    關(guān)注

    5

    文章

    497

    瀏覽量

    28790
  • 語音交互
    +關(guān)注

    關(guān)注

    3

    文章

    307

    瀏覽量

    28607
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    智能語音技術(shù)重新定義車載交互邊界

    憑借自主研發(fā)的智能語音技術(shù),為某國內(nèi)頭部車企提供的語音前處理、喚醒詞、ASR、TTS等技術(shù)
    的頭像 發(fā)表于 07-11 14:00 ?307次閱讀

    智芯科超低功耗離線語音喚醒芯片的應(yīng)用場景

    想讓設(shè)備無需聯(lián)網(wǎng)也能秒速響應(yīng)語音指令?我們的超低功耗離線語音喚醒芯片正是答案!采用前沿技術(shù),待機能耗近乎“休眠”,續(xù)航焦慮一掃而空,智能穿戴、智能家居等設(shè)備電量更持久。
    的頭像 發(fā)表于 07-08 10:24 ?314次閱讀

    告別 “起床氣”!NV340D 語音芯片解鎖電子鬧鐘喚醒新體驗!

    在快節(jié)奏的現(xiàn)代生活中,電子鬧鐘作為我們每天清晨的“喚醒伙伴”,其重要性不言而喻。如今,隨著科技的飛速發(fā)展,電子鬧鐘也在不斷進化,功能日益豐富。而這背后,離不開關(guān)鍵技術(shù)——語音芯片的強力支持
    的頭像 發(fā)表于 07-05 11:09 ?303次閱讀
    告別 “起床氣”!NV340D <b class='flag-5'>語音</b>芯片解鎖電子鬧鐘<b class='flag-5'>喚醒</b>新體驗!

    芯知識|廣州唯創(chuàng)電子WT2003H語音芯片:智能低功耗,喚醒隨心控

    在電池供電或?qū)拿舾械?b class='flag-5'>語音應(yīng)用場景中,WT2003H語音芯片憑借其精心設(shè)計的雙模式低功耗休眠架構(gòu),為開發(fā)者提供了靈活高效的節(jié)能解決方案,顯著延長設(shè)備續(xù)航時間。核心低功耗模式解析深度休眠模式
    的頭像 發(fā)表于 06-30 08:52 ?102次閱讀
    芯知識|廣州唯創(chuàng)電子WT2003H<b class='flag-5'>語音</b>芯片:智能低功耗,<b class='flag-5'>喚醒</b>隨心控

    信息入選2024語音識別技術(shù)公司TOP30榜單

    憑借在語音識別領(lǐng)域多年的技術(shù)積淀與持續(xù)的創(chuàng)新突破,成功入選“2024語音識別技術(shù)公司TOP30”榜單。作為行業(yè)標(biāo)桿,普
    的頭像 發(fā)表于 04-18 17:25 ?622次閱讀

    離線語音模組VC系列出廠固件使用教程——SDK開源?

    安信可VC系列離線語音模組,采用云知聲方案,在語音識別技術(shù)上不斷優(yōu)化和創(chuàng)新算法,離線識別算法與芯片架構(gòu)深度融合,為客戶提供超低成本的離線語音識別方案,可廣泛且快速應(yīng)用于智能家居,各類智
    的頭像 發(fā)表于 02-26 14:14 ?486次閱讀
    離線<b class='flag-5'>語音</b>模組VC系列出廠固件使用教程——SDK開源?

    谷歌“減法”新動作:砍掉耳機按鍵喚醒朗讀功能

    電子發(fā)燒友網(wǎng)報道(文/莫婷婷)近期,谷歌宣布將對耳機上的 Google Assistant語音助手功能進行調(diào)整,取消通過觸控喚醒助理“自動朗讀未讀通知”的功能。谷歌表示,要想完成該功能可以通過語音
    的頭像 發(fā)表于 02-22 22:56 ?2452次閱讀
    谷歌“減法”新動作:砍掉耳機按鍵<b class='flag-5'>喚醒</b>朗讀功能

    語音識別技術(shù)的應(yīng)用與發(fā)展

    語音識別技術(shù)的發(fā)展可以追溯到20世紀(jì)50年代,但直到近年來,隨著計算能力的提升和機器學(xué)習(xí)技術(shù)的進步,這項技術(shù)才真正成熟并廣泛應(yīng)用于各個領(lǐng)域。語音
    的頭像 發(fā)表于 11-26 09:20 ?1624次閱讀

    ASR語音識別技術(shù)應(yīng)用

    ASR(Automatic Speech Recognition)語音識別技術(shù),是計算機科學(xué)與人工智能領(lǐng)域的重要突破,能將人類語音轉(zhuǎn)換為文本,廣泛應(yīng)用于智能家居、醫(yī)療、交通等多個領(lǐng)域。以下是對ASR
    的頭像 發(fā)表于 11-18 15:12 ?2056次閱讀

    語音燈控新體驗,讓傳統(tǒng)開關(guān)實現(xiàn)智能化!

    —方案開發(fā)—LED燈語音控制方案LED燈語音控制方案是一種基于語音識別技術(shù)的智能家居解決方案,旨在通過語音指令實現(xiàn)對家中燈光的智能控制。該方
    的頭像 發(fā)表于 10-19 08:08 ?938次閱讀
    <b class='flag-5'>語音</b>燈控新體驗,讓傳統(tǒng)開關(guān)實現(xiàn)智能化!

    【電磁兼容技術(shù)案例分享】因喚醒線導(dǎo)致的CE電壓法測試超標(biāo)整改分析案例

    【電磁兼容技術(shù)案例分享】因喚醒線導(dǎo)致的CE電壓法測試超標(biāo)整改分析案例
    的頭像 發(fā)表于 09-28 08:03 ?938次閱讀
    【電磁兼容<b class='flag-5'>技術(shù)</b>案例分享】因<b class='flag-5'>喚醒</b>線導(dǎo)致的CE電壓法測試超標(biāo)整改分析案例

    干貨分享 | TSMaster—LIN 喚醒與休眠機制

    在汽車總線中常見的喚醒方式有硬線喚醒、網(wǎng)絡(luò)喚醒和特定信號喚醒,而LIN總線則是通過休眠幀與喚醒電平來實現(xiàn)的,本文將介紹LIN的
    的頭像 發(fā)表于 09-25 08:03 ?3263次閱讀
    干貨分享 | TSMaster—LIN <b class='flag-5'>喚醒</b>與休眠機制

    HLK-V20支持用戶修改喚醒詞和命令詞 海凌科語音定制后臺系統(tǒng)上線

    HLK-V20離線語音模塊首發(fā)即爆款,在抖音上V20的單個視頻播放量過100萬。關(guān)于這款產(chǎn)品用戶咨詢量最多的便是語音命令詞和喚醒詞的自定義問題。在很多用戶看來,作為一款離線語音模塊,H
    的頭像 發(fā)表于 07-28 08:38 ?1625次閱讀
    HLK-V20支持用戶修改<b class='flag-5'>喚醒</b>詞和命令詞 海凌科<b class='flag-5'>語音</b>定制后臺系統(tǒng)上線

    信息成功中標(biāo)“語音智檢項目”

    在智能語音技術(shù)領(lǐng)域深耕多年,成功中標(biāo)澳門某銀行“語音智檢項目”,彰顯了普在智能語音
    的頭像 發(fā)表于 07-25 16:35 ?859次閱讀

    使用\"hi 樂鑫\"語音喚醒,成功率比較低怎么解決?

    你好,我正在測試使用 esp-box,使用\"hi 樂鑫\"語音喚醒,成功率比較低。 已經(jīng)設(shè)置為中文場景,但經(jīng)常用\"hi 樂鑫\"喚醒無反應(yīng),這里面有什么設(shè)置要求嗎? 另,樂這個字是個多音字,有什么方案可以在開發(fā)模式下更換
    發(fā)表于 07-19 06:33