一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

什么是無(wú)聲語(yǔ)音接口?

SSDFans ? 來(lái)源:SSDFans ? 2023-04-28 10:16 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

可穿戴設(shè)備依賴于具有標(biāo)準(zhǔn)物理能力的人機(jī)界面,如語(yǔ)音、觸摸或運(yùn)動(dòng)。雖然這種形式的機(jī)器交互適用于大多數(shù)消費(fèi)者,但殘疾人可能很難或無(wú)法操作標(biāo)準(zhǔn)的可穿戴設(shè)備。為了使更多人能夠使用可穿戴設(shè)備,研究人員正在研究新的人機(jī)界面。

最近,康奈爾大學(xué)的一個(gè)團(tuán)隊(duì)發(fā)表了一篇論文,描述了一副為不能發(fā)聲的用戶配備了無(wú)聲語(yǔ)音接口(SSI)的智能眼鏡。本文將討論無(wú)聲語(yǔ)音接口和來(lái)自康奈爾大學(xué)的可穿戴原型。

什么是無(wú)聲語(yǔ)音接口?

無(wú)聲語(yǔ)音接口(Silent speech interface,簡(jiǎn)稱SSI)允許人們無(wú)需發(fā)聲就能與機(jī)器互動(dòng)。雖然AI助手(如蘋(píng)果的Siri)等技術(shù)是通過(guò)聲音交流工作的,但SSI通過(guò)與語(yǔ)音相關(guān)的動(dòng)作來(lái)完成交流。

SSI技術(shù)通過(guò)嘴巴和舌頭的運(yùn)動(dòng)而不是聲音來(lái)識(shí)別語(yǔ)音。為了做到這一點(diǎn),SSI依賴于各種不同的傳感器,包括放置在嘴巴附近的振動(dòng)傳感器,用于檢測(cè)人們嘴巴的振動(dòng),以及跟蹤和分類與語(yǔ)音相關(guān)運(yùn)動(dòng)的攝像頭。在許多情況下,這些信息會(huì)被機(jī)器學(xué)習(xí)算法處理,該算法會(huì)解釋嘴巴的動(dòng)作,并將其翻譯成文字。

雖然大多數(shù)人可能找不到SSI的用途,但這項(xiàng)技術(shù)對(duì)于因疾病或受傷而失聲的人來(lái)說(shuō)是必不可少的,可以讓他們更容易地交流。例如,患有聲帶損傷或影響語(yǔ)言的神經(jīng)系統(tǒng)疾病的患者可以從SSI中獲益良多。

康奈爾大學(xué)開(kāi)發(fā)無(wú)攝像頭SSI眼鏡

最近,康奈爾大學(xué)的研究人員在SSI技術(shù)方面取得了重大進(jìn)展,發(fā)明了基于SSI的智能眼鏡。

該系統(tǒng)被稱為EchoSpeech,是一種新穎的、侵入性最小的SSI技術(shù),它使用低功率有源聲學(xué)傳感來(lái)捕捉由無(wú)聲語(yǔ)音引起的細(xì)微皮膚變形,并將這些信息轉(zhuǎn)換為可操作的數(shù)據(jù)。這款智能眼鏡的原型建立在康奈爾大學(xué)之前對(duì)一種類似的聲學(xué)傳感可穿戴設(shè)備(“EarIO”)的研究基礎(chǔ)上,EarIO可以從耳朵內(nèi)追蹤面部運(yùn)動(dòng)。

cf967ebe-e4fb-11ed-ab56-dac502259ad0.png

該系統(tǒng)依靠安裝在眼鏡框架上的一系列揚(yáng)聲器和麥克風(fēng)向皮膚發(fā)射聽(tīng)不見(jiàn)的聲波。發(fā)出的聲波產(chǎn)生沿多條路徑傳播的回聲,并被系統(tǒng)解釋推斷為佩戴者的無(wú)聲語(yǔ)音。EchoSpeech完全可以在標(biāo)準(zhǔn)的智能手機(jī)上運(yùn)行,只需要1到6分鐘的訓(xùn)練數(shù)據(jù),并以73.3 mW的低功耗實(shí)時(shí)運(yùn)行。該團(tuán)隊(duì)的深度學(xué)習(xí)算法可以實(shí)時(shí)分析回聲,準(zhǔn)確率約為95%。

該系統(tǒng)通過(guò)12名用戶研究進(jìn)行了評(píng)估,成功展示了識(shí)別31個(gè)獨(dú)立命令和三到六位連接數(shù)字的能力,單詞錯(cuò)誤率(WER)分別為4.5%(標(biāo)準(zhǔn)3.5%)和6.1%(標(biāo)準(zhǔn)4.2%)。此外,在行走和噪聲注入等場(chǎng)景中測(cè)試了系統(tǒng)的魯棒性。

更私密、低功耗、易使用

大多數(shù)SSI技術(shù)使用面部攝像頭,從用戶和與其交流的人那里收集數(shù)據(jù)。除了造成隱私問(wèn)題外,可穿戴攝像頭還會(huì)收集高帶寬視頻數(shù)據(jù)。

由于EchoSpeech不需要可穿戴攝像機(jī),設(shè)備只捕捉音頻數(shù)據(jù),這比圖像或視頻數(shù)據(jù)需要的帶寬要少得多,并且可以通過(guò)藍(lán)牙實(shí)時(shí)發(fā)送到手機(jī)。隱私信息永遠(yuǎn)不會(huì)脫離用戶的控制,因?yàn)閿?shù)據(jù)是在智能手機(jī)上本地處理的(不用在云中處理)。研究人員表示,純音頻傳感器的電池效率也更高:音頻傳感器可以工作10個(gè)小時(shí),而攝像頭只能工作30分鐘。

康奈爾大學(xué)的研究小組表示,他們發(fā)現(xiàn)EchoSpeech在很多應(yīng)用中都有應(yīng)用價(jià)值,從默念密碼來(lái)解鎖智能手機(jī),到跳過(guò)播放列表中的歌曲。該設(shè)備還可以與智能手機(jī)配對(duì),在說(shuō)話不方便的地方與他人交談,比如嘈雜的餐廳或安靜的圖書(shū)館。研究人員表示,該界面與手寫(xiě)筆和CAD等設(shè)計(jì)軟件兼容,從而消除了對(duì)鼠標(biāo)和鍵盤的需求。





審核編輯:劉清

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 人機(jī)界面
    +關(guān)注

    關(guān)注

    5

    文章

    544

    瀏覽量

    44940
  • SSI
    SSI
    +關(guān)注

    關(guān)注

    0

    文章

    38

    瀏覽量

    19648
  • 可穿戴設(shè)備
    +關(guān)注

    關(guān)注

    55

    文章

    3847

    瀏覽量

    168635

原文標(biāo)題:什么?無(wú)聲語(yǔ)音接口?

文章出處:【微信號(hào):SSDFans,微信公眾號(hào):SSDFans】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    芯知識(shí)|語(yǔ)音芯片發(fā)碼無(wú)聲解析:上電無(wú)聲、連發(fā)指令才響的三大根源及解決之道

    在嵌入式語(yǔ)音方案開(kāi)發(fā)中,廣州唯創(chuàng)電子語(yǔ)音芯片(如WT系列)以其高性價(jià)比和易用性廣受青睞。但當(dāng)開(kāi)發(fā)者遭遇“上電發(fā)碼無(wú)聲”或“必須連發(fā)兩次指令才有聲音”的問(wèn)題時(shí),往往陷入調(diào)試?yán)Ь场1疚膶⑸钊肫饰鲞@些現(xiàn)象
    的頭像 發(fā)表于 06-19 09:14 ?188次閱讀
    芯知識(shí)|<b class='flag-5'>語(yǔ)音</b>芯片發(fā)碼<b class='flag-5'>無(wú)聲</b>解析:上電<b class='flag-5'>無(wú)聲</b>、連發(fā)指令才響的三大根源及解決之道

    芯知識(shí)|語(yǔ)音芯片“無(wú)聲之謎”:當(dāng)DACL波形正常,功放開(kāi)啟卻無(wú)聲音時(shí)……

    信號(hào)“通道沖突”這一關(guān)鍵陷阱。一、無(wú)聲故障的典型表現(xiàn)與診斷盲點(diǎn)“正?!钡谋硐螅汗こ處熡檬静ㄆ鳈z測(cè)語(yǔ)音芯片(如廣州唯創(chuàng)電子某型號(hào))的關(guān)鍵引腳:供電電壓穩(wěn)定,邏輯通信正常
    的頭像 發(fā)表于 06-13 08:53 ?170次閱讀
    芯知識(shí)|<b class='flag-5'>語(yǔ)音</b>芯片“<b class='flag-5'>無(wú)聲</b>之謎”:當(dāng)DACL波形正常,功放開(kāi)啟卻<b class='flag-5'>無(wú)聲</b>音時(shí)……

    明遠(yuǎn)智睿SSD2351開(kāi)發(fā)板:語(yǔ)音機(jī)器人領(lǐng)域的變革力量

    連續(xù)的長(zhǎng)句語(yǔ)音識(shí)別,還是復(fù)雜口音的處理,都能快速響應(yīng),保證語(yǔ)音機(jī)器人與用戶之間流暢的對(duì)話體驗(yàn)。 其豐富的接口語(yǔ)音機(jī)器人的功能拓展提供了可能。USB
    發(fā)表于 05-28 11:36

    芯資訊|廣州唯創(chuàng)電子錄音語(yǔ)音芯片應(yīng)用指南及常見(jiàn)問(wèn)題解析

    、存儲(chǔ)及播放功能,但在實(shí)際應(yīng)用中,用戶可能遇到錄音后播放無(wú)聲音的問(wèn)題。本文將從技術(shù)原理、常見(jiàn)故障及解決方案展開(kāi)解析。二、錄音語(yǔ)音芯片的工作原理唯創(chuàng)電子語(yǔ)音芯片的核心
    的頭像 發(fā)表于 05-16 08:41 ?153次閱讀
    芯資訊|廣州唯創(chuàng)電子錄音<b class='flag-5'>語(yǔ)音</b>芯片應(yīng)用指南及常見(jiàn)問(wèn)題解析

    想在ARM中把TVL320的編碼解出來(lái),判斷有無(wú)聲音輸入?

    我想通過(guò)軟件,判斷有沒(méi)有聲音輸入。 我想在ARM中把TVL320的編碼解出來(lái),判斷有無(wú)聲音輸入。
    發(fā)表于 11-08 06:59

    omap4460開(kāi)發(fā)板錄音后播放無(wú)聲音是怎么回事?

    最近想調(diào)試一下omap4460的聲卡,發(fā)現(xiàn)omap4460可以播放聲音卻錄音以后播放無(wú)聲音?有么有搞過(guò)這塊的大神,能給些指點(diǎn)!非常感謝!
    發(fā)表于 11-05 07:27

    TLV320AIC33更換后數(shù)字mic無(wú)聲音是怎么回事?

    請(qǐng)問(wèn)原本pcba上的TLV320AIC33發(fā)生不良后,重新更換新的TLV320AIC33后數(shù)字mic無(wú)聲音? 電壓供電都正常,是否需要重新code編譯? 怎樣才能數(shù)字MIC正常工作?需要燒錄軟件嗎?
    發(fā)表于 10-29 07:57

    功放SR5200中置音箱無(wú)聲音是什么原因?怎么解決?

    請(qǐng)教各位高手,馬蘭士功放SR5200,以前是在數(shù)字播放模式下選擇PRO LOGIC播放時(shí),環(huán)繞有聲音,主聲道和中置無(wú)聲音,模擬播放主聲道有聲音,按照網(wǎng)友的指導(dǎo),更換了IC4391?,F(xiàn)在數(shù)字播放
    發(fā)表于 10-29 07:37

    TMS320C6000 MCBSP轉(zhuǎn)語(yǔ)音帶音頻處理器(VBAP)接口

    電子發(fā)燒友網(wǎng)站提供《TMS320C6000 MCBSP轉(zhuǎn)語(yǔ)音帶音頻處理器(VBAP)接口.pdf》資料免費(fèi)下載
    發(fā)表于 10-26 10:17 ?0次下載
    TMS320C6000 MCBSP轉(zhuǎn)<b class='flag-5'>語(yǔ)音</b>帶音頻處理器(VBAP)<b class='flag-5'>接口</b>

    tas5711 EVM配置以后無(wú)聲音輸出是怎么回事?

    tas5711 EVM DEMO板按照文檔配置以后無(wú)聲音輸出 麻煩幫忙分析, 謝謝 。 配置如下圖: 硬件連接圖如下:
    發(fā)表于 10-25 14:25

    TAS2552+AM4379為什么無(wú)聲音輸出?

    上開(kāi)發(fā)的,直接編譯會(huì)不成功,將相關(guān)的接口修改移植到3.12.10版本上后,編譯OK,運(yùn)行正常。 4、目前在調(diào)試聲卡情況如下: A、 I2C控制正常,讀,寫(xiě)寄存口信息正確; B、 GPIO使能管腳正確
    發(fā)表于 10-25 06:20

    請(qǐng)問(wèn)PCM1795輸出無(wú)聲音是怎么解決?

    PCM1795輸出無(wú)聲問(wèn)題,附件是原理圖請(qǐng)幫忙看一下有什么問(wèn)題
    發(fā)表于 10-16 06:59

    TLV320AIC23B-Q1無(wú)聲音輸出的原因?

    目前我們配置這個(gè)codec,無(wú)聲音傳輸。 背景:codec做slave設(shè)備,使用I2S接口,采樣頻率48k,16bit,選擇I2C配置 已經(jīng)確認(rèn)進(jìn)入codec的I2S信號(hào)沒(méi)有問(wèn)題,引線外接一個(gè)
    發(fā)表于 10-09 08:00

    LM4916規(guī)格書(shū)中的BTL方案接后無(wú)聲音輸出,是什么問(wèn)題呢?

    在應(yīng)用lm4916產(chǎn)品提,規(guī)格書(shū)中的BTL方案接后無(wú)聲音輸出,是什么問(wèn)題呢? 應(yīng)用立體聲輸出,聲音聽(tīng)起來(lái)有失真,請(qǐng)各高手指教,謝謝?。?
    發(fā)表于 09-20 14:42

    LM4991 WSON封裝手工搭建的電路,通電后揚(yáng)聲器無(wú)聲音,為什么?

    LM4991 WSON封裝,手工搭建的電路,5.2V供電,通電后,揚(yáng)聲器無(wú)聲音。 測(cè)量2腳bypass有2.4V的電壓,說(shuō)明整個(gè)芯片已經(jīng)開(kāi)始工作,但就是沒(méi)有聲音。 不知道電路在什么地方出問(wèn)題?相同的電路我換上SOIC封裝的LM4991工作正常。
    發(fā)表于 08-27 06:32