一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線(xiàn)課程
  • 觀(guān)看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

失語(yǔ)者的未來(lái):無(wú)聲語(yǔ)音的數(shù)字發(fā)聲

ss ? 來(lái)源:陳述根本 ? 作者:陳根 ? 2020-11-30 15:26 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

人工智能技術(shù)的精進(jìn)與開(kāi)發(fā)無(wú)疑對(duì)人工智能的應(yīng)用至關(guān)重要,而人工智能除了在與生活強(qiáng)關(guān)聯(lián)方面的應(yīng)用,回應(yīng)少數(shù)群體的需求也將成為人工智能發(fā)展的必然方向。

近日,加州大學(xué)伯克利分校的研究人員表示,他們正在使用無(wú)聲語(yǔ)言和收集肌肉活動(dòng)的傳感器來(lái)訓(xùn)練人工智能。其中,無(wú)聲語(yǔ)言是用肌電圖(EMG)檢測(cè)的,電極則放在臉和喉嚨上。研究人員表示,該模型的重點(diǎn)是研究被稱(chēng)之為“沉默語(yǔ)音”的模型,該模型可以檢測(cè)到人們想說(shuō)、但沒(méi)說(shuō)出聲的話(huà)。

研究人員相信,他們的方法可以為那些無(wú)法發(fā)出聲音的人提供大量的應(yīng)用,并且可以支持人工智能助手或其他對(duì)語(yǔ)音命令做出響應(yīng)的設(shè)備進(jìn)行沉默語(yǔ)音檢測(cè)。

盡管設(shè)想美好,但想真正實(shí)現(xiàn)卻并不容易:首先,在收集數(shù)據(jù)時(shí),研究者會(huì)先在實(shí)驗(yàn)者的臉上等部位貼8個(gè)貼片,每個(gè)貼片都是一個(gè)“監(jiān)視肌肉變化”的傳感器。

隨后,研究人員需要錄制一段實(shí)驗(yàn)者的有聲語(yǔ)音,并與肌電圖進(jìn)行對(duì)應(yīng)這種方法能夠?qū)⒓∪獾淖兓闆r、和語(yǔ)音的類(lèi)型對(duì)應(yīng)起來(lái)。然后使用WaveNet解碼器生成音頻語(yǔ)音預(yù)測(cè)。在記錄數(shù)據(jù)的過(guò)程中,還要再錄制一段“對(duì)口型”的肌電圖,但不需要發(fā)聲,也就是“沉默語(yǔ)音”。

與用發(fā)聲肌電數(shù)據(jù)訓(xùn)練的基線(xiàn)相比,該方法在書(shū)中句子轉(zhuǎn)錄的單詞錯(cuò)誤率下降了64%到4%,錯(cuò)誤率比基線(xiàn)減少了95%。此外,為了推動(dòng)這一領(lǐng)域的進(jìn)一步研究,研究人員還開(kāi)發(fā)了一個(gè)由近20小時(shí)面部肌電數(shù)據(jù)組成的數(shù)據(jù)集。

這項(xiàng)題為“無(wú)聲語(yǔ)音的數(shù)字發(fā)聲”的研究論文,在近日舉行的自然語(yǔ)言處理經(jīng)驗(yàn)方法(EMNLP)活動(dòng)上,獲得了最佳論文獎(jiǎng)。

研究小組的論文寫(xiě)道:“數(shù)字化無(wú)聲語(yǔ)音有著廣泛的潛在應(yīng)用。”例如,它可以用來(lái)制造一種類(lèi)似于藍(lán)牙耳機(jī)的設(shè)備,它允許人們?cè)诓桓蓴_周?chē)说那闆r下進(jìn)行電話(huà)交談。而顯然,這種設(shè)備在環(huán)境噪音太大無(wú)法捕捉到可聽(tīng)語(yǔ)音或保持沉默的環(huán)境中將具有重要作用。

責(zé)任編輯:xj

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀(guān)點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 智能
    +關(guān)注

    關(guān)注

    8

    文章

    1733

    瀏覽量

    120241
  • AI
    AI
    +關(guān)注

    關(guān)注

    88

    文章

    35164

    瀏覽量

    279917
  • 數(shù)字化
    +關(guān)注

    關(guān)注

    8

    文章

    9527

    瀏覽量

    63584
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    Air8000 TTS開(kāi)源,語(yǔ)音合成從此“零距離”!

    技術(shù)不應(yīng)有圍墻,創(chuàng)新需要共生長(zhǎng)。Air8000宣布TTS應(yīng)用源代碼全面開(kāi)放,開(kāi)發(fā)可自由定制語(yǔ)音風(fēng)格、優(yōu)化合成效果,讓文字與聲音的對(duì)話(huà),不再受限于黑箱算法。 TTS (Text-to-Speech
    的頭像 發(fā)表于 07-03 16:33 ?202次閱讀
    Air8000 TTS開(kāi)源,<b class='flag-5'>語(yǔ)音</b>合成從此“零距離”!

    芯知識(shí)|語(yǔ)音芯片發(fā)碼無(wú)聲解析:上電無(wú)聲、連發(fā)指令才響的三大根源及解決之道

    在嵌入式語(yǔ)音方案開(kāi)發(fā)中,廣州唯創(chuàng)電子語(yǔ)音芯片(如WT系列)以其高性?xún)r(jià)比和易用性廣受青睞。但當(dāng)開(kāi)發(fā)遭遇“上電發(fā)碼無(wú)聲”或“必須連發(fā)兩次指令才有聲音”的問(wèn)題時(shí),往往陷入調(diào)試?yán)Ь?。本文將?/div>
    的頭像 發(fā)表于 06-19 09:14 ?195次閱讀
    芯知識(shí)|<b class='flag-5'>語(yǔ)音</b>芯片發(fā)碼<b class='flag-5'>無(wú)聲</b>解析:上電<b class='flag-5'>無(wú)聲</b>、連發(fā)指令才響的三大根源及解決之道

    芯知識(shí)|語(yǔ)音芯片“無(wú)聲之謎”:當(dāng)DACL波形正常,功放開(kāi)啟卻無(wú)聲音時(shí)……

    信號(hào)“通道沖突”這一關(guān)鍵陷阱。一、無(wú)聲故障的典型表現(xiàn)與診斷盲點(diǎn)“正?!钡谋硐螅汗こ處熡檬静ㄆ鳈z測(cè)語(yǔ)音芯片(如廣州唯創(chuàng)電子某型號(hào))的關(guān)鍵引腳:供電電壓穩(wěn)定,邏輯通信正常
    的頭像 發(fā)表于 06-13 08:53 ?181次閱讀
    芯知識(shí)|<b class='flag-5'>語(yǔ)音</b>芯片“<b class='flag-5'>無(wú)聲</b>之謎”:當(dāng)DACL波形正常,功放開(kāi)啟卻<b class='flag-5'>無(wú)聲</b>音時(shí)……

    國(guó)星光電榮獲2025 IDC中國(guó)未來(lái)數(shù)字工業(yè)領(lǐng)航獎(jiǎng)項(xiàng)

    未來(lái)數(shù)字工業(yè)領(lǐng)航——云原生軟件創(chuàng)新先鋒”獎(jiǎng)項(xiàng),標(biāo)志著國(guó)星光電在工業(yè)軟件領(lǐng)域的生態(tài)協(xié)同能力和創(chuàng)新實(shí)踐成果獲得權(quán)威認(rèn)可。
    的頭像 發(fā)表于 05-27 11:42 ?501次閱讀

    解碼未來(lái)數(shù)字編碼器如何重塑智能世界

    標(biāo)題:《解碼未來(lái)數(shù)字編碼器如何重塑智能世界》 在數(shù)字化浪潮席卷全球的今天,每一個(gè)微小的信號(hào)轉(zhuǎn)換都可能成為推動(dòng)技術(shù)革命的關(guān)鍵。而在這場(chǎng)無(wú)聲的變革中,
    的頭像 發(fā)表于 04-07 08:44 ?263次閱讀
    解碼<b class='flag-5'>未來(lái)</b>:<b class='flag-5'>數(shù)字</b>編碼器如何重塑智能世界

    從datasheet到量產(chǎn):WT2000P替代ISD錄音方案的PCB布局優(yōu)化與EMI防護(hù)全記錄

    在如今的社會(huì),智能語(yǔ)音產(chǎn)品已逐漸普遍融入人們的生活,智能語(yǔ)音產(chǎn)品已經(jīng)逐漸替代了許多“啞巴產(chǎn)品”。而智能語(yǔ)音產(chǎn)品之所以能發(fā)聲,主要也是因?yàn)楫a(chǎn)品加入了語(yǔ)
    的頭像 發(fā)表于 02-23 15:26 ?401次閱讀
    從datasheet到量產(chǎn):WT2000P替代ISD錄音方案的PCB布局優(yōu)化與EMI防護(hù)全記錄

    ISD系列錄音芯片無(wú)縫替代方案-唯創(chuàng)知音WT2000P

    01背景:在如今的社會(huì),智能語(yǔ)音產(chǎn)品已逐漸普遍融入人們的生活,智能語(yǔ)音產(chǎn)品已經(jīng)逐漸替代了許多“啞巴產(chǎn)品”。而智能語(yǔ)音產(chǎn)品之所以能發(fā)聲,主要也是因?yàn)楫a(chǎn)品加入了
    的頭像 發(fā)表于 12-26 17:33 ?812次閱讀
    ISD系列錄音芯片無(wú)縫替代方案-唯創(chuàng)知音WT2000P

    PCM1794數(shù)字模擬分開(kāi)供電,二地通過(guò)一個(gè)磁珠連接,pcm1794有輕微發(fā)熱正常嗎?

    PCM1794數(shù)字模擬分開(kāi)供電,二地通過(guò)一個(gè)磁珠連接。后邊使用官方濾波電路,剛開(kāi)始工作正常,但是pcm1794有輕微發(fā)熱,正常嗎?另外工作一段時(shí)間后(大概十幾分鐘,有時(shí)候半個(gè)小時(shí))就不能發(fā)聲
    發(fā)表于 11-05 07:23

    TLV320AIC33更換后數(shù)字mic無(wú)聲音是怎么回事?

    請(qǐng)問(wèn)原本pcba上的TLV320AIC33發(fā)生不良后,重新更換新的TLV320AIC33后數(shù)字mic無(wú)聲音? 電壓供電都正常,是否需要重新code編譯? 怎樣才能數(shù)字MIC正常工作?需要燒錄軟件嗎?
    發(fā)表于 10-29 07:57

    功放SR5200中置音箱無(wú)聲音是什么原因?怎么解決?

    請(qǐng)教各位高手,馬蘭士功放SR5200,以前是在數(shù)字播放模式下選擇PRO LOGIC播放時(shí),環(huán)繞有聲音,主聲道和中置無(wú)聲音,模擬播放主聲道有聲音,按照網(wǎng)友的指導(dǎo),更換了IC4391。現(xiàn)在數(shù)字播放
    發(fā)表于 10-29 07:37

    請(qǐng)問(wèn)PCM1795輸出無(wú)聲音是怎么解決?

    PCM1795輸出無(wú)聲問(wèn)題,附件是原理圖請(qǐng)幫忙看一下有什么問(wèn)題
    發(fā)表于 10-16 06:59

    在仿真放大器時(shí),如何讓speaker發(fā)聲呢?

    在仿真放大器時(shí),發(fā)現(xiàn)TINA-TI Speaker 無(wú)聲?如何讓speaker發(fā)聲呢?
    發(fā)表于 10-10 08:29

    九芯電子革新健康檢測(cè)!語(yǔ)音播報(bào)血壓計(jì)ic芯片解決方案

    血壓計(jì),可測(cè)量血壓并將讀數(shù)顯示在屏幕上。為了提高老年人和視障人士的可用性,現(xiàn)代電子語(yǔ)音血壓計(jì)已經(jīng)開(kāi)發(fā)出來(lái),可提供當(dāng)前血壓讀數(shù)的聽(tīng)覺(jué)反饋。這是通過(guò)集成語(yǔ)音芯片來(lái)實(shí)現(xiàn)的,該芯片將測(cè)量結(jié)果發(fā)聲給用戶(hù)
    的頭像 發(fā)表于 09-22 08:00 ?524次閱讀
    九芯電子革新健康檢測(cè)!<b class='flag-5'>語(yǔ)音</b>播報(bào)血壓計(jì)ic芯片解決方案

    早教有聲掛圖畫(huà)能夠發(fā)聲的工作原理

    有聲掛圖通常分為單語(yǔ)、雙語(yǔ)、多語(yǔ),單面、雙面,以及凹凸和平面之分。至于它能夠發(fā)聲主要依賴(lài)于內(nèi)部的語(yǔ)音芯片,這些芯片能夠響應(yīng)小孩子的觸摸操作,觸發(fā)特定的聲音播放。通過(guò)精心設(shè)計(jì)的圖案和對(duì)應(yīng)的發(fā)聲位置
    的頭像 發(fā)表于 08-30 12:05 ?998次閱讀
    早教有聲掛圖畫(huà)能夠<b class='flag-5'>發(fā)聲</b>的工作原理

    揚(yáng)聲器的發(fā)聲原理是什么

    揚(yáng)聲器的發(fā)聲原理是一個(gè)涉及電聲轉(zhuǎn)換的復(fù)雜過(guò)程,其核心在于將電信號(hào)轉(zhuǎn)化為聲波,從而被人耳所接收。
    的頭像 發(fā)表于 08-08 18:16 ?5249次閱讀