一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

基于Coretex-M3 Design Start的語(yǔ)音識(shí)別和聲源定位識(shí)別系統(tǒng)

安芯教育科技 ? 來(lái)源:安芯教育科技 ? 作者:安芯教育科技 ? 2022-04-08 10:10 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

寫在前面

能獲得企業(yè)大獎(jiǎng)其實(shí)是出乎預(yù)料的,論復(fù)雜程度我自己認(rèn)為可能也無(wú)法比的上其他學(xué)校的朋友們的(不過(guò)是因?yàn)榻衲隂](méi)有線下交流,著實(shí)無(wú)法看到大家的作品),但我覺(jué)得組委會(huì)能選擇我們組作為企業(yè)大獎(jiǎng),可能也是想通過(guò)我們來(lái)拓寬大家的思路,而并不一定是我們的作品做的是多么完美。

學(xué)習(xí)了近幾年ARM杯的作品,感覺(jué)大家都是在同一個(gè)領(lǐng)域做文章(當(dāng)然去年那組BLDC的hxd例外),那就是視覺(jué)和圖像處理方面。這方面感覺(jué)大家做的都非常好了,無(wú)論是用現(xiàn)成的算法拆分成verilog中的矩陣運(yùn)算,還是利用HLS這類高層次綜合工具,我覺(jué)得如果繼續(xù)做視覺(jué)方面的內(nèi)容我們可能再怎么努力也無(wú)法達(dá)到他人積累多年經(jīng)驗(yàn)的程度,所以我們選擇換一個(gè)角度。

人類有五種感官,嗅覺(jué)和味覺(jué)目前來(lái)說(shuō)無(wú)法做到輔助(笑,還剩下聽(tīng)覺(jué)、視覺(jué)和觸覺(jué),視覺(jué)被我們直接否定了,那么觸覺(jué)呢?目前高精度傳感器也不是我們能企及做到的了,這和生物醫(yī)學(xué)電子有關(guān),那么我們的眼前就只有一個(gè)選擇了:聽(tīng)覺(jué)。

這也正是我們選擇做這個(gè)系統(tǒng)的原因之一,還有一個(gè)原因是我們能感覺(jué)得到現(xiàn)在的消費(fèi)電子都逐漸在向聲學(xué)方面走,例如蘋果的HomePod,華為的Sound X,還有小米最近剛推出的小米Sound,這些都是非常高端的走計(jì)算聲學(xué)方向的家居產(chǎn)品,它們的受眾非常廣,而且在這兩年疫情的影響下,更多的人會(huì)選擇在線會(huì)議,那么一個(gè)優(yōu)秀的聲學(xué)處理裝置就顯得更為重要了。

1.設(shè)計(jì)簡(jiǎn)介

1.1 總體介紹

本作品是基于Coretex-M3 Design Start的語(yǔ)音識(shí)別和聲源定位識(shí)別系統(tǒng),包括Digilent NexysVideo開(kāi)發(fā)板、自制麥克風(fēng)矩陣模塊、ESP8266無(wú)線互聯(lián)模塊、LCD屏幕、載體小車以及安卓端APP組成。

本系統(tǒng)在Xilinx Artix-7中搭建ARM Cortex-M3軟核作為中央處理器,使用自制的MEMS硅片麥克風(fēng)陣列作為聲音信號(hào)采集器,利用Artix-7中自帶的XADC將麥克風(fēng)輸出的模擬量信號(hào)轉(zhuǎn)換為數(shù)字信號(hào)并通過(guò)AXI4-FULL傳輸給DDR3控制器,DDR3控制器根據(jù)用戶的控制選擇輸入和輸出,當(dāng)開(kāi)始語(yǔ)音識(shí)別后,將開(kāi)啟后1s內(nèi)的數(shù)據(jù)從DDR3中直接利用Burst讀入語(yǔ)音識(shí)別模塊,該模塊利用HLS綜合,包括語(yǔ)音的MFCC特征提取、BP神經(jīng)網(wǎng)絡(luò)的執(zhí)行等過(guò)程,將最終得出的語(yǔ)音識(shí)別結(jié)果保存在寄存器中并能使CPU通過(guò)AXI4-Lite讀取;當(dāng)開(kāi)啟聲源定位后,數(shù)據(jù)利用AXI4-Stream直接搬移到算法電路模塊,對(duì)四路麥克風(fēng)同時(shí)進(jìn)行流水線處理,經(jīng)過(guò)信號(hào)的處理和變換后得到聲源方位數(shù)據(jù)通過(guò)UART串口輸出到ESP8266,ESP8266利用局域網(wǎng)將數(shù)據(jù)傳至安卓APP。

有一點(diǎn)我們的體會(huì)可以分享給其他朋友們,如果我們?cè)谝欢螘r(shí)間內(nèi)只需要處理一段定長(zhǎng)的數(shù)據(jù),那么我們可以不利用DMA,而是僅僅利用AXI的Burst傳輸即可,例如采集1s的信號(hào)寸到DDR中一段連續(xù)區(qū)域以后,將這些的音頻信號(hào)數(shù)據(jù)整個(gè)Burst到加速器中,這樣可以充分發(fā)揮總線橋的作用,并節(jié)省一個(gè)DMA的資源,還可以減小數(shù)據(jù)搬移過(guò)來(lái)過(guò)去的時(shí)延。

1.2 硬件架構(gòu)

d9baacbc-b6a8-11ec-aa7f-dac502259ad0.jpg

在本系統(tǒng)中,由于最終制作的語(yǔ)音識(shí)別加速器和聲源定位加速器都使用AXI系列總線配置寄存器和讀寫數(shù)據(jù),同時(shí)DDR3由AXI總線接口的MIG管理,因此為了方便實(shí)用和同一總線,使整個(gè)架構(gòu)簡(jiǎn)潔,我們將除了ITCM和DTCM外的所有外設(shè)連接在由AHB轉(zhuǎn)換之后的AXI總線橋上。

1.3 語(yǔ)音識(shí)別加速器

語(yǔ)音識(shí)別采用的方案是利用MFCC提取特征,之后利用BP神經(jīng)網(wǎng)絡(luò)擬合特征系數(shù)對(duì)應(yīng)的神經(jīng)網(wǎng)絡(luò)隱含層參數(shù)。首先輸入的語(yǔ)音數(shù)據(jù)從DDR經(jīng)過(guò)Burst傳輸?shù)叫盘?hào)處理模塊中,經(jīng)過(guò)預(yù)處理(去工頻噪聲、音量均衡)后提取MFCC,再利用BP網(wǎng)絡(luò)將MFCC系數(shù)與訓(xùn)練過(guò)的語(yǔ)句一一對(duì)應(yīng)輸出對(duì)應(yīng)的結(jié)果。語(yǔ)音識(shí)別的網(wǎng)絡(luò)的權(quán)重參數(shù)采用的是MATLAB離線訓(xùn)練的方法,然后把訓(xùn)練的權(quán)重?cái)?shù)據(jù)保存在coe文件中,利用HLS綜合出IP。

流程圖如下:

d9d13f68-b6a8-11ec-aa7f-dac502259ad0.png

1.4 聲源定位加速器

聲源定位加速器融合了TDOA(Time Difference of Arrival 到達(dá)時(shí)間差)和空域波束指向性加權(quán)的方法。

由四個(gè)全向性麥克風(fēng)M1, M2, M3, M4組成的差分麥克風(fēng)列,如圖2.10所示。四麥克風(fēng)等間隔的分布在直徑為D的圓周上。

d9f2eb04-b6a8-11ec-aa7f-dac502259ad0.png

差分麥克風(fēng)陣列的輸出信號(hào)包括原點(diǎn)處的聲壓信號(hào)和原點(diǎn)處振速的兩個(gè)正交分量,可以得到聲源在原點(diǎn)處的聲強(qiáng),進(jìn)而由聲強(qiáng)的方向得到目標(biāo)方位的估計(jì)值。需要指出的是,基于聲強(qiáng)估計(jì)的聲源定位方法通常只適用于單聲源的情況。同時(shí),對(duì)于全向麥克風(fēng)而言(不同于“心”形指向麥克風(fēng)),并沒(méi)有對(duì)特定角度的聲源信號(hào)進(jìn)行增強(qiáng)或削弱,這就使得在進(jìn)行聲源定位時(shí)往往受到其他方向的干擾。采用空域波束指向性加權(quán)的方法,可以只增強(qiáng)期望方向上的信號(hào),削弱其他方向上的干擾信號(hào),提高信干比,使得輸出結(jié)果中特定方向上的信息能量增大。

2.作品外觀和使用體驗(yàn)

作品成品外觀如下:

da0d74ba-b6a8-11ec-aa7f-dac502259ad0.jpg

da457626-b6a8-11ec-aa7f-dac502259ad0.jpg

da692fa8-b6a8-11ec-aa7f-dac502259ad0.jpg

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 語(yǔ)音識(shí)別
    +關(guān)注

    關(guān)注

    39

    文章

    1782

    瀏覽量

    114241
  • 識(shí)別系統(tǒng)
    +關(guān)注

    關(guān)注

    1

    文章

    154

    瀏覽量

    19149
  • CORETEX
    +關(guān)注

    關(guān)注

    0

    文章

    2

    瀏覽量

    6444

原文標(biāo)題:【2021集創(chuàng)賽作品分享】第三期 | Cortex-M3語(yǔ)音識(shí)別聲源定位系統(tǒng)

文章出處:【微信號(hào):Ithingedu,微信公眾號(hào):安芯教育科技】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    水下目標(biāo)智能識(shí)別系統(tǒng)軟件平臺(tái)

    水下目標(biāo)智能識(shí)別系統(tǒng)軟件平臺(tái)
    的頭像 發(fā)表于 07-16 15:28 ?57次閱讀
    水下目標(biāo)智能<b class='flag-5'>識(shí)別系統(tǒng)</b>軟件平臺(tái)

    基于FPGA的數(shù)字識(shí)別系統(tǒng)設(shè)計(jì)

    在圖像處理領(lǐng)域,圖像識(shí)別是較為困難而關(guān)鍵的技術(shù)。這項(xiàng)技術(shù)被廣泛的應(yīng)用到娛樂(lè)、工業(yè)、軍事等領(lǐng)域。本次設(shè)計(jì)數(shù)字識(shí)別系統(tǒng)已經(jīng)在車牌識(shí)別、運(yùn)動(dòng)員號(hào)碼識(shí)別等多處運(yùn)用。本
    的頭像 發(fā)表于 07-16 14:28 ?523次閱讀
    基于FPGA的數(shù)字<b class='flag-5'>識(shí)別系統(tǒng)</b>設(shè)計(jì)

    鐵路車號(hào)識(shí)別系統(tǒng)的基本原理與應(yīng)用

    鐵路車號(hào)識(shí)別系統(tǒng)是鐵路運(yùn)輸智能化管理的關(guān)鍵技術(shù)之一,它通過(guò)自動(dòng)化手段實(shí)現(xiàn)對(duì)貨運(yùn)列車的高效精準(zhǔn)識(shí)別,為礦區(qū)及鐵路運(yùn)輸管理提供了重要的技術(shù)支撐。以下從系統(tǒng)原理、核心組件及技術(shù)優(yōu)勢(shì)三個(gè)方面展開(kāi)說(shuō)明。 一
    的頭像 發(fā)表于 07-07 10:30 ?156次閱讀
    鐵路車號(hào)<b class='flag-5'>識(shí)別系統(tǒng)</b>的基本原理與應(yīng)用

    工地AI行為識(shí)別系統(tǒng)作用

    工地AI行為識(shí)別系統(tǒng)作用 工地AI行為識(shí)別系統(tǒng)是什么? 工地AI行為識(shí)別系統(tǒng)是一種基于人工智能技術(shù)的智能監(jiān)控方案,通過(guò)攝像頭+AI算法,實(shí)時(shí)分析工地人員行為,自動(dòng)識(shí)別安全隱患(如未戴安
    的頭像 發(fā)表于 05-08 12:00 ?284次閱讀

    景區(qū)AI行為識(shí)別系統(tǒng)作用

    景區(qū)AI行為識(shí)別系統(tǒng)作用 景區(qū)AI行為識(shí)別系統(tǒng)是什么? 景區(qū)AI行為識(shí)別系統(tǒng)是利用人工智能技術(shù)(如視頻分析、人臉識(shí)別)構(gòu)建的智能管理方案。通過(guò)部署攝像頭+AI算法,實(shí)時(shí)監(jiān)控游客行為,自
    的頭像 發(fā)表于 05-07 15:32 ?306次閱讀
    景區(qū)AI行為<b class='flag-5'>識(shí)別系統(tǒng)</b>作用

    工廠園區(qū)AI行為識(shí)別系統(tǒng)作用

    工廠園區(qū)AI行為識(shí)別系統(tǒng)作用 工廠園區(qū)AI行為識(shí)別系統(tǒng)是什么? 工廠園區(qū)AI行為識(shí)別系統(tǒng)是基于人工智能技術(shù)的智能化管理方案,通過(guò)攝像頭與AI算法融合,實(shí)時(shí)監(jiān)控人員行為、設(shè)備操作寄環(huán)境狀態(tài),自動(dòng)
    的頭像 發(fā)表于 05-06 17:49 ?240次閱讀

    岸橋箱號(hào)識(shí)別系統(tǒng)的工作原理 #人工智能 #識(shí)別系統(tǒng)

    識(shí)別系統(tǒng)
    jf_60141436
    發(fā)布于 :2025年03月24日 09:28:11

    新唐科技基于NuMaker-M55M1平臺(tái)的人臉識(shí)別系統(tǒng)

    人臉識(shí)別技術(shù)已成為現(xiàn)代科技的重要基石,廣泛應(yīng)用于安全監(jiān)控、門禁系統(tǒng)以及用戶身份認(rèn)證等領(lǐng)域。新唐科技基于 NuMaker-M55M1 平臺(tái)的人臉識(shí)別系統(tǒng),結(jié)合多種核心技術(shù)組件,包括圖像處
    的頭像 發(fā)表于 01-20 10:31 ?742次閱讀

    RFID識(shí)別系統(tǒng)

    隨著信息技術(shù)的快速發(fā)展,RFID(射頻識(shí)別)技術(shù)在各行各業(yè)的應(yīng)用日益廣泛,其中RFID識(shí)別系統(tǒng)作為核心應(yīng)用,已經(jīng)成為智能化管理不可或缺的基石。通過(guò)無(wú)線射頻信號(hào)的非接觸式識(shí)別與數(shù)據(jù)傳輸,RFID
    的頭像 發(fā)表于 12-06 17:57 ?1099次閱讀
    RFID<b class='flag-5'>識(shí)別系統(tǒng)</b>