麥克風(fēng),學(xué)名為傳聲器,是將聲音信號(hào)轉(zhuǎn)換為電信號(hào)的能量轉(zhuǎn)換器件,由“Microphone”這個(gè)英文單詞音譯而來。也稱話筒、微音器。二十世紀(jì),麥克風(fēng)由最初通過電阻轉(zhuǎn)換聲電發(fā)展為電感、電容式轉(zhuǎn)換,大量新的麥克風(fēng)技術(shù)逐漸發(fā)展起來,這其中包括鋁帶、動(dòng)圈等麥克風(fēng),以及當(dāng)前廣泛使用的電容麥克風(fēng)和駐極體麥克風(fēng)。本文為大家介紹幾種麥克風(fēng)的設(shè)計(jì)方案,僅供參考。
TOP1 電容式MEMS麥克風(fēng)讀出電路設(shè)計(jì)
1引言
與傳統(tǒng)的駐極體電容式麥克風(fēng)相比,電容式MEMS麥克風(fēng)具有以下優(yōu)勢(shì):1)性能穩(wěn)定,溫度系數(shù)低,受濕度和機(jī)械振動(dòng)的影響?。?)成本低廉;3)體積小巧,電容式MEMS麥克風(fēng)的背極板和振膜僅有最小的駐極體電容式麥克風(fēng)的1/10左右;4)功耗更低。以上幾方面的優(yōu)勢(shì)使電容式MEMS麥克風(fēng)得到越來越廣泛的應(yīng)用。
然而,電容式MEMS麥克風(fēng)也給設(shè)計(jì)人員提出了挑戰(zhàn):1)麥克風(fēng)在聲壓作用下產(chǎn)生的小信號(hào)幅度非常微小,要求讀出電路的噪聲極低;2)電容式MEMS麥克風(fēng)的靜態(tài)電容是pF量級(jí),讀出電路需要GΩ量級(jí)的輸入電阻才能實(shí)現(xiàn)極點(diǎn)頻率低于20Hz的高通濾波器,因此,高阻值電阻的實(shí)現(xiàn)是讀出電路的又一挑戰(zhàn);3)電容式MEMS麥克風(fēng)通常應(yīng)用于電池供電的產(chǎn)品,因此低功耗設(shè)計(jì)也是讀出電路設(shè)計(jì)時(shí)必須考慮的約束。
基于以上考慮,在分析電容式MEMS麥克風(fēng)工作原理的基礎(chǔ)上,提出了一種低功耗、低噪聲、高分辨率的電容式MEMS麥克風(fēng)讀出電路。
2電容式MEMS麥克風(fēng)
2.1工作原理
電容式MEMS麥克風(fēng)的主要結(jié)構(gòu)包括一個(gè)薄而有彈性的聲學(xué)振膜及一個(gè)剛性的背極板。振膜、背極板以及它們之間的空氣隙共同組成一個(gè)平行板電容器,故有:
V=Q/C,C=εS/x (1)
式中,C為電容量,S為極板的面積,Q是極板間的電壓為V時(shí)存儲(chǔ)的電荷量,ε是極板間介質(zhì)(空氣)的介電常數(shù),x為兩極板間的距離。當(dāng)dP大小的聲壓變化作用于振膜時(shí),將引起兩極板間的電壓變化:
因?yàn)閐x∝dP,所以輸出電壓dV∝dP.這就是電容式MEMS麥克風(fēng)的聲電轉(zhuǎn)換工作原理。
這一原理成立的條件是:在聲電轉(zhuǎn)換過程中,必需保持麥克風(fēng)電容所儲(chǔ)電荷量Q不變,因此需要外加一個(gè)穩(wěn)定的直流電壓給電容充電,使之保持恒定的充電狀態(tài)。這一功能由電荷泵來實(shí)現(xiàn)。
2.2麥克風(fēng)讀出電路結(jié)構(gòu)
電容式MEMS麥克風(fēng)及其讀出電路組成的系統(tǒng)如圖1所示。
圖1麥克風(fēng)及其讀出電路結(jié)構(gòu)
電荷泵為麥克風(fēng)提供穩(wěn)定的直流電壓,以保持麥克風(fēng)電容所儲(chǔ)電荷量不變。在此基礎(chǔ)上,聲壓作用于振膜時(shí),將引起麥克風(fēng)兩極板間電壓的變化,這個(gè)音頻范圍內(nèi)的電壓小信號(hào)Vmic通過麥克風(fēng)電容Cmic和讀出電路的高阻值輸入電阻組成的高通濾波器讀出。
需要特別指出,背靠背的二極管有三個(gè)作用:1)提供高阻值輸入電阻,與麥克風(fēng)電容一起實(shí)現(xiàn)低極點(diǎn)頻率的高通濾波器,進(jìn)而實(shí)現(xiàn)麥克風(fēng)小信號(hào)的讀出;2)為單位增益緩沖器提供直流偏置電壓;3)起靜電保護(hù)作用,在讀出電路遭受靜電襲擊時(shí)為其提供低阻直流通路。單位增益緩沖器的作用一是屏蔽麥克風(fēng)與后續(xù)信號(hào)處理電路,避免兩者之間相互影響,二是提高讀出電路的驅(qū)動(dòng)能力。
3讀出電路設(shè)計(jì)
3.1低極點(diǎn)頻率高通濾波器
背靠背二極管的實(shí)際電路如圖2所示。背靠背二極管可實(shí)現(xiàn)虛擬電阻。二極管連接的PMOS管Ma,Mb的襯底與柵極相接,這種連接方式不會(huì)產(chǎn)生寄生三極管,可以保證兩個(gè)二極管串始終只有一組導(dǎo)通(飽和導(dǎo)通或亞閾值導(dǎo)通)。在正常工作狀態(tài)下,Ma1,Ma2亞閾值導(dǎo)通。仿真結(jié)果表明,當(dāng)節(jié)點(diǎn)IN與節(jié)點(diǎn)A之間的電壓差絕對(duì)值小于0.2V時(shí),背靠背二極管可以實(shí)現(xiàn)GΩ量級(jí)的電阻,如圖3所示。
圖2背靠背二極管的電路
圖3背靠背二極管的電阻-電壓特性
背靠背二極管還可以為單位增益緩沖器提供直流偏置電壓。電流源Ib的電流流過電阻Rb,從而在節(jié)點(diǎn)A形成固定的電壓,單位增益緩沖器的輸入直流偏置也就被固定于IbRb.
背靠背二極管具有ESD保護(hù)作用,在讀出電路遭受靜電襲擊時(shí)為其提供低阻直流通路。需要注意的是,因?yàn)樽x出電路對(duì)輸入阻抗要求很高,所以在設(shè)計(jì)中使用了 ESD保護(hù)電路與讀出電路內(nèi)部功能性電路復(fù)用的電路,這樣可以避免在設(shè)計(jì)完功能性電路后再加上ESD保護(hù)電路而對(duì)電路性能產(chǎn)生重大影響。
3.2低噪聲低功耗單位增益緩沖器
較之開環(huán)運(yùn)算放大器,使用單位增益緩沖器可得到比開環(huán)運(yùn)放更大的輸入阻抗和更小的輸出阻抗,從而可以更好地屏蔽麥克風(fēng)與后續(xù)信號(hào)處理電路,以避免兩者之間的相互影響;同時(shí),還可以更容易地驅(qū)動(dòng)后續(xù)信號(hào)處理電路。
只需將運(yùn)算放大器輸出端與反相輸入端短接,即可實(shí)現(xiàn)單位增益緩沖器,如圖4所示。與套筒式結(jié)構(gòu)相比,使用折疊結(jié)構(gòu)的運(yùn)算放大器最大的優(yōu)點(diǎn)在于易于使運(yùn)放的輸出與輸入短接,共模電平的選取也更加容易。
圖4運(yùn)算放大器
輸入管使用尺寸較大的PMOS管,其原因主要有兩個(gè):一是與NMOS管相比,PMOS管的1/f噪聲更小;二是輸入管直流偏置點(diǎn)可以設(shè)置得更低,從而使電荷泵輸出電壓大部分降落在麥克風(fēng)上。
采用不對(duì)稱的輸入管,反相輸入管尺寸更大,其優(yōu)點(diǎn)在于可以消除輸入失調(diào)電壓的影響,提高分辨率。假如設(shè)置運(yùn)放反相輸入端的直流偏壓比正相輸入端高 50mV,那么,當(dāng)麥克風(fēng)小信號(hào)的幅值小于50mV時(shí),讀出電路分辨率將不受失調(diào)電壓的影響。而且,反相輸入管面積越大,閃爍噪聲越小,進(jìn)而減小了單位增益緩沖器的等效輸入噪聲。
工作在飽和區(qū)的MOS管的跨導(dǎo)與其漏極電流的平方根成正比。但是,工作在亞閾值區(qū)的MOS管的跨導(dǎo)與其漏極電流成正比。所以,為了在降低噪聲和功耗的同時(shí)保持運(yùn)放的開環(huán)增益,設(shè)計(jì)中采用工作在亞閾值區(qū)的輸入管。忽略運(yùn)放第二級(jí)對(duì)輸入噪聲的影響,音頻范圍內(nèi)二級(jí)運(yùn)放的等效輸入噪聲電壓為:
(3)式主要考慮了閃爍噪聲的影響。從(3)式可以看出,增大M1~M6的尺寸可以增大M1和M2的跨導(dǎo),減小M3~M6的跨導(dǎo)可以減小閃爍噪聲。需要說明的是,在設(shè)計(jì)低功耗的二級(jí)運(yùn)放時(shí),為了降低功耗,可以讓運(yùn)放中的一些管子工作在亞閾值區(qū),但這是以增大管子面積、降低運(yùn)放速度為代價(jià)的。在電路設(shè)計(jì)過程中,往往需要考慮多方面的因素來進(jìn)行折中優(yōu)化設(shè)計(jì)。
4電路仿真結(jié)果與分析
基于X-FAB 0.35μm CMOS工藝,使用Cadence軟件,對(duì)MEMS麥克風(fēng)讀出電路進(jìn)行仿真。設(shè)電荷泵輸出電壓為11V,麥克風(fēng)靜態(tài)電容為1pF,設(shè)定單位增益緩沖器輸入直流電平為200mV,負(fù)載為100pF電容和100kΩ電阻的最差負(fù)載情況。輸入管不對(duì)稱的運(yùn)放的性能參數(shù)如表1所示。
表1開環(huán)運(yùn)算放大器的性能參數(shù)
電路仿真結(jié)果顯示,電源電壓在1.2~3.6V時(shí),讀出電路均可正常工作(當(dāng)電源電壓低于1.2V時(shí),基準(zhǔn)電流源無法正常工作,基準(zhǔn)電流會(huì)迅速下降并趨于 0,此時(shí),讀出電路因得不到合適的偏置而無法正常工作;當(dāng)電源電壓高于3.6V時(shí),超過了工藝耐壓的極限,極有可能對(duì)芯片造成毀滅性的損壞);讀出電路靜態(tài)電流小于60μA,在20Hz~20kHz的音頻范圍內(nèi),等效輸入噪聲為5.2μV,信號(hào)讀出效率大于83.6%(-1.56dB)。
電源電壓為1.2V時(shí),讀出電路的幅頻響應(yīng)曲線如圖5所示,低頻的極點(diǎn)頻率為8.6Hz.
圖5讀出電路頻率響應(yīng)
由于運(yùn)放失調(diào)電壓的影響被不對(duì)稱輸入管消除,且電荷泵的等效輸出噪聲是nV量級(jí)(可以忽略不計(jì)),所以讀出電路可以處理的小信號(hào)幅度范圍是50μV~200mV.本文讀出電路與文獻(xiàn)[9]讀出電路的各項(xiàng)性能比較結(jié)果如表2所示。
表2讀出電路性能比較
5結(jié)論
設(shè)計(jì)了一種新穎的電容式MEMS麥克風(fēng)讀出電路,該電路包含低極點(diǎn)頻率的高通濾波器和低噪聲的單位增益緩沖器兩個(gè)部分。采用二極管連接的MOS管實(shí)現(xiàn)了高阻值的輸入電阻,與電容式MEMS麥克風(fēng)的靜態(tài)電容一起組成低極點(diǎn)頻率的高通濾波器,可讀出麥克風(fēng)在聲壓作用下產(chǎn)生的小信號(hào)。另外,采用兩種辦法來提高讀出電路的分辨率:一是運(yùn)放采用不對(duì)稱輸入管來消除失調(diào)電壓的影響,二是通過增大輸入管的尺寸等方法來降低運(yùn)放的輸入噪聲。在讀出電路的設(shè)計(jì)中,為了降低讀出電路的功耗,使用了工作在亞閾值區(qū)的MOS管。
本文提供的讀出電路設(shè)計(jì)方案具有噪聲小、可以處理的小信號(hào)幅度范圍廣、功耗低等特點(diǎn),可延長(zhǎng)電池供電的便攜式設(shè)備的待機(jī)時(shí)間。
TOP2 利用MEMS麥克風(fēng)陣列定位并識(shí)別音頻或語(yǔ)音信源的技術(shù)方案
1.前言
自動(dòng)語(yǔ)音識(shí)別、語(yǔ)音模式識(shí)別和說話人識(shí)別及確認(rèn)等應(yīng)用對(duì)噪聲十分敏感,信源定位識(shí)別是音頻和語(yǔ)音信號(hào)捕捉處理應(yīng)用的一個(gè)關(guān)鍵的預(yù)處理功能。特別是基于微機(jī)電系統(tǒng)(MEMS) 的麥克風(fēng)陣列出現(xiàn)后,麥克風(fēng)陣列音頻定位方案引起科研企業(yè)和開發(fā)人員的廣泛關(guān)注。
目前業(yè)界正在使用MEMS麥克風(fēng)陣列子系統(tǒng)開發(fā)嵌入式音頻定位、自動(dòng)語(yǔ)音識(shí)別和自動(dòng)說話人識(shí)別解決方案,聲音識(shí)別定位是我們識(shí)別確認(rèn)他人身份的基本功能,當(dāng)我們聽到有人講話時(shí),會(huì)將頭轉(zhuǎn)向說話人,查看說話人。
音源定位是自動(dòng)語(yǔ)音識(shí)別和自動(dòng)說話人識(shí)別系統(tǒng)的一個(gè)重要環(huán)節(jié),對(duì)于提高語(yǔ)音識(shí)別系統(tǒng)的性能至關(guān)重要。麥克風(fēng)陣列可捕捉從不同方向傳來的聲音,通過算法運(yùn)算使麥克風(fēng)指向某一個(gè)特定方向,放大從該方向捕捉到的音頻信號(hào),同時(shí)衰減從其它方向捕捉的音頻信號(hào),整個(gè)動(dòng)作就像一個(gè)智能麥克風(fēng)。
圖 1.綜合利用麥克風(fēng)音源互相關(guān)性(CC)、相變(PHAT)和最大相似性處理(ML)技術(shù)的音源定位
2.系統(tǒng)框架
整個(gè)系統(tǒng)由以下幾個(gè)子系統(tǒng)組成:音源方向測(cè)定、數(shù)據(jù)融合、自動(dòng)語(yǔ)音識(shí)別和自動(dòng)說話人確認(rèn)。其中,音頻方向測(cè)定子系統(tǒng)基于麥克風(fēng)陣列,運(yùn)行三個(gè)不同的音頻方向估算算法;數(shù)據(jù)融合子系統(tǒng)負(fù)責(zé)推斷方向,自動(dòng)語(yǔ)音識(shí)別子系統(tǒng)利用傳入的音頻信號(hào)增強(qiáng)主音源信號(hào)強(qiáng)度,衰減主音源周圍的其它音頻信號(hào)。最后,自動(dòng)說話人確認(rèn)子系統(tǒng)識(shí)別某些關(guān)鍵詞匯,再利用相關(guān)特征與說話人匹配。
圖 2. 系統(tǒng)框架
如果語(yǔ)音識(shí)別任務(wù)沒有成功,則反饋給數(shù)據(jù)融合系統(tǒng),估算新方向傳入的語(yǔ)音,然后驅(qū)動(dòng)麥克風(fēng)陣列指向該方向。
2.1 語(yǔ)音識(shí)別和說話人識(shí)別
語(yǔ)音特征提?。?7 LPC-倒普系數(shù))需要確定語(yǔ)音的端點(diǎn),將語(yǔ)音分成數(shù)個(gè)短禎(每禎20 ms),通過一個(gè)DTW模式對(duì)準(zhǔn)算法與一組參考語(yǔ)音(模板)匹配。然后,應(yīng)用歐氏距離測(cè)量法進(jìn)行相似性評(píng)估。
圖 3. 特征提取、模式匹配和評(píng)分是說話人語(yǔ)音識(shí)別確認(rèn)任務(wù)的主要環(huán)節(jié)
說話人身份評(píng)分采用的是動(dòng)態(tài)時(shí)間規(guī)整近鄰(DTW-KNN)算法的距離測(cè)量方法,即動(dòng)態(tài)時(shí)間規(guī)整測(cè)量算法與近鄰決策算法的合并算法。這個(gè)算法需要使用均方根、過零率、自動(dòng)相關(guān)和倒普線性預(yù)測(cè)系數(shù)。使用歐氏距離算法計(jì)算成本函數(shù),使用KNN 算法計(jì)算最小距離匹配度 k。
3.MEMS麥克風(fēng)陣列
我們采用STM32F4微控制器和MEMS麥克風(fēng)開發(fā)一個(gè)硬件音頻信號(hào)同步采集處理子系統(tǒng),其信號(hào)捕捉能力相當(dāng)于8個(gè)采樣率高達(dá)48 KHz的麥克風(fēng) 。
圖 4. 采用STM32F4微控制器和MEMS麥克風(fēng)的硬件音頻信號(hào)同步采集處理子系統(tǒng)
3.1 MEMS技術(shù)
MEMS技術(shù)的主要特性是在能夠同一芯片表面集成微電子和微機(jī)械單元,在同一封裝內(nèi)整合不同的功能。這樣,過去分別由傳感器、執(zhí)行器(例如,射流管理或機(jī)械交互)和邏輯、控制單元完成的不同功能,今天可以整合在同一個(gè)封裝內(nèi)。從生化分析,到慣性系統(tǒng),從機(jī)械傳感器,到音頻和聲波傳感器, MEMS產(chǎn)品覆蓋很多應(yīng)用領(lǐng)域。
3.2 MEMS麥克風(fēng)和音頻編碼
MEMS麥克風(fēng)尺寸雖然比其它技術(shù)麥克風(fēng)小,但是,從物理和機(jī)械角度看,卻具備標(biāo)準(zhǔn)駐極體麥克風(fēng)的全部功能,其核心部件是一個(gè)振膜,振膜和固定框架共同組成一個(gè)可變電容器。當(dāng)聲波引起振膜變形時(shí),電容會(huì)發(fā)生變化,從而導(dǎo)致電壓變化。
被捕捉到的信號(hào)的后期處理,即功率放大和模數(shù)轉(zhuǎn)換過程,都是在同一芯片上完成,因此,麥克風(fēng)輸出是高頻PDM信號(hào)。在脈沖密度調(diào)制過程,邏輯1對(duì)應(yīng)一個(gè)正 (+A) 脈沖,而邏輯0對(duì)應(yīng)一個(gè)負(fù)(-A)脈沖。因此,假設(shè)輸入一個(gè)周期的正弦音頻,當(dāng)輸入電壓在最大正振幅時(shí),輸出為一個(gè)由“1”組成的脈沖序列;當(dāng)輸入電壓在最大負(fù)振幅時(shí),輸出則是一個(gè)由“0”組成的序列。當(dāng)穿過0振幅時(shí),聲波在1和0序列之間快速變化。如果方法正確,PDM可通過數(shù)字方法給高品質(zhì)音頻編碼,而且實(shí)現(xiàn)方法簡(jiǎn)易,成本低廉。因此,PDM比特流是MEMS麥克風(fēng)常用的數(shù)據(jù)輸出格式。
另一方面,PCM是一個(gè)非常著名的音頻編碼標(biāo)準(zhǔn),以相同的間隔對(duì)信號(hào)振幅定期采樣,在數(shù)字步進(jìn)范圍內(nèi),每個(gè)采樣被量化至最接近值。決定比特流是否忠實(shí)原模擬信號(hào)的是PCM比特流的兩個(gè)基本屬性:采樣率,即每秒采樣次數(shù);位寬,即每個(gè)采樣包含的二進(jìn)制數(shù)個(gè)數(shù);通過降低采樣率(降低十分之一)和提高字長(zhǎng),可以將PDM編碼信號(hào)轉(zhuǎn)成PCM信號(hào),PDM數(shù)據(jù)速率與降低十分之一的PCM采樣率的比值被稱為降采樣率。因此,對(duì)于N:1降采樣率,只要每N個(gè)間隔采樣一次 (不考慮剩余的N-1),即可完成降低十分之一的采樣過程。
3.3 麥克風(fēng)陣列
從硬件角度看,這款產(chǎn)品基于STM32F407VGT6高性能微控制器,能夠通過8個(gè)MEMS麥克風(fēng)采集信號(hào)。STM32F4微控制器基于工作頻率最高 168 MHz的高性能ARM? Cortex-M4 32 RISC處理器內(nèi)核,集成高速嵌入式存儲(chǔ)器(閃存容量最高1 MB, SRAM容量最高192KB)以及標(biāo)準(zhǔn)和先進(jìn)的通信接口,例如,I2S全雙工接口、SPI、 USB FS/HS和以太網(wǎng)。
STM32 F4系列是意法半導(dǎo)體首批基于支持FPv4-SP 浮點(diǎn)擴(kuò)展運(yùn)算的ARM Cortex-M4F內(nèi)核的STM32微控制器,這使得該器件適用于重負(fù)荷算法,浮點(diǎn)單元完全支持單精度加法、減法、乘法、除法和累加以及均方根運(yùn)算,還提供定點(diǎn)和浮點(diǎn)數(shù)據(jù)格式轉(zhuǎn)換和浮點(diǎn)常數(shù)指令,完全兼容ANSI/IEEE Std 754-1985二進(jìn)制浮點(diǎn)算術(shù)標(biāo)準(zhǔn)。為提高ARM架構(gòu)的數(shù)字信號(hào)處理和多媒體應(yīng)用性能,指令集還增加了DSP指令集。新指令是數(shù)字信號(hào)處理架構(gòu)常用指令,包括帶符號(hào)乘加變化(variations on signed multiply–accumulate)、飽和加減和前導(dǎo)零計(jì)數(shù)。
麥克風(fēng)陣列通過RJ45以太風(fēng)接口或USB OTG FS接口連接其它器件,與其它器件交互是通過可控制基本板設(shè)置的DIP開關(guān)實(shí)現(xiàn)。
如下圖所示,每個(gè)MEMS麥克風(fēng)都是由同一個(gè)時(shí)鐘源觸發(fā),時(shí)鐘源由專用振蕩器驅(qū)動(dòng),對(duì)每個(gè)GPIO端口的一個(gè)引腳輸出1位PDM 高頻信號(hào)。輸出PDM數(shù)據(jù)頻率與輸入時(shí)鐘同步,因此,DMA控制器以同一頻率即音頻捕捉頻率對(duì)GPIO端口進(jìn)行讀操作,然后將1 ms音頻數(shù)據(jù)(每次)保存在存儲(chǔ)器緩沖電路。這時(shí),該緩沖器包含麥克風(fēng)交叉信號(hào),然后軟件利用優(yōu)化的快速解碼函數(shù)對(duì)數(shù)據(jù)進(jìn)行解復(fù)用處理。最后,PDM 數(shù)據(jù)通過數(shù)字信號(hào)處理環(huán)節(jié),再進(jìn)行PDM轉(zhuǎn)PCM處理。
圖 5.每個(gè)MEMS麥克風(fēng)都是由同一個(gè)時(shí)鐘源觸發(fā),時(shí)鐘源由專用振蕩器驅(qū)動(dòng),對(duì)每個(gè)GPIO端口的一個(gè)引腳輸出1位PDM 高頻信號(hào)
麥克風(fēng)傳來的PDM信號(hào)經(jīng)過過濾和十分之一降采樣率處理,以取得所需頻率和分辨率的信號(hào)。麥克風(fēng)輸出的PDM數(shù)據(jù)頻率(麥克風(fēng)的輸入時(shí)鐘)必須是系統(tǒng)最終音頻輸出的倍數(shù),濾波器管道輸出是一個(gè)16位值,我們將 [-32768, 32767]視為一個(gè)單位增益(0 dB)的輸出范圍。
原先濾波管道產(chǎn)生的數(shù)字音頻信號(hào)在信號(hào)調(diào)理前被進(jìn)一步處理。管道第一級(jí)是一個(gè)高通濾波器,主要用于除掉信號(hào)DC失調(diào)。為保護(hù)信號(hào)質(zhì)量,該濾波級(jí)是使用一個(gè)截止頻率不在可聽頻率范圍內(nèi)的 IIR濾波器,管道第二級(jí)是一個(gè)基于IIR濾波器的低通濾波器。兩個(gè)濾波器有啟用和禁用以及配置功能;可通過外部整數(shù)變量控制增益。
如上文所述,數(shù)據(jù)采集有兩個(gè)比特流解決方案,通過DP開關(guān)選擇使用哪一個(gè)方案。當(dāng)選用 USB且在主機(jī)USB插入麥克風(fēng)陣列時(shí),主機(jī)將STM32_MEMS_Microphones視為一個(gè)標(biāo)準(zhǔn)的USB音頻設(shè)備。因此,主機(jī)系統(tǒng)無需安裝驅(qū)動(dòng)軟件。例如, STM32_MEMS_Microphones可直接連接第三方PC音頻采集軟件。當(dāng)選用以太網(wǎng)時(shí),STM32_MEMS_Microphones發(fā)送 RTP數(shù)據(jù)包。在網(wǎng)絡(luò)服務(wù)器的以太網(wǎng)設(shè)置頁(yè)對(duì)目的地IP、設(shè)備單播地址和采集參數(shù)進(jìn)行配置。
4.結(jié)論
音源定位識(shí)別是語(yǔ)音識(shí)別技術(shù)中的一個(gè)重要的語(yǔ)音預(yù)處理環(huán)節(jié),對(duì)提高音頻應(yīng)用和聲控應(yīng)用性能具有重要意義。音源定位主要用于自動(dòng)語(yǔ)音識(shí)別、音頻模式識(shí)別、說話人發(fā)現(xiàn)及識(shí)別。MEMS技術(shù)的問世讓麥克風(fēng)陣列能夠嵌入在上述應(yīng)用設(shè)計(jì)中,執(zhí)行音頻信號(hào)預(yù)處理過程,為應(yīng)用級(jí)提供最好的信息。
該嵌入式單個(gè)說話人及其語(yǔ)音定位識(shí)別方案基于一個(gè)集成ARM處理器和一組MEMS麥克風(fēng)的原型板。初步測(cè)試結(jié)果證明了這一集成方案的可行性,且系統(tǒng)級(jí)模塊可以做語(yǔ)音、音頻識(shí)別目標(biāo)板,滿足人機(jī)、人與周圍環(huán)境的自然用戶界面的功能要求。
?
TOP3 CMOS電容式微麥克風(fēng)設(shè)計(jì)
?
隨著智能手機(jī)的興起,對(duì)于聲音品質(zhì)和輕薄短小的需求越來越受到大家的重視,近年來廣泛應(yīng)用的噪聲抑制及回聲消除技術(shù)均是為了提高聲音的品質(zhì)。相比于傳統(tǒng)的駐極體式麥克風(fēng)(ECM),電容式微機(jī)電麥克風(fēng)采用硅半導(dǎo)體材料制作,這便于集成模擬放大電路及ADC(∑-ΔADC)電路,實(shí)現(xiàn)模擬或數(shù)字微機(jī)電麥克風(fēng)元件,以及制造微型化元件,非常適合應(yīng)用于輕薄短小的便攜式裝置。本文將針對(duì)CMOS微機(jī)電麥克風(fēng)的設(shè)計(jì)與制造進(jìn)行介紹,并比較純MEMS與CMOS工藝微導(dǎo)入麥克風(fēng)的差異。
電容式微麥克風(fēng)原理
MEMS微麥克風(fēng)是一種微型的傳感器。其原理是利用聲音變化產(chǎn)生的壓力梯度使電容式微麥克風(fēng)的聲學(xué)振膜受聲壓干擾而產(chǎn)生形變,進(jìn)而改變聲學(xué)振膜與硅背極板之間的電容值。該電容值的變化由電容電壓轉(zhuǎn)換電路轉(zhuǎn)化為電壓值的輸出變化,再經(jīng)過放大電路將MEMS傳感器產(chǎn)生得到電壓放大輸出,從而將聲壓信號(hào)轉(zhuǎn)化成電壓信號(hào)。在此必須采用一個(gè)高阻抗的電阻為MEMS傳感器提供一個(gè)偏置電壓VPP,借以在MEMS傳感器上產(chǎn)生固定電荷,最后的輸出電壓將與VPP及振膜的形變?chǔ)成正比。振膜的形變與其剛性有關(guān),剛性越低則形變?cè)酱?;另一方面,輸出電壓與d(氣隙)成反比,因此氣隙越低,則輸出電壓及靈敏度越優(yōu),但這都將受限于MEMS傳感器的吸合電壓,也就是受限于MEMS傳感器靜電場(chǎng)的最大極限值(圖1)。
圖1 電容式麥克風(fēng)原理
CMOS微機(jī)電麥克風(fēng)電路設(shè)計(jì)
在CMOS微麥克風(fēng)設(shè)計(jì)中,電路是一個(gè)非常重要的環(huán)節(jié),它將影響到微麥克風(fēng)的操作、感測(cè),以及系統(tǒng)的靈敏度。以圖2為例,駐極式電容微麥克風(fēng)的感應(yīng)電荷由駐極體材料本身提供的駐極電荷所產(chǎn)生,而凝縮式電容微麥克風(fēng)則是采用從CMOS的操作電壓中抽取一個(gè)偏置電壓,再通過一個(gè)高阻抗電阻提供給微麥克風(fēng)的聲學(xué)振膜來提供固定的電荷源。此時(shí),若聲學(xué)振膜受到聲壓驅(qū)動(dòng)而產(chǎn)生位移變化,則電極板(感測(cè)端)的電壓將會(huì)發(fā)生變化。最后,通過電路放大器將信號(hào)放大,則可實(shí)現(xiàn)模擬麥克風(fēng)的電路設(shè)計(jì);如果再加上一個(gè)∑-ΔADC模數(shù)轉(zhuǎn)換電路,便可完成數(shù)字麥克風(fēng)的電路設(shè)計(jì)(一般數(shù)字麥克風(fēng)的輸出信號(hào)為1比特PDM輸出)。
圖2 微麥克風(fēng)電路設(shè)計(jì)簡(jiǎn)圖
CMOS微機(jī)電麥克風(fēng)工藝分類
從微機(jī)電麥克風(fēng)的制造來看,就目前的技術(shù)層面而言,集成CMOS電路的MEMS元件可分為三種。Pre-CMOS MEMS工藝:先制作MEMS結(jié)構(gòu),再制作CMOS元件;Intra-CMOS MEMS工藝:CMOS與MEMS元件工藝混合制造;Post-CMOS MEMS工藝:先實(shí)現(xiàn)CMOS元件,再進(jìn)行MEMS結(jié)構(gòu)制造。一般而言,前兩種方法無法在傳統(tǒng)的晶圓廠進(jìn)行,而Post-CMOS MEMS則可以在半導(dǎo)體晶圓代工廠進(jìn)行生產(chǎn)。
圖3簡(jiǎn)述了Post-CMOS MEMS的制造方式。在Post-CMOS MEMS工藝中需特別注意,不能讓額外的熱處理或高溫工藝影響到CMOS組件的物理特性及MEMS的應(yīng)力狀態(tài),以免影響到振膜的初始應(yīng)力。鑫創(chuàng)科技公司克服了諸多的技術(shù)難題,完全采用標(biāo)準(zhǔn)的CMOS工藝來同時(shí)制造電路元件及微機(jī)電麥克風(fēng)結(jié)構(gòu)。在CMOS部分完成后,將芯片的背面研磨至適當(dāng)厚度以符合封裝要求。最后,利用氫氟酸溶液(HF)去除犧牲氧化物來釋放懸浮結(jié)構(gòu)。此外,在設(shè)計(jì)中還需考慮可完全去除犧牲材料而又不損害麥克風(fēng)振膜的蝕刻方法,并應(yīng)避免麥克風(fēng)振膜與背電極板之間產(chǎn)生粘黏現(xiàn)象。
圖3 Post-CMOS MEMS微麥克風(fēng)的基本結(jié)構(gòu)及工藝步驟
粘黏現(xiàn)象:由于麥克風(fēng)振膜與背電極板之間的距離僅為數(shù)微米,在該尺寸下,當(dāng)表面張力、范德華力、靜電力、離子鍵等作用力大于麥克風(fēng)振膜的回復(fù)力時(shí),麥克風(fēng)振膜將產(chǎn)生永久形變而附著于背電極板上,從而無法產(chǎn)生振動(dòng)。通常,微機(jī)電懸浮結(jié)構(gòu)粘黏現(xiàn)象的主要成因可以分為兩類:第一類發(fā)生在麥克風(fēng)振膜釋放后,麥克風(fēng)振膜受到表面張力影響,因而被拉近到與背電極板的距離非常靠近,若此時(shí)范德華力或氫鍵力等表面力大于麥克風(fēng)振膜的回復(fù)力,則結(jié)構(gòu)將產(chǎn)生粘黏現(xiàn)象而無法回復(fù);第二類是懸浮結(jié)構(gòu)在使用中受到外力沖擊或是靜電力吸引而落入表面力較回復(fù)力大的區(qū)域,則也會(huì)發(fā)生粘黏現(xiàn)象。因此,在結(jié)構(gòu)設(shè)計(jì)上,必須特別考慮麥克風(fēng)振膜在釋放后的結(jié)構(gòu)變形問題,并在重要的結(jié)構(gòu)部位予以強(qiáng)化,利用特殊設(shè)計(jì)來減少粘黏現(xiàn)象的發(fā)生。
純MEMS與CMOS工藝的差異
多數(shù)企業(yè)所開發(fā)的MEMS微麥克風(fēng)主要分為兩種形態(tài):第一種是利用專業(yè)的MEMS代工廠制造出MEMS IC,再加上一個(gè)ASIC放大器,將MEMS IC及ASIC IC用SIP封裝方式封裝成MEMS麥克風(fēng)芯片。這一部分在IC封裝過程中必須保護(hù)振膜不被破壞,其封裝成本相對(duì)較高;另一種是先利用CMOS晶圓廠制造出ASIC部分,再利用后工藝來形成MEMS的結(jié)構(gòu)部分。其MEMS工藝技術(shù)目前似乎還無法在標(biāo)準(zhǔn)的CMOS晶圓廠完成,這主要是由于振膜需沉積高分子聚合物材料,而高分子聚合物材料還未用于目前的標(biāo)準(zhǔn)半導(dǎo)體IC工藝。另外,在CMOS工藝完成后,需分別在芯片的正面蝕刻出振膜并在其背面蝕刻出腔體及聲學(xué)孔。該步驟通過載體晶圓(Carrier Wafer)來完成,在標(biāo)準(zhǔn)的CMOS鑄造廠目前尚未創(chuàng)建出這樣的環(huán)境。
目前,最大的課題是如何突破這兩種形態(tài)MEMS麥克風(fēng)的封裝技術(shù)。其專利均由美國(guó)的微麥克風(fēng)企業(yè)所掌控,因此,MEMS麥克風(fēng)市場(chǎng)占有率主要分布在少數(shù)企業(yè)手上。
鑫創(chuàng)科技采取的方式是在CMOS工藝完成后,從芯片的背面形成腔體和聲學(xué)孔作為MEMS結(jié)構(gòu)的釋放。這一部分無需使用特殊的機(jī)器和材料,可在現(xiàn)有的 CMOS晶圓廠內(nèi)完成,因而能夠降低開發(fā)成本。另外,鑫創(chuàng)科技的產(chǎn)品可直接利用晶圓級(jí)封裝技術(shù)將CMOS電路與微麥克風(fēng)集成在同一塊芯片上,同樣可避免在封裝過程中對(duì)振膜產(chǎn)生破壞(圖4)。
圖4 微機(jī)麥克風(fēng)掃描電路
MEMS麥克風(fēng)目前已經(jīng)取代ECM麥克風(fēng)被廣泛應(yīng)用于手機(jī)中(尤其是智能手機(jī)),其主要原因是MEMS麥克風(fēng)具有耐候性佳、尺寸小及易于數(shù)字化的優(yōu)點(diǎn)。 MEMS麥克風(fēng)采用半導(dǎo)體材質(zhì),特性穩(wěn)定,不會(huì)受到環(huán)境溫濕度的影響而發(fā)生改變,因而可以維持穩(wěn)定的音質(zhì)。電子產(chǎn)品組裝在過錫爐時(shí)的溫度高達(dá)260℃,常會(huì)破壞ECM麥克風(fēng)的振膜而必須返工,這將增加額外的成本。采用MEMS麥克風(fēng)則不會(huì)因?yàn)殄a爐的高溫而影響到材質(zhì),適合于SMT的自動(dòng)組裝。麥克風(fēng)信號(hào)在數(shù)字化后,可以對(duì)其進(jìn)行去噪、聲音集束及回聲消除等信號(hào)處理,從而能夠提供優(yōu)異的通話品質(zhì)。目前已有多款智能手機(jī)采用數(shù)字化技術(shù),在功能手機(jī)中也有加速采用的跡象。此外,筆記本電腦也是目前使用MEMS麥克風(fēng)的主流,而機(jī)頂盒生產(chǎn)企業(yè)同樣在積極嘗試將MEMS麥克風(fēng)應(yīng)用于開發(fā)聲控型機(jī)頂盒。
TOP4 MEMS麥克風(fēng)的聲學(xué)設(shè)計(jì)
前言
以高性能和小尺寸為特色的MEMS麥克風(fēng)特別適用于平板電腦、筆記本電腦、智能手機(jī)等消費(fèi)電子產(chǎn)品。不過,這些產(chǎn)品的麥克風(fēng)聲孔通常隱藏在產(chǎn)品內(nèi)部,因此,設(shè)備廠商必須在外界與麥克風(fēng)之間設(shè)計(jì)一個(gè)聲音路徑,以便將聲音信號(hào)傳送到MEMS麥克風(fēng)振膜。這條聲音路徑的設(shè)計(jì)對(duì)系統(tǒng)總體性能的影響很大。
下圖是一個(gè)典型的平板電腦的麥克風(fēng)聲音路徑:
圖1–典型應(yīng)用示例
外界與麥克風(fēng)振膜之間的聲音路徑由產(chǎn)品外殼、聲學(xué)密封圈、印刷電路板和麥克風(fēng)組成,這條聲音路徑起到波導(dǎo)作用,構(gòu)建系統(tǒng)總體頻響。此外,聲音路徑材質(zhì)的聲阻抗也會(huì)影響頻響。若想準(zhǔn)確預(yù)測(cè)聲學(xué)設(shè)計(jì)的性能如何,需要建立聲音路徑模型,使用COMSOL等專業(yè)級(jí)仿真工具對(duì)聲音路徑的頻響特性進(jìn)行仿真實(shí)驗(yàn)。然而,本文為讀者提供一些優(yōu)化麥克風(fēng)聲音路徑的基本原則。
Helmholtz諧振
狹窄的傳聲孔與空心腔室相連構(gòu)成的結(jié)構(gòu)在受到聲波激勵(lì)時(shí)會(huì)產(chǎn)生聲學(xué)諧振。當(dāng)我們對(duì)著空瓶的瓶嘴上方吹氣時(shí),就會(huì)發(fā)生這種諧振現(xiàn)象。這種結(jié)構(gòu)叫做 Helmholtz諧振器,是以該現(xiàn)象的發(fā)明者Hermann von Helmholtz命名的。Helmholtz利用諧振頻率不同的諧振器識(shí)別音樂等復(fù)雜聲音內(nèi)的頻率成份。
Helmholtz諧振的中心頻率是由下面的程式確定:
其中c是空氣速度;AH是聲孔的橫截面積;LH是聲孔的長(zhǎng)度;VC是空腔的容積。該方程式假設(shè)諧振器是一個(gè)空腔和一條橫截面均等的管道相連組成的簡(jiǎn)單結(jié)構(gòu)。如果麥克風(fēng)的聲音路徑的橫截面積和材質(zhì)不同,則描述聲音路徑的聲波特性的方程式要復(fù)雜很多。因此,必須對(duì)整個(gè)聲音路徑進(jìn)行聲波特性仿真實(shí)驗(yàn)才能精確地預(yù)測(cè)聲學(xué)設(shè)計(jì)的總體性能。
在本文內(nèi),通過改變麥克風(fēng)密封圈的厚度和內(nèi)徑、產(chǎn)品外殼聲孔直徑、印刷電路板聲孔直徑、聲音路徑彎折和路徑材質(zhì)的聲阻抗,我們對(duì)不同的聲音路徑進(jìn)行了頻響仿真實(shí)驗(yàn)。實(shí)驗(yàn)結(jié)果讓設(shè)計(jì)人員能夠預(yù)先掌握這些參數(shù)變化對(duì)聲音路徑總體性能的影響程度。
麥克風(fēng)的頻響
MEMS麥克風(fēng)低頻頻響是由以下主要參數(shù)決定的:傳感器振膜前側(cè)和后側(cè)之間通風(fēng)孔的尺寸;后室的容積。而MEMS麥克風(fēng)高頻頻響則是由麥克風(fēng)前室和聲孔產(chǎn)生的Helmholtz諧振決定的。
對(duì)于大多數(shù)MEMS麥克風(fēng),當(dāng)麥克風(fēng)的靈敏度降至低頻然后再上升到高頻時(shí),因?yàn)镠elmholtz諧振的原因,頻響曲線大體相同。但是,不同的MEMS麥克在傳感器設(shè)計(jì)、封裝尺寸和結(jié)構(gòu)方面差異很大,所以總體頻響特別是高頻頻響的差異很大。意法半導(dǎo)體的多數(shù)麥克風(fēng)將傳感器直接置于聲孔上面,以最大限度地降低前室容積,確保優(yōu)異的高頻響應(yīng)。
圖2–意法半導(dǎo)體MP34DT01上置聲孔麥克風(fēng)及其聲室的X光影像
下面的仿真實(shí)驗(yàn)結(jié)果描述了意法半導(dǎo)體MP34DB01 MEMS麥克風(fēng)本身的頻響,該仿真工具在聲音路徑模型的每個(gè)離散點(diǎn)上求解該方程式,在仿真結(jié)束后,將在所有有用點(diǎn)采集的數(shù)據(jù)繪成圖形。
圖3–MP34DB01和MP34DT01 MEMS麥克風(fēng)的聲室
MP34DB01麥克風(fēng)仿真結(jié)果證明,頻響曲線在高頻部分非常平坦,在20 kHz時(shí),典型靈敏度上升幅度大約+3dB,這是因?yàn)镠elmholtz諧振的中心頻率很高。該仿真結(jié)果非常接近MP34DB01的實(shí)際測(cè)量頻響。
圖4– MP34DB01 MEMS麥克風(fēng)頻響仿真結(jié)果和實(shí)際測(cè)量結(jié)果
密封圈厚度對(duì)頻響的影響
麥克風(fēng)密封圈是在麥克風(fēng)聲孔與產(chǎn)品外殼聲孔之間起到氣密作用。在安裝一個(gè)麥克風(fēng)密封圈后,聲孔至麥克風(fēng)前室長(zhǎng)度被延長(zhǎng),導(dǎo)致頻響發(fā)生變化。下面的仿真實(shí)驗(yàn)是將長(zhǎng)度不同但直徑固定(400μm)的圓管置于麥克風(fēng)聲孔上,評(píng)估密封圈厚度對(duì)頻響的影響程度。
圖5– MP34DT01頻響與密封圈厚度關(guān)系
從仿真實(shí)驗(yàn)中不難看出,增加一個(gè)密封圈會(huì)破壞頻響性能。在增加密封圈(如果是下聲孔麥克風(fēng),還要增加一個(gè)印刷電路板)后,實(shí)際聲孔長(zhǎng)度被延長(zhǎng),導(dǎo)致諧振頻率降低,高頻部分的靈敏度提高。更厚的密封圈將會(huì)提高諧振器瓶頸長(zhǎng)度,導(dǎo)致諧振頻率降低,高頻響應(yīng)性能變差。
密封圈內(nèi)徑對(duì)頻響的影響
下一個(gè)仿真實(shí)驗(yàn)是評(píng)估內(nèi)徑不同但厚度固定(2mm)的密封圈對(duì)頻響的影響。圖6所示是使用不同內(nèi)徑密封圈的仿真實(shí)驗(yàn)結(jié)果。
圖6– MP34DT01頻響與密封圈內(nèi)徑關(guān)系
這些仿真數(shù)據(jù)表明,增加麥克風(fēng)密封圈內(nèi)徑可提高諧振頻率,提升總體頻響性能。
聲音路徑形狀對(duì)頻響的影響
到此,仿真結(jié)果符合求解Helmholtz諧振方程式獲得的預(yù)測(cè)結(jié)果。下面的仿真實(shí)驗(yàn)討論聲音路徑形狀變化對(duì)頻響的影響,這項(xiàng)預(yù)測(cè)難度很大。圖7(a)所示結(jié)構(gòu)是一個(gè)長(zhǎng)4mm、直徑600μm的簡(jiǎn)易聲音路徑,其它仿真實(shí)驗(yàn)都以這個(gè)簡(jiǎn)單結(jié)構(gòu)為基準(zhǔn)。為了模擬密封圈、產(chǎn)品外殼聲孔和印刷電路板聲孔的寬度和形狀的變化,仿真實(shí)驗(yàn)增加了長(zhǎng)度、半徑和形狀不同的腔體,聲音路徑變得非常復(fù)雜。
圖7–聲音路徑形狀變化
圖8– MP34DB01在不同聲音路徑形狀時(shí)的頻響
密封圈材質(zhì)對(duì)頻響的影響
到此為止所做的全部仿真實(shí)驗(yàn)都是集中在聲音路徑形狀對(duì)頻響的影響,并在所有路徑表面應(yīng)用了聲音硬邊界條件。下面的仿真實(shí)驗(yàn)討論密封圈聲阻抗對(duì)頻響的影響。如圖9所示,本實(shí)驗(yàn)對(duì)聲孔(黃)、傳感器腔體(粉)和傳感器振膜(綠)的表面應(yīng)用適合的聲阻抗,而藍(lán)色表面的聲阻抗是變化的。某一種材質(zhì)的聲阻抗是指該材質(zhì)的密度與穿過該材質(zhì)的聲速的乘積(Z =ρ。c)。密封圈通常由橡膠或其它彈性材料制成,而典型的產(chǎn)品外殼材質(zhì)通常是塑料、鋁或鋼。
圖9–聲音路徑表面
圖10–密封圈材質(zhì)對(duì)諧振峰值振幅的影響
因?yàn)橹C振頻率是由聲音路徑的形狀決定的,雖然改變密封圈的聲阻抗不會(huì)影響諧振頻率,但是會(huì)影響諧振Q值。盡管聲音路徑保持連續(xù)諧振,但是質(zhì)地更柔軟的密封圈可減弱諧振,降低其在諧振頻率附近的影響。與采用聲音硬邊界條件的實(shí)驗(yàn)結(jié)果相比,采用鐵表面材料的聲孔大幅降低了頻響振幅峰值,這表明,使用聲音硬邊界條件得出的測(cè)試結(jié)果的嚴(yán)峻性不切實(shí)際。
案例分析–分析平板電腦下聲孔麥克的整個(gè)聲音路徑
圖11所示是一個(gè)平板電腦的下聲孔麥克的聲音路徑。在這個(gè)示例中,下聲孔麥克裝于印刷電路板上,印刷電路板與產(chǎn)品外殼之間插入一個(gè)氣密性軟橡膠密封圈。
圖11–平板麥克的聲音路徑設(shè)計(jì)和聲腔3D模型
本仿真實(shí)驗(yàn)對(duì)聲音路徑所有組件都設(shè)定了適合的聲學(xué)特性。圖11(b)所示是11(a)結(jié)構(gòu)的聲音路徑3D模型。本仿真實(shí)驗(yàn)所有材質(zhì)在消費(fèi)電子產(chǎn)品中都較為常用:FR4印刷電路板、軟橡膠密封圈、鋁制機(jī)身。
圖12–平板麥克聲音路徑仿真結(jié)果
圖12(a)所示是諧振峰值頻率大約21.6 kHz的聲音路徑的頻響曲線,圖12(b)所示是在21.6 kHz諧振頻率下氣壓在聲音路徑內(nèi)的分布情況。在該諧振頻率下,MEMS振膜承受的氣壓最大。
結(jié)論
下面的指導(dǎo)原則有助于麥克風(fēng)聲音路徑的頻響優(yōu)化。
●聲音路徑盡量最短、最寬。將聲音路徑外部入口加寬有助于改進(jìn)頻響,而將聲音路徑的麥克風(fēng)端加寬,則會(huì)降低頻響性能。
●設(shè)法不讓聲音路徑內(nèi)存在任何空腔。假如無法避免,則盡量讓空腔遠(yuǎn)離麥克風(fēng)聲孔。
●聲音路徑彎曲似乎對(duì)頻響影響不大。
●質(zhì)地柔軟的密封圈材料可弱化諧振,提高頻響性能。
TOP5 在雙線式麥克風(fēng)電路中使用MEMS麥克風(fēng)
簡(jiǎn)介
如今MEMS麥克風(fēng)正逐漸取代音頻電路中的駐極體電容麥克風(fēng)(ECM)。ECM和MEMS這兩種麥克風(fēng)的功能相同,但各自和系統(tǒng)其余部分之間的連接卻不一樣。本應(yīng)用筆記將會(huì)介紹這些區(qū)別,并根據(jù)一個(gè)簡(jiǎn)單的基于MEMS麥克風(fēng)的替換電路提供設(shè)計(jì)詳情。
音頻電路的ECM連接
ECM有兩根信號(hào)引線:輸出和接地。麥克風(fēng)通過輸出引腳上的直流偏置實(shí)現(xiàn)偏置。這種偏置通常通過偏置電阻提供,而且麥克風(fēng)輸出和前置放大器輸入之間的信號(hào)會(huì)經(jīng)過交流耦合。
圖1. ECM電路連接
ECM的常見用例是在手機(jī)上連接的耳機(jī)中用作內(nèi)聯(lián)式語(yǔ)音麥克風(fēng)。這種情況下,耳機(jī)和手機(jī)之間的連接器有四個(gè)引腳:左側(cè)音頻輸出、右側(cè)音頻輸出、麥克風(fēng)信號(hào)以及接地。在這種設(shè)計(jì)中,ECM的輸出信號(hào)和直流偏置電壓在同一信號(hào)線路中傳輸。偏置電壓源通常約為2.2 V.
MEMS麥克風(fēng)區(qū)別
模擬MEMS麥克風(fēng)的信號(hào)引腳上不使用輸入偏置電壓。但是,它是一種三端器件,有不同的引腳分別用于電源、接地和輸出。VDD引腳的供電電壓一般為1.8 至3.3 V.MEMS麥克風(fēng)的信號(hào)輸出通過直流電壓實(shí)現(xiàn)偏置,一般等于或接近0.8 V.在設(shè)計(jì)中,該輸出信號(hào)通常會(huì)經(jīng)過交流耦合。
相對(duì)于ECM,使用MEMS麥克風(fēng)的關(guān)鍵優(yōu)勢(shì)在于它的電源抑制(PSR)性能更強(qiáng)。MEMS麥克風(fēng)的PSR通常至少為70 dBV,ECM卻根本沒有電源抑制能力,因?yàn)槠秒妷褐苯油ㄟ^電阻連接至麥克風(fēng)。
用MEMS麥克風(fēng)取代ECM時(shí)需要進(jìn)行的電路更改
對(duì)于原本圍繞ECM設(shè)計(jì)的系統(tǒng),改用MEMS麥克風(fēng)時(shí)面臨的基本難題是,電源和麥克風(fēng)輸出沒有單獨(dú)的信號(hào),例如使用耳機(jī)式麥克風(fēng)時(shí)。如果對(duì)電路進(jìn)行一些小的更改,就可以在此類設(shè)計(jì)中使用MEMS麥克風(fēng)。首先,必須將信號(hào)鏈中直流偏置提供的下游信號(hào)與麥克風(fēng)的輸出信號(hào)隔離。其次,必須將此直流偏置用于為 MEMS麥克風(fēng)供電,而且不能讓麥克風(fēng)的輸出信號(hào)干擾電源。直流偏置的隔離可通過交流耦合電容實(shí)現(xiàn),MEMS麥克風(fēng)的電源可通過仔細(xì)設(shè)計(jì)的電路提供,該電路充當(dāng)分壓器和低通濾波器。以下設(shè)計(jì)中使用了ADMP504 MEMS麥克風(fēng)作為示例。其中用到了一個(gè)2.2 k偏置電阻。
圖2.將一根線用于電源和輸出信號(hào)的MEMS麥克風(fēng)
圖2顯示了一個(gè)實(shí)現(xiàn)上述功能的設(shè)計(jì)示例。在耳機(jī)的設(shè)計(jì)中,耳機(jī)連接器左側(cè)的電路部分將會(huì)在實(shí)際耳機(jī)中,2.2 k偏置電阻和1 F交流耦合電容則在源設(shè)備(例如智能手機(jī))中。電阻R1和R偏置形成分壓器,MEMS麥克風(fēng)將V偏置電壓降至VDD引腳的供電電壓。根據(jù)V偏置、R偏置和所需VDD電壓的值,電阻R1可能需要非常小,如下例所示。要計(jì)算所需的串聯(lián)電阻(R偏置+ R1),可將麥克風(fēng)建模為一個(gè)電阻,將有固定電流從中流過。VDD = 1.8 V時(shí),ADMP504的典型供電電流為180 A.根據(jù)歐姆定律,VDD上的電壓為1.8 V時(shí),該麥克風(fēng)可建模為一個(gè)10 k的電阻。要求解合適的電阻R1值,所用的分壓器公式為:
?。埯溈孙L(fēng)VDD]=[偏置電壓]×(10 k /(10 k + R1 + R偏置))
根據(jù)此公式可以算出,一個(gè)2.2 k的R偏置電阻和一個(gè)499的R1電阻會(huì)從2.2 V偏置電壓分出1.73 V到麥克風(fēng)的VDD上。在選擇R1值時(shí),需要進(jìn)行權(quán)衡取舍;如下所示,此值太大會(huì)導(dǎo)致VDD過小,但為了防止C2過大,又不能讓此值太小。如今MEMS麥克風(fēng)正逐漸取代音頻電路中的駐極體電容麥克風(fēng)(ECM)。ECM和MEMS這兩種麥克風(fēng)的功能相同,但各自和系統(tǒng)其余部分之間的連接卻不一樣。本應(yīng)用筆記將會(huì)介紹這些區(qū)別,并根據(jù)一個(gè)簡(jiǎn)單的基于MEMS麥克風(fēng)的替換電路提供設(shè)計(jì)詳情。關(guān)鍵詞:MEMSADI
圖3顯示了該分壓器的兩種不同模型。左側(cè),ADMP504麥克風(fēng)建模為180 A電流源;右側(cè),麥克風(fēng)則建模為具有1.8 V VDD的10 k電阻。
圖3.分壓器模型
電容C2和電阻R1形成低通濾波器,用于對(duì)電壓供電信號(hào)中輸出的麥克風(fēng)音頻進(jìn)行濾波。這種濾波器轉(zhuǎn)折頻率應(yīng)該遠(yuǎn)低于麥克風(fēng)本身的濾波器較低轉(zhuǎn)折頻率。將低通濾波器設(shè)計(jì)為至少低于麥克風(fēng)較低轉(zhuǎn)折頻率的兩個(gè)倍頻程,這會(huì)是一個(gè)好的開端。對(duì)于ADMP504,此轉(zhuǎn)折頻率為100 Hz.10 F的電容和499的R1電阻可實(shí)現(xiàn)轉(zhuǎn)折頻率為31 Hz的濾波器。較大的電容或電阻會(huì)進(jìn)一步降低此轉(zhuǎn)折頻率,但是該濾波器的電阻大小必須與它對(duì)分壓器的貢獻(xiàn)保持平衡,其中,分壓器會(huì)向麥克風(fēng)提供VDD.低通濾波器的?3 dB點(diǎn)的計(jì)算公式如下:
f-3 dB = 1/(2π×R1×C2)
其中:
R1為分壓器中的電阻。
C2為低通濾波器電容。
電容C1對(duì)麥克風(fēng)輸出進(jìn)行交流耦合,這樣它的偏置輸出就會(huì)與通過手機(jī)提供的麥克風(fēng)偏置電壓隔離。在給定的VDD條件下,憑借R偏置、R1和麥克風(fēng)的等效電阻,該電容還會(huì)形成高通濾波器。計(jì)算高通濾波器轉(zhuǎn)折頻率時(shí)要考慮的總電阻為與R偏置并聯(lián)的RMIC和R1的串聯(lián)電阻。此電阻的計(jì)算公式為
R總=((RMIC + R1)×R偏置)/(RMIC + R1 + R偏置)
對(duì)于此處的示例,R總= 1810.高通濾波器轉(zhuǎn)折頻率為:
f-3 dB = 1/(2π(R總×C1)
要讓濾波器轉(zhuǎn)折頻率至少低于ADMP504低頻滾降頻率100 Hz一個(gè)倍頻程的濾波器轉(zhuǎn)折頻率為100 Hz,C1至少應(yīng)該為1.8 F.
圖4顯示了一套完整的耳機(jī)電路,其中采用了ADMP504MEMS麥克風(fēng)以及合適的電阻和電容值,并以我們處理的V偏置和R偏置值為依據(jù)。
圖4.采用ADMP504 MEMS麥克風(fēng)的電路
結(jié)論
通過本文介紹的電路,可以實(shí)現(xiàn)在沒有單獨(dú)的電源和麥克風(fēng)輸出信號(hào)的設(shè)計(jì)中使用MEMS麥克風(fēng)。該電路只使用兩個(gè)電容和一個(gè)電阻,即可讓MEMS麥克風(fēng)用于雙線式麥克風(fēng)電路中。
TOP6 選擇適合MEMS麥克風(fēng)前置放大應(yīng)用的運(yùn)算放大器
簡(jiǎn)介
麥克風(fēng)前置放大器電路用于放大麥克風(fēng)的輸出信號(hào)來匹配信號(hào)鏈路中后續(xù)設(shè)備的輸入電平。將麥克風(fēng)信號(hào)電平的峰值與ADC的滿量程輸入電壓匹配能夠最大程度地使用ADC的動(dòng)態(tài)范圍,降低后續(xù)處理可能帶來的信號(hào)噪聲。
單個(gè)運(yùn)算放大器可以簡(jiǎn)單地作為MEMS麥克風(fēng)輸出的前置放大器應(yīng)用于電路中。MEMS麥克風(fēng)是一個(gè)單端輸出設(shè)備,因此單個(gè)運(yùn)算放大器級(jí)可用于為麥克風(fēng)信號(hào)增加增益或僅用于緩沖輸出。
該應(yīng)用筆記包含了設(shè)計(jì)前置放大器時(shí)需要考慮的有關(guān)運(yùn)算放大器規(guī)格的關(guān)鍵內(nèi)容,展示了部分基礎(chǔ)電路,還提供了適合用于前置放大器設(shè)計(jì)中的ADI公司的運(yùn)算放大器產(chǎn)品表格。此應(yīng)用筆記采用ADMP504 MEMS麥克風(fēng)為例,闡述了不同的設(shè)計(jì)選擇。該麥克風(fēng)為模擬麥克風(fēng),信噪比(SNR)為65dB。采用不同的麥克風(fēng)設(shè)計(jì)時(shí),要求可能與該應(yīng)用筆記中所述不同,需要根據(jù)麥克風(fēng)的噪聲、敏感度、最大聲學(xué)輸入和其他規(guī)格進(jìn)行調(diào)整。
運(yùn)算放大器規(guī)格
運(yùn)算放大器有許多不同的規(guī)格和性能曲線,因此從中找出與您應(yīng)用相關(guān)的規(guī)格可能是件非常繁瑣的任務(wù)。對(duì)于麥克風(fēng)前置放大器設(shè)計(jì)來說,部分規(guī)格比其他更重要;該應(yīng)用筆記簡(jiǎn)述了此部分規(guī)格。
噪聲
運(yùn)算放大器的噪聲值分為電壓噪聲和電流噪聲。通常,在前置放大器的設(shè)計(jì)中您僅需要考慮運(yùn)算放大器的電壓噪聲。只有在使用高值(即高噪聲)電阻時(shí),設(shè)計(jì)中才需要考慮電流噪聲。為了將電路的整體噪聲維持在低水平,通常采用低于10 kΩ的電阻。
運(yùn)算放大器的電壓噪聲采用噪聲密度單位nV/√Hz定義。與電路帶寬相關(guān)的器件噪聲,您需要將此噪聲密度乘上帶寬的平方根。請(qǐng)注意該簡(jiǎn)易公式僅適用于在頻率范圍內(nèi)統(tǒng)一的噪聲頻譜,如圖1所示。
對(duì)于20kHz的帶寬,該乘數(shù)因子為141。舉ADA4075-2為例,其噪聲密度為2.8 nV/√Hz乘以141,因此噪聲電平為0.395μV或-128 dBV。運(yùn)算放大器的噪聲密度通常在數(shù)據(jù)手冊(cè)的典型特性部分的表格中顯示,且通常顯示其整個(gè)頻率范圍內(nèi)的曲線。該圖表可用于查看在何頻率下運(yùn)算放大器噪聲將取決于1/f噪聲。對(duì)于許多運(yùn)算放大器來說,這個(gè)點(diǎn)通常低于音頻頻帶(20Hz)低端,但是噪聲密度的曲線仍然值得一看,且不能僅參考噪聲密度指數(shù)來完全描述噪聲性能。圖1為ADA4075-2數(shù)據(jù)手冊(cè)中的噪聲密度圖實(shí)例。請(qǐng)注意圖1中1/f轉(zhuǎn)折點(diǎn)約為10Hz,遠(yuǎn)低于MEMS麥克風(fēng)前置放大器電路的目標(biāo)頻帶。
圖1. ADA4075-2電壓噪聲密度
ADMP504模擬MEMS麥克風(fēng)的SNR(A加權(quán))為65 dB ,敏感度為-38 dBV。因此,在20 kHz帶寬內(nèi)本底噪聲為-103 dBV。這相當(dāng)于50 nV/√Hz的噪聲密度,約與150 kΩ電阻的熱噪聲相同。
對(duì)于運(yùn)算放大器來說,比麥克風(fēng)更加低噪非常重要,因此從噪聲方面考慮,前置放大器電路要盡量的透明性。一個(gè)非常好的做法是運(yùn)算放大器的噪聲比麥克風(fēng)本身低至少10dB,以將其對(duì)于全局噪聲的影響最小化。為了使用ADMP504前置放大器實(shí)現(xiàn)該目的,運(yùn)算放大器的最高本底噪聲為-113 dBV或15.9 nV/√Hz。表1中的大部分運(yùn)算放大器都遠(yuǎn)低于該限值,其中不低于該限值的運(yùn)算放大器仍被列出因?yàn)樗鼈兙哂衅渌赡茉谀承┨厥庠O(shè)計(jì)中非常重要的參數(shù),例如用于低功耗設(shè)計(jì)的工作電流。請(qǐng)注意電路的總輸出噪聲電平將受所施加增益和電路中電阻的影響,而不僅僅取決于運(yùn)算放大器??梢酝ㄟ^選擇足夠小的電阻來使其對(duì)總電路噪聲的影響最小。
壓擺率
運(yùn)算放大器的壓擺率指其輸出電壓從一個(gè)電壓值到另一個(gè)值的改變(或擺動(dòng))速度有多快。該參數(shù)的單位通常為V/μs。前置放大器電路必須支持的最高壓擺率為
SR = 2 ×π× fMAX×VP
其中fMAX為前置放大器需要支持的最高頻率(音頻通常為20kHz),VP為運(yùn)算放大器輸出的峰值電壓電平。如果峰值輸出電壓為+12V (8.5VRMS),則運(yùn)算放大器的壓擺率最低為1.5V/μs。
事實(shí)上,大部分音頻信號(hào)在高頻率區(qū)不會(huì)達(dá)到滿程電壓,但是設(shè)計(jì)前置放大器時(shí)還是應(yīng)該考慮到此種可能性。通常電路設(shè)計(jì)中壓擺率指數(shù)不應(yīng)該設(shè)計(jì)過高。在設(shè)計(jì)中您可以使用一個(gè)壓擺率足夠快的運(yùn)算放大器來處理最高目標(biāo)頻率,但是無需高出該限值太多。
總諧波失真加噪聲(THD + N)
關(guān)于運(yùn)算放大器電路中總諧波失真加噪聲(THD + N)的討論很容易變成一個(gè)復(fù)雜的討論。許多原因都可能導(dǎo)致失真,包括壓擺率限制、輸出負(fù)載以及運(yùn)算放大器的內(nèi)部失真特性。THD通常定義為一個(gè)比例,表示為一個(gè)百分比或者用dB值表示。該比例為信函諧波失真部分的幅度與輸入基頻幅度的比值,因此數(shù)值越?。ㄐ“俜直戎祷蜇?fù)dB值)表示其THD + N性能越好。
THD + N參數(shù)為指定帶寬噪聲與THD之和。并非所有運(yùn)算放大器數(shù)據(jù)手冊(cè)的規(guī)格表格中都會(huì)包含該值,即便沒有改值,通常數(shù)據(jù)手冊(cè)中會(huì)包含一張THD(或THD+N)與頻率的曲線圖。圖2顯示了ADA4075-2數(shù)據(jù)手冊(cè)中該值的實(shí)例。
圖2. ADA4075-2 THD + N與頻率的關(guān)系
電源電壓
運(yùn)算放大器的電壓通常表示為一個(gè)范圍,例如3V至30V,這標(biāo)示了V+和V-電壓引腳之間最小值和最大值的區(qū)別。運(yùn)算放大器可以采用單電源將V-接地或者采用雙極性電源將V+和V-分別設(shè)置為等值的正負(fù)值(例如±15V)。
需要選擇合適的電源電壓以保證運(yùn)算放大器的輸出不對(duì)給定的電源軌削波。有些運(yùn)算放大器以軌到軌方式工作,這表示輸入或輸出電壓(取決于具體的參數(shù))可以在不削波的情況下可以一直調(diào)到軌電壓。如果運(yùn)算放大器不是軌到軌方式,數(shù)據(jù)表中將標(biāo)示最大輸入和輸出電壓;請(qǐng)注意正負(fù)電壓最大值可能不同。
信號(hào)的峰值輸出電壓顯然與前置放大器電路提供的增益有關(guān)。ADMP504的峰值輸出電壓為0.25Vrms。當(dāng)ADMP504連接至增益為20 dB(10×增益)的前置放大器,其峰值輸出電壓為2.5Vrms,即7.0VP-P。因此,該電路需要至少7.0V電源電壓或±3.5的軌到軌輸出運(yùn)算放大器。如果運(yùn)算放大器輸出不是軌到軌,則電源電壓需要更高值。
模擬MEMS麥克風(fēng)工作電壓為1.5V至3.3V。表1中列出的部分運(yùn)算放大器最低電源電壓為2.7V,因此在低功耗單電源電路中麥克風(fēng)的電源電壓VDD必須介于2.7和3.3V之間。
表1. 音頻運(yùn)算放大器
增益帶寬積
增益帶寬積(GBP)正如其名,是放大器帶寬(采用低通-3 dB轉(zhuǎn)折)和加于輸入信號(hào)上的增益的乘積。大部分針對(duì)MEMS麥克風(fēng)的前置放大器設(shè)計(jì)不需要附加大于40 dB的增益,即因子為100。設(shè)計(jì)帶寬至少為50 kHz的前置放大器應(yīng)該提供部分余量保證運(yùn)算放大器的帶寬限制不會(huì)影響更高的音頻頻率。帶6.5 MHz GBP的運(yùn)算放大器,例如ADA4075-2,在一個(gè)增益為40 dB的電路中將在信號(hào)開始滾降之前的通帶最高為65 kHz。
數(shù)據(jù)手冊(cè)中典型性能特性部分繪制的規(guī)格曲線為增益與頻率的關(guān)系。這張ADA4075-2數(shù)據(jù)手冊(cè)中的圖(見圖3)顯示了運(yùn)算放大器的開環(huán)增益與頻率的關(guān)系。
圖3. ADA4075-2開環(huán)增益和相位與頻率的關(guān)系
其他規(guī)格
此外根據(jù)電路具體的用處,還需要考慮其他規(guī)格。例如,如果前置放大器需要驅(qū)動(dòng)低阻抗負(fù)載,例如耳機(jī),您將需要選擇具有高驅(qū)動(dòng)能力的運(yùn)算放大器。
運(yùn)算放大器的電源電流通常指放大器的空載電流。低功耗電路設(shè)計(jì)顯然采用低電源電流的運(yùn)算放大器最合適。運(yùn)算放大器的噪聲和電源電流通常成反比,因此需要在音頻性能和功耗之間進(jìn)行取舍。
最后,也有些其他規(guī)格您不需要考慮。失調(diào)電壓通常被認(rèn)為是運(yùn)算放大器的一個(gè)重要規(guī)格,但對(duì)于ac耦合的前置放大器應(yīng)用并不重要。
電路
基本的前置放大器電路有兩種設(shè)置:反相和同相。該部分描述了這兩種設(shè)置的使用和優(yōu)點(diǎn)。
此類電路不顯示電源或旁通電容。雖然電源盒旁通電路對(duì)于電路性能非常重要,但是顯示這兩個(gè)規(guī)格對(duì)于描述前置運(yùn)算功能并不重要。大部分運(yùn)算放大器的數(shù)據(jù)手冊(cè)和AN-202應(yīng)用筆記:IC放大器耦合、接地以及隨機(jī)應(yīng)變中都包含您設(shè)計(jì)需要的更多有關(guān)去耦電容和接地技術(shù)的信息。您還可以在運(yùn)算放大器數(shù)據(jù)手冊(cè)中獲得更多其它更專業(yè)的音頻電路。
同相
同相前置放大器電路的輸出和其輸入極性相同。在信號(hào)極性需要保持不反相的應(yīng)用中此類電路非常適合。圖4顯示的配置中同相運(yùn)算放大器電路的增益為G = (R1 + R2)/R1。
圖4.同相前置放大器電路
該配置具有非常高的輸入阻抗,因?yàn)辂溈孙L(fēng)信號(hào)直接與運(yùn)算放大器的同相輸入直接相連。C1是由于MEMS麥克風(fēng)輸出偏置在0.8V而采用的一個(gè)隔直電容。該電容在該配置中不需要非常大,因?yàn)檫\(yùn)算放大器的輸入阻抗非常高。
相對(duì)于反相拓?fù)涠?,同相拓?fù)潆娐犯枰紤]共模抑制規(guī)格。在同相電路中,共模電壓能導(dǎo)致輸出信號(hào)的失真。運(yùn)算放大器的數(shù)據(jù)手冊(cè)通常會(huì)顯示共模抑制比 (CMRR)與頻率的關(guān)系供您參考,用于決定音頻頻帶中某個(gè)具體器件的性能。這對(duì)于反相電路則不是問題,因?yàn)榉聪嚯娐窙]有動(dòng)態(tài)共模電壓;兩個(gè)輸入都保持為接地或虛擬接地。
反相
圖5顯示了一個(gè)反相運(yùn)算放大器的電路。該電路的輸出極性與輸入反相,增益為G =-R2/R1。
圖5. 反相前置運(yùn)算電路
反相電路的輸入阻抗等于R1。該電阻成了MEMS麥克風(fēng)輸出的電壓分壓器,因此需要選擇足夠高的電阻值不加載麥克風(fēng)的輸出,但也不能太大,為電路增加不必要的噪聲。模擬MEMS麥克風(fēng)通常具有200Ω的輸出阻抗。如果R1選為2.0 kΩ,則電壓分頻器會(huì)將麥克風(fēng)的輸出信號(hào)電平降低9%。
VOUT= (2.0 kΩ + 200Ω)/2.0 kΩ ×VIN= 0.91 ×VIN
直隔電容C1和R1會(huì)形成一個(gè)高通濾波器,因此C1應(yīng)選擇足夠大的值以確保該濾波器不會(huì)干擾麥克風(fēng)的輸入信號(hào)。ADMP504的低頻轉(zhuǎn)折點(diǎn)為100 Hz。如果R1再次選擇2.0 kΩ,則2.2μF電容將形成一個(gè)頻率為40 Hz的-3 dB高通濾波器,遠(yuǎn)低于麥克風(fēng)的轉(zhuǎn)折頻率。
選擇至少比麥克風(fēng)低一個(gè)頻程的截止頻率也是一項(xiàng)經(jīng)驗(yàn)法則,除非需要實(shí)現(xiàn)一項(xiàng)具體的高通特性。
電壓跟隨器
如果反饋環(huán)路中沒有使用分壓電路,同相放大器也可用作電壓跟隨器。該電路非常適合在無法直接驅(qū)動(dòng)較長(zhǎng)的走線或者電纜時(shí)緩沖麥克風(fēng)的輸出,可能不需要為信號(hào)增加額外的增益。
圖6. 電壓跟隨器
電壓跟隨器可在反相極前端用作緩沖器??赡苄枰呐渲靡源_保能在反相電路中使用更低值的電阻。在無緩沖的情況下,反相極的輸入阻抗可能需要采用更低值以實(shí)現(xiàn)目標(biāo)噪聲性能。在保證緩沖和第一個(gè)運(yùn)算放大器的低輸出阻抗(與MEMS麥克風(fēng)相比)的情況下,電阻R1和R2能選擇較低值以避免給電路造成額外的噪聲。
圖7.帶反相放大器的電壓跟隨器緩沖器
差分輸出
MEMS麥克風(fēng)的單端輸出可用兩個(gè)運(yùn)算放大器和兩個(gè)反相電路級(jí)(見圖8)以簡(jiǎn)單的串聯(lián)結(jié)合轉(zhuǎn)換為一個(gè)差分信號(hào)。每級(jí)的輸出轉(zhuǎn)換為彼此反相,作為差分對(duì)。圖 8顯示的電路中信號(hào)的放大發(fā)生在第一級(jí),由R1和R2設(shè)置。電阻R3和R4值應(yīng)相等,為第二級(jí)提供單位增益。為了實(shí)現(xiàn)最佳性能,應(yīng)該采用1%電阻(或更好)來使兩級(jí)之間的誤差最小化。
該配置的一個(gè)缺點(diǎn)是一個(gè)輸出僅由一個(gè)放大器產(chǎn)生噪聲和失真,而第二級(jí)輸出則有兩個(gè)放大器產(chǎn)生噪聲和失真。第二個(gè)小問題是每個(gè)放大器之間存在一個(gè)非零延遲,因此差分輸出的兩側(cè)并非完全對(duì)齊。然而,這可能對(duì)差分信號(hào)的性能影響極小。
圖8. 差分輸出電路
圖7顯示的電壓跟隨器和反相放大器電路還可用于實(shí)現(xiàn)一個(gè)增益為1的差分信號(hào)。同相輸出可以從電壓跟隨器放大器輸出提取,反相輸出可以從反相放大器的輸出提取。在該配置中,R1和R2的值應(yīng)保持相同以達(dá)到統(tǒng)一的增益。
差分放大器,例如AD8273,也可用于實(shí)現(xiàn)單端至差分電路,從前文提到的問題方面考慮也可能具有更出色的性能。
圖9顯示了AD8273配置為單端至差分放大器。每個(gè)放大器配置為G=2,因此差分增益為4×。
圖9. AD8273單端轉(zhuǎn)差分配置,G = 4
運(yùn)算放大器的選擇
ADI提供大量適合麥克風(fēng)前置放大應(yīng)用的各種運(yùn)算放大器產(chǎn)品。圖1顯示了部分此類元件的規(guī)格,根據(jù)電壓噪聲進(jìn)行分類。不管您的應(yīng)用旨在實(shí)現(xiàn)最佳性能還是您需要設(shè)計(jì)一個(gè)性價(jià)比高的電路,總有一款應(yīng)用放大器能夠滿足您的需要。
性能仿真
ADI提供了用于仿真模擬電路的工具。NI Multisim器件評(píng)估板的ADI版本可用于快速建立一個(gè)電路并顯示其性能規(guī)格,包括頻率響應(yīng)和噪聲電平。該Multisim版本包含了大部分該庫(kù)中討論的大部分運(yùn)算放大器,可以無需從不同源下載和管理SPICE模型就實(shí)現(xiàn)快速仿真。不同器件,包括運(yùn)算放大器,可置入電路或取出以比較不同器件的性能。
TOP7 麥克風(fēng)陣列信號(hào)采集系統(tǒng)的設(shè)計(jì)
作為傳統(tǒng)的語(yǔ)音拾取工具,單個(gè)孤立麥克風(fēng)在噪聲處理、聲源定位和跟蹤,語(yǔ)音提取和分離等方面存在不足,嚴(yán)重影響了語(yǔ)音通信質(zhì)量。如果使用多個(gè)麥克風(fēng)組成陣列,在時(shí)頻域的基礎(chǔ)上增加一個(gè)空間域,對(duì)來自空間不同方向的信號(hào)進(jìn)行實(shí)時(shí)處理,就可以彌補(bǔ)上述不足?,F(xiàn)在已有的麥克風(fēng)陣列采集處理系統(tǒng)中,大多采用4路麥克風(fēng)陣列,這類系統(tǒng)雖然在一定程度上能解決語(yǔ)音增強(qiáng)、噪音抑制、聲源定位和回聲抵消等問題,但由于4個(gè)麥克風(fēng)個(gè)數(shù)較少,只能組成一字線陣,十字陣等幾種特定的陣列形狀,三維空間的方向及距離判斷有較大的誤差。設(shè)計(jì)的16通道麥克風(fēng)采集系統(tǒng)能夠組成麥克風(fēng)面陣,彌補(bǔ)了上述不足,較好地解決了三維空間信號(hào)位置判斷的問題。
一、硬件系統(tǒng)設(shè)計(jì)
該硬件系統(tǒng)主要包括16路麥克風(fēng)構(gòu)成的陣列、A/D采樣模塊、DSP數(shù)據(jù)處理模塊、PC機(jī),如圖1所示。
1.1 麥克風(fēng)陣列
該系統(tǒng)中,麥克風(fēng)陣列選用聲望公司的MPA416傳聲器。MPA416傳聲器的靈敏度可達(dá)50 mV/Pa;擁有低本底噪聲;頻率響應(yīng)范圍20 Hz~20 kHz;當(dāng)其用于陣列時(shí),MPA416的相位差能控制在3°~5°,能滿足系統(tǒng)對(duì)精確度和穩(wěn)定性的要求。
1.2 A/D采樣模塊
A/D采樣模塊由4片PCM4204以及其外圍電路組成。PCM4204內(nèi)置了4個(gè)同步采樣通道,支持音頻串口和DSD數(shù)據(jù)口。音頻串口模式時(shí),輸出24 位線性PCM碼,有主、被動(dòng)兩種工作模式,支持左、右對(duì)齊,I2S和TDM數(shù)據(jù)格式,動(dòng)態(tài)范圍為118 dB,最高采樣頻率216 kHz。系統(tǒng)選用1片PCM4204采用主動(dòng)工作模式,其余3片PCM4204采用被動(dòng)工作模式。通過音頻串口將外部采集的模擬聲音信號(hào)轉(zhuǎn)化為24位 I2S格式數(shù)字信號(hào)。由于前端麥克風(fēng)陣列的輸出信號(hào)不是差分信號(hào),而PCM4204要求輸入信號(hào)為差分信號(hào),同時(shí)要求輸入差分信號(hào)幅值在-0.3~- 0.3+VccV之間,因此其每路信號(hào)的前端都應(yīng)有一個(gè)緩沖電路,用來將所接收的麥克風(fēng)信號(hào)轉(zhuǎn)換為差分信號(hào)并對(duì)幅值進(jìn)行調(diào)整。緩沖電路主要由 OPA1632和OPA22組成,OPA1632和OPA227是高精度、音頻差分放大器,緩沖電路如圖2所示。
1.3 DSP數(shù)據(jù)處理模塊
設(shè)計(jì)中數(shù)據(jù)處理模塊選擇TI公司浮點(diǎn)DSP芯片TMS320C6713作為模塊核心。TMS320C6713為高性能32位浮點(diǎn)DSP,適用于專業(yè)音頻信號(hào)處理,其主頻可達(dá)300 MHz,處理速度高達(dá)2 400 MIPS/1 800 MFLOPS。其內(nèi)部采用改進(jìn)的哈佛結(jié)構(gòu);具有256 kB的片內(nèi)存儲(chǔ)空間;豐富的外設(shè)包括兩個(gè)多通道緩沖串口(McBSP)、兩個(gè)多通道音頻串口(McASP)、SPI和I2C等;增強(qiáng)的直接存儲(chǔ)器訪問 (EDMA)控制器,可控制16個(gè)獨(dú)立通道完成不受CPU干預(yù)的數(shù)據(jù)傳輸;32 bit的外部存儲(chǔ)器接口(EMIF),能與SRAM、ERPOM、Flash、SBSRAM和SDRAM無縫連接。DSP數(shù)據(jù)處理模塊框圖如圖3所示。 其中,TMS320C6713通過McASP與前端的A/D采樣模塊相連,并利用EDMA數(shù)據(jù)傳輸速度快、傳輸量大,且不占用CPU時(shí)鐘周期的特點(diǎn),將采集數(shù)據(jù)轉(zhuǎn)存至TMS320C6713的片內(nèi)存儲(chǔ)空間。TMS320C6713外接CPLD控制EMIF接口,通過對(duì)EMIF接口上CE3空間的控制,控制 USB芯片CY7C680 01,完成TMS320C6713與PC機(jī)平臺(tái)間的USB數(shù)據(jù)傳輸。
1.4 A/D采樣模塊與DSP數(shù)據(jù)處理模塊接口設(shè)計(jì)
4片PCM4204芯片與TMS320C6713的McASP1相連接,其連接示意圖如圖4所示。
圖4中,PCM4204 A采用主動(dòng)工作模式,PCM4204B、PCM4204C和PCM4204D采用被動(dòng)工作模式。系統(tǒng)采用I2S數(shù)據(jù)格式,PCM4204A的SDOUT1 輸出的是1和2通道的數(shù)據(jù),SDOUT2輸出的是3和4通道的數(shù)據(jù);PCM4204B的SDOUT1輸出的是5和6通道的數(shù)據(jù),SDOUT2輸出的是7和 8通道的數(shù)據(jù);PCM4204C的SDOUT1輸出的是9和10通道的數(shù)據(jù),SDOUT2輸出的是11和12通道的數(shù)據(jù);PCM4204D的SDOUT1 輸出的是13和14通道的數(shù)據(jù),SDOUT2輸出的是15和16通道的數(shù)據(jù)。
通過配置芯片引腳S/M、FMT2、FMT1、FMT0、FS2、FS1和:FS0對(duì)PCM4204進(jìn)行設(shè)置。
1.5 DSP數(shù)據(jù)處理模塊USB接口設(shè)計(jì)
TMS320C6713通過EMIF的CE3存儲(chǔ)空間可以外擴(kuò)USB2.0接口,因此在對(duì)外擴(kuò)USB進(jìn)行讀/寫訪問前,需要通過EMIF的 CE3控制寄存器CE3C-TL來配置CE3空間存儲(chǔ)器接口的類型、存儲(chǔ)器寬度及讀寫時(shí)序。CY7C68001采用并行異步存儲(chǔ)器接口通過可編程邏輯芯片 CPLD與TMS320C6713相連,其原理框圖如圖5所示。
CY7C68001除了存儲(chǔ)器接口外,還有1個(gè)中斷信號(hào) 和4個(gè)狀態(tài)信號(hào)
。中斷信號(hào) 采用TMS320C6713的外部中斷EXT_INT6。TMS320C6713使用CY7C68001作為從設(shè)備。在這種模式下,DSP可以像讀/寫普通FIFO一樣對(duì)CY7C68001內(nèi)部的FIFO進(jìn)行讀/寫。PC主機(jī)發(fā)出命令的同時(shí)也由CY7C68001 的引腳提供中斷觸發(fā)信號(hào)給DSP的EXT_INT6。其上升沿被檢測(cè)到后,DSP就進(jìn)入相應(yīng)中斷服務(wù)程序,開始處理USB的傳輸。DSP通過 EA[4:2]連接FIFOA[2:0]對(duì)CY7C68001內(nèi)部FIFO或命令口進(jìn)行選擇。讀/寫數(shù)據(jù)通過ED[15:0]與FIFO[15:0]連接進(jìn)行。FIFO和命令口的選擇和地址分配如表1所示。
經(jīng)實(shí)驗(yàn)驗(yàn)證,USB異步傳輸速率可達(dá)3 Mbit?s-1,滿足系統(tǒng)需求。
1.6 PC機(jī)平臺(tái)
DSP數(shù)據(jù)處理模塊通過USB接口與PC機(jī)相連,通過CY7C68001芯片,將前端采集的數(shù)據(jù)傳輸?shù)絇C機(jī),方便對(duì)數(shù)據(jù)的進(jìn)一步處理。
二、 程序設(shè)計(jì)
2.1 McASP接口程序設(shè)計(jì)
定義了4個(gè)寄存器組:全局寄存器組globalRegs、發(fā)送寄存器組xmtRegs、接收寄存器組mvRegs和串行化器控制寄存器組 srctlRegs。通過這4個(gè)寄存器組,對(duì)McASP1的PFUNC,PDIR,SRCTL,RFMT,AFSRCTL,ACLKRCTL及 AHCLKRCTL等寄存器進(jìn)行設(shè)置。各寄存器組所包含的主要寄存器情況如表2所示。
依據(jù)PCM4204的I2S數(shù)據(jù)格式,將接收幀同步信號(hào)的寬度定為32 bit,接收延遲設(shè)置為1個(gè)delay;AXR[0]~AXR[7]設(shè)置為接收模式。
2.2 EDMA傳輸程序設(shè)計(jì)
為保證數(shù)據(jù)的完整性,選用Ping-Pong模式對(duì)EDMA傳輸進(jìn)行配置,Ping緩存存放如表3所示,Pong緩存與Ping緩存結(jié)構(gòu)相同。
依據(jù)Ping、Pong緩存數(shù)據(jù)格式,對(duì)EDMA接收進(jìn)行配置,即對(duì):EDMA的opt,src,cnt,dst,idx,及rld寄存器分別進(jìn)行設(shè)置。通過opt寄存器設(shè)置數(shù)據(jù)長(zhǎng)度為32 bit,源數(shù)據(jù)和目的數(shù)據(jù)為一維方式,源地址固定,目的地址采用索引,啟用幀同步等。源地址和目的地址分別寫入src,dst寄存器。cnt寄存器主要用于配置幀計(jì)數(shù)和單元計(jì)數(shù)。由于采用I2S的數(shù)據(jù)格式,所以1幀數(shù)據(jù)只包含2個(gè)單元數(shù)據(jù)。通過配置idex及rld寄存器,目的數(shù)據(jù)可以按照設(shè)定的索引方式存儲(chǔ)。
2.3 DSP端OSB接口程序設(shè)計(jì)
首先,通過調(diào)用用戶的初始化函數(shù),使能外部中斷并初始化USB寄存器。之后,程序通過數(shù)據(jù)傳輸函數(shù),完成DSP與PC機(jī)的數(shù)據(jù)傳輸。
USB初始化程序配置如下:
?。?)使能外部中斷6(EXT_INT6)。
?。?)加載USB描述表,并進(jìn)行自舉檢測(cè),如自舉不成功,則重新自舉,直到端點(diǎn)0收到設(shè)置包為止。
(3)配置USB為異步從FIFO(Asynchronous SlaveFIFO)模式,采用內(nèi)部48 MHz時(shí)鐘源。
?。?)讀取FNADDR寄存器,判斷USB工作狀態(tài)。
(5)依據(jù)USB工作狀態(tài),配置EP2、EP4、EP6、EP8,并設(shè)置一次傳送的Byte長(zhǎng)度。設(shè)置EP2、EP4為BULK OUT,EP6、EP8為BULK IN,其緩沖大小分別為2×512 Byte。
在數(shù)據(jù)傳輸過程中,PC端通過EP2向DSP發(fā)送讀數(shù)據(jù)命令,DSP通過外部中斷收到讀命令后,使用EP6發(fā)送已采集好的數(shù)據(jù)。在聲音數(shù)據(jù)采集系統(tǒng)中,每路麥克風(fēng)以96 kHz進(jìn)行24位采樣,按照ping-pong方式進(jìn)行存儲(chǔ)。在傳輸過程中還需進(jìn)行判斷,當(dāng)采集數(shù)據(jù)存儲(chǔ)在ping緩存時(shí),發(fā)送pong緩存中的數(shù)據(jù),當(dāng)采集數(shù)據(jù)存儲(chǔ)在pong緩存時(shí),發(fā)送ping緩存的數(shù)據(jù)。由于TMS320C6713通過EMIF的CE3存儲(chǔ)空間可以外擴(kuò)USB2.0接口,需對(duì) EMIF接口的CE3寄存器進(jìn)行配置,將USB接口設(shè)為16位異步存儲(chǔ)接口,設(shè)定讀/寫的建立時(shí)間(Setup)、促發(fā)時(shí)間(Strobe)、保持時(shí)間,使其滿足CY7C68001的讀/寫時(shí)序要求。
2.4 PC機(jī)平臺(tái)應(yīng)用程序設(shè)計(jì)
PC端接口程序采用VC++6.0編寫,首先調(diào)用OpenDriver()打開USB接口設(shè)備,獲得設(shè)備的句柄hDevice,之后調(diào)用 Sx2SendVendorReq()函數(shù)向外設(shè)發(fā)出命令,讀取USB配置,最后調(diào)用Sx2BulkdataTrans()進(jìn)行數(shù)據(jù)傳輸,通過調(diào)用 CFile類將接收到的數(shù)據(jù)存放在文本文件中。程序使用多線程技術(shù),使得應(yīng)用程序?qū)SB數(shù)據(jù)傳輸在后臺(tái)進(jìn)行處理,應(yīng)用程序前臺(tái)還可進(jìn)行其他操作。
TOP8 利用麥克風(fēng)數(shù)組抑制背景噪聲
?
概述
隨著手持語(yǔ)音通信設(shè)備越來越流行,它們應(yīng)用在嘈吵環(huán)境的機(jī)會(huì)也越來越高,例如機(jī)場(chǎng)、交通繁忙的路段、人多嘈雜的酒吧等。在這種嘈吵的環(huán)境下,通話的雙方實(shí)在難以聽清對(duì)方所說的話。
此外,不少通信系統(tǒng)都是采用計(jì)算機(jī)運(yùn)行的語(yǔ)音識(shí)別、指令及/或響應(yīng)系統(tǒng),這些系統(tǒng)均易受到背景噪聲的影響,假如噪聲過大,便會(huì)導(dǎo)致系統(tǒng)出現(xiàn)很大的偏差。因此,有必要改善語(yǔ)音信號(hào)對(duì)背景聲音噪聲的比率。
本文將解釋利用麥克風(fēng)數(shù)組消除語(yǔ)音通信系統(tǒng)中背景噪聲的基本原理,并引用美國(guó)國(guó)家半導(dǎo)體的LMV1088麥克風(fēng)數(shù)組放大器作為例子加以說明。
麥克風(fēng)數(shù)組
麥克風(fēng)數(shù)組是指將多個(gè)麥克風(fēng)一個(gè)接一個(gè)地排列成一個(gè)特別的樣式,讓它們一起工作以產(chǎn)生出一個(gè)合成輸出信號(hào)或多組信號(hào)。
每一個(gè)麥克風(fēng)都是一個(gè)傳感器或一個(gè)空間窗口(spatial window),用于接收(空間采樣)輸入信號(hào)。數(shù)組的整體響應(yīng)是數(shù)組中每個(gè)麥克風(fēng)的個(gè)別響應(yīng)的迭加,并與所采用的算法相關(guān)。
數(shù)組中多組麥克風(fēng)信號(hào)所采用的 “數(shù)組處理” 算法是根據(jù)幾個(gè)因素來決定的,包括麥克風(fēng)的間隔距離及排列樣式、麥克風(fēng)的數(shù)量及類型,以及聲音的傳播原則。
麥克風(fēng)數(shù)組的基本任務(wù)是消除語(yǔ)音輸入信號(hào)的周圍噪聲,進(jìn)而改善聽覺輔助系統(tǒng)、語(yǔ)音識(shí)別設(shè)備和電信產(chǎn)品的語(yǔ)音質(zhì)量。此外,麥克風(fēng)數(shù)組也可用于方向定位,以及計(jì)算聲源與數(shù)組之間的距離。
語(yǔ)音通信系統(tǒng)中的麥克風(fēng)數(shù)組的主要功能是提供一個(gè)高質(zhì)量的語(yǔ)音信號(hào),同時(shí)降低現(xiàn)場(chǎng)及周圍環(huán)境的噪聲。這里所指的質(zhì)量是指最終的語(yǔ)音信號(hào)非常自然真實(shí),當(dāng)中不存在任何的人工噪音例如是卡嗒聲和砰啪聲、非意愿靜音、頻率失真、回聲或因加強(qiáng)語(yǔ)音信號(hào)處理方法所引起的不定期信號(hào)電平變化。
基于上述的理由,信/噪比改進(jìn)(SNRI)并不是選擇背景噪聲抑制解決方案時(shí)的唯一參數(shù),而必須考慮其它問題。
聲音信息
聲壓級(jí)
聲壓級(jí)(SPL)會(huì)隨著聲源距離的增加而減少。圖1和圖2分別表示出SPL的消減,該數(shù)值以分貝(dB)作單位,并且是聲源距離 “x”的一個(gè)函數(shù)。當(dāng)人們說話的時(shí)候,一般以距離嘴唇約1cm的位置作為基準(zhǔn)參考點(diǎn),并將該位置的SPL定為96 dB。在這條件下,SPL的公式應(yīng)為:
dB=96-20 log(x/0.01)
或可寫成
dB=96+20 log(0.01/x)
公式中的 ( 或 )是0.01m的參考值距離,亦即以米作單位時(shí)相對(duì)于聲源的距離“x” 為1公分。
圖1
圖2
當(dāng)距離“x” 增加一倍時(shí),兩條曲線的SPL均下降6dB 。圖1距離聲源200公分,而圖2則是距離聲源50公分的局部放大圖,從圖中可見聲音壓力會(huì)因與聲源距離的增加而急速下降,即使距離很短的情況下也一樣。例如,當(dāng)與聲源的距離為10公分時(shí),SPL便減少了20 dB,即由96dB下降到約76dB。
近場(chǎng)對(duì)遠(yuǎn)場(chǎng)聲音
聲源的近場(chǎng)是指該位置處于相關(guān)最低頻信號(hào)的一個(gè)波長(zhǎng)范圍之內(nèi)。假設(shè)相關(guān)語(yǔ)音的最低頻為300Hz,如此波長(zhǎng)λ便等于c/f 或 331.1/300 ,又或是 1.104 米,其中c代表聲波于零度攝氏下的水平速度。當(dāng)頻率為3500Hz時(shí),λ便等于c/f或 331.1/3500,又或是 0.0946米 (9.46公分)。因此,語(yǔ)音信號(hào)的典型近場(chǎng)范圍即由聲源距離約9.5公分到1.1米。
超過1米的距離,語(yǔ)音信號(hào)便會(huì)被考慮成語(yǔ)音聲源的遠(yuǎn)場(chǎng)。對(duì)于麥克風(fēng)間隔較近的數(shù)組,近場(chǎng)聲源會(huì)呈現(xiàn)出一個(gè)圓球狀的波陣面,并擁有很強(qiáng)的信號(hào)振幅、壓力梯度,以及對(duì)應(yīng)數(shù)組中各麥克風(fēng)與聲源之間的距離而出現(xiàn)的頻率相關(guān)差別。
現(xiàn)在假設(shè)兩個(gè)麥克風(fēng)的間隔距離為3公分,而最接近聲源的一個(gè)麥克風(fēng),其與聲源的距離為5公分。圖2表示出第一個(gè)麥克風(fēng)(即最接近聲源的一個(gè)),其感受到一個(gè)SPL為82dB的音頻信號(hào),而第二個(gè)麥克風(fēng)(即與聲源相距8公分)所感受到的信號(hào)為78dB SPL。即使兩者間只有4 dB的差別,但相對(duì)于整體的信號(hào)級(jí),這差別仍相當(dāng)大。
從頻譜含量的角度看,麥克風(fēng)數(shù)組內(nèi)的所有近場(chǎng)語(yǔ)音信號(hào)均關(guān)系密切。與最接近聲源的麥克風(fēng)比較,與聲源距離最遠(yuǎn)的麥克風(fēng)信號(hào)的振幅將會(huì)減少,并且會(huì)出現(xiàn)信號(hào)由最近麥克風(fēng)傳送到最遠(yuǎn)麥克風(fēng)的時(shí)間延遲。然而,要恢復(fù)該個(gè)案中的語(yǔ)音信號(hào)并不困難。
在麥克風(fēng)數(shù)組語(yǔ)音近場(chǎng)范圍以外的聲源將被看作是遠(yuǎn)場(chǎng)聲源,并對(duì)數(shù)組中排列緊密的麥克風(fēng)展現(xiàn)出實(shí)質(zhì)平面的波陣面。數(shù)組中每一個(gè)麥克風(fēng)均感受到幾乎一樣的聲波能量及隨機(jī)相位信號(hào),但該些信號(hào)并沒有對(duì)應(yīng)關(guān)系,除非麥克風(fēng)之間的距離非常接近。假如這些信號(hào)與麥克風(fēng)的距離較遠(yuǎn),那麥克風(fēng)的絕對(duì)SPL值便會(huì)進(jìn)一步下降。
現(xiàn)舉出另一個(gè)例子,假若將相同的麥克風(fēng)數(shù)組放置到與聲源距離150公分(即1.5米)的位置,最近聲源的麥克風(fēng)的SPL值便會(huì)下降到52.5 dB,而距離聲源153公分的最遠(yuǎn)麥克風(fēng)的SPL值則稍微下降到52.3dB。雖然兩者僅有0.2dB的差距,但從聲源到最近麥克風(fēng)的整體信號(hào)級(jí)將出現(xiàn) 30dB的下降。
麥克風(fēng)輸出之間的不同信號(hào),在進(jìn)行了適當(dāng)?shù)奶幚砑盀V波后,可將遠(yuǎn)場(chǎng)噪聲消除,使兩個(gè)麥克風(fēng)的復(fù)合輸出及處理電路能提供高清晰度的語(yǔ)音信號(hào)。
聲音噪聲的特質(zhì)
這里的噪聲場(chǎng)可分為三種,分別是相干噪聲、非相干噪聲及擴(kuò)散噪聲。
相干噪聲是指當(dāng)聲波傳到麥克風(fēng)時(shí),在該過程中沒有因環(huán)境中的障礙物而出現(xiàn)任何形式的反射、散射或衰減。
非相干噪聲是指某一位置的噪聲與其它位置的噪聲沒有任何關(guān)系,并且被看成空間白噪音。
擴(kuò)散噪聲是指擁有相同能量的噪聲同時(shí)軸射到所有方向。例子包括辦公室內(nèi)的噪音、機(jī)場(chǎng)候機(jī)樓及交通噪音等,換句話說就是指所有充滿噪音的環(huán)境。
這里所指的聲音噪聲有兩種,分別是穩(wěn)態(tài)噪聲及非穩(wěn)態(tài)噪聲。
穩(wěn)態(tài)噪聲是指噪聲的能量相對(duì)地穩(wěn)定,并具備已知及變化緩慢的頻譜含量,并且是可預(yù)知的。例子包括由引擎發(fā)出的噪音、空調(diào)風(fēng)扇、隨機(jī)或 “白” 噪音等等。噪聲抑制算法能有效抑制這類噪音。
非穩(wěn)態(tài)噪聲是指音量及聲音內(nèi)容會(huì)在短時(shí)間內(nèi)變化,例如高聲說話或叫喊、汽車經(jīng)過的聲音或拍手等,其發(fā)生是不可預(yù)知的。假若出現(xiàn)這類噪音,它們可能在被辨識(shí)及抑制前便會(huì)自動(dòng)地消失掉,非穩(wěn)態(tài)噪聲一般都包含在穩(wěn)態(tài)噪聲之內(nèi)。
最麻煩的情況是當(dāng)噪聲源與語(yǔ)音信號(hào)擁有相同的出現(xiàn)時(shí)間、頻譜及相干特性,這種情況當(dāng)背景噪聲屬于非穩(wěn)態(tài),且旁邊有其它人說話時(shí)便會(huì)出現(xiàn),如在餐館和酒吧,車站及派對(duì)上等。
第二部分
麥克風(fēng)數(shù)組的解決方案
根據(jù)選用的方法,麥克風(fēng)數(shù)組解決方案可以成為抑制穩(wěn)態(tài)及非穩(wěn)態(tài)噪聲的一項(xiàng)非常高效的技術(shù)。
配合適當(dāng)?shù)乃惴?,?shù)組中的個(gè)別麥克風(fēng)信號(hào)經(jīng)過濾波后再組合,以便達(dá)到波束成形或空間濾波的效果,進(jìn)而產(chǎn)生一個(gè)復(fù)雜的麥克風(fēng)數(shù)組極性響應(yīng)模式,能夠指向或遠(yuǎn)離某個(gè)聲音位置。因此,可以將某個(gè)位置的聲音隔離或加強(qiáng),又或可將其抑制或拒絕。同樣地,麥克風(fēng)聲道中的信號(hào)相關(guān)性可找出主要信號(hào)的方向及其正確位置。
視乎數(shù)組的復(fù)雜度及應(yīng)用,該數(shù)組可經(jīng)由一個(gè)配備了數(shù)字信號(hào)處理器的模擬電路,再加上適當(dāng)?shù)挠?jì)算機(jī)軟件和一系列方法去控制。
波束成形
波束成形分為兩種技術(shù):自適應(yīng)及定向。
在自適應(yīng)波束成形技術(shù)中,可通過數(shù)據(jù)相關(guān)濾波及改變對(duì)數(shù)據(jù)的時(shí)間響應(yīng)去調(diào)節(jié)波束的方向,在自適應(yīng)波束成形方面已有幾種方法被開發(fā)出來。雖然在信號(hào)的處理上比較繁復(fù),但好處是設(shè)計(jì)靈活度更高,包括麥克風(fēng)的數(shù)量、類型及間隔距離。自適應(yīng)波束成形一般需要數(shù)字信號(hào)處理器或計(jì)算機(jī)軟件來實(shí)現(xiàn)。
至于定向波束成形方面,波束的行走方向會(huì)按照相關(guān)聲源的方位而優(yōu)化,并且同時(shí)排除來自其它方向的噪聲。一般來說,排列緊密兼具備固有方向性的差分式麥克風(fēng)端射數(shù)組都是依靠固定時(shí)間延遲或其它方法來改變波束的方向。對(duì)于這類應(yīng)用,任何濾波及信號(hào)處理的方法均須對(duì)特別的機(jī)械設(shè)計(jì)加以優(yōu)化。定向波束成形一般需要模擬電路、數(shù)字信號(hào)處理器或計(jì)算機(jī)軟件來實(shí)現(xiàn)。
對(duì)于語(yǔ)音應(yīng)用來說,采用定向波束成形解決方案會(huì)比較好,尤其當(dāng)應(yīng)用牽涉到語(yǔ)音辨識(shí)。假如以模擬電路來實(shí)現(xiàn),它們便應(yīng)該:
● 對(duì)噪聲輸入有實(shí)時(shí)的響應(yīng)
● 容易實(shí)現(xiàn)而且無需開發(fā)任何的算法程序
● 為抑制穩(wěn)態(tài)及非穩(wěn)態(tài)噪聲提供一個(gè)可接受的信/噪比改進(jìn)(SNRI)值
● 在無語(yǔ)音時(shí)表現(xiàn)極低的失真,并且可改善語(yǔ)音質(zhì)量測(cè)試(ITU-T P.835)的整體平均意見分?jǐn)?shù)(mean opinion score)
● 運(yùn)算復(fù)雜度低并具備低信號(hào)延遲
● 功耗比其它解決方案小
與定向方案比較,采用數(shù)字信號(hào)處理器或軟件實(shí)現(xiàn)的自適應(yīng)波束成形的缺點(diǎn)為:
● 當(dāng)實(shí)施及調(diào)節(jié)抑制算法時(shí),需要時(shí)間去重復(fù)辨識(shí)及收斂噪聲
● 雖然可提供較佳的SNRI值,但通常也會(huì)為語(yǔ)音輸出信號(hào)帶來較多的問題,包括因噪聲收斂時(shí)間所引起的延遲、卡嗒聲和砰啪聲、非意愿靜音、頻率失真、回聲或與子頻帶頻率信號(hào)處理方法有關(guān)的不定期信號(hào)級(jí)變化
● 由于需要另行開發(fā)演算程序,因此在實(shí)現(xiàn)上比較困難
● 需要更大的功耗
所有波束成形解決方案都是采用很小的數(shù)組,它們對(duì)誤差都非常敏感,包括由麥克風(fēng)增益與相位失配所引起的誤差,以及由于音頻信號(hào)路徑嵌入于產(chǎn)品內(nèi)而非設(shè)于大氣中所導(dǎo)致的路徑偏差。因此,波束解決方案必須具備某種形式的補(bǔ)償,而這種補(bǔ)償可以設(shè)于波束成形系統(tǒng)之內(nèi),又或是在系統(tǒng)之外加設(shè)適合的麥克風(fēng)和音頻信號(hào)路徑。
麥克風(fēng)間隔
奈奎斯特空間采樣率為相關(guān)最高頻率的二分之一個(gè)波長(zhǎng)(d=λ/2)。為了從空間取得相關(guān)頻率的一個(gè)波長(zhǎng)樣品,兩個(gè)傳感器(即麥克風(fēng))必須相隔二分之一個(gè)波長(zhǎng)。
然而,當(dāng)傳感器的間隔少于二分之一個(gè)波長(zhǎng)時(shí)(d 《 1/2λ),過采樣便會(huì)發(fā)生,使波長(zhǎng)被采樣超過兩次。相反地,如距離大于二分之一個(gè)波長(zhǎng)(d 》 1/2λ),空間性欠采樣便會(huì)發(fā)生,這時(shí)第一個(gè)傳感器在完成一個(gè)波長(zhǎng)的采樣后,會(huì)在第二個(gè)傳感器進(jìn)行采樣之前再重新啟動(dòng)??臻g性欠采樣可將較高頻的信號(hào)混迭到相關(guān)的頻帶,導(dǎo)致結(jié)果出現(xiàn)混亂。為了防止出現(xiàn)假頻,采樣器的頻寬必須限制在最高相關(guān)頻率以上。
不少研究指出假如能夠盡量縮少傳感器之間的距離便可打造出高效的麥克風(fēng)數(shù)組,距離可以比奈奎斯特速率的最低要求小很多。現(xiàn)再舉一個(gè)例子,其中傳感器的間隔為相關(guān)聲波的八分之一個(gè)波長(zhǎng)。
在一個(gè)純語(yǔ)音系統(tǒng)中,頻率范圍為300Hz 到 3500Hz,而最大聲音能量可出現(xiàn)在500Hz 到 2500Hz之間。在此條件下,λ/8的間隔在3500Hz下為1.18公分,而于2500Hz下為1.65公分。
由于波長(zhǎng)增加,在3500Hz 及2500Hz頻率以下的音頻信號(hào)仍然會(huì)被過采樣,因此1.18公分或1.65公分的間隔能有效地取得更多的信號(hào)樣品。
另一個(gè)計(jì)算方法將間隔定為兩公分,如此當(dāng)頻率為2500Hz時(shí),波長(zhǎng)的間隔(λ)/(c/df)便為:
λ/(331.1/0.02*2500)=λ/6.62
假如空間采樣率在最高相關(guān)頻率下仍然低于λ/2,則需要調(diào)節(jié)麥克風(fēng)的間隔以滿足產(chǎn)品的應(yīng)用要求。但隨著間隔越來越擠(空間采樣率越來越高),麥克風(fēng)數(shù)組中的遠(yuǎn)場(chǎng)信號(hào)之間的相干性變大,使得數(shù)組在各頻率下均可發(fā)揮更佳的整體背景噪聲抑制效能。相反地,假如間隔變得較寬闊,數(shù)組的整體抑制能力便會(huì)下降,變得難以對(duì)較低頻信號(hào)作出反應(yīng)。
一旦決定了傳感器的間隔,便可對(duì)應(yīng)頻率的需求將數(shù)組優(yōu)化。假如采用的是定向波束成形方案,數(shù)組的響應(yīng)模式也需同時(shí)被固定。
不論是任何的產(chǎn)品,在設(shè)計(jì)的過程中必須要作出一些折衷決定,包括在操作頻率范圍與所需噪聲抑制級(jí)之間、理論與實(shí)際麥克風(fēng)間隔之間、以及整體的數(shù)組系統(tǒng)成本和復(fù)雜性之間等。
麥克風(fēng)數(shù)組解決方案的例子
以下采用美國(guó)國(guó)家半導(dǎo)體的遠(yuǎn)場(chǎng)抑制麥克風(fēng)數(shù)組放大器LMV1088作為麥克風(fēng)數(shù)組解決方案的一個(gè)例子,它可為語(yǔ)音應(yīng)用提供高至20 dB的背景噪聲抑制。LMV1088是一個(gè)模擬定向波束成形解決方案,適用于采用全指向性麥克風(fēng)的差分式雙麥克風(fēng)端射數(shù)組。
圖中兩個(gè)麥克風(fēng)分別位于兩條相距約1.5公分至2.5公分的線上,或保持等同的聲波路徑距離。說話者與手機(jī)或耳機(jī)的麥克風(fēng)距離最好保持2公分至10公分,通過使用圖1和圖2便可計(jì)算出語(yǔ)音信號(hào)隨距離變化的損耗。
LMV1088不僅可為兩條聲道上的聲音、麥克風(fēng)和放大器信號(hào)路徑之間的差別提供初始性補(bǔ)償,并且可執(zhí)行修正濾波令語(yǔ)音輸出更加自然,還可提供頻寬限制濾波功能。
由于內(nèi)部放大器增益可通過I2C指令調(diào)節(jié),因此可使用不同靈敏度的麥克風(fēng),并促使LMV1088的輸出信號(hào)級(jí)能配合模擬輸入信道信號(hào)的要求,以針對(duì)各式各樣的通信處理器及設(shè)備。
LMV1088可支持四種運(yùn)作模式,并通過I2C命令選擇:
● 預(yù)設(shè)模式 – 同時(shí)使用兩個(gè)麥克風(fēng)進(jìn)行噪聲抑制
● 獨(dú)立模式 – 獨(dú)立地使用麥克風(fēng)1或2(無噪聲抑制)
● 總合模式 – 兩個(gè)麥克風(fēng)的輸出被相加在一起,使麥克風(fēng)信號(hào)得到6dB增益 (無噪聲抑制)
LMV1088的模擬特性可提供一些傳統(tǒng)DSP解決方案沒有的特質(zhì):
● 無需因遷就背景噪聲級(jí)及其類型而花費(fèi)額外的時(shí)間去進(jìn)行噪聲收斂運(yùn)算,進(jìn)而可為語(yǔ)音信號(hào)及背景噪聲提供實(shí)時(shí)反應(yīng),并且可消除令人煩厭的短暫語(yǔ)音消失;
● 由于不采用子頻帶頻率處理算法,因此不會(huì)在輸出產(chǎn)生頻率失真、卡嗒聲和砰啪聲或其它的人工假信;
● 可加強(qiáng)現(xiàn)行系統(tǒng)中的單聲道回聲消除處理
不同麥克風(fēng)數(shù)組解決方案的比較和測(cè)試
為了準(zhǔn)確比較及測(cè)量不同背景噪聲抑制方案的效果,所有的測(cè)試設(shè)置及條件必須一致,以便得到可信的結(jié)果。
基于以上理由,特別安排了幾個(gè)標(biāo)準(zhǔn)的測(cè)試,其中絕大部分采用的是國(guó)際電信聯(lián)合標(biāo)準(zhǔn)ITU-T Rec. 的P0056e、58e、64e、0830e和ITU-T P835。
ITU-T P835專門用于主觀性測(cè)試,能夠有效評(píng)估系統(tǒng)中的語(yǔ)音輸出質(zhì)量包括噪聲抑制的效能。該規(guī)格標(biāo)準(zhǔn)清楚說明評(píng)估噪聲環(huán)境中語(yǔ)音主觀質(zhì)量的方法,特別適合用來評(píng)估噪聲抑制算法。該方法采用獨(dú)立的等級(jí)標(biāo)準(zhǔn)將測(cè)試分為三個(gè)獨(dú)立部分,分別就單獨(dú)的語(yǔ)音信號(hào)的主觀質(zhì)量、單獨(dú)的背景噪聲的主觀質(zhì)量,以及有背景噪聲下的整體語(yǔ)音質(zhì)量(平均意見分?jǐn)?shù))進(jìn)行獨(dú)立的評(píng)估。
圖3 噪聲、遠(yuǎn)場(chǎng)、語(yǔ)音、優(yōu)化語(yǔ)音
至于IEEE標(biāo)準(zhǔn)方面,可以采用IEEE 1209-1994及IEEE 269_1992兩個(gè)標(biāo)準(zhǔn)的測(cè)試。前者是專門測(cè)量電話手機(jī)及耳機(jī)的傳送效果,而后者則針對(duì)模擬及數(shù)字電話機(jī)的傳送效果。兩個(gè)標(biāo)準(zhǔn)的文件均已被IEEE 269-2002文件所取代。
將上述的標(biāo)準(zhǔn)綜合在一起后便可實(shí)現(xiàn)客觀的數(shù)值測(cè)量,并且可準(zhǔn)確地評(píng)估不同背景噪聲抑制解決方案的主觀語(yǔ)音質(zhì)量和電子語(yǔ)音辨識(shí)效果。
一般來說,系統(tǒng)的噪聲抑制數(shù)據(jù)都是由制造商提供的,它們可能是系統(tǒng)所能達(dá)到的最佳水平,但對(duì)于某些要求高語(yǔ)音質(zhì)量的應(yīng)用而言,這些預(yù)設(shè)水平可能無法滿足應(yīng)用需求。
因此,在解決方案數(shù)據(jù)表上標(biāo)明噪聲抑制數(shù)值是很困難的,甚至有時(shí)會(huì)產(chǎn)生誤導(dǎo),除非可以明確地說明所有的測(cè)試條件。在此方面,一般的數(shù)據(jù)表都不會(huì)提供很詳細(xì)的數(shù)據(jù),即使提供了也不切實(shí)際,因?yàn)楹茈y想象客戶應(yīng)用的條件與數(shù)據(jù)表上的測(cè)試條件完全吻合。
?
?
?
?
評(píng)論