一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

為什么我們能判斷聲音的遠近 - 初始時間延遲差的作用

QuTG_CloudBrain ? 來源:云腦智庫 ? 2023-05-17 09:40 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

在聽覺信號中存在著一些線索可以供我們來判斷聲源的距離遠近。這篇文章就以其中的一個線索--初始時間延遲差為例,來介紹應該如何設計對應的聽力測試,探究其在雙耳距離感知中的作用。通常來說,一個聽力測試可以分成三大部分:理論背景,測試準備(包括測量和程序編寫)以及結果分析。下面就通過具體的步驟來進行說明。

1. 初始時間延遲差

房間脈沖響應是房間的屬性之一,表示聲源和麥克風之間的傳遞函數(shù)。它可以分為三個部分:直達聲、早期反射聲和混響聲。初始時間延遲差(Initial Time Delay Gap,后文簡寫為ITDG)是直達聲和第一個從表面反射的聲音之間的時間間隔,如圖1所示。

5987b03c-f44e-11ed-90ce-dac502259ad0.png

圖1: 房間脈沖響應示意圖

ITDG被一些學者認為是距離感知的線索。Stephan 和 Simone 證明,通過修改 ITDG 的長度可以改變人類的距離感知【1】。這是因為,如圖2所示,當麥克風的位置固定時,聲源的距離越遠,直達聲與第一此反射聲之間的路徑差就越小,從而 ITDG 也越小。因此,提出了通過修改 ITDG 來影響人類雙耳距離感知的假設。然而,值得注意的是,這種假設只在地板被認為是唯一反射表面的情況下成立,如在半消聲室或相對空曠的房間中。而聲源和麥克風之間存在多個物體會影響第一個反射,從而影響這個假設的有效性。也有學者持反對意見,F(xiàn)otis 通過實驗發(fā)現(xiàn), ITDG 似乎并不是距離感知中的一個顯著線索【2】。

598c171c-f44e-11ed-90ce-dac502259ad0.png

圖2: 在只考慮地面反射情況下的ITDG,其中dR代表直達聲路徑,dD代表第一次反射聲的路徑

?

2. 實驗設計

2.1 雙耳室內脈沖響應(BRIR)的測量

為了探究 ITDG 在雙耳音頻距離感知中的作用,首先必須建立BRIRs(Binaural Room Impulse Responses)的數(shù)據(jù)庫。為此,在Chalmers的兩個房間EH和LR中,使用人工頭(Dummy head或者Artificial head)和掃頻正弦信號測量雙耳室內脈沖響應。分別在 2 米、4 米、6 米和 8 米的距離上,測量了四個不同方位角(0度、30度、60度、90度)BRIRs 。為了確保獲得可用的 ITDG,測量過程中移除了聲源和麥克風之間的任何物體。隨后,使用fade-in和fade-out窗口函數(shù)處理所有測量到的BRIRs。在理想的測量環(huán)境中,如半消聲室,人工頭和聲源位于 1.6 米高度時的 ITDG 曲線應該和圖3中所示的理想曲線相似。對從EH和LR房間中,人工頭的左右耳測量的脈沖響應進行處理并提取ITDG數(shù)據(jù),發(fā)現(xiàn)測量結果與理想曲線相匹配。為了簡化過程,在本研究中,使用左耳的脈沖響應作為進一步分析和修改的基準。

5991f0ec-f44e-11ed-90ce-dac502259ad0.png

圖3: 在僅考慮地面反射時,1.6米高度的 ITDG 曲線以及來自 EH 和 LR 的測量數(shù)據(jù)

? 2.2 ITDG的修改方法

修改算法的核心概念是調整特定脈沖響應 ITDG 的長度(例如,30度時的2米處的BRIR),使其產生與同一角度下的任何距離(例如,30度時的6米處的BRIR)具有相同的距離感知。一旦這種方法被證明是有效的,便可以通過測量少量BRIRs來表達整個區(qū)域的響應。為了實現(xiàn)這個目標,將測量到的脈沖響應分為三個不同的部分:直接部分(從脈沖信號開始到直達聲峰值后的 1 毫秒),早期反射部分(直接部分后的 35 毫秒),和混響部分(早期反射部分之后,直到信號結束)。這些部分如圖4所示。

59970f5a-f44e-11ed-90ce-dac502259ad0.png

圖4: 在 ITDG 修改前后的脈沖響應,由于本文僅將來自地面的反射視為距離線索,因此在測量的脈沖響應中出現(xiàn)了一個虛假峰值

? 為了準確地確定來自地面的第一次反射聲的起始點,并排除 ITDG 中的虛假峰值的影響,采用了改進的峰度算法與理想 ITDG 曲線相結合的方法來對測量的BRIRs進行分析【3】。此外,為了簡化過程,在修改脈沖響應時,優(yōu)先考慮靠近聲源的一側;具體來說,右耳的修改長度與左耳直接相關(因為在這次測量中,左耳總是更加靠近聲源)。例如,當左耳的 ITDG 縮短 1 毫秒時,右耳也縮短相同的時間。通過保持直接和混響部分不變,壓縮或擴展與 ITDG 重疊的早期反射部分,以實現(xiàn)目標距離處所需的 ITDG。由于修改部分與 BRIRs 中的總數(shù)據(jù)相比要小得多,因此,由此操作產生的聲壓級和頻譜特性的任何變化都被認為是可以忽略不計的。

2.3 程序設計

實驗旨在研究在不同場景下修改 ITDG 是否會影響人類聽覺的距離感知。研究了以下 2 個因素:目標距離(2 米或6 米)和音頻材料(演講聲或鼓聲)。由于 BRIRs 是在兩個房間內進行測量的,因此總共有2x2x2=8 次試驗。聽覺實驗是根據(jù) MUSHRA設計的【4】,但并不完全相同,例如在這個實驗中沒有錨點。MUSHRA是音頻測試中一個很常用的方法,需要注意的是,其中文版存在著一些翻譯錯誤,因此推薦查看其他版本。實驗程序使用MATLAB APP designer進行設計,實驗頁面如圖5所示。在每個試驗中,有3個參考音頻和4個選項音頻。參考音頻是通過將音頻材料與實際測量的BRIR卷積得到的。四個選項分別是ref,orig,drr和drr+itdg 。所有參考音頻和選項音頻均經過調整,以具有相同的響度,以排除響度對距離感知的影響。

以其中一個試驗為例。在這個試驗中,目標距離為6米,修改后的 BRIR 來自 2 米處,測量值來自入口大廳,材料是演講。各選項的描述如下:

ref:與 6 米處的參考音頻完全相同

orig:與 2 米處的參考音頻完全相同

drr:僅將 2 米處的 BRIR 調整至與 6 米處的 BRIR 具有相同的 drr,而不改變 ITDG。

drr+itdg:按照前文所述方法,將 2 米處的BRIR的 ITDG 長度修改為與 6 米處相同。然后保持直接部分不變,修改剩余部分的幅值,直到其drr與 6 米處的BRIR的drr相同。

需要注意的是,4個選項的順序是隨機的,因此測試人員無法猜測每個選項對應的音頻。

59a02a54-f44e-11ed-90ce-dac502259ad0.png

圖5: 聽力測試程序的操作頁面

3. 結果分析

由于實驗難度較大,共有五名參與者參加了實驗,他們都具有豐富的聽力測試經驗,并報告稱沒有聽力缺陷。參考 MUSHRA 驗證方法對結果的準確性和人類距離感知的可壓縮性,如果某個參與者在超過 15% 的所有試驗中對隱藏參考音頻的評分超過真實距離的 10%(即對于 2 米,評估在 1.8-2.2 米之外;對于 6 米,評估在 5.4-6.6 米之外),那么將排除該結果。所有參與者都通過了篩選條件,因此認為他們的結果有效。

聽力測試結果用小提琴圖來呈現(xiàn),該圖顯示了密度曲線和箱線圖的單個顯示,使得更容易洞察數(shù)據(jù)分布。整體測試結果(圖6)顯示,ref和orig的中位數(shù)與實際測量距離相同,這證明了實驗結果的可靠性。進一步分析表明, drr和drr+itdg都可以產生與目標相似的距離感,但drr+itdg對drr并沒有系統(tǒng)性的改進。為了深入了解結果,對得到的數(shù)據(jù)進行了統(tǒng)計分析。由于實驗參與者人數(shù)較少,并且 MUSHRA 測試的結果不符合正態(tài)分布(例如結果中的ref和orig),因此使用非參數(shù)檢驗來分析數(shù)據(jù)。

59a747b2-f44e-11ed-90ce-dac502259ad0.png

圖6:聽力實驗總體結果

Friedman 檢驗發(fā)現(xiàn)所有試驗的差異在p《0.05處顯著。因此,進行了配對的 Wilcoxon 符號秩檢驗作為事后檢驗,并進行了 Bonferroni-Holm p值校正,結果如圖7所示。orig與ref、drr、drr+itdg之間有明顯區(qū)別,但在 drr、drr+itdg和ref三者之間沒有顯著差異。這個結果表明 ITDG 在距離感知中并不起到非常重要的作用,這與 Fotis 的結論一致【2】。

59ac24d0-f44e-11ed-90ce-dac502259ad0.png

圖7:Bonferroni-Holm 校正的 p 值適用于所有成對比較測試,包括speech和drum對以及近處和遠處的參考。在p《0.05時,藍色背景表示顯著差異

? 4. 總結

本文旨在探討 ITDG 在雙耳音頻距離感知中的作用。通過在 Chalmers University of Technology 的兩個房間測量雙耳室內脈沖響應,并對其進行修改,研究了 ITDG 對距離感知的影響。結果表明,盡管修改 ITDG 可以改變雙耳音頻中的距離感知,但這種影響在實驗中并不顯著。這意味著 ITDG 可能不是距離感知中的主要線索。

值得注意的是,本研究的結論僅適用于考慮地板作為唯一反射表面的情況,如半消聲室或相對空曠的房間。在實際環(huán)境中,可能會有多個物體位于聲源與接收點之間,從而影響第一次反射和 ITDG 的有效性。并且因為ITDG本身不是雙耳線索,在對其進行修改時進行了許多的簡化,這些誤差也可能對結果產生影響。因此,在未來的研究中,可能需要進一步探討更復雜環(huán)境中 ITDG 對距離感知的影響。

審核編輯 :李倩

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 脈沖
    +關注

    關注

    20

    文章

    901

    瀏覽量

    97290
  • 數(shù)據(jù)庫

    關注

    7

    文章

    3926

    瀏覽量

    66205
  • 函數(shù)
    +關注

    關注

    3

    文章

    4380

    瀏覽量

    64850

原文標題:為什么我們能判斷聲音的遠近 - 初始時間延遲差的作用

文章出處:【微信號:CloudBrain-TT,微信公眾號:云腦智庫】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    FX10、FX20 FlagA 時間延遲是固定的嘛?

    (CTL5)處的 FLAGA 同步。我們注意到區(qū)塊發(fā)送結束和 FLAGA 失效之間存在延遲。我們目前使用固定數(shù)量的時鐘滴答來彌補這一點。 問題 在不改變線程和套接字的情況下,這個延遲
    發(fā)表于 07-16 08:13

    FX3 GPIF CyU3PGpifWriteDataWords的傳輸時間延遲的原因?

    據(jù)包之間存在明顯的延遲(7~9us)。 我有幾個問題: 1.如何才能減少數(shù)據(jù)包之間的時間? 我希望它們能夠持續(xù)下去。 2.CyU3PGpifWriteDataWords 是否僅適用于寄存器使用? 有沒有我
    發(fā)表于 05-15 06:18

    HMC911寬帶模擬時間延遲器件,采用SMT封裝,DC-24GHz技術手冊

    HMC911是一款62 ps至75 ps寬帶延時器件,連續(xù)可調延遲范圍高達24 GHz。延遲控制相對于延遲控制電壓(VDCP和VDCN)線性單調,且控制輸入具有1.6 Hz的調制帶
    的頭像 發(fā)表于 04-16 14:13 ?359次閱讀
    HMC911寬帶模擬<b class='flag-5'>時間延遲</b>器件,采用SMT封裝,DC-24GHz技術手冊

    HMC910LC4B寬帶模擬時間延遲器件,采用SMT封裝,DC-24GHz技術手冊

    HMC910LC4B是一款寬帶時間延遲器件,具有0至70 ps連續(xù)可調延遲范圍。 延遲控制相對于控制電壓VDC具有直線單調性,控制輸入調制帶寬為600MHz。該器件針對高于輸入靈敏度電平的單端或
    的頭像 發(fā)表于 04-16 14:01 ?334次閱讀
    HMC910LC4B寬帶模擬<b class='flag-5'>時間延遲</b>器件,采用SMT封裝,DC-24GHz技術手冊

    HMC877LC3寬帶時間延遲和相移器,采用SMT封裝,8-23GHz技術手冊

    HMC877LC3是一款相移器/時間延遲器件,具有0至500° (1.4 UI)連續(xù)可調相移/延遲范圍。 延遲控制相對于分控制電壓(VDCP、VDCN)具有直線單調性,控制輸入調制帶
    的頭像 發(fā)表于 04-16 11:49 ?322次閱讀
    HMC877LC3寬帶<b class='flag-5'>時間延遲</b>和相移器,采用SMT封裝,8-23GHz技術手冊

    HMC856 5位寬帶數(shù)字時間延遲,采用SMT封裝技術手冊

    HMC856LC5是一款寬帶時間延遲器件,具有5位數(shù)字控制功能,設計用于時序補償或時鐘偏斜管理應用。 時間延遲提供接近100 ps的延遲范圍,具有3 ps分辨率,支持28 Gbps數(shù)據(jù)。 單調
    的頭像 發(fā)表于 04-16 11:31 ?362次閱讀
    HMC856 5位寬帶數(shù)字<b class='flag-5'>時間延遲</b>,采用SMT封裝技術手冊

    TPS3840-Q1 具有手動復位和可編程復位時間延遲的汽車高輸入電壓監(jiān)控器數(shù)據(jù)手冊

    以上 ~它-~ 加上磁滯 (V ~IT+~ ) 且手動復位 (MR)?浮動或高于 V~MR_H~和復位時間延遲 (t ~D~ ) 過期。復位時間延遲可以通過在 CT 引腳和接地之間連接電容器來編程。對于快速復位,CT pin 可以保持懸空。
    的頭像 發(fā)表于 04-10 11:20 ?345次閱讀
    TPS3840-Q1 具有手動復位和可編程復位<b class='flag-5'>時間延遲</b>的汽車高輸入電壓監(jiān)控器數(shù)據(jù)手冊

    TLV840系列 具有可調復位時間延遲和手動復位功能的低壓監(jiān)控器數(shù)據(jù)手冊

    (典型值)的 當 VDD 上的電壓降至負電壓閾值 (V 以下) 時,復位輸出信號被置位 它- ).當 VDD 上升到 V 以上時,復位信號被清除 它- 加上磁滯 (V HYS 公司 ) 和復位時間延遲 (t
    的頭像 發(fā)表于 04-10 10:17 ?370次閱讀
    TLV840系列 具有可調復位<b class='flag-5'>時間延遲</b>和手動復位功能的低壓監(jiān)控器數(shù)據(jù)手冊

    為什么ADS1298在初始化過程中START引腳的建立時間會有延遲?

    關于 ADS1298,我想澄清下列問題: 1. 為什么 ADS1298 在初始化過程中 START 引腳的建立時間會有延遲?如果輸入信號在該建立時間過程中 (tsettle) 發(fā)生變
    發(fā)表于 02-17 07:15

    OptiSystem應用:分模式延遲和模式帶寬

    對于分模式延遲測量(DMD),在被測多模光纖的纖芯上以小的徑向增量掃描850 nm探針。 在每個位置,記錄對短脈沖的時間響應。在移除參考脈沖寬度之后,DMD的時間寬度是包含在徑向位置
    發(fā)表于 01-03 09:27

    如何選擇合適的電容 電容在電路中的作用

    高頻噪聲,防止噪聲影響其他電路部分。 儲 :在需要快速釋放能量的場合,如閃光燈電路,電容可以儲存能量并在需要時快速釋放。 時間常數(shù) :與電阻器一起構成RC電路,用于控制時間延遲或濾波。 調諧 :在無線通信中,電容與電感器
    的頭像 發(fā)表于 11-15 10:35 ?1364次閱讀

    想在ARM中把TVL320的編碼解出來,判斷有無聲音輸入?

    我想通過軟件,判斷有沒有聲音輸入。 我想在ARM中把TVL320的編碼解出來,判斷有無聲音輸入。
    發(fā)表于 11-08 06:59

    HDDL-E數(shù)字式電纜故障定點儀操作使用

    的傳播速度是光速,從電纜傳播到傳感器的時間可以忽略不計,而聲音傳播速度相比起來慢的多,為每秒幾百米的量級。因此,通過檢測電磁和聲音信號之間的時間差,可以
    的頭像 發(fā)表于 10-14 15:47 ?600次閱讀
    HDDL-E數(shù)字式電纜故障定點儀操作使用

    TAS6422E-Q1: 規(guī)格書中I2C地址時間問題怎么理解?

    TAS6422E-Q1 規(guī)格書中關于這個I2C地址的時間怎么理解?時間延遲300us,是在啥時候開始延遲
    發(fā)表于 10-09 08:27

    分放大電路的原理和作用

    分放大電路是模擬電子技術中的一個重要組成部分,其原理和作用在信號處理、儀器測量、通信系統(tǒng)等領域具有廣泛的應用。以下是對分放大電路的原理和作用的詳細分析。
    的頭像 發(fā)表于 09-02 10:53 ?4263次閱讀