一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

開發(fā)者必須了解的VR音頻定位技術

fFU3_vrtuoluo ? 來源:lq ? 2019-09-13 16:55 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

要想在VR中獲得更好的沉浸感,五感的還原極其重要,視覺還原是其中最為成熟的一部分,而音頻——全景聲,隨著技術的發(fā)展,也慢慢在VR內(nèi)容中應用起來。

縱觀全球聲音定位技術,主要可以分 3 種:聲道為本 (Channel Based)、面向?qū)ο舐曇?(Object Based)及場景聲音(Scene Based) 。值得留意的是,各種技術都可以分為錄音、播放系統(tǒng)和輸出格式三個部分。以下的內(nèi)容主要基于輸出格式,但也會略提各種錄音、播放系統(tǒng)的利弊。

三大定位方式

1. 聲道為本 (Channel Based) 傳統(tǒng)聲音定位技術都是以聲道為本 (Channel Based) 的技術,意思是指所有輸出是根據(jù)系統(tǒng)的聲道數(shù)目來制作。例如立體聲的音樂就有 2 個聲道,5.1 環(huán)繞聲的電影就有 6 個聲道。但這種技術其實即使在環(huán)繞聲中都不理想。原因是不同的系統(tǒng)設計或擺放將會影響到定位效果,而且難以在不同系統(tǒng)中轉(zhuǎn)換,例如 5.1 環(huán)繞聲的電影就不能夠準確地在 7.1 系統(tǒng)中播放。因此極少在 3D 聲效上應用。當然,嚴格來說,所有播放系統(tǒng)在輸出最終都是聲道為本,只不過輸出前的文件格式和制作方法會有分別。

雖然聲道為本的技術在 3D 聲效不常見,但基于聲道為本的錄音技術的悠久歷史,發(fā)展完善,因此即使使用其他技術,很多時都會借用聲道為本的錄音技術制作,例如在接下來介紹的面向?qū)ο舐曇?(Object Based) 技術就常常會用上傳統(tǒng)單聲道及雙聲道錄音技術。 2. 面向?qū)ο舐曇?(Object Based) 近年為了改善不同播放系統(tǒng)的問題,研究人員開始思考如何用一個輸出格式去適應所有系統(tǒng)。其中較流行的方法是用面向?qū)ο舐曇?(Object Based),相信很多人都在部份戲院或電影的片尾中見到杜比全景聲 (Dolby Atmos) 的標志,這是其中一種較常用的面向?qū)ο蟾袷?。面向?qū)ο笫侵嘎曇舳ㄎ灰月曉?(所謂對象) 為本,輸出并不基于聲道數(shù)目,而是基于聲源數(shù)目。

簡單而言,每一個「對象」會輸出兩樣信息,它的聲音,和它在 3D 空間中的位置。在播放時,播放器會根據(jù)對象信息,以及影音系統(tǒng)的設定去分配各聲道的輸出,從而準確定位。因此這技術除了可以用同一輸出檔案做到跨系統(tǒng)播放,亦可以做出超越水平面的 3D 定位。常見的對應輸出系統(tǒng)為 VBAP (Vector Base Amplitude Panning),基本上是傳統(tǒng) 5.1 或 7.1 環(huán)繞聲加上不同高度的喇叭(有關各種輸出系統(tǒng)之后會再介紹),但亦可以在傳統(tǒng) 5.1 或 7.1 環(huán)繞聲系統(tǒng),甚至雙聲道系統(tǒng)播放。

優(yōu)點: 聲音定位一般較凖確,而聲音質(zhì)素亦通常比較好

缺點: 輸出檔案的體積大。聲音來源集中,欠缺現(xiàn)場感

3. 場景聲音 (Scene Based) 除了以聲源為本,另一種常見的方法是以場景為本。場景為本的意思是指,我們嘗試記錄在空間中一個點上接收到的所有聲音。你可以想象成是記錄一個人在某場景中所聽到的所有聲音。唯一的分別是,人類的聽覺有方向性,例如來之前的聲音會比來自后面的聲音清晰,當聲音來自左邊左耳會感受到的音量會比較大等。但場景為本的錄音通常不會紀錄方向性的分別,無論聲音從那方面以來,都會清晰地記錄在錄音中。

其中最常見的錄音方法為Ambisonics (該名詞未有通用的翻譯)。它用幾組收音來全方位地記錄場景聲音。之所以要用幾組收音,是為了把場景中的聲音分為幾個軸,最常見是分為左右 (X)、前后 (Y) 和上下 (Z) 方便在后期制作中定位和加添指向性 (只用 3 個軸的Ambisonics 稱為 1st Order Ambisonics,可根據(jù)球諧函數(shù) (Spherical Harmonics) 去加添更多軸,提高到更高 Order,從而提升聲音定位解像度,一般制作用最高可以到 5th order,但 X Y Z 三軸是較常見也比較容易理解,有機會再另立文章講解 Ambisonics Orders)。大家可以想象,在播放該錄音時,如果沒有分左右前后上下的話,聲音根本不可能定位。 該技術最大的優(yōu)勢,是在于檔案體積,它最少只需要四條聲軌,X、Y 、 Z 和 W ( W 是一條無指向性全方位錄音— Omni Directional Recording),就可以重現(xiàn) 3D 聲效,比 5.1 環(huán)繞聲還少,因此此制式在360 影片及 VR 中很常見。而且因為他的錄音是全方位的,他可以清楚記錄所有在空間中漫射的聲音(Diffuse sound) ,也就是說,它可以記錄來自四方八面的回響 (Reverb),例如在教堂中說話,有時候會聽到回音,那些回音有時會從四方八面?zhèn)鱽?,?Ambisonics 就能夠準確地記錄那些回音。 Ambisonics 有自己對應的播放系統(tǒng),其特色是所有喇叭的間距必須一致,平均地分布在一個虛擬球面。之所以要這樣安排,是因為在播放時,即使聲音內(nèi)原只有一方,理論上所有喇叭都會播放相對應的場景聲音。概念上一般讀者可能較難理解,但概括而言,在播放任何聲音時所有喇叭都會運作,來重現(xiàn)錄音場景的音場。當然這播放系統(tǒng)在民用上是很不現(xiàn)實的,因為理想的播放系統(tǒng)需要很多喇叭,而且擺放位置要求極為精準,有時甚至要鉆穿地下來放置喇叭。因此,通常都會用耳筒來重現(xiàn)虛擬的 Ambisonics 播放系統(tǒng) (稱為 Binaural Audio技術),亦有不少軟件可以將 Ambisonics 轉(zhuǎn)換成其他系統(tǒng)格式包括環(huán)繞聲和立體聲。 優(yōu)點: 音質(zhì)代入感強,仿似在場景中。輸出檔案一般較細,4條聲道起。 缺點: 錄音質(zhì)素通常比較差,因為錄音器和聲源之間通常有一定距離。 錄音過程較復雜,和通常要利用特別器材,如 Ambisonics 。

位于英國的 Ambisonics 播放系統(tǒng)

Sennheiser 出品 Ambisonics( 1st OrderAmbisonics )

Eigenmike Ambisonics ( 4th OrderAmbisonics ) 比較各種聲音定位技術之優(yōu)劣

各種技術的應用情況

聲道為本

如前文所言,傳統(tǒng)聲道為本的格式在 3D 聲效中的應用比較少見。主要是因為他難以兼容不同的播放系統(tǒng)。當然目前有很多沒有配備3D聲效的電影,都繼續(xù)沿用聲道為本的技術。大部份的音樂所使用的雙聲道,亦可歸類為此技術。

面向?qū)ο舐曇?/p>

目前大部份的電影 3D 聲效多使用面向?qū)ο舐曇?。原因是后期制作比較方便,而且得到很多專業(yè)公司的支持,例如 Dolby、Auro、ProTools 等,表表者是杜比全景聲 (Dolby Atmos) 系統(tǒng)。

在這里要先講解一下通常電影聲效制作的流程。一般電影的聲效是混合現(xiàn)場錄音和后期制作。一般而言,現(xiàn)場錄音只會記錄演員的對白,其他所有聲音都是后期制作。相信讀者可以猜到,為何面向?qū)ο舐曇舯容^適合電影制作,是因為所有后期制作的聲音甚至演員的對白都可以視為一個對象,并在后期制作中定位。很多電影并無涉及任何場景錄音的需要。更何況現(xiàn)在很多電影都用上大量場景特效 (綠幕),并非現(xiàn)場拍攝,根本沒有真正的場景聲音可以錄制。

Dolby Atmos 混音插件

另一方面,主流 VR 游戲甚至一些新的非 VR 電子游戲都使用面向?qū)ο舐曇糁谱?,但通常會輸出成場景聲音,主要是因為面向?qū)ο舐曇艏夹g比較能對應六自由度 (6 Degrees of Freedom (6 DoF) )的移動,意思是指玩家可以前后左右移動,聲音會根據(jù)玩家的位置作出對應的調(diào)整。

場景聲音

其實目前場景聲音的制作并不常見,但相信 360 影片的流行,這技術很快會變得普及。這技術其中一個好處是,一般人只要利用 Ambisonics 咪錄音,不需要太多后期制作,都可以有理想的 3D 聲效,而且該聲效可以根據(jù)觀眾觀看影片的角度作出對應的調(diào)整, (注:只限角度,暫時不包括前后左右移動)。例如你在看影片時可以聽到聲音從后方來,而當你 180 度轉(zhuǎn)向后方后,你會聽到該聲音跟隨轉(zhuǎn)向移到你的前方。讀取場景聲音亦不需要很復雜的系統(tǒng)。這技術對系統(tǒng)的要求低,檔案容量細,都是在未來普及的潛在優(yōu)勢,特別在 Youtube 和 Facebook 之類的網(wǎng)上串流平臺都以這技術為基礎。 目前比較平民的器材有Ricoh theta V 的外置收音器。當然目前用此技術最大的問題是,因為收音的距離和欠缺指向性,收音的質(zhì)素比較差,暫時改善的方法主要會配合面向?qū)ο舐曇羰褂茫^的混合方法。

Ricoh theta V 連外置收音

混合方法 (A Hybrid Method)

在錄音質(zhì)素的要求比較高的情況下,例如音樂會現(xiàn)場錄音,或其他音樂相關的制作等,單靠面向?qū)ο舐曇艋驁鼍奥曇簦茧y以滿足音質(zhì)要求。面向?qū)ο舐曇羟啡爆F(xiàn)場感,而場景聲音的錄音又不夠清晰。人類一般對錄音的要求,通常比現(xiàn)場的聲音高,研究員戲稱超真實感聲音 (Hyper-Realistic Sound) 。要達到這個要求,目前最先進的做法是用場景聲音作為背景 (或稱為畫紙(Canvas) ),在該錄音為基礎再在上面加上面向?qū)ο舐曇?。這樣就可以確保聲音清晰同時保有現(xiàn)場感。目前 Dolby Atmos 已經(jīng)支持場景聲音,去改善后制的聲音效果,可見未來可以用在音樂會或戲劇的現(xiàn)場錄音中。 而在360影片,一般實時使用混合方法,輸出時都會用場景聲音 Ambisonics 的文件格式來輸出來維持檔案的輕巧和容易解讀。當然 Dolby Atmos 用較復雜的混合檔案,配合該系統(tǒng),理論上可提供較好的音質(zhì)。但在 360 影片或 VR 中,因為輸出在不同角度下的表現(xiàn)比較平均 (所有喇叭的間距一致,平均地分布在虛擬球面),場景聲音輸出一般是首選。

額外知識: MPEG-H

MPEG-H 是MPEG系列 (如 .mp4) 的新一代高壓縮的影音格式,加入了 3D 聲效支撐,他同時支持面向?qū)ο舐暫蛨鼍奥曇?。這個格式已經(jīng)發(fā)展了一段時間 (2013) ,雖然目前并未流行,但相信未來會成為的主流格式。 小結(jié) 目前最常見的 3D 聲效應技術為面向?qū)ο舐曇?(Object Based) 及場景聲音 (Scene Based) 且有時會混合使用。其實這些技術的應用已經(jīng)日漸普及,很多新出的第一身游戲或多或少都會用到 3D 聲效去增加現(xiàn)場感。特別在射擊游戲,能夠用耳朵去感覺四面八方能大大改善游戲體驗。而在 360 影片或 VR 甚至其他 XR (統(tǒng)稱 VR、AR、MR 等虛擬現(xiàn)實的體驗為 XR) 的潮流下,很多公司包括 Abbey Road Studio 和 BBC 都投放很多資源去改善 3D 聲效制作及播放技術。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 音頻
    +關注

    關注

    30

    文章

    3042

    瀏覽量

    83447
  • 定位技術
    +關注

    關注

    7

    文章

    302

    瀏覽量

    25908
  • vr
    vr
    +關注

    關注

    34

    文章

    9675

    瀏覽量

    152698

原文標題:【干貨】開發(fā)者必須了解的VR音頻定位技術

文章出處:【微信號:vrtuoluo,微信公眾號:VR陀螺】歡迎添加關注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    昂瑞微亮相MFi開發(fā)者技術沙龍

    近日,昂瑞微受邀參加蘋果MFi開發(fā)者技術沙龍,以“萬物皆可尋”為主題展開技術分享?;顒又校臼袌隹偙O(jiān)肖金紅不僅展示了Find My技術在多個應用領域的落地成果——目前已服務340+項
    的頭像 發(fā)表于 07-18 15:28 ?205次閱讀

    矽速科技正式入駐 RuyiSDK 開發(fā)者社區(qū),共建 RISC-V 開發(fā)者生態(tài)!

    近日,深圳矽速科技正式入駐RuyiSDK開發(fā)者社區(qū),攜手社區(qū)共同推動RISC-V技術的發(fā)展與廣泛應用,為開發(fā)者提供一個更加便捷高效的開發(fā)環(huán)境。關于RuyiSDKRuyiSDK是中國科學
    的頭像 發(fā)表于 07-10 11:00 ?293次閱讀
    矽速科技正式入駐 RuyiSDK <b class='flag-5'>開發(fā)者</b>社區(qū),共建 RISC-V <b class='flag-5'>開發(fā)者</b>生態(tài)!

    HDC 2025開發(fā)者主題演講精彩回顧

    日前,華為開發(fā)者大會(HDC 2025)進入第二天,行業(yè)領袖、技術專家、全球開發(fā)者齊聚現(xiàn)場,共同見證這場科技盛會。在開發(fā)者主題演講中,華為技術
    的頭像 發(fā)表于 07-09 11:20 ?383次閱讀

    全志科技亮相OpenHarmony開發(fā)者大會2025

    近日,OpenHarmony開發(fā)者大會 2025(OHDC.2025,以下簡稱“大會”)在深圳舉辦。大會正式發(fā)布了開源鴻蒙5.1 Release版本,舉行了“開源鴻蒙應用技術組件共建啟動、開源鴻蒙
    的頭像 發(fā)表于 06-04 09:16 ?598次閱讀
    全志科技亮相OpenHarmony<b class='flag-5'>開發(fā)者</b>大會2025

    深開鴻CEO王成錄:開發(fā)者是開源鴻蒙生態(tài)的原點

    發(fā)布會上表示:“操作系統(tǒng)的成功,取決于生態(tài)體系的競爭力。開源鴻蒙生態(tài)的建設,必須始于開發(fā)者。”他強調(diào),開發(fā)者是生態(tài)的原點,是推動技術演進與產(chǎn)業(yè)創(chuàng)新的關鍵力量,而開鴻
    的頭像 發(fā)表于 05-26 12:06 ?421次閱讀
    深開鴻CEO王成錄:<b class='flag-5'>開發(fā)者</b>是開源鴻蒙生態(tài)的原點

    深開鴻CEO王成錄:開發(fā)者是開源鴻蒙生態(tài)的原點

    中心”理念的里程碑舉措。 深開鴻CEO王成錄在發(fā)布會上表示:“操作系統(tǒng)的成功,取決于生態(tài)體系的競爭力。開源鴻蒙生態(tài)的建設,必須始于開發(fā)者?!彼麖娬{(diào),開發(fā)者是生態(tài)的原點,是推動技術演進與
    的頭像 發(fā)表于 05-24 20:16 ?288次閱讀
    深開鴻CEO王成錄:<b class='flag-5'>開發(fā)者</b>是開源鴻蒙生態(tài)的原點

    AI開發(fā)平臺如何賦能開發(fā)者

    當下,AI開發(fā)平臺通過提供豐富的工具集、優(yōu)化的開發(fā)環(huán)境以及高效的部署能力,極大地降低了AI應用的開發(fā)門檻,加速了創(chuàng)新步伐。那么,AI開發(fā)平臺如何賦能
    的頭像 發(fā)表于 01-17 14:47 ?408次閱讀

    開發(fā)者的開源鴻蒙故事

    近日,在以“一切為了開發(fā)者”為主題的“2024開放原子開發(fā)者大會暨首屆開源技術學術大會”上,開源鴻蒙5.0 Release版本正式發(fā)布,備受各方關注。該版本在系統(tǒng)完備度、分布式創(chuàng)新、開發(fā)者
    的頭像 發(fā)表于 01-06 10:28 ?871次閱讀

    《HarmonyOS第一課》煥新升級,賦能開發(fā)者快速掌握鴻蒙應用開發(fā)

    ,為職業(yè)發(fā)展增添有力籌碼。 目前,該課程成績斐然,學習人次已超過150萬,頁面訪問量突破440萬,獲4.8分用戶好評,超50萬開發(fā)者通過認證考試。 未來,華為將持續(xù)豐富課程內(nèi)容,幫助開發(fā)者掌握前沿技術
    發(fā)表于 01-02 14:24

    2024開放原子開發(fā)者大會暨首屆開源技術學術大會成功舉辦

    近日,以“一切為了開發(fā)者”為主題的2024開放原子開發(fā)者大會暨首屆開源技術學術大會在武漢成功舉辦。大會為眾多開源項目和開發(fā)者提供了廣闊的展示空間,為繁榮開源生態(tài)注入了強勁動力。與會
    的頭像 發(fā)表于 12-23 14:23 ?555次閱讀

    云端AI開發(fā)者工具怎么用

    云端AI開發(fā)者工具通常包括代碼編輯器、模型訓練平臺、自動化測試工具、代碼管理工具等。這些工具不僅降低了AI開發(fā)的門檻,還極大地提高了開發(fā)效率和模型性能。下面,AI部落小編為您介紹云端AI開發(fā)者
    的頭像 發(fā)表于 12-05 13:31 ?562次閱讀

    KaihongOS 4.1.2開發(fā)者預覽版正式上線,誠邀開發(fā)者免費試用!

    深開鴻在2024開放原子開源生態(tài)大會上正式宣布KaihongOS4.1.2開發(fā)者預覽版全面上線,并向全球開發(fā)者開放免費下載。作為KaihongOS不斷創(chuàng)新與發(fā)展的重要里程碑,此次預覽版為開發(fā)者提供了
    的頭像 發(fā)表于 09-28 08:07 ?738次閱讀
    KaihongOS 4.1.2<b class='flag-5'>開發(fā)者</b>預覽版正式上線,誠邀<b class='flag-5'>開發(fā)者</b>免費試用!

    KaihongOS 4.1.2開發(fā)者預覽版正式上線,誠邀開發(fā)者免費試用!

    今日,深開鴻在2024開放原子開源生態(tài)大會上正式宣布KaihongOS 4.1.2開發(fā)者預覽版全面上線,并向全球開發(fā)者開放免費下載。作為KaihongOS不斷創(chuàng)新與發(fā)展的重要里程碑,此次預覽版為
    的頭像 發(fā)表于 09-26 15:59 ?746次閱讀

    開發(fā)者空間實踐指導:基于 3 大 PaaS 主流服務輕松實現(xiàn)文字轉(zhuǎn)換語音

    【摘要】 基于 CodeArts API 設計語音合成接口,基于 API Explorer 調(diào)試接口,并利用 CodeArts IDE 實現(xiàn)數(shù)據(jù)流轉(zhuǎn)換為音頻 案例簡介 開發(fā)者將在云主機中
    的頭像 發(fā)表于 09-13 16:25 ?746次閱讀
    <b class='flag-5'>開發(fā)者</b>空間實踐指導:基于 3 大 PaaS 主流服務輕松實現(xiàn)文字轉(zhuǎn)換語音

    谷歌:聚焦AI與技術創(chuàng)新,攜手中國開發(fā)者共筑未來

    2024年8月9日,備受矚目的谷歌開發(fā)者大會——I/O Connect China圓滿落幕。此次盛會,谷歌面向中國廣大的開發(fā)者群體,全面展示了其在人工智能(AI)、移動技術、云計算及Web技術
    的頭像 發(fā)表于 08-09 17:03 ?1220次閱讀