一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

為什么做一款抗丟包音頻編解碼器?

BYXG_shengwang ? 來(lái)源:聲網(wǎng)Agora ? 2019-11-19 16:06 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

10 月 24 日,RTC 2019 第五屆實(shí)時(shí)互聯(lián)網(wǎng)大會(huì)在北京悠唐皇冠假日酒店如期舉行。在下午的編解碼技術(shù)專場(chǎng)上,聲網(wǎng)Agora技術(shù)VP高澤華正式宣布,開(kāi)源聲網(wǎng)自研抗丟包音頻編解碼器Agora SOLO。

目前,編解碼器的源代碼已經(jīng)開(kāi)源在 Github

為什么做一款抗丟包音頻編解碼器?

在近些年比較火的應(yīng)用場(chǎng)景有這么幾類:游戲,比如多人在線對(duì)戰(zhàn)游戲、狼人殺等,多人組隊(duì),還需要實(shí)時(shí)語(yǔ)音;互動(dòng)直播,比如主播與觀眾連麥、主播與其他主播進(jìn)行跨直播間連麥,需要實(shí)時(shí)的互動(dòng);在線教育,其中有很多細(xì)分的場(chǎng)景,1 對(duì) 1、1 對(duì)多、雙師等,在當(dāng)前互動(dòng)網(wǎng)絡(luò)教育中最難解決的問(wèn)題還是實(shí)時(shí)性,就是老師跟學(xué)生怎么能夠更好的互動(dòng)。 以上這些實(shí)時(shí)互動(dòng)場(chǎng)景,在當(dāng)前網(wǎng)絡(luò)環(huán)境下,給技術(shù)提出了更高的要求,既要低延時(shí),又要實(shí)現(xiàn)高質(zhì)量的音視頻互動(dòng)。但是,如果承載信息的包沒(méi)有按時(shí)到達(dá),即出現(xiàn)丟包,就會(huì)產(chǎn)生聲音斷斷續(xù)續(xù)、音質(zhì)低等情況,直接影響實(shí)時(shí)互動(dòng)的質(zhì)量。然而,傳統(tǒng)的抗丟包策略不是會(huì)浪費(fèi)帶寬,就是會(huì)影響音頻質(zhì)量,所以我們結(jié)合信源和信道編碼的特點(diǎn),利用充分包交換網(wǎng)絡(luò)的特性,基于此,研發(fā)出了聲網(wǎng)新的編解碼器——Agora SOLO。

Agora SOLO 是什么?

Agora SOLO(以下簡(jiǎn)稱“SOLO”)是由聲網(wǎng)Agora自主研發(fā)的一款面向不穩(wěn)定網(wǎng)絡(luò)的音頻編解碼器,它以 Silk 為基礎(chǔ),融合了帶寬擴(kuò)展(BWE)和多描述編碼(MDC)等技術(shù),使其能在較低復(fù)雜度下?lián)碛腥蹙W(wǎng)對(duì)抗能力。SOLO 編解碼器兼容WebRTC,可集成到基于 WebRTC 自主研發(fā)的產(chǎn)品中。

圖 1. SOLO編碼器架構(gòu)

圖2. SOLO解碼器架構(gòu)

SOLO的抗丟包策略與傳統(tǒng)方法不同。從通信原理來(lái)說(shuō),信源編碼是盡可能去追求高壓縮比,去冗余。而信道編碼是追求強(qiáng)糾錯(cuò),靠加冗余來(lái)實(shí)現(xiàn)糾錯(cuò)。Agora SOLO就是把加冗余和減冗余結(jié)合起來(lái),不重要的地方減冗余,重要的地方加冗余。 在傳輸過(guò)程中,它會(huì)將一個(gè)包拆分為兩個(gè)進(jìn)行傳輸,如果對(duì)端收到其中一個(gè),則解碼恢復(fù)出一個(gè)有限失真的信號(hào);如果對(duì)端收到兩個(gè)包,則可解碼恢復(fù)出一個(gè)高質(zhì)量的信號(hào)。即 SOLO不需要等待對(duì)當(dāng)前網(wǎng)絡(luò)丟包狀態(tài)的統(tǒng)計(jì),只需要直接把抗丟包做到編解碼內(nèi)部。好處有三點(diǎn):1.可實(shí)現(xiàn)更低延時(shí);2.可實(shí)現(xiàn)更高質(zhì)量,當(dāng)收到一個(gè)包時(shí)質(zhì)量達(dá)到的普通編解碼器水平,收到兩個(gè)包達(dá)到高質(zhì)量編解碼水平;3. 可面向多人環(huán)境。

SOLO 關(guān)鍵技術(shù)

01 帶寬擴(kuò)展

SOLO 使用帶寬擴(kuò)展的主要原因是希望減少計(jì)算復(fù)雜度,在 Silk WB 模式中,16khz 的信號(hào)都會(huì)進(jìn)入后續(xù)處理模塊,而對(duì)于語(yǔ)音來(lái)說(shuō),8khz 以上的信息是非常少的,這部分信息進(jìn)入到后續(xù)處理模塊,會(huì)帶來(lái)一定的計(jì)算資源浪費(fèi)。MDC 因?yàn)橐腩~外分析模塊處理多條碼流,又會(huì)引入額外的復(fù)雜度,這是 MDC 在近些年來(lái)落地不順暢的重要原因之一。為了減少?gòu)?fù)雜度,我們?cè)诰幋a寬帶信號(hào)前,將其分為 0-8k 的窄帶信息和 8-16k 的高頻信息。只有窄帶信息會(huì)進(jìn)入到后續(xù)正常分析、編碼流程中,這樣后續(xù)的計(jì)算量就減少了一半,同時(shí)得益于帶寬擴(kuò)展算法,整體質(zhì)量不會(huì)有明顯下降。高頻信息部分,SOLO 使用獨(dú)立的分析與編碼模塊,默認(rèn)將高頻信息壓縮成 1.6kbps 的碼流。這部分高頻信息可以在解碼器內(nèi)結(jié)合低頻信號(hào)恢復(fù)出高頻信號(hào)。

02 結(jié)合 delay-decision 的 MDC

在 Silk 中,delay-decision 模塊是一個(gè)滯后計(jì)算編碼誤差的模塊,它可以從多個(gè)候選碼流中選擇誤差最小的碼流作為編碼輸出,一定程度上來(lái)說(shuō),它使得標(biāo)量量化擁有了矢量量化的性能。SOLO 利用 delay-decision 模塊,實(shí)現(xiàn)了多描述碼流的分析與構(gòu)建。SOLO 的MDC主要作用于濾波器輸出的殘差信號(hào), SOLO 會(huì)根據(jù)當(dāng)前信號(hào)狀態(tài),對(duì)殘差信號(hào)做多增益控制:計(jì)算出 MD 增益 a(0

圖 3. 多描述殘差信號(hào)產(chǎn)生

隨后,這兩段殘差信號(hào)會(huì)進(jìn)入到新的 delay-decision 模塊中,每個(gè)殘差信號(hào)使用不同的抖動(dòng)和量化方法,一共可以產(chǎn)生 8 種不同的備選狀態(tài),兩兩組合起來(lái)共有 64 種備選合成狀態(tài),新的 delay-decision 模塊會(huì)對(duì)每個(gè)殘差信號(hào)的獨(dú)立誤差和兩個(gè)殘差信號(hào)的合成誤差進(jìn)行加權(quán)求和,決定出最佳的兩個(gè)殘差信號(hào)進(jìn)入到編碼模塊。

03 輸出碼流組包

圖 4. 編碼器碼流整合及組包

SOLO 默認(rèn)配置為每次輸入 40ms(2 幀),輸出兩段互補(bǔ)的多描述碼流,解碼器接收到任一段碼流,即可解碼出 40ms 的信號(hào)。為了方便接收端區(qū)分碼流的順序,碼流第一個(gè)字節(jié)的右數(shù)第 4 個(gè) bit 是碼流順序標(biāo)志位,第一段碼流標(biāo)志位的值是 0,第二段碼流標(biāo)志位的值是 1。接收端在進(jìn)行碼流處理時(shí),可依據(jù)此標(biāo)志位進(jìn)行碼流順序判斷。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 解碼器
    +關(guān)注

    關(guān)注

    9

    文章

    1176

    瀏覽量

    41990
  • 音頻
    +關(guān)注

    關(guān)注

    30

    文章

    3042

    瀏覽量

    83448

原文標(biāo)題:聲網(wǎng)Agora開(kāi)源抗丟包音頻編解碼器Agora SOLO

文章出處:【微信號(hào):shengwang-agora,微信公眾號(hào):聲網(wǎng)Agora】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    Texas Instruments TAC5x42接口編解碼器數(shù)據(jù)手冊(cè)

    Texas Instruments TAC5x42接口編解碼器包括低功耗立體聲音頻模數(shù)轉(zhuǎn)換 (ADC) 和音頻數(shù)模轉(zhuǎn)換器 (DAC),集成了豐富的功能。這些支持時(shí)分復(fù)用 (TDM)、
    的頭像 發(fā)表于 07-14 14:43 ?99次閱讀
    Texas Instruments TAC5x42接口<b class='flag-5'>編解碼器</b>數(shù)據(jù)手冊(cè)

    Texas Instruments TAC5311-Q1汽車單聲道音頻編解碼器數(shù)據(jù)手冊(cè)

    Texas Instruments TAC5311-Q1汽車單聲道音頻編解碼器一款低功耗單聲道編解碼器,具有10V~RMS ~差分輸入、104dB ADC和2V~RMS~ 差分輸出、
    的頭像 發(fā)表于 07-09 15:35 ?127次閱讀
    Texas Instruments TAC5311-Q1汽車單聲道<b class='flag-5'>音頻</b><b class='flag-5'>編解碼器</b>數(shù)據(jù)手冊(cè)

    CYW20721內(nèi)置的所有編解碼器類型有哪些?

    您能告訴我們 CYW20721 內(nèi)置的所有編解碼器類型嗎? LDAC、LC3(LE 音頻)、AAC、SBC 等。
    發(fā)表于 06-27 08:03

    AI玩具爆發(fā),音頻編解碼器如何滿足語(yǔ)音交互需求

    電子發(fā)燒友網(wǎng)綜合報(bào)道,在AI玩具已經(jīng)開(kāi)始逐漸爆發(fā)的當(dāng)下,人機(jī)交互已經(jīng)成為標(biāo)配功能,而最重要的便是語(yǔ)音控制。而語(yǔ)音控制的第步,便需要讓AI玩具聽(tīng)懂你在說(shuō)什么這就需要用到音頻編解碼器。 ? 音頻
    的頭像 發(fā)表于 06-20 01:07 ?6317次閱讀

    TPS65950 集成電源管理 IC (PMIC),具有 3 個(gè) DC/DC、11 個(gè) LDO、音頻編解碼器、USB HS收發(fā)數(shù)據(jù)手冊(cè)

    TPS65950 器件是一款高度集成的電源管理和音頻編碼/解碼器編解碼器)集成電路 (IC),支持 OMAP? 應(yīng)用處理
    的頭像 發(fā)表于 04-28 14:38 ?295次閱讀
    TPS65950 集成電源管理 IC (PMIC),具有 3 個(gè) DC/DC、11 個(gè) LDO、<b class='flag-5'>音頻</b><b class='flag-5'>編解碼器</b>、USB HS收發(fā)<b class='flag-5'>器</b>數(shù)據(jù)手冊(cè)

    TWL6040 用于便攜式應(yīng)用的 8 通道高質(zhì)量低功耗音頻編解碼器數(shù)據(jù)手冊(cè)

    TWL6040 設(shè)備是具有高集成度的音頻編碼/解碼器編解碼器),可為便攜式應(yīng)用程序提供模擬音頻編解碼
    的頭像 發(fā)表于 04-27 17:52 ?419次閱讀
    TWL6040 用于便攜式應(yīng)用的 8 通道高質(zhì)量低功耗<b class='flag-5'>音頻</b><b class='flag-5'>編解碼器</b>數(shù)據(jù)手冊(cè)

    TWL6041 用于便攜式應(yīng)用的 8 通道高質(zhì)量低功耗音頻編解碼器數(shù)據(jù)手冊(cè)

    TWL6041 是種具有高集成度的音頻編解碼器,為便攜式應(yīng)用程序提供模擬音頻編解碼器功能,如 所示。該設(shè)備包含多個(gè)
    的頭像 發(fā)表于 04-27 14:55 ?406次閱讀
    TWL6041 用于便攜式應(yīng)用的 8 通道高質(zhì)量低功耗<b class='flag-5'>音頻</b><b class='flag-5'>編解碼器</b>數(shù)據(jù)手冊(cè)

    國(guó)芯思辰| 單聲道音頻編解碼器SC2601應(yīng)用于錄音筆,替換ES8311

    國(guó)芯思辰| 單聲道音頻編解碼器SC2601應(yīng)用于錄音筆,替換ES8311
    的頭像 發(fā)表于 01-07 10:33 ?714次閱讀
    國(guó)芯思辰| 單聲道<b class='flag-5'>音頻</b><b class='flag-5'>編解碼器</b>SC2601應(yīng)用于錄音筆,替換ES8311

    TLV320AIC28音頻編解碼器評(píng)估模塊

    電子發(fā)燒友網(wǎng)站提供《TLV320AIC28音頻編解碼器評(píng)估模塊.pdf》資料免費(fèi)下載
    發(fā)表于 12-20 16:02 ?0次下載
    TLV320AIC28<b class='flag-5'>音頻</b><b class='flag-5'>編解碼器</b>評(píng)估模塊

    替換ES8311,音頻編解碼器SC2601在行車記錄儀中的應(yīng)用

    替換ES8311,音頻編解碼器SC2601在行車記錄儀中的應(yīng)用
    的頭像 發(fā)表于 11-29 10:07 ?965次閱讀
    替換ES8311,<b class='flag-5'>音頻</b><b class='flag-5'>編解碼器</b>SC2601在行車記錄儀中的應(yīng)用

    TMS320F2833x與AIC23B立體聲音頻編解碼器的接口

    電子發(fā)燒友網(wǎng)站提供《TMS320F2833x與AIC23B立體聲音頻編解碼器的接口.pdf》資料免費(fèi)下載
    發(fā)表于 10-15 09:21 ?0次下載
    TMS320F2833x與AIC23B立體聲<b class='flag-5'>音頻</b><b class='flag-5'>編解碼器</b>的接口

    TMS320DM365中的智能編解碼器功能

    電子發(fā)燒友網(wǎng)站提供《TMS320DM365中的智能編解碼器功能.pdf》資料免費(fèi)下載
    發(fā)表于 10-14 10:24 ?0次下載
    TMS320DM365中的智能<b class='flag-5'>編解碼器</b>功能

    音頻編解碼器和ADC中有哪些常見(jiàn)噪聲問(wèn)題,如何幫助避免這些問(wèn)題?

    音頻編解碼器和 ADC 中有哪些常見(jiàn)噪聲問(wèn)題,如何幫助避免這些問(wèn)題?
    發(fā)表于 10-10 08:09

    音頻編解碼器中的常見(jiàn)噪聲問(wèn)題

    電子發(fā)燒友網(wǎng)站提供《音頻編解碼器中的常見(jiàn)噪聲問(wèn)題.pdf》資料免費(fèi)下載
    發(fā)表于 10-09 10:19 ?1次下載
    <b class='flag-5'>音頻</b><b class='flag-5'>編解碼器</b>中的常見(jiàn)噪聲問(wèn)題

    一款低功率、高質(zhì)量的單聲道音頻編解碼器 - CJC8911

    CJC8911是個(gè)低功率,高質(zhì)量的單聲道編解碼器,設(shè)計(jì)用于便攜式數(shù)字音頻應(yīng)用程序。該設(shè)備集成了完整的接口到個(gè)出線端口的接口。片上數(shù)字信號(hào)處理執(zhí)行圖形均衡器,三維聲音增強(qiáng)和麥克風(fēng)或線
    的頭像 發(fā)表于 08-08 09:39 ?971次閱讀
    <b class='flag-5'>一款</b>低功率、高質(zhì)量的單聲道<b class='flag-5'>音頻</b><b class='flag-5'>編解碼器</b> - CJC8911