資料介紹
1 引言
G.723.1是刪組織于1996年推出的一種低碼率的語音編碼算法標準,也是目前該組織頒布的語音壓縮標準中碼率最低的一種標準。G.723.1主要用于對語音及其它多媒體聲音信號的壓縮,目前在一些數(shù)字音視頻傳輸、高質量語音壓縮等系統(tǒng)中都得到廣泛應用。
2 G.723.1算法的復雜度分析
將G.723.1移植到TMS320C64xx后,就可借助TI集成開發(fā)工具CCS(Code Composer Studio)的Profile功能來評估其各個子程序或函數(shù)的執(zhí)行運算量,從而把程序的優(yōu)化集中在對程序性能影響最大的代碼上去。
通過分析可以看出,在G.723.1的編解碼算法中,碼本搜索所花費的運算量是比較大的,如Find_Best(),F(xiàn)ind_Fcbk(),F(xiàn)ind_Acbk():另外,在LPC分析和LSP參數(shù)的計算上也有運算量比較大的,如Comp_Lpc(),Lsp_Qnt(),Lsp_Svq()。
3 代碼的優(yōu)化
代碼優(yōu)化的工作有兩大目的:一是執(zhí)行速度提高,實現(xiàn)實時;二是盡量不擴大程序體積(Code Size),使之在內存允許的范圍內。顯然,兩者存在一定的矛盾,當今超大規(guī)模集成電路的發(fā)展使RAM資源不再是系統(tǒng)的瓶頸,因此該部分工作的主要任務是怎樣提高執(zhí)行速度。代碼的優(yōu)化工作主要在CCS環(huán)境中進行。優(yōu)化的原則是要充分考慮C64xx處理器超長指令字、多個運算單元和深度流水線的結構特點,以及避免過多的讀寫內存指令和程序轉移指令,充分發(fā)揮其強大的運算能力。具體方法包括(次序有先后):
3.1基本運算集的優(yōu)化
G.723.1算法程序是用定點運算完成浮點運算,為了防止定點運算時可能溢出,許多運算需要進行飽和判斷,為此程序專門定義了基本運算集,實現(xiàn)諸如飽和加法、飽和乘法、除法和移位等操作。在程序中這些操作調用相當頻繁,經(jīng)CCS的profile工具測試,基本運算函數(shù)集的調用占用了95%以上的CPU時間。因此,我們要從基本運算集的優(yōu)化開始。在熟悉掌握C64xx指令集的前提下,分析基本運算集中各個函數(shù)完成的悉掌握C64xx指令集的前提下,分析基本運算集中各個函數(shù)完成的功能和對全局變量產(chǎn)生的影響,用C64xx指令取而代之或加以改編。其中包括對跳轉和流水線的優(yōu)化討論、對乘積的飽和調整和全局變量OveRFlow的相關操作。
由于基本運算集以函數(shù)形式存在,兩次跳轉f函數(shù)的調用與返回1必不可少,將引起流水線的兩次打斷,表現(xiàn)為12個指令周期的占用。將這嶁基本運算函數(shù)集改成宏的形式,即將基本運算內嵌(inline)至lJ調用程序中,由此町以消除跳轉和流水線打斷帶來的指令周期占用,提高執(zhí)行速度。雖然這樣做增加了代碼長度,多占用了一些內存,但由于基本運算函數(shù)體積均較小,再經(jīng)過一定的代碼優(yōu)化,在程序體積上的犧牲幾乎町以忽略。
基本運算的函數(shù)定義在BASIC.C文件里面,如果能夠對這些簡單甬數(shù)進行內聯(lián)指令(intrinsic)的優(yōu)化,就能達到事半功倍的效果。內聯(lián)指令是匯編指令的直接映射,具有很高的效率。與此同時帶來的一個問題是溢出保護位Overflow的判斷,這是基本函數(shù)里用來標識溢出的全局變量,它的作用等同于CSR(Control Status Register)寄存器的SAT(Saturation)位,當數(shù)據(jù)溢出時,SAT位被系統(tǒng)自動設置為1,所以編解碼函數(shù)里對Overflow的判斷可以轉化成對SAT位的判斷。引用CSR寄存器時需要在最開始的時候聲明extem cregister volatile ansigned int CSR。
C64xx指令提供了飽和乘法指令SMPY,實現(xiàn)16“16位的乘法與飽和結果調整,其執(zhí)行操作如下:
if(cond){
if((src 1*src2《《1)!=0x80000000)
dst=((src 1*src2)《《1);
else
dst=0x7ffffff;
}
else
nop;
將原指令中的乘法指令改為SMPY.就可以完成乘法和飽和調整兩種計算,這樣可以省去飽和調整3條指令。與此類似,其它的飽和運算,C64xx都提供了相應的指令實現(xiàn),將普通運算指令替換為飽和運算指令,飽和結果調整部分的運算均可以省去。
3.2主程序的優(yōu)化
主程序的優(yōu)化手段主要采用了以下幾種方法:
?。?)使用內聯(lián)函數(shù)(intrinsics)
內聯(lián)函數(shù)是可直接映射為C64xx指令的特殊函數(shù),它在指令前加上”_”表示。例如:
#define L_add(L_var1,L_var2) _sadd(L_var1,L_var2)
#define L_mult(var1,vat2) _smpy(var1,var2)
等,基本函數(shù)的內聯(lián)優(yōu)化需要對原函數(shù)的定義和內聯(lián)指令都比較熟悉。
使用內聯(lián)函數(shù)代替相應的C語句是一種非常簡便高效的優(yōu)化方法。如上面提到的飽和乘法,在C語句中。我們通常要使用兩個嵌套的條件判斷語句來檢查結果是否溢出,而指令int_smpy(int a.int b) 則在完成乘b的運算后,再做一次飽和處理,這樣一條DSP指令就可完成C語言中多條語句才能完成的計算,可以節(jié)省很多時鐘周期。
?。?)循環(huán)展開(loop—unrolling)
程序中的有很多的雙重循環(huán)和多暈循環(huán)(比如代數(shù)碼本搜索計算),由于C64xx優(yōu)化器在優(yōu)化時只在最內層循環(huán)中形成一個指令流水(最多可以達到8級流水),這樣循環(huán)語句就不能充分利用軟件流水線,而且對于內部循環(huán)次數(shù)較少的情況,消耗在prolog和eplog上的時鐘周期也不可忽視。針對這種情況,一個有效的辦法就是將雙重或多重循環(huán)展開,降低循環(huán)次數(shù)。這樣雖然代碼長度增加了,但有更多的運算能夠參加到pipeline中。由于減少了流水線排空和提高了功能單元的利用率,程序執(zhí)行速度會大大提高。
?。?)減少分支和調用指令,減少判斷指令
程序中的分支、調用以及判斷指令會引起程序的跳轉,而每個跳轉指令都有5個延遲間隙。因此延長了程序執(zhí)行時間;另外,循環(huán)內跳轉也會使軟件流水受到阻塞,降低了代碼執(zhí)行效率。優(yōu)化中,可以使用內嵌、合并判斷語句來減少判斷次數(shù)或用邏輯指令替代判斷的方法盡可能的消除中斷流水線指令帶來的影響。
G.723.1是刪組織于1996年推出的一種低碼率的語音編碼算法標準,也是目前該組織頒布的語音壓縮標準中碼率最低的一種標準。G.723.1主要用于對語音及其它多媒體聲音信號的壓縮,目前在一些數(shù)字音視頻傳輸、高質量語音壓縮等系統(tǒng)中都得到廣泛應用。
2 G.723.1算法的復雜度分析
將G.723.1移植到TMS320C64xx后,就可借助TI集成開發(fā)工具CCS(Code Composer Studio)的Profile功能來評估其各個子程序或函數(shù)的執(zhí)行運算量,從而把程序的優(yōu)化集中在對程序性能影響最大的代碼上去。
通過分析可以看出,在G.723.1的編解碼算法中,碼本搜索所花費的運算量是比較大的,如Find_Best(),F(xiàn)ind_Fcbk(),F(xiàn)ind_Acbk():另外,在LPC分析和LSP參數(shù)的計算上也有運算量比較大的,如Comp_Lpc(),Lsp_Qnt(),Lsp_Svq()。
3 代碼的優(yōu)化
代碼優(yōu)化的工作有兩大目的:一是執(zhí)行速度提高,實現(xiàn)實時;二是盡量不擴大程序體積(Code Size),使之在內存允許的范圍內。顯然,兩者存在一定的矛盾,當今超大規(guī)模集成電路的發(fā)展使RAM資源不再是系統(tǒng)的瓶頸,因此該部分工作的主要任務是怎樣提高執(zhí)行速度。代碼的優(yōu)化工作主要在CCS環(huán)境中進行。優(yōu)化的原則是要充分考慮C64xx處理器超長指令字、多個運算單元和深度流水線的結構特點,以及避免過多的讀寫內存指令和程序轉移指令,充分發(fā)揮其強大的運算能力。具體方法包括(次序有先后):
3.1基本運算集的優(yōu)化
G.723.1算法程序是用定點運算完成浮點運算,為了防止定點運算時可能溢出,許多運算需要進行飽和判斷,為此程序專門定義了基本運算集,實現(xiàn)諸如飽和加法、飽和乘法、除法和移位等操作。在程序中這些操作調用相當頻繁,經(jīng)CCS的profile工具測試,基本運算函數(shù)集的調用占用了95%以上的CPU時間。因此,我們要從基本運算集的優(yōu)化開始。在熟悉掌握C64xx指令集的前提下,分析基本運算集中各個函數(shù)完成的悉掌握C64xx指令集的前提下,分析基本運算集中各個函數(shù)完成的功能和對全局變量產(chǎn)生的影響,用C64xx指令取而代之或加以改編。其中包括對跳轉和流水線的優(yōu)化討論、對乘積的飽和調整和全局變量OveRFlow的相關操作。
由于基本運算集以函數(shù)形式存在,兩次跳轉f函數(shù)的調用與返回1必不可少,將引起流水線的兩次打斷,表現(xiàn)為12個指令周期的占用。將這嶁基本運算函數(shù)集改成宏的形式,即將基本運算內嵌(inline)至lJ調用程序中,由此町以消除跳轉和流水線打斷帶來的指令周期占用,提高執(zhí)行速度。雖然這樣做增加了代碼長度,多占用了一些內存,但由于基本運算函數(shù)體積均較小,再經(jīng)過一定的代碼優(yōu)化,在程序體積上的犧牲幾乎町以忽略。
基本運算的函數(shù)定義在BASIC.C文件里面,如果能夠對這些簡單甬數(shù)進行內聯(lián)指令(intrinsic)的優(yōu)化,就能達到事半功倍的效果。內聯(lián)指令是匯編指令的直接映射,具有很高的效率。與此同時帶來的一個問題是溢出保護位Overflow的判斷,這是基本函數(shù)里用來標識溢出的全局變量,它的作用等同于CSR(Control Status Register)寄存器的SAT(Saturation)位,當數(shù)據(jù)溢出時,SAT位被系統(tǒng)自動設置為1,所以編解碼函數(shù)里對Overflow的判斷可以轉化成對SAT位的判斷。引用CSR寄存器時需要在最開始的時候聲明extem cregister volatile ansigned int CSR。
C64xx指令提供了飽和乘法指令SMPY,實現(xiàn)16“16位的乘法與飽和結果調整,其執(zhí)行操作如下:
if(cond){
if((src 1*src2《《1)!=0x80000000)
dst=((src 1*src2)《《1);
else
dst=0x7ffffff;
}
else
nop;
將原指令中的乘法指令改為SMPY.就可以完成乘法和飽和調整兩種計算,這樣可以省去飽和調整3條指令。與此類似,其它的飽和運算,C64xx都提供了相應的指令實現(xiàn),將普通運算指令替換為飽和運算指令,飽和結果調整部分的運算均可以省去。
3.2主程序的優(yōu)化
主程序的優(yōu)化手段主要采用了以下幾種方法:
?。?)使用內聯(lián)函數(shù)(intrinsics)
內聯(lián)函數(shù)是可直接映射為C64xx指令的特殊函數(shù),它在指令前加上”_”表示。例如:
#define L_add(L_var1,L_var2) _sadd(L_var1,L_var2)
#define L_mult(var1,vat2) _smpy(var1,var2)
等,基本函數(shù)的內聯(lián)優(yōu)化需要對原函數(shù)的定義和內聯(lián)指令都比較熟悉。
使用內聯(lián)函數(shù)代替相應的C語句是一種非常簡便高效的優(yōu)化方法。如上面提到的飽和乘法,在C語句中。我們通常要使用兩個嵌套的條件判斷語句來檢查結果是否溢出,而指令int_smpy(int a.int b) 則在完成乘b的運算后,再做一次飽和處理,這樣一條DSP指令就可完成C語言中多條語句才能完成的計算,可以節(jié)省很多時鐘周期。
?。?)循環(huán)展開(loop—unrolling)
程序中的有很多的雙重循環(huán)和多暈循環(huán)(比如代數(shù)碼本搜索計算),由于C64xx優(yōu)化器在優(yōu)化時只在最內層循環(huán)中形成一個指令流水(最多可以達到8級流水),這樣循環(huán)語句就不能充分利用軟件流水線,而且對于內部循環(huán)次數(shù)較少的情況,消耗在prolog和eplog上的時鐘周期也不可忽視。針對這種情況,一個有效的辦法就是將雙重或多重循環(huán)展開,降低循環(huán)次數(shù)。這樣雖然代碼長度增加了,但有更多的運算能夠參加到pipeline中。由于減少了流水線排空和提高了功能單元的利用率,程序執(zhí)行速度會大大提高。
?。?)減少分支和調用指令,減少判斷指令
程序中的分支、調用以及判斷指令會引起程序的跳轉,而每個跳轉指令都有5個延遲間隙。因此延長了程序執(zhí)行時間;另外,循環(huán)內跳轉也會使軟件流水受到阻塞,降低了代碼執(zhí)行效率。優(yōu)化中,可以使用內嵌、合并判斷語句來減少判斷次數(shù)或用邏輯指令替代判斷的方法盡可能的消除中斷流水線指令帶來的影響。
下載該資料的人也在下載
下載該資料的人還在閱讀
更多 >
- PCM語音編解碼及原理圖下載 16次下載
- DSP芯片實現(xiàn)語音編解碼技術的設計方案 18次下載
- 基于TMS320C6201的G.723.1多通道語音編解碼分析 1次下載
- 多制式語音編解碼算法的DSP設計 3次下載
- 詳解G.723.1算法在DSP上的優(yōu)化 0次下載
- 基于DSP的語音編解碼算法G.723.1優(yōu)化分析 0次下載
- 基于DSP的G.723.1語音編碼算法實現(xiàn)方案分析 1次下載
- G.7xx語音編解碼模塊及在AD218X上的實現(xiàn) 0次下載
- 在DSP上G.729A算法的優(yōu)化
- G.726語音編解碼器在SoPC中的實現(xiàn)
- 三代移動通信變速率語音編解碼AMR-WB+算法優(yōu)化
- G7231算法在DSP上的優(yōu)化
- G.726語音編解碼器在SoPC中的實現(xiàn)
- 基于TMS320C6713的G.723.1語音編解碼的實時實
- G.723.1 語音壓縮算法的分析及DSP實現(xiàn)
- 遙控編解碼芯片有哪些 1126次閱讀
- MAXQ3120在編解碼應用中的應用 841次閱讀
- 基于TMS320C6203 DSP芯片實現(xiàn)G.729ab聲碼器的應用方案 3114次閱讀
- 新唐科技語音頻段編解碼器簡介 2306次閱讀
- SinoV-100AI單網(wǎng)口單FXS IAD語音網(wǎng)關詳細參數(shù)介紹 2511次閱讀
- 淺談SinoV-200I 2FXS IAD語音網(wǎng)關 2227次閱讀
- 淺析基于嵌入式DSP的流媒體解決方案 1248次閱讀
- 基于TI Soc OMAP4430異構多核處理器的H264編解碼 1738次閱讀
- 關于音頻編解碼器EVS及用好要做的準備工作詳解 6074次閱讀
- 音頻的編解碼簡述及其優(yōu)化方法 4393次閱讀
- FFMPEG視頻編解碼流程 H.264硬件編解碼實現(xiàn) 1.9w次閱讀
- 分析了各主流編解碼器的優(yōu)勢與不足,并對編解碼器的選擇給出建議 1.4w次閱讀
- 數(shù)字視頻編解碼技術回顧及展望 1096次閱讀
- 音頻編解碼器技術 5015次閱讀
- 基于DSP的雙通道數(shù)字語音監(jiān)錄器設計 1307次閱讀
下載排行
本周
- 1DC電源插座圖紙
- 0.67 MB | 2次下載 | 免費
- 2AN158 GD32VW553 Wi-Fi開發(fā)指南
- 1.51MB | 2次下載 | 免費
- 3AN148 GD32VW553射頻硬件開發(fā)指南
- 2.07MB | 1次下載 | 免費
- 4AN111-LTC3219用戶指南
- 84.32KB | 次下載 | 免費
- 5AN153-用于電源系統(tǒng)管理的Linduino
- 1.38MB | 次下載 | 免費
- 6AN-283: Σ-Δ型ADC和DAC[中文版]
- 677.86KB | 次下載 | 免費
- 7SM2018E 支持可控硅調光線性恒流控制芯片
- 402.24 KB | 次下載 | 免費
- 8AN-1308: 電流檢測放大器共模階躍響應
- 545.42KB | 次下載 | 免費
本月
- 1ADI高性能電源管理解決方案
- 2.43 MB | 450次下載 | 免費
- 2免費開源CC3D飛控資料(電路圖&PCB源文件、BOM、
- 5.67 MB | 138次下載 | 1 積分
- 3基于STM32單片機智能手環(huán)心率計步器體溫顯示設計
- 0.10 MB | 130次下載 | 免費
- 4使用單片機實現(xiàn)七人表決器的程序和仿真資料免費下載
- 2.96 MB | 44次下載 | 免費
- 53314A函數(shù)發(fā)生器維修手冊
- 16.30 MB | 31次下載 | 免費
- 6美的電磁爐維修手冊大全
- 1.56 MB | 24次下載 | 5 積分
- 7如何正確測試電源的紋波
- 0.36 MB | 17次下載 | 免費
- 8感應筆電路圖
- 0.06 MB | 10次下載 | 免費
總榜
- 1matlab軟件下載入口
- 未知 | 935121次下載 | 10 積分
- 2開源硬件-PMP21529.1-4 開關降壓/升壓雙向直流/直流轉換器 PCB layout 設計
- 1.48MB | 420062次下載 | 10 積分
- 3Altium DXP2002下載入口
- 未知 | 233088次下載 | 10 積分
- 4電路仿真軟件multisim 10.0免費下載
- 340992 | 191367次下載 | 10 積分
- 5十天學會AVR單片機與C語言視頻教程 下載
- 158M | 183335次下載 | 10 積分
- 6labview8.5下載
- 未知 | 81581次下載 | 10 積分
- 7Keil工具MDK-Arm免費下載
- 0.02 MB | 73810次下載 | 10 積分
- 8LabVIEW 8.6下載
- 未知 | 65988次下載 | 10 積分
評論