亚洲国产模特在线播放,在线喷水网站视频

作者：Mitesh Moonat and Sanket Nayak

有限脈沖響應（FIR）和無限脈沖響應（IIR）濾波器是最常用的數(shù)字信號處理算法，尤其適用于音頻處理應用。因此，在典型的音頻系統(tǒng)中，處理器內(nèi)核的很大一部分時間都用于FIR和IIR濾波。數(shù)字信號處理器上的片上FIR和IIR硬件加速器（也稱為FIRA和IIRA）可用于卸載FIR和IIR處理任務，從而騰出內(nèi)核用于其他處理。在本文中，我們將討論如何借助經(jīng)過測試的實時示例說明的不同使用模型在實踐中使用這些加速器。

介紹

pYYBAGOhLm2ABg1yAABaCR6ISD8170.png?h=270&hash=79213006D327243D2DBB339EABAE80BB&imgver=1

圖1.FIRA和IIRA系統(tǒng)框圖。

圖 1 顯示了 FIRA 和 IIRA 的簡化框圖，以及它們?nèi)绾闻c處理器系統(tǒng)的其余部分和資源交互。

FIRA 和 IIRA 模塊主要由一個計算引擎（乘法和累加（MAC）單元）以及一個小的本地數(shù)據(jù)和系數(shù) RAM 組成。

要啟動 FIRA/IIRA 處理，內(nèi)核使用特定于通道的信息初始化處理器內(nèi)存中的 DMA 傳輸控制塊（TCB）鏈。然后，內(nèi)核使用該 TCB 鏈的起始地址寫入 FIRA/IIRA 鏈指針寄存器，然后配置 FIRA/IIRA 控制寄存器以啟動加速器處理。完成所有通道的處理后，將向內(nèi)核發(fā)送中斷，以便它可以將處理后的輸出用于進一步的操作。

從理論上講，最好的方法是將所有FIR和/或IIR任務從核心卸載到加速器，并允許核心并行執(zhí)行其他操作。但在實踐中，這可能并不總是可行的，特別是當內(nèi)核需要使用加速器的輸出進行進一步處理并且沒有其他獨立任務要并行完成時。在這種情況下，我們需要選擇合適的加速器使用模型以達到最佳效果。

在本文中，我們將討論各種模型，以最佳方式將這些加速器用于不同的應用場景。

實時使用FIRA和IIRA

poYBAGOhLm6AU1X9AAAufwcNmp4033.png?h=270&hash=0A90977B333FEA964E9B4E6446A96A45&imgver=2

圖2.典型的實時音頻數(shù)據(jù)流。

圖 2 顯示了一個典型的實時 PCM 音頻數(shù)據(jù)流圖。一幀數(shù)字化 PCM 音頻數(shù)據(jù)通過同步串行端口（SPORT）接收，并通過直接內(nèi)存訪問（DMA）發(fā)送到內(nèi)存。當接收幀N+1時，幀N由內(nèi)核和/或加速器處理，先前處理的幀（N-1）的輸出通過SPORT發(fā)送到DAC進行數(shù)模轉(zhuǎn)換。

加速器使用模型

如前所述，根據(jù)應用的不同，加速器可能需要以不同的方式使用，以卸載最大的FIR和/或IIR處理任務，并為其他操作節(jié)省盡可能多的核心周期。概括地說，加速器使用模型可以分為三類：直接替換、拆分任務和數(shù)據(jù)流水線。

直接更換

核心 FIR 和/或 IIR 處理直接被加速器取代，核心只需等待加速器完成作業(yè)。

僅當加速器的處理速度比核心更快時，此模型才有效;也就是說，使用 FIRA 塊。

拆分任務

FIR 和/或 IIR 處理任務在核心和加速器之間分配。

當多個通道可供并行處理時，此模型特別有用。

根據(jù)粗略的時序估計，通道總數(shù)可以在內(nèi)核和加速器之間劃分，使兩者幾乎同時完成。

如圖 3 所示，與直接替換模型相比，此使用模型可節(jié)省更多的內(nèi)核周期。

數(shù)據(jù)流水線

核心和加速器之間的數(shù)據(jù)流可以流水線化，使兩者可以在不同的數(shù)據(jù)幀上并行工作。

如圖 3 所示，內(nèi)核處理 N千幀，然后啟動加速器對此幀的處理。然后，核心繼續(xù)并行以進一步處理N-1千加速器在上一次迭代中生成的幀輸出。此序列允許將 FIR 和/或 IIR 處理任務完全卸載到加速器，但代價是額外的輸出延遲。

管道級以及因此的輸出延遲可能會增加，具體取決于整個處理鏈中此類 FIR 和/或 IIR 處理階段的數(shù)量。

圖 3 說明了音頻數(shù)據(jù)幀如何在各種加速器使用模型的三個階段（DMA IN、內(nèi)核/加速器處理和 DMA OUT）之間流動。它還顯示了通過跨不同加速器使用模型將 FIR/IIR 處理全部或部分卸載到加速器，與僅內(nèi)核模型相比，自由內(nèi)核周期如何增加。

pYYBAGOhLm6ANHbgAACUDGZ1-sk250.png?h=270&hash=EB64D08CB0744075BC40EB702210121A&imgver=2

圖3.加速器使用模型比較。

FIRA 和 IIRA 在 SHARC 處理器上

以下ADI公司的SHARC處理器系列支持片上FIRA和IIRA（從最舊到最新）。?

ADSP-214xx（例如，ADSP-21489 )

ADSP-SC58x

ADSP-SC57x/ADSP-2157X

ADSP-2156x

跨處理器系列：

計算速度各不相同。

除ADSP-2156x處理器上的自動配置模式（ACM）外，基本編程模型保持不變。

FIRA有四個MAC單元，而IIRA有一個MAC單元。

FIRA/IIRA對ADSP-2156x處理器的改進

ADSP-2156x是SHARC處理器系列的最新成員。它是第一款1 GHz單核SHARC處理器，F(xiàn)IRA和IIRA也能夠以1 GHz運行。 ADSP-2156x處理器上的FIRA和IIRA與其前代產(chǎn)品ADSP-SC58x/ADSP-SC57x處理器相比具有各種改進。

性能改進

計算速度提高了八倍（SCLK-125 MHz 到 CCLK-1 GHz）。

由于在專用核心結(jié)構(gòu)的幫助下，核心和加速器的更緊密集成，因此核心和加速器之間的數(shù)據(jù)和 MMR 訪問延遲更少。

功能改進

添加了對 ACM 的支持，以最大程度地減少處理加速器處理所需的核心干預。此模式具有以下新的主要功能：

允許停止動態(tài)任務排隊的加速器。

沒有通道數(shù)限制。

觸發(fā)器生成（主）和觸發(fā)器等待（從）支持。

為每個通道選擇性生成中斷。

實驗結(jié)果

在本節(jié)中，我們將討論在ADSP-2156x評估板上借助不同加速器使用模型實現(xiàn)的兩個實時多通道FIR/IIR用例的結(jié)果。

用例 1

圖 4 顯示了用例 1 的框圖。采樣率為 48 kHz，塊大小為 256 個樣本，拆分任務模型中使用的內(nèi)核與加速器通道之比為 5：7。

表 1 顯示了測量的內(nèi)核和 FIRA MIPS 數(shù)字，以及與僅內(nèi)核模型相比，由此產(chǎn)生的內(nèi)核 MIPS 節(jié)省。該表還顯示了相應使用模型添加的其他輸出延遲。如我們所見，使用加速器時，使用數(shù)據(jù)流水線使用模型可以節(jié)省多達 335 個內(nèi)核 MIPS，代價是 1 塊（5.33 ms）的輸出延遲。直接替換和拆分任務使用模型還分別節(jié)省了 98 MIPS 和 189 MIPS，沒有任何額外的輸出延遲。

poYBAGOhLm6AEVIFAABcdoz2mT4306.png?h=270&hash=5B411A5874A9689866B264B3E985FCC9&imgver=2

圖4.用例 1 框圖。

使用模型	核心 MIPS	費拉米普斯	IIRA MIPS	核心 MIPS 節(jié)省	使用模型延遲（毫秒）
僅核心	337				0
直接更換	239	162	75	98	0
拆分任務	148	96	44	189	0
數(shù)據(jù)流水線	2	161	75	335	5.33（1 幀）

用例 2

圖 5 顯示了用例 2 的框圖。采樣率為 48 kHz，塊大小為 128 個樣本，拆分任務模型中使用的內(nèi)核與加速器通道的比例為 1：1。

與表 1 一樣，表 2 顯示了此用例的結(jié)果。如我們所見，使用加速器時，使用數(shù)據(jù)流水線使用模型可以節(jié)省多達 490 個內(nèi)核 MIPS，代價是 1 塊（2.67 ms）的輸出延遲。拆分任務使用模型可節(jié)省 234 個內(nèi)核 MIPS，而不會產(chǎn)生任何額外的輸出延遲。請注意，與用例 1 不同，頻域（快速卷積）處理用于內(nèi)核，而不是時域處理。這就是為什么處理一個通道的核心MIPS少于FIRA MIPS的原因，這導致直接替換使用模型的核心MIPS節(jié)省為負數(shù)。

pYYBAGOhLm-AVl5qAAAYP444rho261.png?h=270&hash=EB786962D74B68EA24927AF9695AFFD3&imgver=1

圖5.用例 2 框圖。

使用模型	核心 MIPS	費拉米普斯	核心 MIPS 節(jié)省	使用模型延遲（毫秒）
僅核心	493			0
直接更換	515	511	–22	0
拆分任務	259	257	234	0
數(shù)據(jù)流水線	3	511	490	2.67（1 幀）

結(jié)論

在本文中，我們了解了如何將內(nèi)核MIPS卸載到ADSP-2156x處理器上的FIRA和IIRA加速器，利用不同的加速器使用模型來實現(xiàn)所需的MIPS和處理配置文件。

審核編輯：郭婷

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

處理器

處理器

+關(guān)注

關(guān)注
68

文章
19890

瀏覽量
235115
濾波器

濾波器

+關(guān)注

關(guān)注
162

文章
8136

瀏覽量
182017
FIR

FIR

+關(guān)注

關(guān)注
4

文章
151

瀏覽量
34257

一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

搜索歷史

利用數(shù)字信號處理器上的片上FIR和IIR硬件加速器

評論