XAPP1206:利用NEON提高ZYNQ-7000 AP SOC上的軟件性能
一般來說,CPU需要一個(gè)接一個(gè)地執(zhí)行指令和進(jìn)程數(shù)據(jù)。設(shè)計(jì)人員通常使用高時(shí)鐘頻率來實(shí)現(xiàn)高性能,但是半導(dǎo)體技術(shù)在此項(xiàng)技術(shù)上存在極限。并行計(jì)算是下一個(gè)提高CPU數(shù)據(jù)處理能力的典型策略。單指令多數(shù)據(jù)(SIMD)技術(shù)使得在一個(gè)或幾個(gè)CPU周期內(nèi)處理多個(gè)數(shù)據(jù)成為可能。NEON是賽靈思Zynq-7000 All Programmable SoC所采用的雙核ARM Cortex-A9處理器中的高級(jí)SIMD引擎。NEON專門用來對(duì)大數(shù)據(jù)集進(jìn)行并行數(shù)據(jù)計(jì)算,有效利用該技術(shù)可以提高設(shè)計(jì)的軟件性能。
在本應(yīng)用指南中,作者Haoliang Qin介紹了四種利用Cortex-A9處理器內(nèi)核上的NEON 提高軟件性能和緩存效率的方法,這四種方法分別是:優(yōu)化匯編碼、使用NEON intrinsics、使用針對(duì)NEON優(yōu)化的函數(shù)庫以及使用針對(duì)編譯器優(yōu)化的自動(dòng)向量化。此外,他還詳細(xì)介紹了改善CPU、緩存和主存儲(chǔ)器之間數(shù)據(jù)交換的方法。
軟件優(yōu)化是一個(gè)復(fù)雜的話題。Qin表示,要實(shí)現(xiàn)最佳硬件性能,必須同時(shí)使用所有這些技術(shù),并在它們之間取得最佳平衡。
XAPP1208:邏輯中的BITSLIP
賽靈思UltraScale器件中的I/O邏輯是指位于I/O緩沖器和通用互聯(lián)之間的專用I/O處理組件。相對(duì)此前器件系列而言,UltraScale器件中的I/O邏輯設(shè)置可提供更快速的I/O處理、更低的抖動(dòng)以及更多的功能。但是,它省略了7系列和Virtex-6 FPGAI/O邏輯中的一些可用功能,如Bitslip。
由Marc Defossez撰寫的本應(yīng)用指南介紹了在通用互聯(lián)中實(shí)現(xiàn)的可用在UltraScale器件及此前器件架構(gòu)中的Bitslip解決方案。本參考設(shè)計(jì)實(shí)現(xiàn)了Bitslip功能,并通過若干附加選項(xiàng)擴(kuò)展了基本功能。
Bitslip參考設(shè)計(jì)執(zhí)行的功能與7 系列和Virtex-6 FPGA的ISERDES中嵌入的固有Bitslip功能相同,但是,該參考設(shè)計(jì)提供的一些額外選項(xiàng)是基于7 系列和Virtex-6 FPGA器件的解決方案中所沒有的,因而超越了后者。當(dāng)這個(gè)設(shè)計(jì)中的功能需要用在7系列或Virtex-6 FPGA設(shè)計(jì)中時(shí),必須使用通用互聯(lián)。因此,Bitslip參考設(shè)計(jì)可滿足先前器件系列中Bitslip的要求和目標(biāo)。
XAPP1203:在ZYNQ-7000 AP SOC上實(shí)現(xiàn)信號(hào)處理IP,以對(duì)XADC采樣進(jìn)行后處理
本應(yīng)用指南是白皮書《在賽靈思All Programmable器件中有效實(shí)現(xiàn)模擬信號(hào)處理功能》(WP442)的后續(xù)配套文章,給出了簡(jiǎn)單易用的設(shè)計(jì)流程,以便利用賽靈思All Programmable抽象在賽靈思FPGA和All Programmable SoC中實(shí)現(xiàn)模擬信號(hào)處理功能。作者M(jìn)rinal J. Sarmah和Cathal Murphy在書中詳細(xì)描述了如何利用白皮書中介紹的概念在Zynq-7000 All Programmable SoC上輕松構(gòu)建信號(hào)處理IP核與完整的混合信號(hào)系統(tǒng)。
本應(yīng)用指南演示了如何對(duì)來自模數(shù)轉(zhuǎn)換器的采樣進(jìn)行后處理,以便以低成本方式濾除環(huán)境噪聲。所用的設(shè)計(jì)模塊是基于DSP模塊(支持標(biāo)準(zhǔn)AXI接口)的輕量級(jí)解決方案。讀者可在他們自己的設(shè)計(jì)中重用這些IP核,并作為XADC采樣的后處理方法。基于Vivado IP Integrator的設(shè)計(jì)流程可在基于原理圖的環(huán)境下簡(jiǎn)化重用過程,使設(shè)計(jì)人員在該環(huán)境下不必處理底層RTL。
XAPP1205:利用ZYNQ-7000 ALL PROGRAMMABLE SOC和IP INTEGRATOR設(shè)計(jì)高性能視頻系統(tǒng)
對(duì)于賽靈思Zynq-7000 All Programmable SoC這樣的高端處理平臺(tái),客戶希望充分利用器件中的處理系統(tǒng)(PS)和可用的定制外設(shè)。針對(duì)該理念的實(shí)例為一種具有多條視頻流水線的系統(tǒng),其中,在處理器訪問存儲(chǔ)器的同時(shí),可將現(xiàn)場(chǎng)視頻流寫入存儲(chǔ)器(輸入),將存儲(chǔ)器的內(nèi)容送到現(xiàn)場(chǎng)視頻流(輸出)。由James Lucero和Bob Slous撰寫的本應(yīng)用指南涵蓋相應(yīng)設(shè)計(jì)原則,以便從Zynq SoC存儲(chǔ)器接口、可編程邏輯(PL)中實(shí)現(xiàn)的AXI主接口以及ARM Cortex-A9處理器中獲得高性能。.
對(duì)于視頻流,最差情況時(shí)延要確保不丟失或破壞數(shù)據(jù)幀。為了在PL中提供具有更低時(shí)延的高速AXI主接口,并直接訪問Zynq-7000 SoC存儲(chǔ)器接口,需要連接到高性能(HP)接口。Zynq SoC包含四個(gè)HP接口,均為針對(duì)高吞吐量而設(shè)計(jì)的64位或32位AXI3從接口。
該設(shè)計(jì)使用四個(gè)AXI視頻直接存儲(chǔ)器訪問(VDMA)內(nèi)核同步移動(dòng)8個(gè)視頻流(4個(gè)發(fā)送視頻流和4個(gè)接收視頻流),所有視頻流均為1920 x 1080p格式,60Hz刷新率,每像素多達(dá)24個(gè)數(shù)據(jù)位。每個(gè)AXI視頻DMA內(nèi)核均采用視頻定時(shí)控制器(VTC)內(nèi)核建立必要的視頻定時(shí)信號(hào),內(nèi)核由視頻測(cè)試模式發(fā)生器(TPG)驅(qū)動(dòng)。每個(gè)AXI視頻DMA內(nèi)核讀取的數(shù)據(jù)被送到一個(gè)共用的視頻屏幕顯示(OSD)內(nèi)核,該內(nèi)核可將多個(gè)視頻流多路復(fù)用或重疊為單個(gè)輸出視頻流。板載HDMI視頻顯示接口由視頻屏幕顯示內(nèi)核的輸出和附加的IP核驅(qū)動(dòng)。
該設(shè)計(jì)采用AXI性能監(jiān)視器內(nèi)核捕捉性能數(shù)據(jù)。所有4個(gè)AXI視頻DMA內(nèi)核都通過AXI互聯(lián)連接到4個(gè)獨(dú)立的HP接口,并受Cortex-A9處理器的控制。該系統(tǒng)使用70%的存儲(chǔ)器控制器帶寬。該參考設(shè)計(jì)適用于Zynq SoC ZC702評(píng)估板。
XAPP1091:在KINTEX-7 FPGA中實(shí)現(xiàn)實(shí)時(shí)視頻引擎2.0
在廣播視頻領(lǐng)域,不同格式的視頻內(nèi)容流經(jīng)過采集、處理、分配和使用等不同操作。為了正確存檔、分配和顯示內(nèi)容,視頻信號(hào)經(jīng)常需要通過適當(dāng)?shù)母袷睫D(zhuǎn)換進(jìn)行正確處理。例如,為了在全高清(FHD)LCD屏幕上正確顯示NTSC/PAL信號(hào),必須執(zhí)行一系列去隔行、縮放、色度上采樣、顏色校正以及α混合操作。
本應(yīng)用指南利用最新的賽靈思Kintex-7 FPGA架構(gòu)提供真正可擴(kuò)展的視頻處理器參考設(shè)計(jì),以滿足多數(shù)據(jù)流/多流水線視頻處理需求。作者Bob Feng和Kavoos Hedayati針對(duì)的是多畫面監(jiān)控器顯示器、視頻開關(guān)和多通道視頻路由器以及多數(shù)據(jù)流上變頻器和下變頻器等應(yīng)用。
XAPP1095:在賽靈思ZYNQ-7000 ALL PROGRAMMABLE SOC中實(shí)現(xiàn)實(shí)時(shí)視頻引擎2.1
另一個(gè)以視頻為導(dǎo)向的應(yīng)用指南利用最新的Zynq-7000 All Programmable SoC架構(gòu)提供真正可擴(kuò)展的視頻處理器參考設(shè)計(jì),以滿足多數(shù)據(jù)流/多流水線視頻處理需求。此外,它還提供用以創(chuàng)建差異化內(nèi)容的圖形渲染功能。該設(shè)計(jì)針對(duì)的是多畫面監(jiān)控器顯示器、視頻開關(guān)和多通道視頻路由器以及多數(shù)據(jù)流上變頻器和下變頻器等應(yīng)用。
作者Bob Feng表示,他們的目標(biāo)是提供針對(duì)多種視頻應(yīng)用的高度可論證的廣播質(zhì)量視頻處理參考設(shè)計(jì)。實(shí)時(shí)視頻引擎參考設(shè)計(jì)2.1版本(RTVE 2.1)可提供一種在Linux v3.3下使用API的圖形渲染平臺(tái),具有Qt圖形環(huán)境并可執(zhí)行可擴(kuò)展的視頻處理功能。
TIPS:文中文檔下載方式,請(qǐng)登錄China.xilinx.com,在搜索欄直接以文件編號(hào)為關(guān)鍵詞進(jìn)行搜索,比如“XAPP1095”。
---> END <---
-
cpu
+關(guān)注
關(guān)注
68文章
11011瀏覽量
215244 -
模擬信號(hào)
+關(guān)注
關(guān)注
8文章
1156瀏覽量
53168 -
高性能
+關(guān)注
關(guān)注
0文章
170瀏覽量
20741
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦

評(píng)論