一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

基本數(shù)學(xué)運(yùn)算在FPGA中的實(shí)現(xiàn)算法仿真分析

電子設(shè)計 ? 來源:博客園 ? 作者:沒落騎士 ? 2020-12-25 14:02 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

作者:沒落騎士

一、前言

FPGA以擅長高速并行數(shù)據(jù)處理而聞名,從有線/無線通信到圖像處理中各種DSP算法,再到現(xiàn)今火爆的AI應(yīng)用,都離不開卷積、濾波、變換等基本的數(shù)學(xué)運(yùn)算。但由于FPGA的硬件結(jié)構(gòu)和開發(fā)特性使得其對很多算法不友好,之前本人零散地總結(jié)和轉(zhuǎn)載了些基本的數(shù)學(xué)運(yùn)算在FPGA中的實(shí)現(xiàn)方式,今天做一個系統(tǒng)的總結(jié)歸納。

二、FPGA中的加減乘除

1.硬件資源

Xilinx 7系列的FPGA中有DSP Slice ,叫做“DSP48E1”這一專用硬件資源,這是一個功能強(qiáng)大的計算單元,單就用于基本運(yùn)算的部分有加減單元和乘法器。詳見參考文獻(xiàn)1.

o4YBAF9uH6KAcCDkAAB5s7i_M8w954.png

因此可以直接用HDL語言中的加、減、乘符號實(shí)現(xiàn)變量與常量間運(yùn)算操作以及變量與變量間操作。而四則運(yùn)算中的除法沒有基本的邏輯計算單元可以對應(yīng),因此計算除法需要調(diào)用除法器IP核。

2.確認(rèn)數(shù)據(jù)的表示范圍

有符號數(shù):(補(bǔ)碼)-2^(N-1) ~ 2^(N-1)-1 如N = 8,則表示范圍是:-128 ~ 127.

無符號數(shù):0~2^N-1 如N = 8,則表示范圍是:0~255.

定點(diǎn)數(shù):2Q13 范圍是:-4~4-2^(-13) 精度是:2^(-13)

3.結(jié)果有效位寬

首先討論結(jié)果位寬問題。在FPGA中往往采用定點(diǎn)運(yùn)算替代浮點(diǎn)運(yùn)算來降低硬件資源占用率和計算延遲,其中的精髓就是精度與資源的權(quán)衡。若按照保留計算結(jié)果的全部精度,N bit數(shù)與Mbit數(shù)相加結(jié)果需要N+1bit(N>M)。N bit數(shù)與M bit數(shù)相乘之積需要N+M bit。而減法可以轉(zhuǎn)化為加法,除法則轉(zhuǎn)換為乘法和加減法的組合。如果操作數(shù)是定點(diǎn)小數(shù),則在滿足以上準(zhǔn)則的前提下,A與B相加(A小數(shù)點(diǎn)位數(shù)>B小數(shù)點(diǎn)位數(shù)),結(jié)果小數(shù)點(diǎn)位數(shù)與A相同;A與B相乘(小數(shù)點(diǎn)位數(shù)分別為p和q),結(jié)果小數(shù)點(diǎn)位數(shù)是p+q。

4.定點(diǎn)運(yùn)算步驟

然而(話鋒一轉(zhuǎn)),在大多數(shù)場合下,不需要以上這么多位來保留計算結(jié)果,因?yàn)槲覀冊谶M(jìn)行數(shù)學(xué)運(yùn)算時,已經(jīng)知道輸入數(shù)據(jù)的大致范圍,一個數(shù)除以1000和除以1結(jié)果數(shù)據(jù)所需最小位寬能一樣么?加減運(yùn)算的操作步驟是先對齊小數(shù)點(diǎn)位數(shù),后加減。而乘法是先計算后取小數(shù)點(diǎn)。這實(shí)際上與十進(jìn)制運(yùn)算一致,我們看看具體的計算步驟:

整數(shù)之間加減以及乘法的統(tǒng)一步驟:預(yù)估結(jié)果位寬N --> 按照結(jié)果位寬擴(kuò)展操作數(shù)符號位以防止溢出 --> 運(yùn)算取低N位。

定點(diǎn)小數(shù)加減運(yùn)算步驟:預(yù)估結(jié)果位寬N --> 得到結(jié)果小數(shù)點(diǎn)后位數(shù) --> 對齊操作數(shù)整數(shù)位和小數(shù)位,確定擴(kuò)展位寬M(M≥N) --> 加減運(yùn)算取低M位。

定點(diǎn)小數(shù)乘法運(yùn)算步驟:預(yù)估結(jié)果位寬N --> 得到結(jié)果小數(shù)點(diǎn)后位數(shù) --> 擴(kuò)展操作數(shù)位寬 --> 相乘取低N位

5. 變量與常量運(yùn)算化簡

以上討論的均是兩變量之間的運(yùn)算規(guī)則,當(dāng)然結(jié)果位寬及格式準(zhǔn)則是適用的。變量與常量的運(yùn)算的優(yōu)勢在于,可以將乘除法轉(zhuǎn)換成加減以及移位運(yùn)算實(shí)現(xiàn),從而降低計算復(fù)雜度和延遲。當(dāng)常數(shù)項(xiàng)C為2的整數(shù)次冪(C = 2^p),則乘C等于變量左移p位,除以C等于變量右移p位。幾個在書中看到的幾個簡單示例:A*16 = A >1A除以3 = A*(0.25+0.0625+0.0156) = A>>2+A>>4+A>>6A除以5 = A*(0.125+0.0625+0.0156) = A>>3 + A>>4 + A>>6.其中乘法完全等價對應(yīng)的移位相加操作,而除法的移位代替會損失精度。

三、如何計算特殊函數(shù)

FPGA內(nèi)部的DSP Slice可以直接進(jìn)行最基本的加法和乘法運(yùn)算,但是對于其他比如對數(shù)、指數(shù)、三角函數(shù)、開根號等特殊函數(shù)就無能為力了。這時需要借助算法對這些特殊函數(shù)進(jìn)行變換和簡化。FPGA實(shí)現(xiàn)復(fù)雜函數(shù)的常用手段一個是級數(shù)展開,再一個就是CORDIC算法。關(guān)于CORDIC的理論知識和具體內(nèi)容詳見參考文獻(xiàn)2,這里主要闡述CORDIC的IP核調(diào)用以及應(yīng)用示例。CORDIC算法就是通過一定的手段,將很多復(fù)雜的特殊函數(shù)變?yōu)橄嗉右莆贿\(yùn)算,這一點(diǎn)對于硬件芯片實(shí)現(xiàn)來說非常友好。CORDIC分為旋轉(zhuǎn)模式和矢量模式,配合圓周坐標(biāo)、線性坐標(biāo)和雙曲線坐標(biāo)會有六種組合,具體見下表:

o4YBAF9uH6eAYHStAAUPTubgJdM481.png

從表中發(fā)現(xiàn),基本的乘除法、三角函數(shù)、反三角函數(shù)、雙曲函數(shù)、反雙曲函數(shù)、開根號都能夠直接求得,那其他函數(shù)怎么辦?

o4YBAF9uH6uAdk1gAAKsIU8Rl24196.png

常見的函數(shù)計算需求基本都能滿足,雖上述變換式對自變量定義域有限制,但同樣可以分析輸入數(shù)據(jù)的取值范圍并利用簡單的數(shù)學(xué)變換得到想要的結(jié)果。Xilinx同時提供了浮點(diǎn)IP核以及CORDIC IP核,前者調(diào)用簡單但占用資源大,延遲高,因此利用CORDIC算法計算函數(shù)是個較好的選擇。

四、CORDIC計算e^x Demo

1. 算法仿真分析

要計算e^x數(shù)值需要讓CORDIC工作在雙曲坐標(biāo)的旋轉(zhuǎn)模式下,通過e^x = sinhx+coshx關(guān)系式間接求得。首先看下sinh和cosh函數(shù)的曲線,有個直觀認(rèn)識。

我們用MATLAB毫不費(fèi)力地驗(yàn)證一下公式正確性:

在設(shè)計后也同樣要借助MATLAB進(jìn)行仿真驗(yàn)證。

2. CORDIC IP核

現(xiàn)在通過查看user guide得知CORDIC IP核的接口及主要特性。

o4YBAF9uH7GAeoe_AAEXmjcb690888.png

接口包括輸入笛卡爾數(shù)據(jù)輸入通道、相位輸入通道、全局信號以及數(shù)據(jù)輸出通道。該IP核有兩種結(jié)構(gòu):串行和并行,可根據(jù)數(shù)據(jù)吞吐量需求選擇,并行結(jié)構(gòu)可以每個時鐘輸出一個計算結(jié)果。如果計算sinh和cosh,要向phase通道輸入相位信息,X_OUT是cosh(phase),Y_OUT是sinh(phase).輸入phase必須滿足數(shù)據(jù)范圍,否則出現(xiàn)不可預(yù)計結(jié)果。輸出幀結(jié)構(gòu)及數(shù)據(jù)范圍如下:

pIYBAF9uH7OARASKAACJBvr-Sog572.png

其中輸入數(shù)據(jù)格式為2QN,輸出則是1QN。由于均是有符號數(shù),也就是輸入整數(shù)部分3bit,輸出整數(shù)部分2bit。接下來對IP核進(jìn)行配置,重點(diǎn)是第一頁,此處將其配置為計算sinh和cosh模式,采用并行優(yōu)化的流水線結(jié)構(gòu)。相位以角度為單位,輸入輸出位寬設(shè)置成16bit。

o4YBAF9uH7WAWgPKAAEbXDGFtVk789.png

3.HDL代碼設(shè)計及仿真驗(yàn)證

設(shè)計代碼:
`timescale 1ns / 1ps

module cordic_ex#(parameter DIN_W = 16,
DOUT_W = 16)
(
input clk,
input [DIN_W-1:0] din,//2Q13
input din_vld,

output reg [DOUT_W+1-1:0] dout = 0,//2Q14
output reg dout_vld = 0
);

wire [DOUT_W*2-1 : 0] m_axis_dout_tdata;
wire m_axis_dout_tvalid;
wire signed [DOUT_W-1:0] sinh,cosh;

// ex = sinhx + coshx
always @(posedge clk)begin
dout end

assign sinh = m_axis_dout_tdata[DOUT_W*2-1 -:DOUT_W];
assign cosh = m_axis_dout_tdata[DOUT_W-1 -:DOUT_W];

always @(posedge clk)begin
if(m_axis_dout_tvalid)begin
dout_vld end
else
dout_vld end

cordic_0 cordic_cosh_sinh (
.aclk(clk), // input wire aclk
.s_axis_phase_tvalid(din_vld), // input wire s_axis_phase_tvalid
.s_axis_phase_tdata(din), // input wire [15 : 0] s_axis_phase_tdata
.m_axis_dout_tvalid(m_axis_dout_tvalid), // output wire m_axis_dout_tvalid
.m_axis_dout_tdata(m_axis_dout_tdata) // output wire [31 : 0] m_axis_dout_tdata
);

endmodule

cordic_ex

用MATLAB產(chǎn)生兩組數(shù)據(jù),并將角度值定點(diǎn)化后作為設(shè)計模塊數(shù)據(jù)激勵:

pIYBAF9uH7uAccWfAAX_UP1GgPU919.png

testbench:
`timescale 1ns / 1ps

module cordic_ex_tb();

parameter CYC = 20;

reg clk;
reg [16-1:0] din;
reg din_vld;

wire signed [17-1:0] dout;
wire dout_vld;

cordic_ex#(.DIN_W(16),
.DOUT_W(16))
uut(
.clk (clk) ,
.din (din) ,//2Q13
.din_vld (din_vld) ,
.dout (dout) ,//2Q14
.dout_vld (dout_vld)
);

initial begin
clk = 1;
forever #(CYC/2) clk = ~clk;
end

initial begin
#1;
din = 0;
din_vld = 0;
#(CYC*10);

din_vld = 1;
din = 16'b0001010000011011;//pi * 1/5
#(CYC*1);
din = 16'b1110011011011110;//-pi * 1/4
#5;
$stop;
end

endmodule

cordic_ex_tb

仿真結(jié)果:

仿真波形表明,計算結(jié)果與MATLAB浮點(diǎn)運(yùn)算相近,滿足一般計算需求。若想提高精度,可以增加CORDIC輸出數(shù)據(jù)位寬。

參考文獻(xiàn):

1 ug479 7 Series DSP48E1 Slice User Guide.

2 Xilinx CORDIC算法(非常經(jīng)典)_圖文_百度文庫 https://wenku.baidu.com/view/6c623aa8910ef12d2bf9e732.html

編輯:hfy


聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • dsp
    dsp
    +關(guān)注

    關(guān)注

    556

    文章

    8155

    瀏覽量

    357385
  • FPGA
    +關(guān)注

    關(guān)注

    1645

    文章

    22040

    瀏覽量

    618222
  • Xilinx
    +關(guān)注

    關(guān)注

    73

    文章

    2185

    瀏覽量

    125283
  • 無線通信
    +關(guān)注

    關(guān)注

    58

    文章

    4751

    瀏覽量

    145181
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    基于FPGA的壓縮算法加速實(shí)現(xiàn)

    本設(shè)計,計劃實(shí)現(xiàn)對文件的壓縮及解壓,同時優(yōu)化壓縮中所涉及的信號處理和計算密集型功能,實(shí)現(xiàn)對其的加速處理。本設(shè)計的最終目標(biāo)是證明在充分并行化的硬件體系結(jié)構(gòu) FPGA
    的頭像 發(fā)表于 07-10 11:09 ?628次閱讀
    基于<b class='flag-5'>FPGA</b>的壓縮<b class='flag-5'>算法</b>加速<b class='flag-5'>實(shí)現(xiàn)</b>

    FPGA定點(diǎn)和浮點(diǎn)數(shù)學(xué)運(yùn)算實(shí)例對比

    在創(chuàng)建 RTL 示例時,經(jīng)常使用 VHDL 2008 附帶的 VHDL 包。它提供了出色的功能,可以高效地處理定點(diǎn)數(shù),當(dāng)然,它們也是可綜合的。該包的一些優(yōu)點(diǎn)包括:
    的頭像 發(fā)表于 06-23 09:53 ?352次閱讀
    <b class='flag-5'>FPGA</b>定點(diǎn)和浮點(diǎn)<b class='flag-5'>數(shù)學(xué)運(yùn)算</b>實(shí)例對比

    進(jìn)群免費(fèi)領(lǐng)FPGA學(xué)習(xí)資料!數(shù)字信號處理、傅里葉變換與FPGA開發(fā)等

    ~ 01、數(shù)字信號處理的FPGA實(shí)現(xiàn) 旨在講解前端數(shù)字信號處理算法的高效實(shí)現(xiàn)。首先概述了當(dāng)前的FPGA技術(shù)、器件以及用于設(shè)計最先進(jìn)DSP系
    發(fā)表于 04-07 16:41

    從零開始學(xué)運(yùn)算放大器筆記一 | 認(rèn)識運(yùn)算放大器

    )是一種模擬電路模塊,它采用差分電壓輸入,產(chǎn)生單端電壓輸出。它可以對輸入信號進(jìn)行放大以及加、減、乘、除、微分、積分等數(shù)學(xué)運(yùn)算,現(xiàn)多應(yīng)用于信號放大功能。一個運(yùn)算放大器至
    的頭像 發(fā)表于 03-24 19:32 ?1908次閱讀
    從零開始<b class='flag-5'>學(xué)運(yùn)算</b>放大器筆記一 | 認(rèn)識<b class='flag-5'>運(yùn)算</b>放大器

    如何使用自然語言處理分析本數(shù)據(jù)

    使用自然語言處理(NLP)分析本數(shù)據(jù)是一個復(fù)雜但系統(tǒng)的過程,涉及多個步驟和技術(shù)。以下是一個基本的流程,幫助你理解如何使用NLP來分析本數(shù)據(jù): 1. 數(shù)據(jù)收集 收集文
    的頭像 發(fā)表于 12-05 15:27 ?1572次閱讀

    三種常見平方根算法的電路設(shè)計及Verilog實(shí)現(xiàn)仿真

    一、平方根及三種常見平方根算法簡介 數(shù)學(xué)是物理的基礎(chǔ),是廣大世界的基本組成部分,而數(shù)學(xué)運(yùn)算數(shù)學(xué)理論的核心部分,數(shù)學(xué)運(yùn)算有加減乘除乘方等基本
    的頭像 發(fā)表于 11-26 10:12 ?1395次閱讀
    三種常見平方根<b class='flag-5'>算法</b>的電路設(shè)計及Verilog<b class='flag-5'>實(shí)現(xiàn)</b>與<b class='flag-5'>仿真</b>

    【「從算法到電路—數(shù)字芯片算法的電路實(shí)現(xiàn)」閱讀體驗(yàn)】+內(nèi)容簡介

    、AI芯片、多媒體處理芯片等)都是由四則運(yùn)算器、濾波器、特殊信號發(fā)生器等基本算法電路構(gòu)成的,熟練掌握這些基本算法電路是實(shí)現(xiàn)復(fù)雜算法電路的基礎(chǔ)
    發(fā)表于 11-21 17:14

    【「從算法到電路—數(shù)字芯片算法的電路實(shí)現(xiàn)」閱讀體驗(yàn)】+介紹基礎(chǔ)硬件算法模塊

    數(shù)問題。因此,深入理解芯片所基于的算法是國產(chǎn)自主研發(fā)的關(guān)鍵。任何算法都是由加減四則運(yùn)算、濾波器、特殊信號發(fā)生器等基本數(shù)學(xué)方法構(gòu)成的,熟練掌握這些方法是
    發(fā)表于 11-21 17:05

    FPGA的浮點(diǎn)四則運(yùn)算是什么

    由于定點(diǎn)的四則運(yùn)算比較簡單,如加減法只要注意符號擴(kuò)展,小數(shù)點(diǎn)對齊等問題即可。在本文中,運(yùn)用在前一節(jié)描述的自定義浮點(diǎn)格式FPGA數(shù)的表示方法(下),完成浮點(diǎn)四則
    的頭像 發(fā)表于 11-16 12:51 ?932次閱讀
    <b class='flag-5'>FPGA</b><b class='flag-5'>中</b>的浮點(diǎn)四則<b class='flag-5'>運(yùn)算</b>是什么

    FPGA浮點(diǎn)四則運(yùn)算實(shí)現(xiàn)過程

    由于定點(diǎn)的四則運(yùn)算比較簡單,如加減法只要注意符號擴(kuò)展,小數(shù)點(diǎn)對齊等問題即可。在本文中,運(yùn)用在前一節(jié)描述的自定義浮點(diǎn)格式FPGA數(shù)的表示方法(下),完成浮點(diǎn)四則
    的頭像 發(fā)表于 11-16 11:19 ?1419次閱讀
    <b class='flag-5'>FPGA</b><b class='flag-5'>中</b>浮點(diǎn)四則<b class='flag-5'>運(yùn)算</b>的<b class='flag-5'>實(shí)現(xiàn)</b>過程

    邊緣計算在工業(yè)自動化的應(yīng)用

    邊緣計算在工業(yè)自動化的應(yīng)用日益廣泛,它通過將數(shù)據(jù)處理和計算能力移至靠近數(shù)據(jù)源的邊緣設(shè)備,實(shí)現(xiàn)了更高效、實(shí)時的工業(yè)自動化控制。以下是邊緣計算在工業(yè)自動化
    的頭像 發(fā)表于 10-24 14:30 ?1323次閱讀

    云計算在大數(shù)據(jù)分析的應(yīng)用

    云計算在大數(shù)據(jù)分析的應(yīng)用廣泛且深入,它為用戶提供了存儲、計算、分析和預(yù)測的強(qiáng)大能力。以下是對云計算在大數(shù)據(jù)
    的頭像 發(fā)表于 10-24 09:18 ?1114次閱讀

    為什么FPGA屬于硬件,還需要搞算法?

    嗎?單純搞算 法就行了嗎?一臉懵求解答。 A:FPGA 屬于硬件,但其功能的實(shí)現(xiàn)離不開算法。 FPGA 雖然是硬件,但它具有可編程性,要
    發(fā)表于 09-09 16:54

    FPGA在人工智能的應(yīng)用有哪些?

    ,FPGA可以有效地處理深度學(xué)習(xí)的大規(guī)模并行運(yùn)算,從而提高深度學(xué)習(xí)應(yīng)用的效率。 定制化計算:FPGA的高度可編程性使其可以針對特定的應(yīng)用場景和算法
    發(fā)表于 07-29 17:05

    PLC的邏輯運(yùn)算方式有哪些

    PLC(可編程邏輯控制器)的邏輯運(yùn)算方式主要包括以下幾種,這些邏輯運(yùn)算在PLC編程扮演著至關(guān)重要的角色,用于實(shí)現(xiàn)各種復(fù)雜的控制邏輯。
    的頭像 發(fā)表于 07-24 16:55 ?1501次閱讀