一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Speedster7t FPGA中可編程邏輯的架構(gòu)

Achronix ? 來源:Achronix ? 作者:Achronix ? 2022-07-05 15:37 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

概述

隨著數(shù)據(jù)中心、人工智能自動駕駛、5G、計算存儲和先進(jìn)測試等應(yīng)用的數(shù)據(jù)量和數(shù)據(jù)流量不斷增大,不僅需要引入高性能、高密度FPGA來發(fā)揮其并行計算和可編程硬件加速功能,而且還對大量數(shù)據(jù)在FPGA芯片內(nèi)外流動提出了更高的要求。于是,在FPGA芯片中集成包括片上二維網(wǎng)絡(luò)(2D NoC)和各種最新高速接口的新品類FPGA芯片應(yīng)運而生,成為FPGA產(chǎn)業(yè)和相關(guān)應(yīng)用的新熱點。

拉開這場FPGA芯片創(chuàng)新大幕的是全球最大的獨立FPGA技術(shù)和產(chǎn)品提供商Achronix半導(dǎo)體公司,其采用7nm工藝打造的Achronix Speedster7t FPGA不僅擁有諸多高性能外圍Hard IP,而且是全球第首次在FPGA的邏輯陣列上集成了2D NoC,一經(jīng)推出就在市場得到了積極的響應(yīng),并引來競爭對手的模仿和跟隨。

Speedster7t這款專門針對人工智能/機(jī)器學(xué)習(xí)AI / ML)和高帶寬應(yīng)用進(jìn)行優(yōu)化的高性能、高密度FPGA,包括了革命性的二維片上網(wǎng)絡(luò)(2D NoC)、新型機(jī)器學(xué)習(xí)處理器(MLP)、400G以太網(wǎng)和PCIe Gen5端口,以及高帶寬GDDR6和DDR4/5存儲控制器。Speedster7t FPGA架構(gòu)如圖1所示。

0e8f62bc-fc35-11ec-ba43-dac502259ad0.png

圖1 Speedster7t FPGA結(jié)構(gòu)圖

Achronix Speedster7t FPGA除了在外圍Hard IP上都采用目前業(yè)內(nèi)領(lǐng)先的大帶寬高速率IP,在內(nèi)部的可編程邏輯的架構(gòu)中也做了大量的優(yōu)化去進(jìn)一步提高內(nèi)部可編程邏輯的性能,從而適配外圍IP超高帶寬需求。本文首先談?wù)凷peedster7t FPGA的片上SRAM,也就是Block RAM針對傳統(tǒng)的結(jié)構(gòu)所做出的一些優(yōu)化。

Speedster7t FPGA中可編程邏輯的架構(gòu)

Speedster7t FPGA中內(nèi)部的可編程資源是按列排布,包括LUT、FF、ALU、MUX、MLP、Block RAM、Logic RAM。如圖2所示。

0ecf9238-fc35-11ec-ba43-dac502259ad0.png

圖2 Speedster7t FPGA可編程邏輯結(jié)構(gòu)

其中MLP、Block RAM、Logic RAM是集成在一起,他們之間的連接用的是專有的走線,不占用可編程邏輯走線資源,這樣做的目的主要是為了提高性能,同時也可以節(jié)省可編程邏輯走線資源,這個架構(gòu)對于AI,還有需要用到MLP的一些復(fù)雜算法的性能優(yōu)化是非常明顯的,在我們的MLP系列文章中會詳細(xì)講到,這里我們只重點說一下Block RAM。 Speedster7t FPGA的Block RAM特點 Speedster7t FPGA內(nèi)部的Block RAM是一個容量為72k bit的簡單雙端口RAM,有一個讀端口,一個寫端口。兩個端口的時鐘完全獨立,并且可以完全獨立的配置讀寫位寬。它可以靈活的配置成簡單雙端口RAM或者ROM。

Block RAM的主要特性如表1所示。

表1 Block RAM的關(guān)鍵特性

0f142a56-fc35-11ec-ba43-dac502259ad0.png

Block RAM框圖如圖3所示。

0f340204-fc35-11ec-ba43-dac502259ad0.png

圖3 Block RAM內(nèi)部結(jié)構(gòu)

Speedster7t FPGA的Block RAM級聯(lián)結(jié)構(gòu)

Speedster7t FPGA的Block RAM最大的特點是增加了Block RAM間的級聯(lián)走線,級聯(lián)走線是BRAM間專有的連線,不占用可編程邏輯的走線資源,可以極大的提升多個Block RAM級聯(lián)的性能。圖4顯示了Block RAM間級聯(lián)走線的架構(gòu)。

0f5735da-fc35-11ec-ba43-dac502259ad0.png

圖4 Block RAM級聯(lián)結(jié)構(gòu)

由圖4可以看出,讀寫地址線和數(shù)據(jù)線都有專有的級聯(lián)線連接。這樣的架構(gòu)在一些場景中都會有應(yīng)用,比如:需要從外部端口接收數(shù)據(jù)或者從GDDR6讀數(shù)據(jù)去初始化大量Block RAM的場景,AI的神經(jīng)網(wǎng)絡(luò)就是一個典型的應(yīng)用,在每一層的卷積算法中,系統(tǒng)都會從GDDR6讀出圖像數(shù)據(jù)和權(quán)重數(shù)據(jù)放入每個引擎的Block RAM中,引擎計算完畢以后再存入到GDDR6中供下一次運算使用。

有了這樣的級聯(lián)架構(gòu),我們在寫入數(shù)據(jù)去初始化大量Block RAM的時候不需要外部數(shù)據(jù)有很大的扇出,直接通過同一列Block RAM的級聯(lián)線就可以輕松完成,具體實現(xiàn)可以參考Achronix MLP_Conv2D參考設(shè)計。另外一個例子就是在需要多個Block RAM去構(gòu)成更大容量的RAM的時候,如果利用級聯(lián)線可以大大提升系統(tǒng)的性能。我們針對這個專門做了一個工程比較一下,生成一個位寬64bit,深度16384的一個簡單雙端口RAM,需要用到16個Block RAM。我們分別用專有級聯(lián)線和內(nèi)部可編程邏輯去拼深度兩種方法來對比??梢钥吹接脤S械募壜?lián)線資源更省,而且性能有了很大的提高。

使用專有的級聯(lián)線資源占用和性能:

0f7a5dda-fc35-11ec-ba43-dac502259ad0.png

使用可編程邏輯資源占用和性能:

0f9b4658-fc35-11ec-ba43-dac502259ad0.png

后面我們會繼續(xù)深入了解Speedster7t FPGA可編程邏輯的各種特性,并且會用一些例子來說明如何更高效的利用這些特性,以將Speedster7t這款業(yè)界首創(chuàng)的高數(shù)據(jù)帶寬FPGA芯片與更多的創(chuàng)新智能化應(yīng)用結(jié)合起來。

此外,Achronix也提供Speedcore嵌入式FPGA硅知識產(chǎn)權(quán)(IP)產(chǎn)品,用來幫助用戶在應(yīng)用規(guī)模進(jìn)一步擴(kuò)大后,去開發(fā)帶有eFPGA邏輯陣列的ASIC或者SoC產(chǎn)品,它們由Achronix的ACE FPGA開發(fā)工具提供支持,從而可以重用FPGA開發(fā)成果,這是Achronix在率先引入2D NoC和MLP之外,另一個層面上的創(chuàng)新。

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • FPGA
    +關(guān)注

    關(guān)注

    1645

    文章

    22036

    瀏覽量

    618106
  • 芯片
    +關(guān)注

    關(guān)注

    459

    文章

    52471

    瀏覽量

    440441
  • 機(jī)器學(xué)習(xí)

    關(guān)注

    66

    文章

    8501

    瀏覽量

    134564

原文標(biāo)題:超高數(shù)據(jù)流通量FPGA新品類中的Block RAM級聯(lián)架構(gòu)

文章出處:【微信號:Achronix,微信公眾號:Achronix】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    5CEBA4F23C8NQS現(xiàn)場可編程門陣列(FPGA)芯片

    5CEBA4F23C8NQS現(xiàn)場可編程門陣列(FPGA)芯片5CEBA4F23C8NQS是Intel-ALTERA(原 Altera)研發(fā)的Cyclone V系列性能卓越、低能耗的現(xiàn)場可編程門陣列
    發(fā)表于 06-11 09:01

    H5U系列可編程邏輯控制器指令手冊

    INOVANCE匯川-H5U系列可編程邏輯控制器指令手冊-中文
    發(fā)表于 04-30 16:38 ?0次下載

    fpga和cpu的區(qū)別 芯片是gpu還是CPU

    型的芯片,它們在結(jié)構(gòu)、功能、應(yīng)用場景等方面存在顯著差異。 結(jié)構(gòu)與靈活性 FPGAFPGA是一種可編程邏輯器件,其內(nèi)部由大量的可編程邏輯
    的頭像 發(fā)表于 02-01 14:57 ?1602次閱讀

    可編程交流負(fù)載標(biāo)準(zhǔn)

    標(biāo)準(zhǔn)通常具有高精度和高穩(wěn)定性的特點,在測試過程,負(fù)載需要提供穩(wěn)定的電壓和電流輸出,以確保測試結(jié)果的準(zhǔn)確性。因此,可編程交流負(fù)載設(shè)備通常會采用先進(jìn)的控制技術(shù)和高精度的傳感器,以保證輸出的穩(wěn)定性和精度
    發(fā)表于 01-15 13:53

    可編程混合信號技術(shù)彌補邏輯IC的成本與密度空白

    GreenPAK系列可配置IC和ForgeFPGA家族的低密度可編程邏輯產(chǎn)品,完美地滿足了這一需求。 Jason Kim Jason Kim, VP and GM Configura
    的頭像 發(fā)表于 12-28 15:47 ?749次閱讀
    <b class='flag-5'>可編程</b>混合信號技術(shù)彌補<b class='flag-5'>邏輯</b>IC的成本與密度空白

    Achronix與BigCat Wireless建立戰(zhàn)略合作伙伴關(guān)系

    Speedster7t FPGA上的創(chuàng)新機(jī)器學(xué)習(xí)處理器(MLP)來滿足無線應(yīng)用先進(jìn)的信號處理要求,以及支撐未來的6G標(biāo)準(zhǔn)。此次合作旨在通過基于Achronix FPGA
    的頭像 發(fā)表于 11-21 10:58 ?704次閱讀

    兼容SiTime,國產(chǎn)可編程硅振用于智能化測試設(shè)備ATE

    兼容SiTime,國產(chǎn)可編程硅振用于智能化測試設(shè)備ATE
    的頭像 發(fā)表于 10-30 10:06 ?444次閱讀
    兼容SiTime,國產(chǎn)<b class='flag-5'>可編程</b>硅振用于智能化測試設(shè)備ATE<b class='flag-5'>中</b>

    德州儀器推出全新可編程邏輯產(chǎn)品系列

    德州儀器(TI)近日宣布推出其最新的可編程邏輯器件(PLD)系列,為工程師們帶來了從概念到原型設(shè)計的全新解決方案。這一創(chuàng)新產(chǎn)品系列基于TI出色的邏輯產(chǎn)品系列,旨在簡化各類應(yīng)用的邏輯設(shè)計流程,讓工程師們能夠更高效地完成工作任務(wù)。
    的頭像 發(fā)表于 10-28 17:38 ?847次閱讀

    詳解FPGA的基本結(jié)構(gòu)

    ZYNQ PL 部分等價于 Xilinx 7 系列 FPGA,因此我們將首先介紹 FPGA架構(gòu)。簡化的 FPGA 基本結(jié)構(gòu)由 6 部分組
    的頭像 發(fā)表于 10-25 16:50 ?3304次閱讀
    詳解<b class='flag-5'>FPGA</b>的基本結(jié)構(gòu)

    可編程晶振的優(yōu)點和缺點

    的靈活性和可調(diào)整性,使得在多種電子產(chǎn)品設(shè)計過程能夠精確地匹配所需的時鐘信號?。可編程晶振是一種能夠通過外部編程器對其頻率進(jìn)行調(diào)整的晶體振蕩器。它采用先進(jìn)的數(shù)字信
    的頭像 發(fā)表于 09-30 10:44 ?858次閱讀
    <b class='flag-5'>可編程</b>晶振的優(yōu)點和缺點

    Achronix Speedster7t FPGA與GPU解決方案的比較

    這篇針對大模型推理跟GPU對比分析,雖然以Llama2為例,也適用于最新的Llama3,模型的日新月易也更進(jìn)一步說明硬件平臺的可編程可擴(kuò)展的重要性,FPGA是其中一個不錯的選擇。
    的頭像 發(fā)表于 09-18 16:19 ?752次閱讀
    Achronix <b class='flag-5'>Speedster7t</b> <b class='flag-5'>FPGA</b>與GPU解決方案的比較

    基于Achronix Speedster7t FPGA器件的AI基準(zhǔn)測試

    Achronix半導(dǎo)體公司推出了為AI優(yōu)化的Speedster7t系列FPGA芯片,該系列包含專門針對AI工作負(fù)載的強(qiáng)化計算引擎。隨著AI在各個領(lǐng)域變得普遍,在FPGA芯片上部署AI應(yīng)用的需求促使了
    的頭像 發(fā)表于 09-18 16:10 ?1060次閱讀
    基于Achronix <b class='flag-5'>Speedster7t</b> <b class='flag-5'>FPGA</b>器件的AI基準(zhǔn)測試

    可編程邏輯控制器——安全威脅和解決方案

    電子發(fā)燒友網(wǎng)站提供《可編程邏輯控制器——安全威脅和解決方案.pdf》資料免費下載
    發(fā)表于 09-14 09:57 ?0次下載
    <b class='flag-5'>可編程</b><b class='flag-5'>邏輯</b>控制器——安全威脅和解決方案

    用TMAG5328電阻器和電壓可編程霍爾效應(yīng)開關(guān)實現(xiàn)可編程性和診斷

    電子發(fā)燒友網(wǎng)站提供《用TMAG5328電阻器和電壓可編程霍爾效應(yīng)開關(guān)實現(xiàn)可編程性和診斷.pdf》資料免費下載
    發(fā)表于 09-11 10:01 ?0次下載
    用TMAG5328電阻器和電壓<b class='flag-5'>可編程</b>霍爾效應(yīng)開關(guān)實現(xiàn)<b class='flag-5'>可編程</b>性和診斷

    可編程晶振都有什么頻率的呢?分享3個挑選可編程晶振的技巧

    頻率范圍全面覆蓋,滿足多樣化需求: ? CMOS可編程晶振:1~200MHz寬廣選擇,為您的基礎(chǔ)應(yīng)用提供穩(wěn)定可靠的支持。 ? 可編程差分晶振:高達(dá)2100MHz的卓越性能,滿足高速數(shù)據(jù)傳輸與信號處理的高標(biāo)準(zhǔn)要求。 ? 可編程壓控
    的頭像 發(fā)表于 07-18 18:30 ?1624次閱讀
    <b class='flag-5'>可編程</b>晶振都有什么頻率的呢?分享3個挑選<b class='flag-5'>可編程</b>晶振的技巧