一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

AI引擎機(jī)器學(xué)習(xí)陣列指南

Xilinx賽靈思官微 ? 來源:Xilinx賽靈思官微 ? 2024-09-18 09:16 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

AMD Versal AI Core 系列和 Versal AI Edge 系列旨在憑借 AI 引擎機(jī)器學(xué)習(xí) ( ML ) 架構(gòu)來提供突破性的 AI 推斷加速。這些器件的設(shè)計(jì)應(yīng)用范圍廣泛,包括用于云端動(dòng)態(tài)工作負(fù)載以及超高帶寬網(wǎng)絡(luò),同時(shí)還可提供高級(jí)安全性功能。AI 和數(shù)據(jù)科學(xué)家以及軟硬件開發(fā)者均可充分利用高計(jì)算密度的優(yōu)勢(shì)來加速提升任何應(yīng)用的性能。AI 引擎機(jī)器學(xué)習(xí)擁有先進(jìn)的張量計(jì)算能力,非常適合用于高度優(yōu)化的 AI 和 ML 應(yīng)用。

AI 引擎機(jī)器學(xué)習(xí)器件包含二維陣列,由帶有單指令流多數(shù)據(jù)流 ( SIMD ) 矢量單元的超長(zhǎng)指令字 ( VLIW ) 處理器構(gòu)成,專為計(jì)算密集型應(yīng)用而高度優(yōu)化,特別適用于機(jī)器學(xué)習(xí) ( ML ) 等 AI 技術(shù)。

AI 引擎機(jī)器學(xué)習(xí)陣列支持三種級(jí)別并行度:

指令級(jí)并行度 ( ILP ):通過 VLIW 架構(gòu),允許在單個(gè)時(shí)鐘周期內(nèi)執(zhí)行多次運(yùn)算。
SIMD:通過矢量寄存器,允許并行執(zhí)行多項(xiàng)計(jì)算。
多核:通過 AI 引擎機(jī)器學(xué)習(xí)陣列,支持并行執(zhí)行多個(gè) AI 引擎機(jī)器學(xué)習(xí)核。

指令級(jí)并行度包括 1 次標(biāo)量操作、1 次移動(dòng)、2 次矢量讀?。虞d)、1 次矢量寫入(存儲(chǔ))和 1 條可執(zhí)行的矢量指令,總計(jì)每個(gè)時(shí)鐘周期達(dá) 6 路 VLIW 指令。數(shù)據(jù)級(jí)并行度是通過矢量級(jí)操作來實(shí)現(xiàn)的,其中每個(gè)時(shí)鐘周期可執(zhí)行多組數(shù)據(jù)操作。

每個(gè) AI 引擎機(jī)器學(xué)習(xí)都包含矢量處理器和標(biāo)量處理器、專用程序存儲(chǔ)器、本地 64 KB 數(shù)據(jù)存儲(chǔ)器、支持訪問其本身和三個(gè)相鄰 AI 引擎機(jī)器學(xué)習(xí)內(nèi)的本地存儲(chǔ)器。它還可訪問 DMA 引擎和 AXI4 互連開關(guān),以通過串流來與其他 AI 引擎機(jī)器學(xué)習(xí)進(jìn)行通信或者與可編程邏輯 ( PL ) 或 DMA 進(jìn)行通信。請(qǐng)參閱《Versal 自適應(yīng) SoC AIE ML 架構(gòu)手冊(cè)》 ( AM020 ) 以獲取有關(guān) AI 引擎機(jī)器學(xué)習(xí)陣列和接口的具體詳細(xì)信息。

b5d29b6992f9e799189185986d306675.png

雖然對(duì)于 AI 引擎機(jī)器學(xué)習(xí)而言,大部分標(biāo)準(zhǔn) C 語言代碼均可編譯,但代碼可能需要重構(gòu)才能充分利用硬件所提供的并行度。AI 引擎機(jī)器學(xué)習(xí)的優(yōu)勢(shì)在于,它能夠在每個(gè)時(shí)鐘周期內(nèi)使用 2 個(gè)矢量執(zhí)行乘積累加 ( MAC ) 運(yùn)算、為下一項(xiàng)運(yùn)算加載 2 個(gè)矢量、存儲(chǔ)來自上一項(xiàng)運(yùn)算的單個(gè)矢量,并遞增一個(gè)指針或執(zhí)行另一次標(biāo)量運(yùn)算。稱為本征函數(shù)的專用函數(shù)允許您以 AI 引擎機(jī)器學(xué)習(xí)矢量處理器和標(biāo)量處理器為目標(biāo),并提供多個(gè)常用矢量函數(shù)和標(biāo)量函數(shù)的實(shí)現(xiàn),使您能夠?qū)W⒂谔幚砟繕?biāo)算法。AI 引擎機(jī)器學(xué)習(xí)不僅包含其矢量單元,還包含一個(gè)標(biāo)量單元用于所有標(biāo)準(zhǔn) C 語言代碼程序。

AI 引擎機(jī)器學(xué)習(xí)程序使用以 C++ 編寫的數(shù)據(jù)流計(jì)算圖(自適應(yīng)數(shù)據(jù)流計(jì)算圖)規(guī)格。此規(guī)范可使用 AI 引擎編譯器進(jìn)行編譯并執(zhí)行。自適應(yīng)數(shù)據(jù)流 ( ADF ) 計(jì)算圖應(yīng)用由多個(gè)節(jié)點(diǎn)和邊緣組成,其中節(jié)點(diǎn)表示計(jì)算內(nèi)核函數(shù),邊緣則表示數(shù)據(jù)連接。應(yīng)用中的內(nèi)核可編譯為在 AI 引擎機(jī)器學(xué)習(xí)上運(yùn)行,這些內(nèi)核構(gòu)成了 ADF 計(jì)算圖規(guī)范的基礎(chǔ)構(gòu)建塊。ADF 計(jì)算圖屬于 Kahn 進(jìn)程網(wǎng)絡(luò),其中包含并行運(yùn)行的 AI 引擎內(nèi)核。AI 引擎內(nèi)核在數(shù)據(jù)串流和緩沖器上執(zhí)行運(yùn)算。這些內(nèi)核會(huì)耗用輸入數(shù)據(jù)塊并生成輸出數(shù)據(jù)塊。內(nèi)核還可包含靜態(tài)數(shù)據(jù)或運(yùn)行時(shí)參數(shù) ( RTP ) 實(shí)參,包括異步實(shí)參或同步實(shí)參。

下圖顯示

ADF 計(jì)算圖的概念視圖及其與處理器系統(tǒng) ( PS )、可編程邏輯 ( PL ) 和 DDR 存儲(chǔ)器的對(duì)接接口。它包括:

AI 引擎機(jī)器學(xué)習(xí):每個(gè) AI 引擎機(jī)器學(xué)習(xí)都是一個(gè) VLIW 處理器,其中包含一個(gè)標(biāo)量單元、一個(gè)矢量單元、兩個(gè)加載單元和一個(gè)存儲(chǔ)單元。

AI 引擎內(nèi)核:內(nèi)核是以 AI 引擎機(jī)器學(xué)習(xí)中運(yùn)行的 C/C++ 編寫的。

ADF 計(jì)算圖:ADF 計(jì)算圖是具有單個(gè)或多個(gè) AI 引擎內(nèi)核(以數(shù)據(jù)串流和/或緩沖器連接)的 Kahn 進(jìn)程網(wǎng)絡(luò)。它憑借如下特定構(gòu)造來與 PL、全局存儲(chǔ)器和 PS 進(jìn)行交互,此類構(gòu)造有:PLIO(計(jì)算圖中的端口屬性,用于建立往來可編程邏輯的串流連接)、GMIO(計(jì)算圖中的端口屬性,用于建立往來全局存儲(chǔ)器的外部存儲(chǔ)器映射連接)和 RTP。

如需了解有關(guān) AI 引擎機(jī)器學(xué)習(xí)存儲(chǔ)器拼塊訪問的信息,請(qǐng)參閱 AI 引擎機(jī)器學(xué)習(xí)存儲(chǔ)器拼塊訪問。如需了解有關(guān) AI 引擎機(jī)器學(xué)習(xí)外部存儲(chǔ)器訪問的信息,請(qǐng)參閱 AI 引擎機(jī)器學(xué)習(xí)外部存儲(chǔ)器訪問。

本文檔第 2 章到第 5 章聚焦 AI 引擎內(nèi)核編程,不僅涉及單內(nèi)核編程,還涵蓋了多方面的內(nèi)容,如內(nèi)核之間的數(shù)據(jù)通信,這些內(nèi)容都是將應(yīng)用分區(qū)為多個(gè)內(nèi)核以達(dá)成所需的吞吐量所必不可少的概念。

本文檔第 6 到 14 章焦點(diǎn)包括 AI 引擎計(jì)算圖編程構(gòu)造、內(nèi)核之間的數(shù)據(jù)通信類型、通過主機(jī)應(yīng)用來控制 AI 引擎計(jì)算圖以及高級(jí)計(jì)算圖編程構(gòu)造。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 處理器
    +關(guān)注

    關(guān)注

    68

    文章

    19896

    瀏覽量

    235254
  • AI
    AI
    +關(guān)注

    關(guān)注

    88

    文章

    35164

    瀏覽量

    279980
  • 機(jī)器學(xué)習(xí)

    關(guān)注

    66

    文章

    8503

    瀏覽量

    134623

原文標(biāo)題:AI 引擎機(jī)器學(xué)習(xí)內(nèi)核與計(jì)算圖編程指南

文章出處:【微信號(hào):賽靈思,微信公眾號(hào):Xilinx賽靈思官微】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    RISC-V如何支持不同的AI機(jī)器學(xué)習(xí)框架和庫?

    RISC-V如何支持不同的AI機(jī)器學(xué)習(xí)框架和庫?還請(qǐng)壇友們多多指教一下。
    發(fā)表于 10-10 22:24

    信而泰×DeepSeek:AI推理引擎驅(qū)動(dòng)網(wǎng)絡(luò)智能診斷邁向 “自愈”時(shí)代

    DeepSeek-R1:強(qiáng)大的AI推理引擎底座DeepSeek是由杭州深度求索人工智能基礎(chǔ)技術(shù)研究有限公司開發(fā)的新一代AI大模型。其核心優(yōu)勢(shì)在于強(qiáng)大的推理引擎能力,融合了自然語言處理(
    發(fā)表于 07-16 15:29

    機(jī)器學(xué)習(xí)實(shí)踐指南——案例應(yīng)用解析

    機(jī)器學(xué)習(xí)實(shí)踐指南——案例應(yīng)用解析
    發(fā)表于 04-13 16:40

    Firefly支持AI引擎Tengine,性能提升,輕松搭建AI計(jì)算框架

    `Tengine 是OPEN AI LAB 為嵌入式設(shè)備開發(fā)的一個(gè)輕量級(jí)、高性能并且模塊化的引擎。基于ARM平臺(tái)高效的計(jì)算庫實(shí)現(xiàn),針對(duì)特定硬件平臺(tái)的性能優(yōu)化,吸取已有AI計(jì)算框架的優(yōu)點(diǎn),設(shè)計(jì)全新
    發(fā)表于 08-13 15:58

    AI學(xué)習(xí)AI概論:(Part-A)與AI智慧交流

    人機(jī)界面---基于Excel+Python任務(wù)三:觀察事物,提取特征任務(wù)四:如何把特征傳遞給AI---邁入機(jī)器學(xué)習(xí)任務(wù)五:傳遞你觀察到的新特征任務(wù)六:觀察特征的更多(新的組合)任務(wù)七:觀察更多食物和特征任務(wù)八:創(chuàng)作你自己的
    發(fā)表于 10-30 14:04

    AI概論: <TensorFlow + Excel>可操作教案(Part-C:AI(機(jī)器)是如何學(xué)習(xí)呢?)

    任務(wù)十四:從您孰悉的出發(fā)任務(wù)十五:認(rèn)識(shí)AI術(shù)語-- 權(quán)重(Weight)任務(wù)十六:簡(jiǎn)單的權(quán)重運(yùn)算-- 兩兩相乘&求和任務(wù)十七:訓(xùn)練(機(jī)器學(xué)習(xí))-- AI開始任務(wù)十八:創(chuàng)作您的
    發(fā)表于 12-02 14:12

    最值得學(xué)習(xí)機(jī)器學(xué)習(xí)編程語言

    如果你對(duì)人工智能和機(jī)器學(xué)習(xí)感興趣,而且正在積極地規(guī)劃著自己的程序員職業(yè)生涯,那么你肯定面臨著一個(gè)問題:你應(yīng)該學(xué)習(xí)哪些編程語言,才能真正了解并掌握 AI
    發(fā)表于 03-02 06:22

    AI+機(jī)器學(xué)習(xí):推動(dòng)AI應(yīng)用產(chǎn)業(yè)化,加快機(jī)器學(xué)習(xí)步伐

    毫不客氣地說,人工智能(AI)和機(jī)器學(xué)習(xí)(ML)已然“滲透”到了各行各業(yè),企業(yè)們期待通過機(jī)器學(xué)習(xí)基礎(chǔ)架構(gòu)平臺(tái),以推動(dòng)人工智能在業(yè)務(wù)中的利用。
    的頭像 發(fā)表于 07-03 11:45 ?3028次閱讀

    賽靈思AI引擎簡(jiǎn)介

    在部分賽靈思 Versal ACAP 中包含了 AI 引擎。這些 AI 引擎可排列組合為一組與內(nèi)存、數(shù)據(jù)流和級(jí)聯(lián)接口相連的二維AI
    的頭像 發(fā)表于 09-03 09:35 ?3755次閱讀

    火山引擎機(jī)器學(xué)習(xí)平臺(tái)與NVIDIA加深合作

    隨著 AI 在醫(yī)療健康和生命科學(xué)領(lǐng)域應(yīng)用的不斷增加,GPU 算力的需求迅猛增長(zhǎng)。火山引擎機(jī)器學(xué)習(xí)平臺(tái)在 NVIDIA A100 Tensor Core GPU 的硬件基礎(chǔ)架構(gòu)之上,基于
    的頭像 發(fā)表于 07-05 08:59 ?1306次閱讀

    AI引擎架構(gòu)和陣列編程要求

    Versal AI Core 系列可借助 AI 引擎提供突破性的 AI 推斷加速。此系列應(yīng)用范圍廣泛,包括用于云端動(dòng)態(tài)工作負(fù)載以及超高帶寬網(wǎng)絡(luò),同時(shí)還可提供高級(jí)安全性功能。
    的頭像 發(fā)表于 12-08 09:18 ?1310次閱讀

    Versal ACAP AI引擎編程環(huán)境用戶指南

    電子發(fā)燒友網(wǎng)站提供《Versal ACAP AI引擎編程環(huán)境用戶指南.pdf》資料免費(fèi)下載
    發(fā)表于 09-14 10:10 ?0次下載
    Versal ACAP <b class='flag-5'>AI</b><b class='flag-5'>引擎</b>編程環(huán)境用戶<b class='flag-5'>指南</b>

    AI引擎內(nèi)核編碼最佳實(shí)踐指南

    電子發(fā)燒友網(wǎng)站提供《AI引擎內(nèi)核編碼最佳實(shí)踐指南.pdf》資料免費(fèi)下載
    發(fā)表于 09-14 14:58 ?0次下載
    <b class='flag-5'>AI</b><b class='flag-5'>引擎</b>內(nèi)核編碼最佳實(shí)踐<b class='flag-5'>指南</b>

    AI引擎內(nèi)核與計(jì)算圖編程指南

    電子發(fā)燒友網(wǎng)站提供《AI引擎內(nèi)核與計(jì)算圖編程指南.pdf》資料免費(fèi)下載
    發(fā)表于 01-03 10:50 ?0次下載
    <b class='flag-5'>AI</b><b class='flag-5'>引擎</b>內(nèi)核與計(jì)算圖編程<b class='flag-5'>指南</b>

    面向AI機(jī)器學(xué)習(xí)應(yīng)用的開發(fā)平臺(tái) AMD/Xilinx Versal? AI Edge VEK280

    解讀: *附件:VEK280_用戶指南 開發(fā)手冊(cè).pdf 一、核心配置與架構(gòu) ? 自適應(yīng)SoC芯片 基于AMD Versal? AI Edge系列VE2802自適應(yīng)SoC,集成AI引擎
    的頭像 發(fā)表于 04-11 18:33 ?1325次閱讀
    面向<b class='flag-5'>AI</b>與<b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>應(yīng)用的開發(fā)平臺(tái) AMD/Xilinx Versal? <b class='flag-5'>AI</b> Edge VEK280