一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

一種用于AI視覺處理芯片的驗(yàn)證加速方案

路科驗(yàn)證 ? 來源:路科驗(yàn)證 ? 作者:路科驗(yàn)證 ? 2023-03-28 16:41 ? 次閱讀

介紹

本文中所涉及的AI邊緣推斷視覺處理芯片的實(shí)際用例都較為復(fù)雜,而且也需要牽扯到多個(gè)模塊參與,例如攝像頭輸入、多通道數(shù)據(jù)的媒體編解碼、圖像處理、多顯示支持等。要去協(xié)調(diào)這么多的模塊,還要將它們與神經(jīng)網(wǎng)絡(luò)算法結(jié)合構(gòu)建用例。

由于對(duì)系統(tǒng)中各個(gè)硬件要素的協(xié)調(diào)調(diào)度要求較多,AI視覺處理芯片需要更多使用固件去進(jìn)行測(cè)試,這對(duì)于從IP/子系統(tǒng)層的測(cè)試用例到系統(tǒng)層的移植、以及在早期階段獲得較為準(zhǔn)確的性能數(shù)據(jù)和功耗數(shù)據(jù)都提出了要求。這篇論文提供了一個(gè)作者在功能、性能和功耗這三個(gè)方面的硬件加速驗(yàn)證方案。

問題闡述

不同于常見的SoC在數(shù)據(jù)傳輸和控制上的測(cè)試方案,AI視覺處理芯片往往需要結(jié)合多個(gè)高帶寬的多媒體控制器發(fā)起多個(gè)數(shù)據(jù)幀,模擬真實(shí)應(yīng)用。而這么大的數(shù)據(jù)處理量,仿真往往會(huì)受制于仿真性能無法有較好的表現(xiàn),所以在AI芯片驗(yàn)證方面,如果想要測(cè)試真實(shí)場(chǎng)景,那么就需要將固件在硬件加速器(emulator)上去處理。

由于功能、性能、功耗三個(gè)方面的驗(yàn)證在工具層面都缺少統(tǒng)一的平臺(tái)做處理,而且不同形式的測(cè)試向量和方法學(xué)也讓這些測(cè)試場(chǎng)景無法做到自動(dòng)化映射。從工程實(shí)現(xiàn)角度考慮,一個(gè)需求是把功能測(cè)試的數(shù)據(jù)能夠給到性能分析和功耗評(píng)估,另外一個(gè)需求是將IP/子系統(tǒng)層面的測(cè)試用例能夠給到SoC層面測(cè)試。

功能驗(yàn)證方案

下方給出了在采用固件驗(yàn)證的情況下的測(cè)試方案。固件在早期驗(yàn)證中,可能使用的是例如SystemC/C++這類的純軟件測(cè)試平臺(tái),在此基礎(chǔ)上他們可以提供早期的固件和十六進(jìn)制文件(在后期的硬件加速測(cè)試中使用)。同時(shí),在IP/子系統(tǒng)硬件加速測(cè)試中,可以根據(jù)測(cè)試文件(二進(jìn)制文件和log文件)做后處理繼而獲得測(cè)試中的硬件配置數(shù)據(jù)和圖形文件。

在接下來的SoC emulation,可以將從早期軟件測(cè)試中固件、IP/子系統(tǒng)emulation中提取的硬件配置、圖形文件共同作為SoC測(cè)試中的元素,讓他們用來盡可能實(shí)現(xiàn)從IP/子系統(tǒng)到SoC的測(cè)試場(chǎng)景移植。 接下來可以利用emulator中的總線監(jiān)測(cè)組件,獲得總線傳輸數(shù)據(jù),并將這些數(shù)據(jù)信息交由Python腳本去做處理,以便達(dá)到數(shù)據(jù)比較、性能監(jiān)測(cè)等目的。

7a7f12dc-cd41-11ed-bfe3-dac502259ad0.png

這個(gè)方案意味著測(cè)試從大的層面來看,是以最終通過固件測(cè)試為目的,也就是說從一開始構(gòu)建測(cè)試場(chǎng)景時(shí),就需要固件的人參與其中。這就不得不考慮在開發(fā)AI視覺芯片時(shí)的驗(yàn)證分工協(xié)作的場(chǎng)景不單單是simulation、emulation參與在內(nèi),也同樣需要固件。盡管一開始硬件可能還不穩(wěn)定,需要simulation/emulation讓硬件逐步穩(wěn)定,但固件的人只要前期有SystemC/C++這樣的模型在的話也可以在早期做固件有關(guān)的測(cè)試準(zhǔn)備。

這一點(diǎn)挺重要的,如果固件的人直到emulation階段才參與進(jìn)來的話,那么也就沒有上面方案里的Software Testbench部分了,所有的信息都只能等到IP/子系統(tǒng)emulation階段得出。更甚至,如果在IP/子系統(tǒng)emulation階段沒有固件參與的話,那么在SoC層面去做固件相關(guān)的測(cè)試,從開發(fā)固件測(cè)試用例到做參考比較都會(huì)延緩測(cè)試進(jìn)度。更為推薦的是固件也有條件在某個(gè)測(cè)試平臺(tái)(software testbench、IP/subsys emulation testbench)完成測(cè)試。

還有一點(diǎn),在IP/subsys階段的測(cè)試,方案中是通過測(cè)試中的bin文件、log文件來做后處理,繼而生成SoC層面可以使用的配置。這一點(diǎn)不同于我們以往所理解的將測(cè)試文件從IP/subsys到SoC階段的修改移植??赡苁菫榱藢?shí)現(xiàn)準(zhǔn)確的、自動(dòng)化的配置參數(shù),它是按照后處理的方式,提取出來對(duì)目標(biāo)硬件做的各項(xiàng)配置,這些提取的信息可能按照某個(gè)格式做了中間信息的保存,并且結(jié)合SoC的結(jié)構(gòu)特征,做了自動(dòng)化的配置測(cè)試生成。

在SoC emulation階段,利用的是內(nèi)置的總線監(jiān)測(cè)(可能有多個(gè)),周期性地獲得數(shù)據(jù),并完成數(shù)據(jù)完整性檢查(可能在測(cè)試中或者測(cè)試后通過Python腳本完成)。

性能分析方案

在性能分析時(shí),也需要利用測(cè)試場(chǎng)景的移植(porting)和分析時(shí)的多個(gè)深度。從IP/subsys到SoC的移植,就性能分析而言分為了3個(gè)階段。 第1階段即是將IP/subsys的傳輸數(shù)據(jù)移植到SoC層面,這一點(diǎn)可以利用IP/subsys emulation過程中l(wèi)og文件的后處理來獲得。 第2階段是將IP/subsys的固件移植到SoC層面,這一點(diǎn)也可以利用“功能驗(yàn)證方案”中已有的“software testbench”信息。 第3階段是為了讓多個(gè)多媒體控制器、接口的數(shù)據(jù)信息能夠并行運(yùn)行以期達(dá)到真實(shí)的、大規(guī)模的數(shù)據(jù)吞吐。這種場(chǎng)景需要文中提到的一個(gè)特殊的混合方法(unique hybrid methodology),共同利用數(shù)據(jù)網(wǎng)絡(luò)(network)和固件,將多個(gè)多媒體控制器充分并行調(diào)動(dòng),構(gòu)建復(fù)雜的測(cè)試場(chǎng)景。

7aa67de0-cd41-11ed-bfe3-dac502259ad0.png ?

功耗估測(cè)方案

在功耗估測(cè)中,需要考慮的是相比于通常在仿真中收集功耗有關(guān)數(shù)據(jù),如何在emulation中收集數(shù)據(jù),并且做到準(zhǔn)確的、快速的功耗分析。在下面的方案中,利用了波形數(shù)據(jù)獲得開關(guān)信息文件SAIF,并結(jié)合power engine去獲得平均功耗和峰值功耗(論文并沒有就power engine給出詳細(xì)的信息)。 這里附贈(zèng)一篇文章: 《Using Emulators For Power/Performance Tradeoffs》 https://semiengineering.com/using-emulators-for-power-performance-tradeoffs/

7ac2c7fc-cd41-11ed-bfe3-dac502259ad0.png

結(jié)果分析

受益于可以從IP/subsys層將測(cè)試用例有關(guān)的數(shù)據(jù)自動(dòng)遷移到SoC級(jí),使得與VPU(視覺處理單元)、DMA、ISP(Image Signal Processing)有關(guān)的測(cè)試用例能夠在4周的時(shí)間完成交付。這里的測(cè)試用例遷移我們應(yīng)該吸取文章中的經(jīng)驗(yàn),那就是它不是從測(cè)試用例自身文本的遷移去實(shí)現(xiàn)的,而是通過log/bin文件的后處理,獲得某種中間型的標(biāo)準(zhǔn)信息文件,再結(jié)合系統(tǒng)測(cè)試的環(huán)境配置數(shù)據(jù),最終生成SoC測(cè)試用例。

從發(fā)現(xiàn)的bug類型來看,有接近40%來自于固件級(jí)別的測(cè)試,這也突出了AI類芯片在測(cè)試時(shí)需要結(jié)合實(shí)際場(chǎng)景的需求,畢竟整個(gè)系統(tǒng)的調(diào)動(dòng)牽扯很多模塊,需要固件人員在早期就能夠參與進(jìn)來。這也進(jìn)一步突出了如何規(guī)劃一個(gè)跨平臺(tái)的方案在系統(tǒng)級(jí)測(cè)試上面有多么重要,我們不應(yīng)該被SV/UVM/C所限制,也應(yīng)該考慮如何讓這個(gè)測(cè)試平臺(tái)能夠被更多的人所使用。

7adaf46c-cd41-11ed-bfe3-dac502259ad0.png

相比于SoC仿真動(dòng)輒需要用2天左右的時(shí)間完成某一個(gè)固件級(jí)的測(cè)試用例,emulation僅需要大概90分鐘的時(shí)間即能夠完成測(cè)試,并且更快地將性能數(shù)據(jù)反饋給架構(gòu)組合設(shè)計(jì)組。在將simulation與emulation對(duì)比過程中,無論是固件測(cè)試用例數(shù)量、可支持?jǐn)?shù)據(jù)幀的數(shù)目還是數(shù)據(jù)保存時(shí)間窗口,emulation的優(yōu)勢(shì)都更為明顯。

7aea8a76-cd41-11ed-bfe3-dac502259ad0.png

而在功耗評(píng)估中,emualtion的功耗評(píng)估數(shù)據(jù)準(zhǔn)確度與傳統(tǒng)的功耗分析工具差別大致在5%以內(nèi),而所消耗的時(shí)間則顯著縮短(大致是傳統(tǒng)功耗分析工具的125倍)。論文這里仍然沒有給出消耗時(shí)間的計(jì)算方式,是否包含了每個(gè)測(cè)試用例在simulation與emulation的耗時(shí)差別,還是只是包含了兩種工具用于功耗評(píng)估的時(shí)間。如果是后者的話,那么文中的power engine可能是內(nèi)部開發(fā)的工具了,線索在文章的引文中(有一篇“pre-silicon power estimation methodology using emulation”,也一并在論文下載鏈接中提供)。

給出的參考論文來自于SNUG India 2020,而在2021年的時(shí)候Synopsys推出了業(yè)界第一款用來對(duì)運(yùn)行真實(shí)軟件做功耗驗(yàn)證(hardware+software)的工具ZeBu Empower。 https://www.synopsys.com/verification/emulation/zebu-empower.html

7b16ff3e-cd41-11ed-bfe3-dac502259ad0.png

7b2fd874-cd41-11ed-bfe3-dac502259ad0.png

Fastest Power Emulation for Hardware-Software Power Verification

7b3cfe28-cd41-11ed-bfe3-dac502259ad0.png






審核編輯:劉清

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 控制器
    +關(guān)注

    關(guān)注

    114

    文章

    16838

    瀏覽量

    182289
  • soc
    soc
    +關(guān)注

    關(guān)注

    38

    文章

    4303

    瀏覽量

    221096
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    33554

    瀏覽量

    274263
  • 硬件加速器
    +關(guān)注

    關(guān)注

    0

    文章

    42

    瀏覽量

    12959
  • 視覺處理芯片
    +關(guān)注

    關(guān)注

    2

    文章

    10

    瀏覽量

    6695

原文標(biāo)題:DVCon文賞-2023w14 一種用于AI視覺處理芯片的驗(yàn)證加速方案

文章出處:【微信號(hào):Rocker-IC,微信公眾號(hào):路科驗(yàn)證】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    AI MPU# 瑞薩RZ/V2H 四核視覺 ,采用 DRP-AI3 加速器和高性能實(shí)時(shí)處理

    RZ/V2H 高端 AI MPU 采用瑞薩電子專有的AI 加速器-動(dòng)態(tài)可重配置處理器 (DRP-AI3)、四核 Arm^?^ Cortex
    的頭像 發(fā)表于 03-15 11:50 ?1174次閱讀
    <b class='flag-5'>AI</b> MPU# 瑞薩RZ/V2H 四核<b class='flag-5'>視覺</b> ,采用 DRP-<b class='flag-5'>AI</b>3 <b class='flag-5'>加速</b>器和高性能實(shí)時(shí)<b class='flag-5'>處理</b>器

    AI Agent 應(yīng)用與項(xiàng)目實(shí)戰(zhàn)》----- 學(xué)習(xí)如何開發(fā)視頻應(yīng)用

    再次感謝發(fā)燒友提供的閱讀體驗(yàn)活動(dòng)。本期跟隨《AI Agent 應(yīng)用與項(xiàng)目實(shí)戰(zhàn)》這本書學(xué)習(xí)如何構(gòu)建開發(fā)個(gè)視頻應(yīng)用。AI Agent是一種智能應(yīng)用,能夠根據(jù)用戶需求和環(huán)境變化做出相應(yīng)響應(yīng)
    發(fā)表于 03-05 19:52

    FPGA+AI王炸組合如何重塑未來世界:看看DeepSeek東方神秘力量如何預(yù)測(cè)......

    起暢想! 、關(guān)于FPGA的前世今生——“無處不在的加速引擎”我們首先文科普什么是FPGA?FPGA(Field-Programmable Gate Array,現(xiàn)場(chǎng)可編程門陣列)是一種
    發(fā)表于 03-03 11:21

    文詳解視覺語言模型

    視覺語言模型(VLM)是一種多模態(tài)、生成式 AI 模型,能夠理解和處理視頻、圖像和文本。
    的頭像 發(fā)表于 02-12 11:13 ?1197次閱讀
    <b class='flag-5'>一</b>文詳解<b class='flag-5'>視覺</b>語言模型

    一種使用LDO簡(jiǎn)單電源電路解決方案

    本期我們介紹一種使用LDO簡(jiǎn)單電源電路解決方案,該方案可以處理12V/24V、多節(jié)鋰離子電池和4節(jié)干電池等相對(duì)較高的輸入電壓。
    的頭像 發(fā)表于 12-04 16:05 ?665次閱讀
    <b class='flag-5'>一種</b>使用LDO簡(jiǎn)單電源電路解決<b class='flag-5'>方案</b>

    面向視覺 AI 應(yīng)用的全新 MPU 平臺(tái):瑞薩RZ/V2H MPU

    視覺 AI 是發(fā)展最快的嵌入式人工智能學(xué)科之,它加入了 AI 增強(qiáng)的語音工具和實(shí)時(shí)分析,成為快速收集、處理和訓(xùn)練大量數(shù)據(jù)的
    的頭像 發(fā)表于 11-22 15:08 ?793次閱讀

    BitEnergy AI公司開發(fā)出一種AI處理方法

    BitEnergy AI公司,家專注于人工智能(AI)推理技術(shù)的企業(yè),其工程師團(tuán)隊(duì)創(chuàng)新性地開發(fā)了一種名為線性復(fù)雜度乘法(L-Mul)的AI
    的頭像 發(fā)表于 10-22 15:15 ?656次閱讀

    什么是AI服務(wù)器?AI服務(wù)器的優(yōu)勢(shì)是什么?

    AI服務(wù)器是一種專門為人工智能應(yīng)用設(shè)計(jì)的服務(wù)器,它采用異構(gòu)形式的硬件架構(gòu),通常搭載GPU、FPGA、ASIC等加速芯片,利用CPU與加速
    的頭像 發(fā)表于 09-21 11:43 ?1646次閱讀

    EPSON差分晶振SG3225VEN頻點(diǎn)312.5mhz應(yīng)用于AI加速

    AI加速卡,通常也被稱為AI算力卡,是一種專為加速人工智能(AI)應(yīng)用和算法而設(shè)計(jì)的硬件設(shè)備。
    發(fā)表于 09-10 14:56 ?0次下載

    AI視覺芯片技術(shù)升級(jí),加速智能終端設(shè)備迭代

    AR眼鏡。行業(yè)人士認(rèn)為,AR眼鏡有望成為AI落地的理想載體。 ? AI 眼鏡對(duì)視覺芯片的要求 ? AI智能眼鏡作為新型可穿戴設(shè)備,既強(qiáng)調(diào)眼鏡
    的頭像 發(fā)表于 08-21 00:22 ?4313次閱讀

    基于瑞薩RZ/V2H AI處理器的解決方案:高性能視覺AI系統(tǒng)

    復(fù)雜的實(shí)時(shí)物體識(shí)別及推理,同時(shí)功耗可與傳統(tǒng)的嵌入式MPU相媲美,無需冷卻風(fēng)扇。這里介紹基于RZ/V2H的解決方案:高性能視覺AI系統(tǒng)。
    發(fā)表于 07-02 18:36 ?770次閱讀
    基于瑞薩RZ/V2H <b class='flag-5'>AI</b>微<b class='flag-5'>處理</b>器的解決<b class='flag-5'>方案</b>:高性能<b class='flag-5'>視覺</b><b class='flag-5'>AI</b>系統(tǒng)

    PROPHESEE 攜手 AMD,推出業(yè)界首款兼容 Kria? KV260 視覺 AI 入門套件的事件視覺解決方案

    基于 Prophesee Metavision? 事件視覺傳感器和 AI算法在性能、功耗及速度上的優(yōu)勢(shì),開發(fā)人員現(xiàn)可打造支持 AMD 平臺(tái)的全新代邊緣 AI 機(jī)器
    發(fā)表于 05-30 10:41 ?1094次閱讀
    PROPHESEE 攜手 AMD,推出業(yè)界首款兼容 Kria? KV260 <b class='flag-5'>視覺</b> <b class='flag-5'>AI</b> 入門套件的事件<b class='flag-5'>視覺解決方案</b>

    AI視覺檢測(cè)系統(tǒng)在多方面實(shí)現(xiàn)技術(shù)創(chuàng)新

    電子發(fā)燒友網(wǎng)報(bào)道(文/李彎彎)AI視覺檢測(cè)系統(tǒng)是一種基于AI技術(shù)的視覺分析系統(tǒng),它通過模擬人類視覺
    的頭像 發(fā)表于 05-24 00:16 ?3735次閱讀

    NVIDIA發(fā)布DeepStream 7.0,助力下視覺AI開發(fā)

    NVIDIA DeepStream 是款功能強(qiáng)大的 SDK,能夠提供用于構(gòu)建端到端視覺 AI 管線的 GPU 加速構(gòu)建模塊。
    的頭像 發(fā)表于 05-23 10:09 ?1040次閱讀
    NVIDIA發(fā)布DeepStream 7.0,助力下<b class='flag-5'>一</b>代<b class='flag-5'>視覺</b><b class='flag-5'>AI</b>開發(fā)

    如何通過視覺檢測(cè)確保eMMC存儲(chǔ)芯片質(zhì)量?

    eMMC(嵌入式多媒體卡)存儲(chǔ)芯片一種集成式的存儲(chǔ)解決方案,通常用于嵌入式系統(tǒng)、智能手機(jī)、平板電腦、相機(jī)和其他便攜式設(shè)備中。eMMC存儲(chǔ)芯片
    的頭像 發(fā)表于 05-22 17:33 ?1095次閱讀
    如何通過<b class='flag-5'>視覺</b>檢測(cè)確保eMMC存儲(chǔ)<b class='flag-5'>芯片</b>質(zhì)量?