一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

用于有效使用TinyML的隨機計算架構(gòu)

星星科技指導(dǎo)員 ? 來源:嵌入式計算設(shè)計 ? 作者:Abhishek Jadhav ? 2022-07-11 09:20 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

神經(jīng)網(wǎng)絡(luò)是一種流行的機器學(xué)習(xí)模型,但它們需要更高的能耗和更復(fù)雜的硬件設(shè)計。隨機計算是平衡硬件效率和計算性能之間權(quán)衡的一種有效方式。然而,由于算術(shù)單元的低數(shù)據(jù)精度和不準(zhǔn)確性,隨機計算見證了 ML 工作負載的低準(zhǔn)確性。

為了解決與傳統(tǒng)隨機計算方法相關(guān)的問題,并通過更高的精度和更低的功耗來提高性能,正在進行的研究提出了一種改進的基于塊的隨機計算架構(gòu)。通過在輸入層中引入塊,可以通過利用高數(shù)據(jù)并行性來減少延遲。更重要的是確定全局優(yōu)化方法所需要的塊數(shù)。

現(xiàn)有的方法包括增加比特流的長度以提高數(shù)據(jù)精度,甚至使用指數(shù)比特來獲得準(zhǔn)確的結(jié)果。然而,這引入了較長的計算延遲,這對于 TinyML 應(yīng)用程序來說是不合理的。因此,為了應(yīng)對這種不斷上升的計算延遲,比特流被分成塊然后并行執(zhí)行。結(jié)合塊內(nèi)算術(shù)單元和輸出修正 (OUR) 方案可緩解塊間不準(zhǔn)確問題,從而提供高計算效率。

基于塊的隨機計算架構(gòu)

研究提供了一種新穎的架構(gòu),其中輸入被劃分為塊并使用優(yōu)化的塊內(nèi)算術(shù)單元并行執(zhí)行乘法和加法。此外,在 TinyML 應(yīng)用程序的延遲-功耗權(quán)衡方面,所提出的模型是一個出色的架構(gòu)。

架構(gòu)劃分如下:

塊劃分

如上圖所示,輸入比特流被劃分為“k”個值塊。所提出的想法是,為比特流選擇大量塊并不能保證是最佳的,但可以用于接近近似值。如果在選擇塊數(shù)時出現(xiàn)錯誤,這可能會自相矛盾地導(dǎo)致大錯誤。在確定來自輸入比特流的正和負部分的兩個平均值的概率方面存在復(fù)雜的計算。

塊內(nèi)計算

緩解了傳統(tǒng)加法器面臨的OR加法器相關(guān)問題和分離加法器溢出問題。新修改的架構(gòu)設(shè)計在輸入之間帶有 XNOR+AND 門,以消除雙極計算的相關(guān)性。

每個輸入位都在并行計數(shù)器 (PC) 中獲取,對于正負部分 (Ap, An) 分別進行處理。有兩個專用累加器用于處理有符號位。取輸入位后,累加器之間發(fā)生減法,如正負部分所示。目標(biāo)是獲得所有輸入的累積 1 的數(shù)量。進一步地,比較取時間輸出(Sop,Son)中的一位,在多個“n”個循環(huán)之后,計算符號位,并根據(jù)符號位Ap和An,選擇Sop和Son的輸出結(jié)果。

這種新的基于累加器的符號幅度格式加法器利用 unNSADD 加法器來比較輸出和輸入中的實際累加 1 以確定輸出位。這種方法消除了相關(guān)性和快速溢出問題的影響。

塊間??輸出修正方案

盡管塊內(nèi)加法器解決了相關(guān)性和溢出問題,但塊劃分引入了新的塊間不準(zhǔn)確錯誤。乘法器不會發(fā)生這種情況,因為輸入是 XNORed 和 ANDed。但是對于加法器,輸出中 1 的數(shù)量可能會偏離所產(chǎn)生的不準(zhǔn)確性。輸出修訂方案在并行塊內(nèi)計算階段之后添加或刪除 1s,而不會引入任何額外的延遲來解決這些塊間不準(zhǔn)確錯誤。

新穎的基于塊的隨機計算架構(gòu)旨在提高隨機計算運算電路的精度,同時降低計算延遲和能源效率。根據(jù)研究結(jié)果,該方法比現(xiàn)有方法的準(zhǔn)確度提高了 10% 以上,并節(jié)省了 6 倍以上的功率。

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    芯片功能安全必修課 FMEDA量化分析的最佳實踐

    Analysis),用于評估芯片架構(gòu)處理隨機硬件失效的有效性和評估芯片架構(gòu)隨機失效的概率足夠低
    的頭像 發(fā)表于 07-07 14:28 ?170次閱讀
    芯片功能安全必修課  FMEDA量化分析的最佳實踐

    GPU架構(gòu)深度解析

    GPU架構(gòu)深度解析從圖形處理到通用計算的進化之路圖形處理單元(GPU),作為現(xiàn)代計算機中不可或缺的一部分,已經(jīng)從最初的圖形渲染專用處理器,發(fā)展成為強大的并行計算引擎,廣泛應(yīng)
    的頭像 發(fā)表于 05-30 10:36 ?368次閱讀
    GPU<b class='flag-5'>架構(gòu)</b>深度解析

    Arm架構(gòu)何以成為現(xiàn)代計算的基礎(chǔ)

    2025 年 4 月,Arm 架構(gòu)迎來了問世 40 周年。這個始于英國劍橋一隅、懷揣雄心壯志的項目,如今已成為全球廣泛采用的計算架構(gòu)。從傳感器、智能手機、筆記本電腦,到汽車、數(shù)據(jù)中心等諸多領(lǐng)域,有數(shù)十億設(shè)備如今運行在 Arm
    的頭像 發(fā)表于 05-20 10:02 ?486次閱讀

    揭秘云計算架構(gòu)的分層奧秘

    的重要基石。那么,云計算架構(gòu)究竟是如何構(gòu)建的呢?今天,我們帶您揭秘云計算架構(gòu)的分層奧秘——邊緣層、IaaS、PaaS、SaaS。
    的頭像 發(fā)表于 02-26 17:41 ?512次閱讀

    熵基科技實現(xiàn)BioCV TinyML與DeepSeek大模型融合

    近日,熵基科技宣布了一項重大技術(shù)突破。該公司自主研發(fā)的“BioCV TinyML模型”已成功與全球知名的LLM大模型DeepSeek實現(xiàn)接入與融合。 這一融合成果不僅彰顯了熵基科技在智能物聯(lián)和智慧
    的頭像 發(fā)表于 02-19 16:15 ?798次閱讀

    HPC云計算的技術(shù)架構(gòu)

    HPC云計算結(jié)合了HPC的強大計算能力和云計算的彈性、可擴展性,為用戶提供了按需獲取高性能計算資源的便利。下面,AI部落小編帶您了解HPC云計算
    的頭像 發(fā)表于 02-05 14:51 ?385次閱讀

    ADS1282是32位ADC,在計算對紋波要求的時候,LSB按照32位計算,還是按照有效位數(shù)計算

    ADS1282是32位ADC,那么在計算對紋波要求的時候,LSB按照32位計算,還是按照有效位數(shù)計算(有效位數(shù)才20位)。
    發(fā)表于 12-04 08:36

    開源芯片系列講座第24期:基于SRAM存算的高效計算架構(gòu)

    鷺島論壇開源芯片系列講座第24期「基于SRAM存算的高效計算架構(gòu)」明晚(27日)20:00精彩開播期待與您云相聚,共襄學(xué)術(shù)盛宴!|直播信息報告題目基于SRAM存算的高效計算架構(gòu)報告簡介
    的頭像 發(fā)表于 11-27 01:05 ?847次閱讀
    開源芯片系列講座第24期:基于SRAM存算的高效<b class='flag-5'>計算</b><b class='flag-5'>架構(gòu)</b>

    ads1256有效位數(shù)怎么計算

    您好,對于ADS1256有效位數(shù)的計算,數(shù)據(jù)手冊給出的測試公式是怎么推到出來的呢?能夠幫我推到出來嗎?對于第一張圖中rms的計算是怎么出來的?
    發(fā)表于 11-22 07:07

    用于MySQL的dbForge架構(gòu)比較

    dbForge Schema Compare for MySQL 是一種工具,用于輕松有效地比較和部署 MySQL 數(shù)據(jù)庫結(jié)構(gòu)和腳本文件夾差異。該工具提供了 MySQL 數(shù)據(jù)庫架構(gòu)中所有差異的全面視圖。
    的頭像 發(fā)表于 10-28 09:41 ?570次閱讀
    適<b class='flag-5'>用于</b>MySQL的dbForge<b class='flag-5'>架構(gòu)</b>比較

    邊緣計算架構(gòu)設(shè)計最佳實踐

    邊緣計算架構(gòu)設(shè)計最佳實踐涉及多個方面,以下是一些關(guān)鍵要素和最佳實踐建議: 一、核心組件與架構(gòu)設(shè)計 邊緣設(shè)備與網(wǎng)關(guān) 邊緣設(shè)備 :包括各種嵌入式設(shè)備、傳感器、智能手機、智能攝像頭等,負責(zé)采集原始數(shù)據(jù)
    的頭像 發(fā)表于 10-24 14:17 ?1101次閱讀

    內(nèi)存儲器分為隨機存儲器和什么

    內(nèi)存儲器是計算機系統(tǒng)中用于臨時存儲數(shù)據(jù)和程序的關(guān)鍵部件,它直接影響到計算機的運行速度和性能。內(nèi)存儲器主要分為兩大類:隨機存儲器(RAM,Random Access Memory)和只讀
    的頭像 發(fā)表于 10-14 09:54 ?2878次閱讀

    閃存隨機讀寫與連續(xù)讀寫哪個重要

    快速響應(yīng)的應(yīng)用中,如數(shù)據(jù)庫操作、服務(wù)器處理請求等,隨機讀寫速度至關(guān)重要。 多任務(wù)處理能力 : 隨機讀寫能力強的閃存能夠更有效地處理多個并發(fā)任務(wù),因為它們可以更快地訪問和修改存儲在不同位置的數(shù)據(jù)。 連續(xù)讀寫的重要性 大數(shù)據(jù)傳輸 :
    的頭像 發(fā)表于 10-12 11:44 ?1056次閱讀

    用于控制和保護的HVDC架構(gòu)和解決方案簡介

    電子發(fā)燒友網(wǎng)站提供《用于控制和保護的HVDC架構(gòu)和解決方案簡介.pdf》資料免費下載
    發(fā)表于 09-04 09:24 ?1次下載
    <b class='flag-5'>用于</b>控制和保護的HVDC<b class='flag-5'>架構(gòu)</b>和解決方案簡介

    瑞薩電子推出Reality AI Explorer Tier,用于開發(fā)AI與TinyML解決方案

    全球半導(dǎo)體解決方案供應(yīng)商瑞薩電子(TSE:6723)宣布推出Reality AI Explorer Tier——作為Reality AI Tools軟件的免費版本,可用于開發(fā)工業(yè)、汽車和商業(yè)應(yīng)用中的AI與TinyML解決方案。
    的頭像 發(fā)表于 07-19 10:03 ?734次閱讀