一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

電子發(fā)燒友App

硬聲App

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示
創(chuàng)作
電子發(fā)燒友網(wǎng)>電子資料下載>電子資料>EMLL高性能端側(cè)機器學(xué)習(xí)計算庫

EMLL高性能端側(cè)機器學(xué)習(xí)計算庫

2022-06-17 | zip | 0.39 MB | 次下載 | 2積分

資料介紹

授權(quán)協(xié)議 Apache
開發(fā)語言 C/C++
軟件類型 開源軟件

軟件簡介

EMLL(Edge ML Library)為加速終端側(cè)設(shè)備上機器學(xué)習(xí)的推理而設(shè)計,提供基于端側(cè)處理器的高性能機器學(xué)習(xí)計算函數(shù)庫。EMLL支持fp32、fp16、int8等數(shù)據(jù)類型,已在有道詞典筆、翻譯王和超級詞典等硬件產(chǎn)品的機器翻譯和語音識別引擎中應(yīng)用,大幅降低了推理延遲。

特點

高性能

EMLL實現(xiàn)的矩陣乘法函數(shù),為端側(cè)人工智能中常見的扁平矩陣作了專門的優(yōu)化,為各常見ARM處理器作了特定的優(yōu)化。對于cortex-A35/A53/A55處理器,本庫針對它們的流水線特點,使用了匯編級別的優(yōu)化。

下面是單精度矩陣乘法的測試結(jié)果:

pYYBAGKn_kyADgnxAAHOehhaBFM978.png

矩陣乘法的通式為 C[MxN] = A[MxK] B[KxN];所列數(shù)據(jù)為全行主序和全列主序的最好性能。

易用性

EMLL使用的函數(shù)接口在參數(shù)設(shè)計上力求簡潔直接,矩陣乘法去掉了不常用的LD*參數(shù),矩陣和向量的傳遞通過指針和整數(shù)維度分別傳遞。本庫的構(gòu)建和運行不依賴第三方計算庫。

擴展性

對于矩陣乘法和量化函數(shù),EMLL 庫提取了它們和架構(gòu)無關(guān)的代碼作為通用的宏,這些宏可以在支持新的CPU架構(gòu)時大大節(jié)省所需的代碼量。

EMLL 應(yīng)用接口

EMLL提供基于 C 的接口,詳情請見?Usage_ZH.md。

函數(shù)類型 函數(shù)名稱 函數(shù)參數(shù)
矩陣乘法 data_type + "gemm" 源矩陣排列順序,各矩陣地址,M,N,K,beta,并行線程數(shù)
全連接層(單精度) "fc" src/weight/bias/output的地址,M,K,N,源矩陣排列順序,(并行線程數(shù))
量化 "quantize_" + "symmetric"/"asymmetric" + input_type + output_type 輸入數(shù)組,輸出數(shù)組,(輸出零點值),縮放值,數(shù)組大小,輸入范圍
重量化 "requantize_" + "symmetric/asymmetric" + "_XtoY" 輸入數(shù)組,輸出數(shù)組,(輸出零點值),輸出縮放值,數(shù)組大小,輸入范圍
偏置 "bias" + data_type 被偏置的矩陣,標量偏置,平行于主方向的向量偏置,平行于次方向的向量偏置,矩陣大小

各函數(shù)支持的數(shù)據(jù)類型

處理器 矩陣乘法 偏置 量化 重量化
ARMv7a 32-bit fp32,(u)int8 fp32,int32 fp32 -> (u)int16/(u)int8 int32 -> (u)int16/(u)int8,int16 -> (u)int8
ARMv8a 64-bit fp32,fp16,(u)int8 fp32,int32 fp32 -> (u)int16/(u)int8 int32 -> (u)int16/(u)int8,int16 -> (u)int8

EMLL 支持在 Linux 和安卓系統(tǒng)上運行。

EMLL 支持用 GCC 和 Clang 編譯。

?

下載該資料的人也在下載 下載該資料的人還在閱讀
更多 >

評論

查看更多

下載排行

本周

  1. 1山景DSP芯片AP8248A2數(shù)據(jù)手冊
  2. 1.06 MB  |  532次下載  |  免費
  3. 2RK3399完整板原理圖(支持平板,盒子VR)
  4. 3.28 MB  |  339次下載  |  免費
  5. 3TC358743XBG評估板參考手冊
  6. 1.36 MB  |  330次下載  |  免費
  7. 4DFM軟件使用教程
  8. 0.84 MB  |  295次下載  |  免費
  9. 5元宇宙深度解析—未來的未來-風(fēng)口還是泡沫
  10. 6.40 MB  |  227次下載  |  免費
  11. 6迪文DGUS開發(fā)指南
  12. 31.67 MB  |  194次下載  |  免費
  13. 7元宇宙底層硬件系列報告
  14. 13.42 MB  |  182次下載  |  免費
  15. 8FP5207XR-G1中文應(yīng)用手冊
  16. 1.09 MB  |  178次下載  |  免費

本月

  1. 1OrCAD10.5下載OrCAD10.5中文版軟件
  2. 0.00 MB  |  234315次下載  |  免費
  3. 2555集成電路應(yīng)用800例(新編版)
  4. 0.00 MB  |  33566次下載  |  免費
  5. 3接口電路圖大全
  6. 未知  |  30323次下載  |  免費
  7. 4開關(guān)電源設(shè)計實例指南
  8. 未知  |  21549次下載  |  免費
  9. 5電氣工程師手冊免費下載(新編第二版pdf電子書)
  10. 0.00 MB  |  15349次下載  |  免費
  11. 6數(shù)字電路基礎(chǔ)pdf(下載)
  12. 未知  |  13750次下載  |  免費
  13. 7電子制作實例集錦 下載
  14. 未知  |  8113次下載  |  免費
  15. 8《LED驅(qū)動電路設(shè)計》 溫德爾著
  16. 0.00 MB  |  6656次下載  |  免費

總榜

  1. 1matlab軟件下載入口
  2. 未知  |  935054次下載  |  免費
  3. 2protel99se軟件下載(可英文版轉(zhuǎn)中文版)
  4. 78.1 MB  |  537798次下載  |  免費
  5. 3MATLAB 7.1 下載 (含軟件介紹)
  6. 未知  |  420027次下載  |  免費
  7. 4OrCAD10.5下載OrCAD10.5中文版軟件
  8. 0.00 MB  |  234315次下載  |  免費
  9. 5Altium DXP2002下載入口
  10. 未知  |  233046次下載  |  免費
  11. 6電路仿真軟件multisim 10.0免費下載
  12. 340992  |  191187次下載  |  免費
  13. 7十天學(xué)會AVR單片機與C語言視頻教程 下載
  14. 158M  |  183279次下載  |  免費
  15. 8proe5.0野火版下載(中文版免費下載)
  16. 未知  |  138040次下載  |  免費