一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

愛芯通元NPU賦能SPACEMIT

愛芯元智AXERA ? 來源:愛芯元智AXERA ? 2025-03-13 11:09 ? 次閱讀

SPACEMIT:進迭時空是一家計算芯片企業(yè),專注于研發(fā)下一代 RISC-V架構(gòu)的高性能CPU并提供軟硬一體優(yōu)化的計算解決方案。秉承進取不息、迭代不止的企業(yè)精神,公司致力于構(gòu)建“云—邊—端”架構(gòu)原生一體的下一個計算時代。

愛芯通元:以算子為原子指令集的AI計算處理器。高效支持混合精度算法設(shè)計和Transformer,為大模型(DeepSeek、Qwen、MiniCPM……)在“云—邊—端”的AI應(yīng)用提供強力基礎(chǔ)。

TLDR

模型名稱 SPACEMIT M1 SPACEMIT M1 + M.2卡
DeepSeek-R1-1.5B 5.5 tokens/s 17.0 tokens/s
(還有優(yōu)化空間)
DeepSeek-R1-7B 1.3 tokens/s 4.0 tokens/s
(還有優(yōu)化空間)

背景

最近,路邊社消息說又要大力推廣RISC-V產(chǎn)業(yè)生態(tài)了。還好提前布局,借助于AXCL項目優(yōu)秀的可移植性,已經(jīng)完成了國內(nèi)能順利買到的基于RISC-V指令集的應(yīng)用處理器開發(fā)板,同時完成內(nèi)置愛芯通元NPU的M.2算力卡適配,讓DeepSeek蒸餾模型在市面上已有的RISC-V開發(fā)板上運行更加流暢,給RISC-V生態(tài)提供了一種高性價比的AI算力拓展解決方案。

本文簡單介紹下SPACEMIT M1社區(qū)開發(fā)板加裝M.2算力卡運行DeepSeek-R1-7B模型的安裝細節(jié)和注意事項,降低大家踩坑概率。

Milk-V Jupiter

RISC-V PC for Everyone。Milk-V Jupiter由Spacemit K1/M1 SoC提供動力,是世界上第一款同時支持RVA22和RVV1.0的Mini ITX設(shè)備。本設(shè)備集成標準PCIe連接器,支持常見PCIe器件,如顯卡、PCIe轉(zhuǎn)SATA適配器、網(wǎng)卡等。它具有雙千兆以太網(wǎng)接口,板載Wi-Fi 6/BT 5.2,并支持NVMe SSD,使其成為入門級RISC-V桌面的理想選擇。

cdbbb5ee-fe64-11ef-9310-92fbcf53809c.png

芯繭加速卡

芯繭人工智能算力卡是深圳市云集互聯(lián)生態(tài)科技有限公司推出的基于AXCL軟件架構(gòu)的M.2 2280計算卡。

規(guī)格參數(shù)

項目 描述
內(nèi)存 4GiB or 8GiB,64bit LPDDR4x
智能 18TOPs@Int8,72TOPs@Int4;
支持CNN、Transformer模型部署;
支持LLM、VLM部署
視頻解碼 H.264/H.265,32路
1080@30fps解碼
視頻編碼 H.264/H.265,16路
1080@30fps編碼
Host適配 支持Intel、AMD、NXP、Xilinx、Raspberry Pi、Rockchip、SPACEMIT、StarFive、SG2042等
Host系統(tǒng) Linux:Ubuntu、Debian、CentOS、OpenKylin等;
Windows(適配中)
外形尺寸 M.2 2280,M Key
M.2 2242(開發(fā)中)
工作電壓 3.3V
系統(tǒng)功耗 <8w

cdf01f78-fe64-11ef-9310-92fbcf53809c.jpg

硬件安裝

cdfd7966-fe64-11ef-9310-92fbcf53809c.jpgce16ff6c-fe64-11ef-9310-92fbcf53809c.jpg

軟件安裝

適用于SPACEMIT M1的axcl deb包獲取鏈接

https://huggingface.co/AXERA-TECH/AXCL/blob/main/axcl_host_riscv_spacemit_V2.23.0_20250212162521.deb

詳細安裝流程可參考:AXCL安裝 - AXCL V1.0文檔

https://axcl-docs.readthedocs.io/zh-cn/latest/doc_guide_setup.html

踩坑記錄

在Milk-V Jupiter開發(fā)板上預(yù)裝的Bianbu OS中,如果要使用python環(huán)境或者安裝pip package,需要啟用python虛擬環(huán)境進行隔離。很遺憾大家最熟悉的miniconda貌似沒有RISC-V版本,建議采用python venv創(chuàng)建python虛擬環(huán)境。

當前DEMO依賴Transformer庫,pip安裝時請選用SPACEMIT提供的pip源。

pip install transformers --index-url https://git.spacemit.com/api/v4/projects/33/packages/pypi/simple

測試

基本功能

DeepSeek

直接嘗試DeepSeek-R1 7B模型,可以從AXERA-TECH/DeepSeek-R1-Distill-Qwen-7B-GPTQ-Int4獲取。

(https://huggingface.co/AXERA-TECH/DeepSeek-R1-Distill-Qwen-7B-GPTQ-Int4)

安裝完成后,可以使用類似nvidia-smi的設(shè)備管理工具axcl-smi。

ce2cc022-fe64-11ef-9310-92fbcf53809c.jpg

使用axcl_ut_npu完成NPU功能自測。

ce42b0f8-fe64-11ef-9310-92fbcf53809c.jpg

Tokenizer解析器

DEMO中的Tokenizer解析器采用本地模塊與HTTP Server兩種方案,其中本地方案又嘗試了sentencepiece、tiktoken兩種方案。但是我們在實際調(diào)試過程中發(fā)現(xiàn)sentencepiece對于不同LLM模型的special tokens支持不友好,需要用戶自行處理special tokens的拆分,容易導(dǎo)致板端token id與Transformers庫中的AutoTokenizer獲得的token id存在差異,最終影響LLM的輸出結(jié)果正確性。因此我們建議前期調(diào)試的時候使用Tokenizer HTTP Server的方式直接調(diào)用Transformers庫中的AutoTokenizer模塊進行測試。

Tokenizer HTTP Server的特點:

保證token id正確

方便添加chat template

支持本地、遠端部署

支持多用戶接入

以huggingface中提供的基于DeepSeek-R1-Distill-Qwen-7B的相關(guān)文件為例:

i@m1:~/samples/deepseek-7b-gptq-int4$ tree
.
├── deepseek-r1-7b-gptq-int4-ax650
│  ├── model.embed_tokens.weight.bfloat16.bin
│  ├── qwen2_p128_l0_together.axmodel
......
│  ├── qwen2_p128_l9_together.axmodel
│  └── qwen2_post.axmodel
├── deepseek-r1_tokenizer
│  ├── tokenizer_config.json
│  └── tokenizer.json
├── deepseek-r1_tokenizer.py
├── main_axcl_riscv
├── main_prefill
├── post_config.json
└── run_deepseek-r1_7b_gptq_int4_axcl_riscv.sh

deepseek-r1_tokenizer:是tokenizer相關(guān)文件,從DeepSeek/DeepSeek-R1-Distill-Qwen-7B中提取

deepseek-r1_tokenizer.py:是用python實現(xiàn)的Tokenizer HTTP Server

運行說明如下:

python deepseek-r1_tokenizer --host xxx.xxx.xxx.xxx --port 12345,其中--host xxx.xxx.xxx.xxx設(shè)置tokenizer解析服務(wù)器的IP地址,確保開發(fā)板能正常訪問該地址??梢栽诰邆鋚ython環(huán)境的開發(fā)板本地運行;

修改run_deepseek-r1_7b_gptq_int4_axcl_riscv.sh中--filename_tokenizer_model的IP信息和步驟1中的一致;

運行run_deepseek-r1_7b_gptq_int4_axcl_riscv.sh即可。

ce502efe-fe64-11ef-9310-92fbcf53809c.jpg

運行視頻

結(jié)束語

當前,AI芯片行業(yè)競爭已從單純算力比拼轉(zhuǎn)向場景化適配能力。愛芯元智以“普惠AI造就美好生活”為使命,通過愛芯通元NPU與RISC-V產(chǎn)業(yè)鏈深度協(xié)同,成為驅(qū)動行業(yè)從“云端集中”邁向“邊緣智能”的關(guān)鍵力量。

因此從今年開始,愛芯通元NPU IP正式啟動商業(yè)授權(quán)服務(wù),歡迎RISC-V產(chǎn)業(yè)鏈中感興趣的朋友來咨詢。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 處理器
    +關(guān)注

    關(guān)注

    68

    文章

    19740

    瀏覽量

    232871
  • RISC-V
    +關(guān)注

    關(guān)注

    46

    文章

    2461

    瀏覽量

    48006
  • NPU
    NPU
    +關(guān)注

    關(guān)注

    2

    文章

    312

    瀏覽量

    19363
  • 愛芯元智
    +關(guān)注

    關(guān)注

    1

    文章

    96

    瀏覽量

    5012

原文標題:愛芯分享 | 愛芯通元NPU賦能產(chǎn)業(yè)鏈-SPACEMIT

文章出處:【微信號:愛芯元智AXERA,微信公眾號:愛芯元智AXERA】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    NPU適配Qwen2.5-VL-3B視覺多模態(tài)大模型

    熟悉NPU的網(wǎng)友很清楚,從去年開始我們在端側(cè)多模態(tài)大模型適配上一直處于主動緊跟的節(jié)奏。先后適配了國內(nèi)最早開源的多模態(tài)大模MiniCPM V 2.0,上海人工智能實驗室的書生多模
    的頭像 發(fā)表于 04-21 10:56 ?888次閱讀
    <b class='flag-5'>愛</b><b class='flag-5'>芯</b>通<b class='flag-5'>元</b><b class='flag-5'>NPU</b>適配Qwen2.5-VL-3B視覺多模態(tài)大模型

    派 Pro 開發(fā)板試用體驗】篇一:開箱篇

    了豐富的外設(shè)可供用戶方便地進行調(diào)試。它可幫助用戶在智慧城市、智慧教育、智能創(chuàng)造等領(lǐng)域發(fā)揮更大的價值。 上圖: 關(guān)于AX650N:智推出的又一款高性能智能視覺芯片。一款高畫質(zhì),高能效比
    發(fā)表于 11-15 11:32

    科技”完成新一輪品牌升級,正式更名“智”

    科技正式更名為——智半導(dǎo)體(上海)有限公司(簡稱為“
    發(fā)表于 09-09 12:42 ?1372次閱讀
    “<b class='flag-5'>愛</b><b class='flag-5'>芯</b>科技”完成新一輪品牌升級,正式更名“<b class='flag-5'>愛</b><b class='flag-5'>芯</b><b class='flag-5'>元</b>智”

    智CEO仇肖莘出席CISES:AI傳統(tǒng)技術(shù),加速智能化轉(zhuǎn)型

    智成立于2019年5月,專注于圖像和視頻處理領(lǐng)域的AI SOC芯片研發(fā),主要應(yīng)用于端側(cè)和邊緣側(cè)。
    發(fā)表于 10-20 09:15 ?1341次閱讀
    <b class='flag-5'>愛</b><b class='flag-5'>芯</b><b class='flag-5'>元</b>智CEO仇肖莘出席CISES:AI<b class='flag-5'>賦</b><b class='flag-5'>能</b>傳統(tǒng)技術(shù),加速智能化轉(zhuǎn)型

    科技”正式更名“智” 比亞迪半導(dǎo)體推出四合一鎖控MCU

    AI視覺芯片研發(fā)及基礎(chǔ)算力平臺公司——科技正式更名為——智半導(dǎo)體(上海)有限公司(簡稱“
    的頭像 發(fā)表于 03-16 13:50 ?2950次閱讀

    TI科技 中國新基建 | 飛馳之“”——TI科技中國新基建之城際軌道交通

    TI科技 中國新基建 | 飛馳之“”——TI科技
    發(fā)表于 10-28 11:59 ?0次下載
    TI<b class='flag-5'>芯</b>科技 <b class='flag-5'>賦</b><b class='flag-5'>能</b>中國新基建 | 飛馳之“<b class='flag-5'>芯</b>”——TI<b class='flag-5'>芯</b>科技<b class='flag-5'>賦</b><b class='flag-5'>能</b>中國新基建之城際軌道交通

    派?AXera-Pi?亮相ICCAD 智開源生態(tài)建設(shè)加速

    隨著人工智能的深入發(fā)展,開源開放已成為推動技術(shù)持續(xù)進步的行業(yè)共識和重要驅(qū)動力。近日,智推出的開源生態(tài)社區(qū)開發(fā)板「派」AXera-P
    的頭像 發(fā)表于 12-28 15:06 ?1562次閱讀

    智宣布正式入局車載市場

    。 智成立于2019年5月,致力于打造世界領(lǐng)先的人工智能芯片,擁有混合精度NPU智眸
    的頭像 發(fā)表于 06-12 14:09 ?1596次閱讀

    智混合精度NPU中文名“”正式公布

    目前,智已完成四代多顆芯片產(chǎn)品的研發(fā)和量產(chǎn)工作,并逐漸落地智慧城市、智能駕駛和AIoT三大市場?!斑@些市場都將感知和計算作為基本能力,這也是
    的頭像 發(fā)表于 07-18 14:32 ?906次閱讀

    智旗下“速”宣布與廣汽埃安達成系列智能駕駛項目合作

    2024年5月29日,AI芯片創(chuàng)新公司智旗下車載業(yè)務(wù)品牌“速”宣布與廣汽埃安達成系列
    的頭像 發(fā)表于 05-30 10:13 ?1116次閱讀

    智發(fā)布“AI處理器”

    在近日隆重召開的世界人工智能大會(WAIC)這一全球科技盛會上,智科技有限公司憑借其深厚的AI技術(shù)研發(fā)實力,正式推出了劃時代的“
    的頭像 發(fā)表于 07-09 09:35 ?629次閱讀

    速榮膺最佳技術(shù)實踐應(yīng)用獎

    智車載事業(yè)部(品牌“速”)憑借在車載芯片領(lǐng)域的創(chuàng)新技術(shù)研發(fā)實力以及在推動量產(chǎn)上車方面
    的頭像 發(fā)表于 10-25 11:39 ?583次閱讀

    智榮獲DEKRA德凱TCL3汽車功能安全認證證書

    近日,DEKRA德凱為智半導(dǎo)體有限公司(以下簡稱:智)頒發(fā)了針對“
    的頭像 發(fā)表于 12-26 16:49 ?612次閱讀

    MUNIK秒尼科助力NPU工具鏈Pulsar2通過汽車功能安全認證

    近日,全球領(lǐng)先的檢驗檢測認證機構(gòu)DEKRA德凱為智半導(dǎo)體有限公司(以下簡稱:智)頒發(fā)
    的頭像 發(fā)表于 12-29 09:16 ?506次閱讀

    智與STRADVISION簽署戰(zhàn)略合作協(xié)議

    近日,智半導(dǎo)體股份有限公司(“智”)與行業(yè)領(lǐng)先的AI視覺感知技術(shù)公司STRADVIS
    的頭像 發(fā)表于 04-30 10:30 ?194次閱讀