幾B都有！BM1684X一鍵適配全系列Qwen3

Qwen3發(fā)布，大小尺寸通吃

Qwen3一發(fā)布，登頂開源大模型排行榜！235B、32B、8B、4B、1.7B云邊端全尺寸模型，BF16和FP8兩種精度，一次性發(fā)布，無論云端大卡還是邊緣AI設備，都可體驗最新的大模型能力。

來看下Qwen3各個模型的benchmark得分：

這些年看多了大模型的迭代，各家都在玩參數(shù)競賽和架構(gòu)魔術(shù)，但阿里這次Qwen3的設計有點意思——它搞了個"混合模式"的機制，讓模型能自己決定什么時候該"慢慢想"，什么時候該"快速答"。這玩意兒本質(zhì)上是在延遲和精度之間做動態(tài)權(quán)衡，技術(shù)上不算新鮮（OpenAI的o3就玩過這套），但阿里的實現(xiàn)方式更像個老會計——給你個"思考預算"的開關(guān)，讓用戶自己把控成本。

BM1684X，Qwen3部署性價比之王

這種設計背后是典型的工程思維：既然大模型的推理成本居高不下，不如把選擇權(quán)交給用戶。就像當年CPU的動態(tài)調(diào)頻技術(shù)，與其無腦跑滿頻，不如讓系統(tǒng)根據(jù)負載靈活調(diào)節(jié)，但這種模式切換要在硬件層面做好流水線調(diào)度，否則切換時的上下文保存就能吃掉那點省下來的算力。

現(xiàn)在的大模型就像過度教育的孩子，解得了奧數(shù)題但算不清買菜賬。Qwen3給"孩子"裝了個手動擋，讓用戶自己決定什么時候該掛高檔位沖刺，什么時候該低檔省油，這種策略下每瓦特的性價比自然就上去了，而邊緣和端側(cè)的設備對成本更是敏感，那作為邊緣大模型部署的性價比之王，BM1684X表現(xiàn)如何？

4B運行demo（SOC模式950Mhz 16.4tokens/s）

1.7B運行demo(SOC模式950Mhz 30.3 tokens/s)

一行代碼適配，解鎖全系模型

BM1684X 單芯配置16GB內(nèi)存，20B以下的都可以在一顆芯片跑，32B用2顆就可以(32B dense模型性能約5 tokens/s)。

更詳細的適配流程參考：https://github.com/sophgo/LLM-TPU/tree/main/models/Qwen3，拉取最新的tpu-mlir代碼后，只需要一行代碼即可轉(zhuǎn)出bmodel，不用再通過onnx中介。

bmodel轉(zhuǎn)好之后，可以用python或者cpp來跑：

限制我們適配新模型速度的不是工具鏈，而是模型下載速度，歡迎關(guān)注算能產(chǎn)品，解鎖更多大模型部署方案，手中有BM1684X的同學可以玩起來了！

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

邊緣AI

邊緣AI

+關(guān)注

關(guān)注
0

文章
164

瀏覽量
5463
大模型

大模型

+關(guān)注

關(guān)注
2

文章
3146

瀏覽量
4073

算能開發(fā)者社區(qū)
企業(yè)號

63 內(nèi)容 8.7w 閱讀 6 粉絲

我要咨詢關(guān)注

Hot 重塑翻譯與識別技術(shù)：開源語音識別模型Whisper的編譯優(yōu)化與部署
Hot 探索ChatGLM2在算能BM1684X上INT8量化部署，加速大模型商業(yè)落地
New ROCm 6.2.4 成功移植至 SG2044: 大模型部署速率飆升，RISC-V + AI 新紀元！代碼已經(jīng)開源，一起來試試！
New SC11 FP300 MLA算子融合與優(yōu)化

精選推薦
更多

文章

資料

帖子

AI通話的N種新玩法，讓科幻照進現(xiàn)實

腦極體
19小時前

450 閱讀

三菱電機SiC DIPIPM在變頻家電中的應用（2）

三菱電機半導體
7小時前

299 閱讀

三菱電機SiC DIPIPM在變頻家電中的應用（1）

三菱電機半導體
7小時前

312 閱讀

英飛凌TLD7002-16 OTP PRG的常見問題解析

駿龍電子
7小時前

280 閱讀

DC/DC轉(zhuǎn)換器電路板安裝過程中的焊接技巧與導通檢查要點

駿龍電子
7小時前

313 閱讀

回流焊中出現(xiàn)的缺陷及其解決方案

梅利號
523

10積分

78下載

電子產(chǎn)品測試點優(yōu)化綜述

楊福林
633

10積分

53下載

超實用電路穩(wěn)壓芯片電路圖資料集合

o_dream
11.59 MB

1積分

26下載

imewlconverter深藍詞庫轉(zhuǎn)換

yqdedli
64.05 MB

免費

0下載

Vimerl Vim的Erlang插件

YYXIAO
0.03 MB

免費

0下載

省錢+環(huán)保+個性：打造一臺永不“過時”的自定義電腦！

早知
1天前

388 閱讀

【BPI-CanMV-K230D-Zero開發(fā)板體驗】+溫度大氣壓檢測及顯示

jinglixixi
1天前

588 閱讀

【RA-Eco-RA6M4開發(fā)板評測】+01+開箱測評+UART+PWM+LED

jf_18702540
2天前

556 閱讀

【VisionFive 2單板計算機試用體驗】2、打造復古游戲機（Batocera鏡像+FBNeo虛擬機，多款游戲ROM分享）

左岸cpx
2天前

589 閱讀

【BPI-CanMV-K230D-Zero開發(fā)板體驗】+兩種開發(fā)板間的比較

jinglixixi
2天前

523 閱讀

推薦企業(yè)號
更多

企業(yè)產(chǎn)品

資料

方案
更多

一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

搜索歷史

幾B都有！BM1684X一鍵適配全系列Qwen3

Qwen3發(fā)布，大小尺寸通吃

BM1684X，Qwen3部署性價比之王

一行代碼適配，解鎖全系模型

評論

搜索歷史

幾B都有！BM1684X一鍵適配全系列Qwen3

Qwen3發(fā)布，大小尺寸通吃

BM1684X，Qwen3部署性價比之王

一行代碼適配，解鎖全系模型

評論

Qwen3發(fā)布，大小尺寸通吃

一行代碼適配，解鎖全系模型