近日,阿里云重磅推出Qwen3 系列開源混合推理模型。用時(shí)不到1天,后摩智能自研NPU迅速實(shí)現(xiàn)Qwen3 系列模型(Qwen3 0.6B-14B)在端邊側(cè)的高效部署。這一成果充分彰顯了后摩智能NPU在生態(tài)適配性與快速響應(yīng)能力方面的顯著優(yōu)勢。
通義千問 Qwen3 系列作為國內(nèi)領(lǐng)先的混合推理模型,其亮點(diǎn)在于創(chuàng)造性地將 “快思考” 與 “慢思考” 集成進(jìn)同一個(gè)模型架構(gòu)。對(duì)于簡單需求,可迅速做出低算力響應(yīng),實(shí)現(xiàn) “秒回”;面對(duì)復(fù)雜問題,能夠進(jìn)行多步驟深度思考,逐步推導(dǎo)出合理答案。此外,Qwen3 系列基于海量多語言、多模態(tài)數(shù)據(jù)預(yù)訓(xùn)練,并經(jīng)過高質(zhì)量數(shù)據(jù)微調(diào),在人類偏好對(duì)齊方面表現(xiàn)出色,推理效率提升 3 倍,支持 API 商用及開源代碼庫,為用戶提供了靈活多樣的部署選擇。
后摩智能通過多種產(chǎn)品組合,為用戶提供豐富的高性能 AI 算力選擇?;谧匝?NPU,后摩智能推出了力謀SM30 計(jì)算模組、力謀LM30 智能加速卡及力謀BX30 計(jì)算盒子等產(chǎn)品,在政務(wù)、工業(yè)、消費(fèi)、汽車等行業(yè)全面覆蓋端側(cè)與邊緣側(cè)的多樣化應(yīng)用場景。這些產(chǎn)品憑借其高性能、低功耗的特點(diǎn),為 AI 技術(shù)的落地提供了堅(jiān)實(shí)的算力基礎(chǔ),滿足了不同用戶在不同場景下的需求。
此前,后摩智能 NPU 已成功支持了 DeepSeek R1 Distilled 系列模型,展現(xiàn)出其在適配主流大模型方面的卓越性能和廣泛兼容性。此次適配通義千問 Qwen3 系列模型,進(jìn)一步驗(yàn)證了后摩智能 NPU 在處理復(fù)雜 AI 任務(wù)時(shí)的高效性和穩(wěn)定性,為國產(chǎn)技術(shù)棧的完整性與競爭力提供了有力證明。
未來,后摩智能將繼續(xù)深耕存算一體技術(shù),持續(xù)優(yōu)化 NPU 性能,加強(qiáng)與生態(tài)伙伴的合作,推動(dòng)國產(chǎn) NPU 在 AI 領(lǐng)域的廣泛應(yīng)用。通過技術(shù)創(chuàng)新與生態(tài)共建,后摩智能致力于為更多用戶提供高效、普惠的 AI 算力解決方案。
-
模型
+關(guān)注
關(guān)注
1文章
3519瀏覽量
50414 -
阿里云
+關(guān)注
關(guān)注
3文章
1010瀏覽量
44162 -
NPU
+關(guān)注
關(guān)注
2文章
328瀏覽量
19743 -
后摩智能
+關(guān)注
關(guān)注
0文章
35瀏覽量
1379
原文標(biāo)題:后摩智能 NPU 率先完成阿里 Qwen3 系列模型的端邊側(cè)部署
文章出處:【微信號(hào):后摩智能,微信公眾號(hào):后摩智能】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
廣和通加速通義千問Qwen3在端側(cè)全面落地
Intel OpenVINO? Day0 實(shí)現(xiàn)阿里通義 Qwen3 快速部署

MediaTek天璣9400率先完成阿里Qwen3模型部署
寒武紀(jì)率先支持Qwen3全系列模型
幾B都有!BM1684X一鍵適配全系列Qwen3

評(píng)論