4月29日,阿里巴巴通義千問(wèn)發(fā)布并開(kāi)源8款新版Qwen3系列“混合推理模型”(簡(jiǎn)稱(chēng)“Qwen3”)。Qwen3發(fā)布后數(shù)小時(shí)內(nèi),壁仞科技完成全系列支持,并率先在壁仞科技開(kāi)發(fā)者云平臺(tái)上線。
性能卓越,Qwen3部署成本大幅下降
Qwen3包括兩款混合專(zhuān)家(MoE)模型Qwen3-235B-A22B和Qwen3-30B-A3B;同時(shí)還包括六個(gè)密集(Dense)模型Qwen3-32B、Qwen3-14B、Qwen3-8B、Qwen3-4B、Qwen3-1.7B和Qwen3-0.6B。從官方披露的數(shù)據(jù)來(lái)看,旗艦?zāi)P蚎wen3-235B-A22B在代碼、數(shù)學(xué)、通用能力等基準(zhǔn)測(cè)試中,與DeepSeek-R1、o1、o3-mini、Grok-3和Gemini-2.5-Pro等頂級(jí)模型相比,表現(xiàn)出極具競(jìng)爭(zhēng)力的結(jié)果。此外,小型MoE模型Qwen3-30B-A3B的激活參數(shù)數(shù)量是QwQ-32B的10%,表現(xiàn)更勝一籌。
基于廣泛的訓(xùn)練,Qwen3在推理、指令跟隨、Agent能力和多語(yǔ)言支持方面取得了突破性的進(jìn)展,不僅是國(guó)內(nèi)首個(gè)“混合推理模型”,“快思考”與“慢思考”集成進(jìn)同一個(gè)模型,大大節(jié)省算力消耗;部署成本大也幅下降,顯存占用僅為性能相近模型的三分之一。
極速響應(yīng),數(shù)小時(shí)全系列適配
壁仞科技依托自研的壁礪系列通用GPU架構(gòu)與深度優(yōu)化的軟件棧,在Qwen3正式發(fā)布后,僅用數(shù)小時(shí)完成Qwen3全系列模型的適配工作,并成功上線開(kāi)發(fā)者云平臺(tái)。
與此同時(shí),壁仞科技快速響應(yīng),推出基于壁礪系列一體機(jī),包括便捷4卡機(jī)、通用8卡機(jī)、高密16卡機(jī),全面支持Qwen3全系列模型。
Qwen3開(kāi)源更重要的行業(yè)意義在于推動(dòng)大模型技術(shù)的普惠和應(yīng)用的落地。據(jù)相關(guān)媒體報(bào)道,Qwen3顯著降低了設(shè)備適配的技術(shù)門(mén)檻以及部署成本,可滿足海量中小企業(yè)和AI開(kāi)發(fā)者的需求,從而加速AI推理應(yīng)用落地。
用戶訪問(wèn)以下鏈接或點(diǎn)擊閱讀全文即可體驗(yàn)部分模型:
https://sgc.birentech.com:5000/
-
阿里巴巴
+關(guān)注
關(guān)注
7文章
1631瀏覽量
47979 -
壁仞科技
+關(guān)注
關(guān)注
1文章
65瀏覽量
3004 -
大模型
+關(guān)注
關(guān)注
2文章
2941瀏覽量
3683 -
通義千問(wèn)
+關(guān)注
關(guān)注
1文章
31瀏覽量
372
原文標(biāo)題:即刻適配!壁仞科技完成Qwen3全系列模型支持
文章出處:【微信號(hào):Birentech,微信公眾號(hào):壁仞科技Birentech】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
上新:小米首個(gè)推理大模型開(kāi)源 馬斯克:下周推出Grok 3.5
阿里最新消息:國(guó)家超算互聯(lián)網(wǎng)平臺(tái)、廣州算力中心、多所高校接入通義千問(wèn)大模型
摩爾線程支持阿里云通義千問(wèn)QwQ-32B開(kāi)源模型

評(píng)論