工業(yè)和信息化部高新技術(shù)司近日公布2024年未來(lái)產(chǎn)業(yè)創(chuàng)新發(fā)展優(yōu)秀典型案例申報(bào)成果,壁仞科技作為牽頭單位,聯(lián)合上海儀電、中興通訊申報(bào)的 “軟硬一體異構(gòu)協(xié)同的國(guó)產(chǎn)GPU智算集群解決方案”,成功入選工信部未來(lái)產(chǎn)業(yè)創(chuàng)新發(fā)展“標(biāo)志性產(chǎn)品”優(yōu)秀典型案例。壁仞科技是“未來(lái)信息”方向“標(biāo)志性產(chǎn)品”類別唯一芯片設(shè)計(jì)企業(yè)及上海市唯一上榜企業(yè),充分體現(xiàn)了壁仞科技在人工智能芯片和智算集群領(lǐng)域的技術(shù)創(chuàng)新和產(chǎn)品實(shí)力。
創(chuàng)新標(biāo)志性產(chǎn)品“超大規(guī)模新型智算中心”方向唯一上榜企業(yè)
為落實(shí)工業(yè)和信息化部等七部門(mén)《關(guān)于推動(dòng)未來(lái)產(chǎn)業(yè)創(chuàng)新發(fā)展的實(shí)施意見(jiàn)》的部署要求,充分發(fā)揮標(biāo)桿和樣板的示范引領(lǐng)作用,加快推動(dòng)標(biāo)志性產(chǎn)品打造、高水平產(chǎn)業(yè)主體培育和應(yīng)用場(chǎng)景建設(shè),工業(yè)和信息化部高新技術(shù)司組織開(kāi)展了2024年未來(lái)產(chǎn)業(yè)創(chuàng)新發(fā)展優(yōu)秀典型案例征集工作。案例征集工作聚焦未來(lái)制造、未來(lái)信息、未來(lái)材料、未來(lái)能源、未來(lái)空間、未來(lái)健康等六大方向,面向全國(guó)征集遴選標(biāo)志性產(chǎn)品、領(lǐng)軍企業(yè)和典型應(yīng)用場(chǎng)景三類典型案例。其中,標(biāo)志性產(chǎn)品的定義為“代表未來(lái)產(chǎn)業(yè)發(fā)展方向,且已實(shí)現(xiàn)產(chǎn)業(yè)化,能切實(shí)體現(xiàn)前沿技術(shù)突破并具有良好應(yīng)用前景的產(chǎn)品”。
在十大創(chuàng)新標(biāo)志性產(chǎn)品方向中,“超大規(guī)模新型智算中心”旨在加快突破GPU芯片、集群低時(shí)延互連網(wǎng)絡(luò)、異構(gòu)資源管理等技術(shù),建設(shè)超大規(guī)模智算中心,滿足大模型迭代訓(xùn)練和應(yīng)用推理需求。壁仞科技自主創(chuàng)新研發(fā)的“軟硬一體異構(gòu)協(xié)同的國(guó)產(chǎn)GPU智算集群解決方案”成為該方向唯一上榜產(chǎn)品。
六項(xiàng)核心技術(shù)創(chuàng)新成果,突破大規(guī)模智算集群及異構(gòu)算力孤島難題
大模型參數(shù)從千億擴(kuò)展到萬(wàn)億,訓(xùn)練資源從千卡需要擴(kuò)展到萬(wàn)卡甚至十萬(wàn)卡的集群。DeepSeek引爆了大模型的落地應(yīng)用,推理資源需求激增。但高端算力供應(yīng)緊張、國(guó)產(chǎn)芯片百花齊放、智算中心擴(kuò)容混建,形成大量異構(gòu)算力孤島,智算集群的資源利用效率和靈活性存在很大挑戰(zhàn)。
本案例基于壁仞科技國(guó)產(chǎn)高性能GPU打造了軟硬一體、全棧優(yōu)化、異構(gòu)協(xié)同、自主可控的智算集群解決方案,實(shí)現(xiàn)智算集群資源的高效利用及異構(gòu)協(xié)同,支持大模型快速發(fā)展。本案例堅(jiān)持自主創(chuàng)新,整體方案覆蓋高性能集群、大模型訓(xùn)練一體平臺(tái)、加速庫(kù)、基礎(chǔ)框架、超大模型框架、算法/應(yīng)用等六個(gè)層次,取得六項(xiàng)業(yè)界首創(chuàng)成果:
1)業(yè)界首創(chuàng)利用Chiplet架構(gòu)實(shí)現(xiàn)大算力GPU;
2)國(guó)內(nèi)第一次實(shí)現(xiàn)GPU跨節(jié)點(diǎn)光互連技術(shù)驗(yàn)證并實(shí)現(xiàn)商用落地;
3)業(yè)界首創(chuàng)大模型3D并行彈性訓(xùn)練,通過(guò)訓(xùn)推一體平臺(tái)實(shí)現(xiàn)集群高效調(diào)度利用;
4)業(yè)界首創(chuàng)三級(jí)異步Checkpoint,實(shí)現(xiàn)低開(kāi)銷、高可靠斷點(diǎn)續(xù)訓(xùn);
5)業(yè)界首創(chuàng)異步Offload技術(shù),突破大模型訓(xùn)練的顯存瓶頸;
6)業(yè)界首次支持4種及以上不同廠商不同型號(hào)的GPU混合訓(xùn)練同一個(gè)大模型,實(shí)現(xiàn)數(shù)千卡規(guī)?;煊?xùn),突破大模型異構(gòu)算力孤島難題。
商業(yè)化落地加速,技術(shù)迭代持續(xù)領(lǐng)跑
本案例方案已經(jīng)在多個(gè)大規(guī)模智算集群落地應(yīng)用,通過(guò)應(yīng)用落地和生態(tài)、標(biāo)準(zhǔn)建設(shè)持續(xù)打磨技術(shù),技術(shù)持續(xù)升級(jí)滿足客戶新興重要需求,形成良性循環(huán)。目前,壁仞科技壁礪系列通用GPU產(chǎn)品已經(jīng)在中國(guó)電信落地千卡集群并開(kāi)展商業(yè)化落地應(yīng)用,千卡集群、千億參數(shù)模型訓(xùn)練線性加速比超過(guò)95%,多次運(yùn)行l(wèi)oss零誤差持續(xù)收斂,連續(xù)訓(xùn)練30天不中斷,連續(xù)訓(xùn)練5天無(wú)故障,千卡集群千億參數(shù)斷點(diǎn)續(xù)訓(xùn)時(shí)間小于5分鐘,滿足大模型訓(xùn)練的性能、精度、穩(wěn)定性要求。壁仞科技自主研發(fā)了BIRENLINK高速互連技術(shù),原生支持跨節(jié)點(diǎn)的多機(jī)高速光互連通信,業(yè)內(nèi)首次完成技術(shù)可行性驗(yàn)證,之后聯(lián)合上海儀電旗下上海智能算力科技有限公司設(shè)計(jì)并建設(shè)了首批國(guó)產(chǎn)大規(guī)模光互連集群,實(shí)現(xiàn)了國(guó)產(chǎn)光互連集群的技術(shù)突破。
為解決大模型異構(gòu)算力孤島難題,壁仞科技自主研發(fā)了異構(gòu)GPU協(xié)同訓(xùn)練方案HGCT,業(yè)界首次支持四種異構(gòu)GPU混合訓(xùn)練同一個(gè)大模型,完成數(shù)千卡混訓(xùn)落地,實(shí)現(xiàn)了異構(gòu)算力的有效聚合,將逐步實(shí)現(xiàn)萬(wàn)卡異構(gòu)集群。基于HGCT方案,壁仞已聯(lián)合中國(guó)移動(dòng)發(fā)布“芯合”異構(gòu)混合并行訓(xùn)練系統(tǒng),聯(lián)合中國(guó)電信、中興通訊等發(fā)布“智算異構(gòu)四芯混訓(xùn)解決方案”,牽頭推動(dòng)智算集群異構(gòu)混訓(xùn)標(biāo)準(zhǔn)建設(shè)工作,實(shí)現(xiàn)技術(shù)創(chuàng)新、落地應(yīng)用、標(biāo)準(zhǔn)制定的有機(jī)結(jié)合。
躋身新質(zhì)生產(chǎn)力標(biāo)桿,共建開(kāi)放智算生態(tài)
憑借技術(shù)創(chuàng)新與商用落地能力,壁仞科技的超大規(guī)模智算集群解決方案近期榮登「2024新質(zhì)生產(chǎn)力產(chǎn)業(yè)實(shí)踐“人工智能”示范案例」TOP5。未來(lái),壁仞科技將攜手合作伙伴,以基礎(chǔ)軟件棧為核心,構(gòu)建開(kāi)放融合的智算生態(tài),推動(dòng)國(guó)產(chǎn)算力從“可用”向“好用”躍遷,支撐更大參數(shù)規(guī)模模型、更大規(guī)模異構(gòu)集群及多業(yè)務(wù)場(chǎng)景融合,為中國(guó)算力強(qiáng)國(guó)戰(zhàn)略提供堅(jiān)實(shí)底座。
-
gpu
+關(guān)注
關(guān)注
28文章
4882瀏覽量
130390 -
人工智能
+關(guān)注
關(guān)注
1804文章
48449瀏覽量
244955 -
壁仞科技
+關(guān)注
關(guān)注
1文章
65瀏覽量
3004 -
大模型
+關(guān)注
關(guān)注
2文章
2941瀏覽量
3683
原文標(biāo)題:壁仞科技入選工信部2024年未來(lái)產(chǎn)業(yè)創(chuàng)新發(fā)展“標(biāo)志性產(chǎn)品”優(yōu)秀典型案例
文章出處:【微信號(hào):Birentech,微信公眾號(hào):壁仞科技Birentech】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
上能電氣入選工信部2024年未來(lái)產(chǎn)業(yè)創(chuàng)新發(fā)展優(yōu)秀典型案例
時(shí)識(shí)科技首批入選類腦智能產(chǎn)業(yè)創(chuàng)新發(fā)展聯(lián)盟
北斗智聯(lián)榮獲工信部未來(lái)產(chǎn)業(yè)創(chuàng)新發(fā)展領(lǐng)軍企業(yè)
燧原科技入選工信部2024年未來(lái)產(chǎn)業(yè)創(chuàng)新發(fā)展優(yōu)秀典型案例
云知聲入選工信部2024年未來(lái)產(chǎn)業(yè)創(chuàng)新發(fā)展優(yōu)秀典型案例
如祺出行入選2024廣州人工智能創(chuàng)新發(fā)展榜單
??低?b class='flag-5'>入選工信部2024年實(shí)數(shù)融合典型案例
鯤云科技入選工信部2024年實(shí)體經(jīng)濟(jì)和數(shù)字經(jīng)濟(jì)深度融合典型案例
聚飛光電入選工信部2024年度視聽(tīng)系統(tǒng)典型案例
維信諾亮相2024世界顯示產(chǎn)業(yè)創(chuàng)新發(fā)展大會(huì)
漢威科技亮相2024高端儀器儀表產(chǎn)業(yè)鏈創(chuàng)新發(fā)展大會(huì)
弘信電子亮相2024海南高等教育創(chuàng)新發(fā)展國(guó)際論壇
黑芝麻智能亮相2024高端芯片產(chǎn)業(yè)創(chuàng)新發(fā)展大會(huì)
兆芯金融方案入選工信部2023年信息技術(shù)應(yīng)用創(chuàng)新典型解決方案
比亞迪DMS入選工信部2024年新型數(shù)字服務(wù)優(yōu)秀案例

評(píng)論