一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

匹敵7nm GPU,燧原科技第二代云端AI推理卡發(fā)布,落地服務(wù)器、身份識(shí)別、車路協(xié)同等應(yīng)用

21克888 ? 來源:電子發(fā)燒友網(wǎng) ? 作者:黃晶晶 ? 2021-12-09 13:12 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

數(shù)據(jù)算力需求的日益增長帶動(dòng)了AI芯片行業(yè)的興起,作為中國AI芯片的中堅(jiān)力量,燧原科技聚焦于AI訓(xùn)練與推理不斷推出芯片以及加速卡產(chǎn)品。12月7日,燧原科技重磅發(fā)布第二代云端人工智能推理加速卡“云燧i20”,這是時(shí)隔僅五個(gè)月,繼今年7月發(fā)布云端人工智能訓(xùn)練加速卡“云燧T20”之后,燧原科技又推出的全新一代針對(duì)云端推理場景的AI加速產(chǎn)品。

燧原科技CEO趙立東和COO張亞林發(fā)布第二代云端AI推理產(chǎn)品


燧原科技CEO趙立東在發(fā)布會(huì)上表示,我們的第1代訓(xùn)練和推理產(chǎn)品已經(jīng)在國家重點(diǎn)實(shí)驗(yàn)室、互聯(lián)網(wǎng)、智慧城市、智慧金融等幾大方向上實(shí)現(xiàn)了突破,已產(chǎn)生了過億的訂單和收入。在這個(gè)過程中,我們也通過多種業(yè)務(wù)模式和產(chǎn)學(xué)研結(jié)合,建立了強(qiáng)大的朋友圈和生態(tài)圈。隨著第2代訓(xùn)練和推理兩條產(chǎn)品線逐步量產(chǎn),以及軟件生態(tài)的不斷優(yōu)化和完善,業(yè)務(wù)的加速落地和規(guī)模化正按計(jì)劃逐步實(shí)現(xiàn)。未來,我們除了繼續(xù)大力拓展上述的幾個(gè)業(yè)務(wù)方向之外,還會(huì)在高性能計(jì)算,交通和能源等領(lǐng)域投入資源,拓展商機(jī)。


從2017年到2023年,整個(gè)AI云端市場訓(xùn)練和推理產(chǎn)品比例在發(fā)生變化,推理產(chǎn)品比例在慢慢變高?;谶@樣的AI市場趨勢,燧原科技COO張亞林表示,燧原科技也在做產(chǎn)品線拓展,AI的業(yè)務(wù)從傳統(tǒng)的單一的機(jī)器視覺、聲音、文字,還有決策、推薦等方向性的算法,已經(jīng)變成多場景、多應(yīng)用的落地,廣泛分布在用戶日常生活中。

12nm工藝打造的新一代“邃思”AI推理芯片


第二代云端推理加速卡云燧i20,基于新一代“邃思”AI推理芯片,它采用第二代高性能計(jì)算核心和數(shù)據(jù)引擎,由12nm工藝打造,通過架構(gòu)升級(jí),大大提高了單位面積的晶體管效率,從而實(shí)現(xiàn)了與目前業(yè)內(nèi)7nm GPU相匹敵的計(jì)算能力。不僅如此,基于12nm成熟工藝帶來的成本優(yōu)勢,使得云燧i20在相同性能表現(xiàn)下更具性價(jià)比優(yōu)勢。并且供應(yīng)鏈體系更加穩(wěn)定成熟,客戶的業(yè)務(wù)需求可以得到及時(shí)滿足。

燧原科技發(fā)布全新一代“邃思”云端AI推理芯片


具體來看,邃思推理芯片的計(jì)算架構(gòu)具備全AI的算力空間,其中單精度FP32達(dá)到了32 TFLOPS,以及單精度張量TF32,達(dá)到了128 TFLOPS,它同樣具備半精度BF16/FP16的算力,達(dá)到128 TFLOPS。最重要的在推理方面,提升整個(gè)整數(shù)精度INT8,達(dá)到256TOPS。也就是,從FP32到INT8,包含中間精度TF32、BF16、FP16五個(gè)精度構(gòu)成了全AI算力空間,滿足各種各樣推理的客戶需求。

邃思推理芯片用16位算力做到32位的精度效果。如何做到的?它具備TF32張量單精度,擁有4倍于FP32的算力,但是在整個(gè)模型上擁有99%的精度一致性。于是,就可以用4倍的FP32算力達(dá)到99%FP32的算力精度,這也是中國第一顆TF32的推理芯片。

邃思推理芯片的數(shù)據(jù)架構(gòu),擁有完全自研的SVS (Sparse Value Segment ) 數(shù)據(jù)壓縮格式。它能夠進(jìn)行獨(dú)立的分層壓縮和硬件自動(dòng)循環(huán)解壓,使得所有的數(shù)據(jù),特別是稀疏數(shù)據(jù)在傳輸過程之中,能夠節(jié)省帶寬和功耗。它支持硬件指令預(yù)取的操作,使得指令的預(yù)取、數(shù)據(jù)的傳輸和計(jì)算可以同時(shí)進(jìn)行。進(jìn)行并行的數(shù)據(jù)廣播,使得同樣的數(shù)據(jù)可以廣播到多個(gè)處理器上進(jìn)行并行執(zhí)行。同時(shí),它具有很強(qiáng)的動(dòng)態(tài)功耗控制,讓整個(gè)數(shù)據(jù)傳輸?shù)膭?dòng)態(tài)功耗變得非常的有效。

在存儲(chǔ)方面,燧原科技依然采用了業(yè)內(nèi)最領(lǐng)先的HBM2E,由2顆HBM2E構(gòu)建,單芯片容量達(dá)到16GB,最大帶寬達(dá)到819GB/s,在整個(gè)封裝上,依然采用2.5D的高級(jí)封裝,整合了五顆芯片,它的整個(gè)封裝尺寸達(dá)到了55毫米乘以55毫米。大芯片加上兩顆HBM2E存儲(chǔ)的護(hù)航,構(gòu)建了計(jì)算加存儲(chǔ)的互促,使得AI的推理在帶寬、存儲(chǔ)容量和算力上能夠進(jìn)行極致的發(fā)揮。

云燧i20加速卡性能顯著提升


比上一代云燧i10相比,云燧i20在浮點(diǎn)32位、浮點(diǎn)16位、整點(diǎn)8位的算力,以及存儲(chǔ)帶寬,存儲(chǔ)類型等方面都有巨大提升。云燧i20單精度FP32峰值算力達(dá)到32 TFLOPS,單精度張量TF32峰值算力達(dá)到128 TFLOPS,整型INT8峰值算力達(dá)到256 TOPS。對(duì)比第一代推理產(chǎn)品,云燧i20將浮點(diǎn)算力提升到1.8倍,整型算力提升到3.6倍。

燧原科技發(fā)布第二代人工智能推理加速卡“云燧i20”




和業(yè)內(nèi)主流的GPU的次旗艦相比,云燧i20的浮點(diǎn)16位的算力、INT8的算力,都是其2倍,內(nèi)存帶寬是2.65倍。

基準(zhǔn)測試部分,在業(yè)內(nèi)的主流模型中以友商的GPU次旗艦為baseline,從圖像分類、識(shí)別到目標(biāo)檢測到圖像分割到圖像超分等整個(gè)模型來看,云燧i20是友商的GPU次旗艦的2.5到3.7倍不等。



一個(gè)例子是,針對(duì)bert文本場景分析,每一個(gè)白色的框是一段文本,通過邃思推理芯片DTU和GPU的實(shí)時(shí)渲染和處理,分析出每一段文字的情感,這個(gè)情感用彩色框標(biāo)注為各種情緒。運(yùn)時(shí)顯示,DTU整個(gè)分析速度明顯加快,彩色的框出現(xiàn)的比率明顯增高,頻率也越來越快。同時(shí),DTU的實(shí)時(shí)性能是GPU的2.5倍以上,而實(shí)時(shí)的延時(shí)DTU只有GPU的不到一半。

軟件生態(tài)升級(jí),搭建訓(xùn)推一體化


此次,在軟件支持層面,升級(jí)后的“馭算TopsRider”軟件棧,在性能、開發(fā)效率和模型覆蓋面上得到大幅提升。通過引入通用高層圖優(yōu)化和大規(guī)模算子融合技術(shù),充分釋放了大容量片內(nèi)存儲(chǔ)和高帶寬存儲(chǔ)的利用率,將模型平均性能提升3.5倍,硬件算力利用率平均提升2倍;通過升級(jí)的編程模型以及算子自動(dòng)分片、自動(dòng)生成技術(shù),自定義算子開發(fā)效率翻倍,模型遷移成本大大降低;此外,馭算增強(qiáng)了對(duì)動(dòng)態(tài)性的支持,使云燧i20在檢測、語音識(shí)別、語義理解等場景更具競爭力。

張亞林表示,T20和i20組合的訓(xùn)推一體化系統(tǒng)日臻完善,在TopsRider軟件系統(tǒng)里,從高層的圖優(yōu)化到中間的算子庫再到中間的編程模型,最后到底層的Runtime,四個(gè)階段中分別統(tǒng)一了整個(gè)訓(xùn)練和推理引擎,使得用一套結(jié)構(gòu)可以支持所有訓(xùn)練和推理軟件棧,通過統(tǒng)一的表達(dá),統(tǒng)一的訓(xùn)練推理的算子編程模型和Runtime,訓(xùn)練和推理?xiàng)_M(jìn)行了深度融合和充分泛化,在運(yùn)用訓(xùn)推一體化時(shí)更高效、精密和兼容。

同時(shí),我們支持Lazy、Graph、Eager、Trace mode四種圖執(zhí)行模式,這四種模式涵蓋了廣泛的框架和圖執(zhí)行,它能適配各種各樣的訓(xùn)練和推理的場景。通過今天i20和i20相關(guān)匹配的DTU2.5和TopsRider2.5的發(fā)布,燧原科技已經(jīng)擁有第二代全系統(tǒng)、全自主的技術(shù)棧。

云燧i20已量產(chǎn)應(yīng)用


目前,已經(jīng)有不少合作伙伴推出了基于燧原科技i20板卡的服務(wù)器產(chǎn)品,包括浪潮、華三和超威等等,產(chǎn)品涵蓋4U到2U的服務(wù)器,搭配16張DTU的卡到2到4張DTU的卡,

比如,浪潮標(biāo)準(zhǔn)的4U服務(wù)器配置了16張i20板卡,以及2CPU,通過16張i20板卡,4U服務(wù)器能夠提供非常高的算力密度。



浪潮信息副總裁劉軍表示:“燧原科技是國產(chǎn)人工智能計(jì)算芯片的領(lǐng)軍企業(yè),浪潮信息與燧原科技通過元腦生態(tài)聯(lián)合創(chuàng)新,在AI整機(jī)系統(tǒng)、AI算力優(yōu)化、場景方案落地等多方面深入合作。此次云燧i20的發(fā)布,標(biāo)志著燧原從訓(xùn)練到推理全面進(jìn)入2.0時(shí)代,這也是國產(chǎn)AI算力發(fā)展的里程碑。我們期待和燧原一起緊密合作,共同推進(jìn)中國人工智能產(chǎn)業(yè)的快速發(fā)展。”

此外,在身份證識(shí)別、人像卡通化、人體姿態(tài)檢測、車路協(xié)同等應(yīng)用場景,燧原云燧推理卡和相關(guān)識(shí)別技術(shù)的搭配,實(shí)現(xiàn)快速、精準(zhǔn)的智能效果。





燧原科技以其國產(chǎn)AI算力產(chǎn)品為核心,以商業(yè)生態(tài)和科研生態(tài)為支撐,實(shí)現(xiàn)燧原科技的云端AI推理產(chǎn)品在互聯(lián)網(wǎng)、金融、政務(wù)等多家客戶的商業(yè)落地,并獲得認(rèn)可。在第一代訓(xùn)練和推理產(chǎn)品產(chǎn)生了過億的訂單和收入之后,相信第二代產(chǎn)品將加速向更多領(lǐng)域進(jìn)行滲透。根據(jù)規(guī)劃,面向訓(xùn)練和推理的下一代產(chǎn)品T30/T31,i30已經(jīng)在研發(fā)中,三年完成兩代產(chǎn)品迭代,隨著燧原科技產(chǎn)品和技術(shù)路線圖延伸,將有更多驚喜的產(chǎn)品和技術(shù)的展露。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 推理
    +關(guān)注

    關(guān)注

    0

    文章

    8

    瀏覽量

    7339
  • AI芯片
    +關(guān)注

    關(guān)注

    17

    文章

    1978

    瀏覽量

    35780
  • 燧原科技
    +關(guān)注

    關(guān)注

    0

    文章

    137

    瀏覽量

    8913
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    AMD第二代Versal AI Edge和Versal Prime系列加速量產(chǎn) 為嵌入式系統(tǒng)實(shí)現(xiàn)單芯片智能

    我們推出了 AMD 第二代 Versal AI Edge 系列和第二代 Versal Prime 系列,這兩款產(chǎn)品是對(duì) Versal 產(chǎn)品組合的擴(kuò)展,可為嵌入式系統(tǒng)實(shí)現(xiàn)單芯片智能。
    的頭像 發(fā)表于 06-11 09:59 ?503次閱讀

    恩智浦推出第二代OrangeBox規(guī)級(jí)開發(fā)平臺(tái)

    第二代OrangeBox開發(fā)平臺(tái)集成AI功能、后量子加密技術(shù)及內(nèi)置軟件定義網(wǎng)絡(luò)的能力,應(yīng)對(duì)快速演變的信息安全威脅。
    的頭像 發(fā)表于 05-27 14:25 ?531次閱讀

    第二代AMD Versal Premium系列SoC滿足各種CXL應(yīng)用需求

    第二代 AMD Versal Premium 系列自適應(yīng) SoC 是一款多功能且可配置的平臺(tái),提供全面的 CXL 3.1 子系統(tǒng)。該系列自適應(yīng) SoC 旨在滿足從簡單到復(fù)雜的各種 CXL 應(yīng)用需求
    的頭像 發(fā)表于 04-24 14:52 ?428次閱讀
    <b class='flag-5'>第二代</b>AMD Versal Premium系列SoC滿足各種CXL應(yīng)用需求

    方正微電子推出第二代規(guī)主驅(qū)SiC MOS產(chǎn)品

    2025年4月16日,在上海舉行的三電關(guān)鍵技術(shù)高峰論壇上,方正微電子副總裁彭建華先生正式發(fā)布第二代規(guī)主驅(qū)SiC MOS 1200V 13mΩ產(chǎn)品,性能達(dá)到國際頭部領(lǐng)先水平。
    的頭像 發(fā)表于 04-17 17:06 ?591次閱讀

    簡單認(rèn)識(shí)第二代高通3D Sonic傳感

    目前,已有多款搭載驍龍8至尊版移動(dòng)平臺(tái)的新機(jī)陸續(xù)發(fā)布,其中不少機(jī)型采用第二代高通3D Sonic超聲波指紋解鎖,為用戶帶來了更為便捷、高效的解鎖體驗(yàn)。作為高通新一超聲波指紋解鎖解決方案,第二
    的頭像 發(fā)表于 01-21 10:05 ?788次閱讀

    第二代AMD Versal Premium系列器件的主要應(yīng)用

    隨著數(shù)據(jù)中心工作負(fù)載持續(xù)呈指數(shù)級(jí)增長,存儲(chǔ)層也需要同等的性能提升才能跟上步伐。第二代 AMD Versal Premium 系列器件為各種存儲(chǔ)應(yīng)用提供了巨大優(yōu)勢,包括企業(yè)級(jí) SSD、加密/壓縮加速
    的頭像 發(fā)表于 01-15 14:03 ?534次閱讀

    瑞芯微第二代8nm高性能AIOT平臺(tái),看這款板卡怎么樣?

    瑞芯微近期推出了第二代8nm高性能AIOT平臺(tái)——RK3576。RK3576應(yīng)用方向指向工業(yè)控制及網(wǎng)關(guān),云終端,人臉識(shí)別設(shè)備,車載中控,商顯等等。參數(shù)方面,內(nèi)置了四核Cortex-A72+四核
    的頭像 發(fā)表于 01-09 08:03 ?1223次閱讀
    瑞芯微<b class='flag-5'>第二代</b>8<b class='flag-5'>nm</b>高性能AIOT平臺(tái),看這款板卡怎么樣?

    Windows端USB讀二代身份證C#樣例程序

    本開發(fā)包支持USB免驅(qū)型、串口型這2種類型的讀卡,支持讀取二代居民身份證、M1和CPU等。提供動(dòng)態(tài)連接庫dll,提供C++(MFC)和C#下的演示程序執(zhí)行文件和示例源碼。動(dòng)態(tài)庫文件
    發(fā)表于 12-21 14:47

    新品 | 第二代 CoolSiC? 34mΩ 1200V SiC MOSFET D2PAK-7L封裝

    新品第二代CoolSiC34mΩ1200VSiCMOSFETD2PAK-7L封裝采用D2PAK-7L(TO-263-7)封裝的第二代Cool
    的頭像 發(fā)表于 11-29 01:03 ?443次閱讀
    新品 | <b class='flag-5'>第二代</b> CoolSiC? 34mΩ 1200V SiC MOSFET D2PAK-<b class='flag-5'>7</b>L封裝

    簡單認(rèn)識(shí)第二代高通Oryon CPU

    在不久前的2024驍龍峰會(huì)上,備受矚目的新一驍龍旗艦移動(dòng)平臺(tái)——驍龍8至尊版正式發(fā)布。這款以“至尊版”命名的全新平臺(tái)也是首個(gè)采用第二代高通Oryon CPU的移動(dòng)平臺(tái)。憑借領(lǐng)先的CPU、GP
    的頭像 發(fā)表于 11-13 09:43 ?1117次閱讀

    AMD推出第二代Versal Premium系列

    近日,AMD(超威,納斯達(dá)克股票代碼:AMD )今日宣布推出第二代 AMD Versal Premium 系列,這款自適應(yīng) SoC 平臺(tái)旨在面向各種工作負(fù)載提供最高水平系統(tǒng)加速。第二代 Versal
    的頭像 發(fā)表于 11-13 09:27 ?861次閱讀

    一加正式發(fā)布第二代東方屏,獲全球首個(gè)DisplayMate A++認(rèn)證

    近日,一加攜手京東方正式發(fā)布第二代東方屏,并宣布將在年度旗艦產(chǎn)品一加 13 中首發(fā)搭載。去年,一加聯(lián)合京東方打造出世界上最好的屏幕——東方屏,這是一次中國屏幕歷史級(jí)的突破。本次發(fā)布第二代
    的頭像 發(fā)表于 10-21 17:32 ?692次閱讀

    二代身份識(shí)別身份證閱讀讀卡

    身份證讀卡通用版 醫(yī)院社保讀卡 APP集成識(shí)別讀取身份證 云解碼讀卡 身份證網(wǎng)絡(luò)讀卡模塊
    發(fā)表于 09-07 15:09

    新品 | 采用第二代1200V CoolSiC? MOSFET的集成伺服電機(jī)的驅(qū)動(dòng)

    新品采用第二代1200VCoolSiCMOSFET的集成伺服電機(jī)的驅(qū)動(dòng)REF-DR3KIMBGSIC2MA是為集成伺服電機(jī)的驅(qū)動(dòng)應(yīng)用而開發(fā)的升級(jí)版逆變器和柵極驅(qū)動(dòng)板。設(shè)計(jì)用于評(píng)估
    的頭像 發(fā)表于 09-05 08:03 ?629次閱讀
    新品 | 采用<b class='flag-5'>第二代</b>1200V CoolSiC? MOSFET的集成伺服電機(jī)的驅(qū)動(dòng)<b class='flag-5'>器</b>

    TMS320第二代數(shù)字信號(hào)處理數(shù)據(jù)表

    電子發(fā)燒友網(wǎng)站提供《TMS320第二代數(shù)字信號(hào)處理數(shù)據(jù)表.pdf》資料免費(fèi)下載
    發(fā)表于 08-02 09:55 ?0次下載
    TMS320<b class='flag-5'>第二代</b>數(shù)字信號(hào)處理<b class='flag-5'>器</b>數(shù)據(jù)表