一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

升騰910和含光800性能對比 昇騰910和含光800性能對比

工程師鄧生 ? 2023-08-31 17:31 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

有網(wǎng)友關(guān)注升騰910和含光800性能對比;升騰910一般認(rèn)為就是華為的昇騰910;而含光800則是阿里巴巴發(fā)布的含光800AI芯片。

2019年9月25日,阿里巴巴發(fā)布含光800AI芯片;含光800是高性能的AI推理芯片。該芯片推理性能達(dá)到78563 IPS,能效比500 IPS/W。

含光800AI芯片基于RISC-V和阿里自有算法,含光800芯片性能的突破得益于軟硬件的協(xié)同創(chuàng)新:硬件層面采用自研芯片架構(gòu),通過推理加速等技術(shù)有效解決芯片性能瓶頸問題;軟件層面集成了達(dá)摩院先進(jìn)算法,針對CNN及視覺類算法深度優(yōu)化計(jì)算、存儲(chǔ)密度,可實(shí)現(xiàn)大網(wǎng)絡(luò)模型在一顆NPU上完成計(jì)算。

含光800AI芯片相比傳統(tǒng)GPU算力,性價(jià)比提升100%。根據(jù)云棲大會(huì)的現(xiàn)場演示結(jié)果顯示,比如拍立淘商品庫每天新增10億商品圖片,使用傳統(tǒng)GPU算力識(shí)別需要1小時(shí),使用含光800后可縮減至5分鐘。

據(jù)阿里介紹含光NPU采用TSMC 12nm工藝制程,可提供全球最高單芯片AI推理性能。 在HGAI模型的推理應(yīng)用中,含光NPU每秒鐘可處理高達(dá)78000 IPS的圖片,是同類處理器的數(shù)十倍性能。

目前含光800目前已被應(yīng)用到阿里巴巴旗下的的多個(gè)業(yè)務(wù)場景,比如圖像視頻分析、城市大腦、搜索優(yōu)化等等。

2019年8月23日,華為發(fā)布AI芯片Ascend 910(昇騰910)。

據(jù)華為官方介紹,昇騰910AI處理器,基于自研華為達(dá)芬奇架構(gòu)3D Cube技術(shù),實(shí)現(xiàn)業(yè)界最佳AI性能與能效,架構(gòu)靈活伸縮,支持云邊端全棧全場景應(yīng)用。

除了基于達(dá)芬奇架構(gòu)的AI核外,昇騰910還集成了多個(gè)CPU、DVPP和任務(wù)調(diào)度器(Task Scheduler),因而具有自我管理能力,可以充分發(fā)揮其高算力的優(yōu)勢。

昇騰910集成了HCCS、PCIe 4.0和RoCE v2接口,為構(gòu)建橫向擴(kuò)展(Scale Out)和縱向擴(kuò)展(Scale Up)系統(tǒng)提供了靈活高效的方法。HCCS是華為自研的高速互聯(lián)接口,片內(nèi)RoCE可用于節(jié)點(diǎn)間直接互聯(lián)。最新的PCIe 4.0的吞吐量比上一代提升一倍。

昇騰910算力是國際頂尖AI芯片的2倍,相當(dāng)50個(gè)當(dāng)前最新最強(qiáng)的CPU;其訓(xùn)練速度,也比當(dāng)前最新最強(qiáng)的芯片提升了50%-100%。同時(shí)華為還發(fā)布了配套的新一代AI開源計(jì)算框架MindSpore。兩者搭配性能最大化利用芯片算力。

新一代的AI開源計(jì)算框架MindSpore創(chuàng)新編程范式,使得工程師更容易使用;該計(jì)算框架可滿足終端、邊緣計(jì)算、云全場景需求,能更好保護(hù)數(shù)據(jù)隱私;可開源,形成廣闊應(yīng)用生態(tài)。

昇騰910半精度(FP16)算力達(dá)256 TFLOPS。(還有一個(gè)說法是昇騰910的半精度(FP16)算力達(dá)到320 TFLOPS);而整數(shù)精度(INT8)算力達(dá)到 640 TOPS,(還有一個(gè)說法是整數(shù)精度(INT8)算力達(dá)到512 Tera-OPS;小編認(rèn)為一個(gè)數(shù)值可能是設(shè)計(jì)參數(shù)值,一個(gè)可能是極值)功耗 310W,采用 7nm 先進(jìn)工藝。此外,昇騰 910 集成了 HCCS、PCIe 4.0 和 RoCE v2 接口,為構(gòu)建橫向擴(kuò)展 (Scale Out)和縱向擴(kuò)展(Scale Up)系統(tǒng)提供了靈活高效的方法。

比如華為的Atlas 900 AI訓(xùn)練集群,算力達(dá)到了256 PFLOPS。要實(shí)現(xiàn)這樣的算力,如果采用通用CPU需要6195個(gè)機(jī)柜,用GPU需要208個(gè)機(jī)柜,而NPU如昇騰只要128個(gè)機(jī)柜,這歸功于昇騰架構(gòu)對深度學(xué)習(xí)業(yè)務(wù)的優(yōu)化。而且最終,華為只用了16個(gè)機(jī)柜來實(shí)現(xiàn)。

此外,昇騰910為國產(chǎn)AI芯片助力,華為盤古大模型從算力(昇騰算力,昇騰的底層架構(gòu)也是華為自創(chuàng)的)、芯片使能、AI框架(MindSpore AI計(jì)算框架)到AI平臺(tái)(AI開發(fā)生產(chǎn)線ModelArts)實(shí)現(xiàn)了全棧自主創(chuàng)新。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 處理器
    +關(guān)注

    關(guān)注

    68

    文章

    19896

    瀏覽量

    235282
  • RISC-V
    +關(guān)注

    關(guān)注

    46

    文章

    2573

    瀏覽量

    48839
  • AI芯片
    +關(guān)注

    關(guān)注

    17

    文章

    1983

    瀏覽量

    35916
  • 昇騰910
    +關(guān)注

    關(guān)注

    0

    文章

    14

    瀏覽量

    7034
  • 含光800
    +關(guān)注

    關(guān)注

    0

    文章

    3

    瀏覽量

    1759
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    800KVA伏儲(chǔ)能并網(wǎng)變壓器性能全解析

    800KVA伏儲(chǔ)能并網(wǎng)變壓器知識(shí)科普:技術(shù)、性能、選配與容量配置——卓爾凡電力科技的卓越之選 一、引言 在全球?qū)η鍧嵞茉吹男枨笕找嬖鲩L的今天,13650169149卓爾凡伏儲(chǔ)能并網(wǎng)
    的頭像 發(fā)表于 04-11 10:57 ?413次閱讀
    <b class='flag-5'>800</b>KVA<b class='flag-5'>光</b>伏儲(chǔ)能并網(wǎng)變壓器<b class='flag-5'>性能</b>全解析

    DeepSeek推動(dòng)AI算力需求:800G模塊的關(guān)鍵作用

    : 飛速(FS)模塊支持最新的標(biāo)準(zhǔn)協(xié)議,確保與多種現(xiàn)有設(shè)備和網(wǎng)絡(luò)架構(gòu)的兼容性,并支持驗(yàn)證告警、DDM數(shù)據(jù)及模塊識(shí)別的準(zhǔn)確性,保障系統(tǒng)正常運(yùn)行。這一特性使得飛速(FS)800G模塊品質(zhì)可靠,
    發(fā)表于 03-25 12:00

    厚聲電阻與旺詮合金電阻的性能對比

    厚聲電阻與旺詮合金電阻在性能上各有千秋,以下是對兩者的詳細(xì)對比: 一、厚聲電阻性能特點(diǎn) 1、尺寸與阻值范圍廣泛: 厚聲電阻提供了多種尺寸選擇,如01005、0201、0402、0603等,以滿足
    的頭像 發(fā)表于 02-27 14:40 ?396次閱讀
    厚聲電阻與旺詮合金電阻的<b class='flag-5'>性能對比</b>

    DLPC910忽然無法正常啟動(dòng),怎么解決?

    1、DLPC910忽然無法正常啟動(dòng),分析可能是DLPR910的問題。這里想問一下DLPR910內(nèi)的程序是可以被覆蓋的嗎? 2、如果真的是誤操作導(dǎo)致DLPR910的配置程序丟失,請問有
    發(fā)表于 02-26 08:43

    改性EVA膠膜在伏封裝中的抗PID性能對比研究

    伏組件的抗PID性能影響組件的發(fā)電效率和使用壽命,被伏行業(yè)廣泛關(guān)注。EVA膠膜是伏組件的主要封裝材料之一,其具有優(yōu)異的性價(jià)比,但隨著
    的頭像 發(fā)表于 01-22 09:02 ?867次閱讀
    改性EVA膠膜在<b class='flag-5'>光</b>伏封裝中的抗PID<b class='flag-5'>性能對比</b>研究

    為什么400G模塊和800G模塊如此火爆?

    算力中心作為承載大量計(jì)算任務(wù)的核心設(shè)施,需要快速、穩(wěn)定的網(wǎng)絡(luò)環(huán)境,400G和800G模塊應(yīng)運(yùn)而生,尤其是800G模塊的需求尤為旺盛。800
    的頭像 發(fā)表于 12-23 14:41 ?697次閱讀

    單片機(jī)Debug工具性能對比 單片機(jī)調(diào)試常用命令

    。以下是對單片機(jī)調(diào)試工具性能的簡要對比以及一些常用的調(diào)試命令。 單片機(jī)Debug工具性能對比 Keil uVision 性能 :Keil uVision 是一款功能強(qiáng)大的集成開發(fā)環(huán)境(
    的頭像 發(fā)表于 12-19 09:56 ?1420次閱讀

    TNC連接器對比分析:與其他射頻連接器的性能對

    德索工程師說道在射頻連接器領(lǐng)域,TNC連接器以其卓越的性能和廣泛的應(yīng)用而著稱。以下是TNC連接器與其他射頻連接器的性能對比分析: TNC連接器vs SMA連接器 頻率范圍:TNC連接器的工作頻率
    的頭像 發(fā)表于 12-17 10:58 ?906次閱讀
    TNC連接器<b class='flag-5'>對比</b>分析:與其他射頻連接器的<b class='flag-5'>性能對</b>決

    800G模塊:滿足高速數(shù)據(jù)傳輸需求的必然選擇

    800G 模塊正在引領(lǐng)高速、高容量數(shù)據(jù)通信的新時(shí)代。本文探討了 800G 模塊的發(fā)展,深入研究了其技術(shù)標(biāo)準(zhǔn)、封裝、類型和應(yīng)用,幫助您了解 800
    的頭像 發(fā)表于 12-16 11:38 ?1399次閱讀
    <b class='flag-5'>800</b>G<b class='flag-5'>光</b>模塊:滿足高速數(shù)據(jù)傳輸需求的必然選擇

    800G模塊:高速通信的關(guān)鍵力量

    隨著信息技術(shù)的飛速發(fā)展,數(shù)據(jù)流量呈爆炸式增長,對高速、大容量的數(shù)據(jù)傳輸設(shè)備需求日益迫切,800G模塊應(yīng)運(yùn)而生。800G模塊作為新一代的光通信模塊,在數(shù)據(jù)中心、5G網(wǎng)絡(luò)等眾多領(lǐng)域發(fā)揮
    的頭像 發(fā)表于 12-09 12:19 ?971次閱讀

    DDR3、DDR4、DDR5的性能對比

    DDR3、DDR4、DDR5是計(jì)算機(jī)內(nèi)存類型的不同階段,分別代表第三代、第四代和第五代雙倍數(shù)據(jù)速率同步動(dòng)態(tài)隨機(jī)存取存儲(chǔ)器(SDRAM)。以下是它們之間的性能對比: 一、速度與帶寬 DDR3 :速度
    的頭像 發(fā)表于 11-29 15:08 ?1w次閱讀

    NPU與GPU的性能對比

    NPU(Neural Processing Unit,神經(jīng)網(wǎng)絡(luò)處理單元)與GPU(Graphics Processing Unit,圖形處理單元)在性能上各有千秋,它們各自的設(shè)計(jì)初衷和優(yōu)化方向決定了
    的頭像 發(fā)表于 11-14 15:19 ?4192次閱讀

    華迅光通AI計(jì)算加速800G模塊部署

    ,對人工智能服務(wù)器集群的需求也急劇上升。隨著數(shù)據(jù)中心基礎(chǔ)設(shè)施的不斷擴(kuò)大,模塊的使用量呈指數(shù)級增長。目前,200G和400G模塊已經(jīng)大規(guī)模部署,800G模塊已經(jīng)開始進(jìn)入量產(chǎn)和引進(jìn)階
    發(fā)表于 11-13 10:16

    PCIe 4.0與PCIe 3.0的性能對比

    隨著科技的快速發(fā)展,計(jì)算機(jī)硬件也在不斷地更新?lián)Q代。PCI Express(PCIe)作為一種高速串行計(jì)算機(jī)擴(kuò)展總線標(biāo)準(zhǔn),廣泛應(yīng)用于計(jì)算機(jī)硬件連接,如顯卡、固態(tài)硬盤等。 1. 帶寬對比 PCIe
    的頭像 發(fā)表于 11-06 09:22 ?1.3w次閱讀

    DLPC910的datasheet中未看到pindelay數(shù)據(jù),DLPC910和DMD之間的LVDS總線是否要考慮pindelay的影響?

    如標(biāo)題所述,DLPC910的datasheet中未看到pindelay數(shù)據(jù),DLPC910和DMD之間的LVDS總線是否要考慮pindelay的影響
    發(fā)表于 08-16 06:18