有網(wǎng)友關(guān)注升騰910和含光800性能對比;升騰910一般認(rèn)為就是華為的昇騰910;而含光800則是阿里巴巴發(fā)布的含光800AI芯片。
2019年9月25日,阿里巴巴發(fā)布含光800AI芯片;含光800是高性能的AI推理芯片。該芯片推理性能達(dá)到78563 IPS,能效比500 IPS/W。
含光800AI芯片基于RISC-V和阿里自有算法,含光800芯片性能的突破得益于軟硬件的協(xié)同創(chuàng)新:硬件層面采用自研芯片架構(gòu),通過推理加速等技術(shù)有效解決芯片性能瓶頸問題;軟件層面集成了達(dá)摩院先進(jìn)算法,針對CNN及視覺類算法深度優(yōu)化計(jì)算、存儲(chǔ)密度,可實(shí)現(xiàn)大網(wǎng)絡(luò)模型在一顆NPU上完成計(jì)算。
含光800AI芯片相比傳統(tǒng)GPU算力,性價(jià)比提升100%。根據(jù)云棲大會(huì)的現(xiàn)場演示結(jié)果顯示,比如拍立淘商品庫每天新增10億商品圖片,使用傳統(tǒng)GPU算力識(shí)別需要1小時(shí),使用含光800后可縮減至5分鐘。
據(jù)阿里介紹含光NPU采用TSMC 12nm工藝制程,可提供全球最高單芯片AI推理性能。 在HGAI模型的推理應(yīng)用中,含光NPU每秒鐘可處理高達(dá)78000 IPS的圖片,是同類處理器的數(shù)十倍性能。
目前含光800目前已被應(yīng)用到阿里巴巴旗下的的多個(gè)業(yè)務(wù)場景,比如圖像視頻分析、城市大腦、搜索優(yōu)化等等。
2019年8月23日,華為發(fā)布AI芯片Ascend 910(昇騰910)。
據(jù)華為官方介紹,昇騰910AI處理器,基于自研華為達(dá)芬奇架構(gòu)3D Cube技術(shù),實(shí)現(xiàn)業(yè)界最佳AI性能與能效,架構(gòu)靈活伸縮,支持云邊端全棧全場景應(yīng)用。
除了基于達(dá)芬奇架構(gòu)的AI核外,昇騰910還集成了多個(gè)CPU、DVPP和任務(wù)調(diào)度器(Task Scheduler),因而具有自我管理能力,可以充分發(fā)揮其高算力的優(yōu)勢。
昇騰910集成了HCCS、PCIe 4.0和RoCE v2接口,為構(gòu)建橫向擴(kuò)展(Scale Out)和縱向擴(kuò)展(Scale Up)系統(tǒng)提供了靈活高效的方法。HCCS是華為自研的高速互聯(lián)接口,片內(nèi)RoCE可用于節(jié)點(diǎn)間直接互聯(lián)。最新的PCIe 4.0的吞吐量比上一代提升一倍。
昇騰910算力是國際頂尖AI芯片的2倍,相當(dāng)50個(gè)當(dāng)前最新最強(qiáng)的CPU;其訓(xùn)練速度,也比當(dāng)前最新最強(qiáng)的芯片提升了50%-100%。同時(shí)華為還發(fā)布了配套的新一代AI開源計(jì)算框架MindSpore。兩者搭配性能最大化利用芯片算力。
新一代的AI開源計(jì)算框架MindSpore創(chuàng)新編程范式,使得工程師更容易使用;該計(jì)算框架可滿足終端、邊緣計(jì)算、云全場景需求,能更好保護(hù)數(shù)據(jù)隱私;可開源,形成廣闊應(yīng)用生態(tài)。
昇騰910半精度(FP16)算力達(dá)256 TFLOPS。(還有一個(gè)說法是昇騰910的半精度(FP16)算力達(dá)到320 TFLOPS);而整數(shù)精度(INT8)算力達(dá)到 640 TOPS,(還有一個(gè)說法是整數(shù)精度(INT8)算力達(dá)到512 Tera-OPS;小編認(rèn)為一個(gè)數(shù)值可能是設(shè)計(jì)參數(shù)值,一個(gè)可能是極值)功耗 310W,采用 7nm 先進(jìn)工藝。此外,昇騰 910 集成了 HCCS、PCIe 4.0 和 RoCE v2 接口,為構(gòu)建橫向擴(kuò)展 (Scale Out)和縱向擴(kuò)展(Scale Up)系統(tǒng)提供了靈活高效的方法。
比如華為的Atlas 900 AI訓(xùn)練集群,算力達(dá)到了256 PFLOPS。要實(shí)現(xiàn)這樣的算力,如果采用通用CPU需要6195個(gè)機(jī)柜,用GPU需要208個(gè)機(jī)柜,而NPU如昇騰只要128個(gè)機(jī)柜,這歸功于昇騰架構(gòu)對深度學(xué)習(xí)業(yè)務(wù)的優(yōu)化。而且最終,華為只用了16個(gè)機(jī)柜來實(shí)現(xiàn)。
此外,昇騰910為國產(chǎn)AI芯片助力,華為盤古大模型從算力(昇騰算力,昇騰的底層架構(gòu)也是華為自創(chuàng)的)、芯片使能、AI框架(MindSpore AI計(jì)算框架)到AI平臺(tái)(AI開發(fā)生產(chǎn)線ModelArts)實(shí)現(xiàn)了全棧自主創(chuàng)新。
-
處理器
+關(guān)注
關(guān)注
68文章
19896瀏覽量
235282 -
RISC-V
+關(guān)注
關(guān)注
46文章
2573瀏覽量
48839 -
AI芯片
+關(guān)注
關(guān)注
17文章
1983瀏覽量
35916 -
昇騰910
+關(guān)注
關(guān)注
0文章
14瀏覽量
7034 -
含光800
+關(guān)注
關(guān)注
0文章
3瀏覽量
1759
發(fā)布評論請先 登錄
800KVA光伏儲(chǔ)能并網(wǎng)變壓器性能全解析

DeepSeek推動(dòng)AI算力需求:800G光模塊的關(guān)鍵作用
厚聲電阻與旺詮合金電阻的性能對比

DLPC910忽然無法正常啟動(dòng),怎么解決?
改性EVA膠膜在光伏封裝中的抗PID性能對比研究

為什么400G光模塊和800G光模塊如此火爆?
單片機(jī)Debug工具性能對比 單片機(jī)調(diào)試常用命令
TNC連接器對比分析:與其他射頻連接器的性能對決

800G光模塊:滿足高速數(shù)據(jù)傳輸需求的必然選擇

評論