一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

英特爾面向中國(guó)市場(chǎng)發(fā)布Gaudi2處理器,加速大模型訓(xùn)練和推理

Carol Li ? 來(lái)源:電子發(fā)燒友網(wǎng) ? 作者:李彎彎 ? 2023-07-17 00:01 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

電子發(fā)燒友網(wǎng)報(bào)道(文/李彎彎)日前,英特爾AI產(chǎn)品戰(zhàn)略暨Gaudi2新品發(fā)布會(huì)在京舉行。會(huì)上,英特爾正式于中國(guó)市場(chǎng)推出第二代Gaudi深度學(xué)習(xí)加速器——HabanaGaudi2。英特爾在中國(guó)市場(chǎng)推出的Gaudi2AI加速器,將通過(guò)其合作伙伴浪潮提供給中國(guó)客戶。

Gaudi2在訓(xùn)練和推理上的出色表現(xiàn)

英特爾此次推出的Gaudi2深度學(xué)習(xí)加速器暨Gaudi2夾層卡HL-225B,以第一代Gaudi高性能架構(gòu)為基礎(chǔ),以多方位性能與能效比提升,加速高性能大語(yǔ)言模型運(yùn)行。該加速器具備:

24個(gè)可編程Tensor處理器核心(TPCs)

21個(gè)100Gbps(RoCEv2)以太網(wǎng)接口

96GBHBM2E內(nèi)存容量

2.4TB/秒的總內(nèi)存帶寬

48MB片上SRAM

集成多媒體處理引擎。

相比于國(guó)際版本,面向中國(guó)市場(chǎng)的Gaudi2每張芯片集成的專用于內(nèi)部互聯(lián)的100Gbps(RoCEv2RDMA)以太網(wǎng)接口,從24個(gè)減至21個(gè)。

英特爾HabanaLabs首席運(yùn)營(yíng)官EltanMedina對(duì)媒體表示,根據(jù)模型的不同,特供版Gaudi2性能會(huì)有輕微的影響,但在很多數(shù)據(jù)訓(xùn)練擴(kuò)展中,并不是用這三個(gè)端口,整體性能差別不大。

根據(jù)英特爾的展示,相比于上一代產(chǎn)品,在ResNet-50模型測(cè)試中,Gaudi2訓(xùn)練吞吐量提高了3倍,BERT模型的訓(xùn)練吞吐量提高了4.7倍。目前,單個(gè)Gaudi2在ResNet-50模型可達(dá)到非常穩(wěn)定的5800個(gè)圖像/每秒的吞吐量。

英偉達(dá)相比,Gaudi2運(yùn)行ResNet-50的每瓦性能約是英偉達(dá)A100的2倍,性價(jià)比相較于AWS云中基于英偉達(dá)的解決方案高出40%。英特爾表示,接下來(lái)到9月,采用FP8軟件的Gaudi2預(yù)計(jì)能夠提供比H100更高的性價(jià)比。

根據(jù)此前的報(bào)道,在測(cè)試GPT-3方面,Gaudi2也表現(xiàn)出了強(qiáng)勁性能,384個(gè)加速器上的訓(xùn)練時(shí)間為311分鐘,從256個(gè)加速器到384個(gè)加速器實(shí)現(xiàn)近線性95%的擴(kuò)展效果。

Gaudi2在大規(guī)模的多模態(tài)和語(yǔ)言模型的推理方面也表現(xiàn)出色。HuggingFace評(píng)估中,Gaudi2在運(yùn)行StableDiffusion、70億以及1760億參數(shù)BLOOMz模型時(shí),在行業(yè)內(nèi)都保持領(lǐng)先水平。

英特爾在AI領(lǐng)域的布局

AI計(jì)算包括訓(xùn)練和推理,目前而言,在訓(xùn)練方面,英偉達(dá)的GPU長(zhǎng)期占據(jù)主導(dǎo)地位。近段時(shí)間,大模型的熱潮四起,英偉達(dá)的GPU明顯供不應(yīng)求。這讓AMD、英特爾以及一些AI芯片初創(chuàng)企業(yè)看到了新的機(jī)會(huì)。

事實(shí)上英特爾在AI領(lǐng)域早有布局。2019年12月,英特爾斥資約20億美元重金收購(gòu)了成立于2016年的以色列人工智能(AI)芯片初創(chuàng)企業(yè)HabanaLabs。在此之前,英特爾還收購(gòu)了FPGA廠商Altera、AI芯片公司Nervana。

在收購(gòu)HabanaLabs后的幾年中,英特爾加緊使Habana團(tuán)隊(duì)與英特爾內(nèi)部業(yè)務(wù)整合。在2022年IntelVision活動(dòng)上,英特爾推出第二代深度學(xué)習(xí)芯片HabanaGaudi2和HabanaGreco,分別用于AI訓(xùn)練和AI推理。也就是說(shuō),英特爾此次面向中國(guó)市場(chǎng)推出的新Gaudi2,也是在此前收購(gòu)了HabanaLabs的基礎(chǔ)上完成的。

面向AI領(lǐng)域的應(yīng)用,英特爾有全面的芯片組合,包括CPU、GPU、FPGA、AI專用芯片等。英特爾公司執(zhí)行副總裁數(shù)據(jù)中心與人工智能事業(yè)部總經(jīng)理SandraRivera表示,Gaudi2作為用于AI加速的專用處理器,是英特爾產(chǎn)品組合適用于大模型負(fù)載中,性能最優(yōu)的產(chǎn)品。

除了硬件方面,英特爾也非常注重在軟件方面的優(yōu)化,SandraRivera表示,英特爾致力于通過(guò)客戶提供廣泛的硬件選擇,并支持開(kāi)放的軟件環(huán)境,加速人工智能技術(shù)的發(fā)展。

據(jù)英特爾介紹,為支持客戶輕松構(gòu)建模型,或?qū)?dāng)前基于GPU的模型業(yè)務(wù)和系統(tǒng)遷移到基于全新Gaudi2服務(wù)器,并幫助保護(hù)軟件開(kāi)發(fā)投入,SynapseAI軟件套件針對(duì)Gaudi平臺(tái)深度學(xué)習(xí)業(yè)務(wù)進(jìn)行了優(yōu)化,旨在與廣泛的軟件生態(tài)系統(tǒng)一起,幫助簡(jiǎn)化模型的開(kāi)發(fā)和遷移。

SynapseAI集成了對(duì)TensorFlow和PyTorch框架的支持,并提供眾多流行的計(jì)算機(jī)視覺(jué)和自然語(yǔ)言參考模型,能夠滿足深度學(xué)習(xí)開(kāi)發(fā)者的多樣化需求。

對(duì)于英特爾來(lái)說(shuō),中國(guó)是一個(gè)很重要的市場(chǎng),根據(jù)2022年數(shù)據(jù),英特爾在中國(guó)的營(yíng)收占到總營(yíng)收的27%。如今中國(guó)的大模型發(fā)展如火如荼,而英偉達(dá)的A100/H100在中國(guó)禁售,特供版的A800/H800也需要獲得許可才能出售。這對(duì)于英特爾來(lái)說(shuō),是一個(gè)很好的機(jī)會(huì)。

據(jù)悉,目前英特爾正與浪潮信息合作,打造并發(fā)售基于Gaudi2深度學(xué)習(xí)加速器的浪潮信息AI服務(wù)器NF5698G7,該服務(wù)器集成8顆Gaudi2加速卡HL-225B,還包含雙路第四代英特爾至強(qiáng)可擴(kuò)展處理器。此外,新華三、超聚變等公司,預(yù)計(jì)也將推出搭載Gaudi2的服務(wù)器。

小結(jié)

算力是AI大模型發(fā)展的重要基礎(chǔ),而AI芯片又是提供算力的重要組成部分。無(wú)論是訓(xùn)練還是推理,未來(lái)隨著大模型的不斷推進(jìn)及應(yīng)用落地,AI芯片的市場(chǎng)需求都將會(huì)持續(xù)上升。在英偉達(dá)一家獨(dú)大的情況下,英特爾等廠商競(jìng)爭(zhēng)力的不斷提升,對(duì)整個(gè)產(chǎn)業(yè)的發(fā)展也更為有利。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 處理器
    +關(guān)注

    關(guān)注

    68

    文章

    19896

    瀏覽量

    235299
  • 英特爾
    +關(guān)注

    關(guān)注

    61

    文章

    10196

    瀏覽量

    174706
  • AI芯片
    +關(guān)注

    關(guān)注

    17

    文章

    1983

    瀏覽量

    35917
  • Gaudi2
    +關(guān)注

    關(guān)注

    0

    文章

    13

    瀏覽量

    195
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    直擊Computex2025:英特爾重磅發(fā)布新一代GPU,圖形和AI性能躍升3.4倍

    5月19日,在Computex 2025上,英特爾發(fā)布了最新全新圖形處理器(GPU)和AI加速器產(chǎn)品系列。包括全新英特爾銳炫? Pro B系
    的頭像 發(fā)表于 05-20 12:27 ?4472次閱讀
    直擊Computex2025:<b class='flag-5'>英特爾</b>重磅<b class='flag-5'>發(fā)布</b>新一代GPU,圖形和AI性能躍升3.4倍

    英特爾發(fā)布全新GPU,AI和工作站迎來(lái)新選擇

    英特爾推出面向準(zhǔn)專業(yè)用戶和AI開(kāi)發(fā)者的英特爾銳炫Pro GPU系列,發(fā)布英特爾? Gaudi 3
    發(fā)表于 05-20 11:03 ?1514次閱讀

    英特爾至強(qiáng)6處理器助力數(shù)據(jù)中心整合升級(jí)

    繼去年9月重磅推出英特爾 至強(qiáng) 6900性能核處理器后,英特爾進(jìn)一步擴(kuò)充至強(qiáng)6產(chǎn)品家族,于近期發(fā)布了包括至強(qiáng)6700性能核處理器及至強(qiáng)650
    的頭像 發(fā)表于 03-13 17:36 ?884次閱讀

    英特爾展示基于至強(qiáng)6處理器的基礎(chǔ)網(wǎng)絡(luò)設(shè)施

    ? 集成AI功能的英特爾至強(qiáng)6系統(tǒng)級(jí)芯片,與前幾代產(chǎn)品相比,可帶來(lái)高達(dá)2.4倍的無(wú)線接入網(wǎng)(RAN)容量提升1,和70%的每瓦性能提升2; 集成的人工智能加速器將AI RAN性能提升了高達(dá)3.2倍3
    的頭像 發(fā)表于 03-08 09:24 ?535次閱讀

    全新英特爾至強(qiáng)6處理器來(lái)襲,現(xiàn)代數(shù)據(jù)中心的性能與能效平衡“大師”

    數(shù)據(jù)中心工作負(fù)載提供強(qiáng)大的計(jì)算支持。 ·?為網(wǎng)絡(luò)和邊緣應(yīng)用設(shè)計(jì)的全新至強(qiáng)6處理器,內(nèi)置英特爾vRAN Boost技術(shù),可帶來(lái)高達(dá)2.4倍2的無(wú)線接入網(wǎng)(RAN)工作負(fù)載容量提升。 在企業(yè)加速
    的頭像 發(fā)表于 02-25 17:39 ?411次閱讀

    英特爾Gaudi 2D AI加速器助力DeepSeek Janus Pro模型性能提升

    近日,DeepSeek公司發(fā)布了備受矚目的Janus Pro模型,其憑借超強(qiáng)性能和高精度在業(yè)界引發(fā)了廣泛關(guān)注。為了進(jìn)一步提升該模型的應(yīng)用效能,英特爾宣布其
    的頭像 發(fā)表于 02-10 11:10 ?628次閱讀

    DeepSeek發(fā)布Janus Pro模型,英特爾Gaudi 2D AI加速器優(yōu)化支持

    Gaudi 2D AI加速器現(xiàn)已針對(duì)該模型進(jìn)行了全面優(yōu)化。這一優(yōu)化舉措使得AI開(kāi)發(fā)者能夠更輕松地實(shí)現(xiàn)復(fù)雜任務(wù)的部署與優(yōu)化,從而有效滿足行業(yè)應(yīng)用對(duì)于
    的頭像 發(fā)表于 02-08 14:35 ?625次閱讀

    英特爾酷睿Ultra 7處理器助力聯(lián)想YOGA Air 15 Aura AI元啟版樹(shù)立輕薄本新標(biāo)桿

    作為第二代英特爾酷睿Ultra 7處理器首發(fā)護(hù)航產(chǎn)品,年貨送禮的難題或許能在這臺(tái)旗艦級(jí)AI PC上找到答案。對(duì)于事業(yè)有成的親友,普通的禮品難以打動(dòng),奢侈品又顯得過(guò)于繁復(fù)。在這個(gè)AI引領(lǐng)新周期的時(shí)代
    的頭像 發(fā)表于 12-31 16:05 ?1607次閱讀

    使用英特爾AI PC為YOLO模型訓(xùn)練加速

    之后,情況有了新的變化,PyTorch2.5正式開(kāi)始支持英特爾顯卡,也就是說(shuō),此后我們能夠借助英特爾 銳炫 顯卡來(lái)進(jìn)行模型訓(xùn)練了。
    的頭像 發(fā)表于 12-09 16:14 ?1598次閱讀
    使用<b class='flag-5'>英特爾</b>AI PC為YOLO<b class='flag-5'>模型</b><b class='flag-5'>訓(xùn)練</b><b class='flag-5'>加速</b>

    英特爾發(fā)布全新企業(yè)AI一體化方案

    近日,英特爾正式推出了全新的企業(yè)AI一體化方案。該方案以英特爾至強(qiáng)處理器英特爾Gaudi 2D
    的頭像 發(fā)表于 12-03 11:20 ?596次閱讀

    英特爾發(fā)布至強(qiáng)6性能核處理器,攜手生態(tài)加速數(shù)據(jù)中心算力升級(jí)

    英特爾至強(qiáng)6處理器在云計(jì)算、數(shù)據(jù)中心架構(gòu)創(chuàng)新、綠色可持續(xù)發(fā)展等諸多領(lǐng)域的應(yīng)用實(shí)踐,并攜手多家產(chǎn)業(yè)伙伴進(jìn)行了聯(lián)合發(fā)布
    的頭像 發(fā)表于 09-27 10:54 ?7343次閱讀
    <b class='flag-5'>英特爾</b><b class='flag-5'>發(fā)布</b>至強(qiáng)6性能核<b class='flag-5'>處理器</b>,攜手生態(tài)<b class='flag-5'>加速</b>數(shù)據(jù)中心算力升級(jí)

    英特爾發(fā)布Gaudi3 AI加速器,押注低成本優(yōu)勢(shì)挑戰(zhàn)市場(chǎng)

    英特爾近期震撼發(fā)布了專為AI工作負(fù)載設(shè)計(jì)的Gaudi3加速器,這款新芯片雖在速度上不及英偉達(dá)熱門型號(hào)H100與H200 GPU,但英特爾巧妙
    的頭像 發(fā)表于 09-26 16:16 ?1197次閱讀

    英特爾發(fā)布至強(qiáng)6處理器產(chǎn)品

    以“綠色向新,釋放新質(zhì)生產(chǎn)力”為主題的英特爾至強(qiáng)6能效核處理器新品發(fā)布會(huì)在北京舉行。會(huì)上,英特爾重磅推出首款配備能效核的英特爾至強(qiáng)6
    的頭像 發(fā)表于 09-23 15:48 ?685次閱讀

    英特爾? 酷睿? Ultra 處理器面向多行業(yè)加速AI產(chǎn)業(yè)升級(jí)

    持競(jìng)爭(zhēng)力,企業(yè)亟需更高效的計(jì)算平臺(tái)來(lái)處理日益復(fù)雜的數(shù)據(jù)分析和AI推理任務(wù)。 為響應(yīng)這一時(shí)代需求,英特爾正式發(fā)布英特爾? 酷睿? Ultra
    發(fā)表于 09-14 20:36 ?1.3w次閱讀
    <b class='flag-5'>英特爾</b>? 酷睿? Ultra <b class='flag-5'>處理器</b><b class='flag-5'>面向</b>多行業(yè)<b class='flag-5'>加速</b>AI產(chǎn)業(yè)升級(jí)

    開(kāi)箱即用,AISBench測(cè)試展示英特爾至強(qiáng)處理器的卓越推理性能

    。 中國(guó)電子技術(shù)標(biāo)準(zhǔn)化研究院賽西實(shí)驗(yàn)室依據(jù)國(guó)家標(biāo)準(zhǔn)《人工智能服務(wù)系統(tǒng)性能測(cè)試規(guī)范》(征求意見(jiàn)稿)相關(guān)要求,使用AISBench?2.0測(cè)試工具,完成了第五代英特爾至強(qiáng)可擴(kuò)展處理器的A
    的頭像 發(fā)表于 09-06 15:33 ?825次閱讀
    開(kāi)箱即用,AISBench測(cè)試展示<b class='flag-5'>英特爾</b>至強(qiáng)<b class='flag-5'>處理器</b>的卓越<b class='flag-5'>推理</b>性能