一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

英特爾推出AI加速器性價比產品Gaudi2

IT葡萄皮 ? 來源:IT葡萄皮 ? 2023-07-14 16:42 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

日前,英特爾面向中國市場發(fā)布了HabanaGaudi2深度學習加速卡器。

新的Gaudi2直接給到了24個Tensor處理核心(TPC),是上代產品的三倍;而在對大模型應用至關重要的顯存方面,Gaudi2也大方的配置了96GBHBM2e,顯存帶寬直接達到了2.4TB/s。而在連接方式上,Gaudi2則采用了OCPOAM接口形式,可擴展出21個100G以太網連接,并支持RoCE(RDMAover Converged Ethernet)v2。同時,Gaudi2還集成了多媒體處理器引擎和48MB片上SRAM作為高速緩存。

在系統(tǒng)層面,英特爾則提供能夠同時安裝8塊Gaudi2的夾層基板,同樣遵循OCP標準,可擴展出24個100GRoCE網絡接口。

性能更好的新選擇

Gaudi2搭載的96GBHBM顯存的確令人眼前一亮,但真正能夠影響用戶購買行為的仍舊似乎加速卡本身的計算性能。

在HuggingFace工程師RégisPierrard去年底進行的Gaudi2測試中,Gaudi2不僅在與前代產品的對比中表現(xiàn)出了近乎線性的性能提升,更大幅超越了對標的A100加速卡。

5261f29a-2220-11ee-962d-dac502259ad0.png

BERT預訓練,8卡

Gaudi2使用bf16/fp32混合精度,A100使用fp16精度

526f3b26-2220-11ee-962d-dac502259ad0.png

StableDiffusion測試,單卡

從RégisPierrard使用IntelDeveloper Cloud進行的兩輪測試中我們不難發(fā)現(xiàn),無論是在BERT這樣的大模型應用中,還是在StableDiffusion這樣的“傳統(tǒng)”AIGC應用中,Gaudi2的性能表現(xiàn)均相當亮眼;相對于前代產品展現(xiàn)出了至少3倍的性能優(yōu)勢(Gaudi2的TPC數(shù)量是前代的3倍),且比對標的A100產品更具性能優(yōu)勢。

在兩項測試中,Gaudi2均使用了英特爾推出的SynapseAI1.10套件和OptimumHabana1.6;其中前者是面向Gaudi系列加速卡的SDK開發(fā)套件,能夠對TensorFlow和Pytorch等流行框架提供支持,而后者則是專門面向Transformers和Diffusers優(yōu)化的運行庫。

同時,在發(fā)布會的現(xiàn)場演示環(huán)節(jié),英特爾工作人員展示了StableDiffusion應用中1至64張卡的計算性能,并實現(xiàn)了99%的近線性性能擴展。換而言之,在更大規(guī)模的業(yè)務部署當中,Gaudi2也能通過集群橫向擴展獲得更加線性的性能增長。

目前,Gaudi系列AI加速器已經在AWS的EC2DL1主機中進行了實際的商業(yè)部署。AWS表示,相對于傳統(tǒng)GPU,Gaudi能夠在深度學習應用中帶來40%的性價比提升。

在走量的市場做走心的產品

誠然,Gaudi2的競品并非性能無兩的H100,更無法對即將面市的H100NVL構成性能威脅。但對于更加“走量”的A100而言,Gaudi2所展現(xiàn)出的性價比則對大多數(shù)用戶而言更有價值。

近兩年,“從中端入局”似乎已經成為英特爾的慣用手段,消費級的Arc770顯卡和如今的Gaudi2均如此。

走量的中端市場對英特爾有足夠的吸引力,也更容易幫助英特爾用一兩款產品就建立口碑、站穩(wěn)腳跟;同時,能在中端市場為用戶提供先進技術和優(yōu)勢性價比也證明英特爾對目標用戶足夠走心,愿意把真正的實惠帶給最廣闊的用戶市場。

在走量的市場做走心的產品,這樣的英特爾令人喜聞樂見。

為Ai加速器市場打開一扇窗

近兩年,以AIGC為代表的AI應用快速崛起,吸引了科技圈和投資界的廣泛關注,其中的語言類大模型更有望大幅降低企業(yè)在營銷、客服和售后方面的成本,實現(xiàn)生產效率的大幅提升。

在科技企業(yè)爭相進行大模型“軍備競賽”的背后,GPU的需求也水漲船高。在GPU市場格局高度固化的當下,這一現(xiàn)象很容易帶來終端市場的價格起伏,導致GPU價格畸高,進而推高企業(yè)投身AI業(yè)務的成本并導致基礎架構被綁定。

而英特爾Gaudi2加速卡的出現(xiàn)則意味著企業(yè)有了全新選擇。一方面,Gaudi2在絕對性能、顯存容量、集群性能等方面都比對標產品有優(yōu)勢,能夠承接現(xiàn)有的市場需求;另一方面,伴隨oneAPI等算力調用工具的不斷成熟和完善,用戶也能在開發(fā)和應用層面實現(xiàn)基礎架構的透明化,更輕松的調用多元算力,繼而獲得算力和基礎架構層面的靈活性。

528258aa-2220-11ee-962d-dac502259ad0.png

作為AI加速器市場的“追趕者”,Gaudi2證明英特爾能夠為用戶提供有競爭力的先進產品。當然,這還僅是在“獨立AI加速器”這一條賽道中。

在更廣闊的數(shù)據(jù)中心賽道中,英特爾還有并行的DataCenter Max和DataCenterFlex兩條產品線,以及更加獨立的FPGA賽道。此外,英特爾也在積極推動AI能力與傳統(tǒng)CPU的結合。從最初的AVX-512指令集和DLBoost到如今AMX-512指令集,英特爾正在為用戶構建一條“用CPU靈活處理AI推理業(yè)務”的全新路徑。

很顯然,在英特爾的眼中,用戶在未來應該針對不同場景和不同業(yè)務負載來規(guī)劃不同的基礎架構,用不同算力來滿足業(yè)務需求。而伴隨oneAPI的逐步成熟,底層算力的區(qū)別將被抹除,模型訓練和多端部署不再需要特別調優(yōu)就能實現(xiàn)無縫遷移和高效調優(yōu)。

在產品層面,英特爾最新推出的Gaudi2對用戶而言有足夠的吸引力;在戰(zhàn)略層面,Gaud2則是英特爾站穩(wěn)獨立AI加速器市場并構筑多元算力體系的重要一步。而在AI研究快速推進,技術落地如火如荼的當下,Gaudi2的出現(xiàn)無疑為用戶帶來了全新選擇;而奮力前行的英特爾更有望為市場帶來AI與算力需求之間的全新平衡。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 英特爾
    +關注

    關注

    61

    文章

    10196

    瀏覽量

    174705
  • 加速器
    +關注

    關注

    2

    文章

    827

    瀏覽量

    39127
  • AI
    AI
    +關注

    關注

    88

    文章

    35164

    瀏覽量

    280018
  • Gaudi2
    +關注

    關注

    0

    文章

    13

    瀏覽量

    195

原文標題:先得走心,才能走量!英特爾推出AI加速器性價比產品Gaudi2

文章出處:【微信號:IT葡萄皮,微信公眾號:IT葡萄皮】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    直擊Computex 2025:英特爾重磅發(fā)布新一代GPU,圖形和AI性能躍升3.4倍

    B60和英特爾銳炫Pro B50 GPU,AI加速器產品英特爾Gaudi 3
    的頭像 發(fā)表于 05-21 00:57 ?5944次閱讀
    直擊Computex 2025:<b class='flag-5'>英特爾</b>重磅發(fā)布新一代GPU,圖形和<b class='flag-5'>AI</b>性能躍升3.4倍

    直擊Computex2025:英特爾重磅發(fā)布新一代GPU,圖形和AI性能躍升3.4倍

    5月19日,在Computex 2025上,英特爾發(fā)布了最新全新圖形處理(GPU)和AI加速器產品系列。包括全新
    的頭像 發(fā)表于 05-20 12:27 ?4471次閱讀
    直擊Computex2025:<b class='flag-5'>英特爾</b>重磅發(fā)布新一代GPU,圖形和<b class='flag-5'>AI</b>性能躍升3.4倍

    英特爾發(fā)布全新GPU,AI和工作站迎來新選擇

    英特爾推出面向準專業(yè)用戶和AI開發(fā)者的英特爾銳炫Pro GPU系列,發(fā)布英特爾? Gaudi 3
    發(fā)表于 05-20 11:03 ?1514次閱讀

    英特爾Gaudi 2D AI加速器助力DeepSeek Janus Pro模型性能提升

    近日,DeepSeek公司發(fā)布了備受矚目的Janus Pro模型,其憑借超強性能和高精度在業(yè)界引發(fā)了廣泛關注。為了進一步提升該模型的應用效能,英特爾宣布其Gaudi 2D AI
    的頭像 發(fā)表于 02-10 11:10 ?627次閱讀

    DeepSeek發(fā)布Janus Pro模型,英特爾Gaudi 2D AI加速器優(yōu)化支持

    Gaudi 2D AI加速器現(xiàn)已針對該模型進行了全面優(yōu)化。這一優(yōu)化舉措使得AI開發(fā)者能夠更輕松地實現(xiàn)復雜任務的部署與優(yōu)化,從而有效滿足行業(yè)應
    的頭像 發(fā)表于 02-08 14:35 ?624次閱讀

    英特爾推出全新英特爾銳炫B系列顯卡

    備受玩家青睞的價格提供卓越的性能與價值1,很好地滿足現(xiàn)代游戲需求,并為AI工作負載提供加速。其配備的英特爾Xe矩陣計算引擎(XMX),為新推出的XeSS
    的頭像 發(fā)表于 12-07 10:16 ?1430次閱讀
    <b class='flag-5'>英特爾</b><b class='flag-5'>推出</b>全新<b class='flag-5'>英特爾</b>銳炫B系列顯卡

    英特爾發(fā)布全新企業(yè)AI一體化方案

    近日,英特爾正式推出了全新的企業(yè)AI一體化方案。該方案以英特爾至強處理英特爾
    的頭像 發(fā)表于 12-03 11:20 ?596次閱讀

    英特爾發(fā)布全新企業(yè)AI一體化解決方案

    近日,英特爾正式推出了其全新的企業(yè)AI一體化解決方案,這一方案旨在為企業(yè)提供更加開放、可擴展且高效的端到端服務。 該方案的核心在于其全棧硬件的支撐,包括英特爾至強處理
    的頭像 發(fā)表于 12-02 10:48 ?919次閱讀

    Inflection AI轉向英特爾Gaudi 3,放棄英偉達GPU

    近日,人工智能技術公司Inflection AI宣布了一項重要決策,其最新的企業(yè)平臺將放棄采用英偉達(Nvidia)的GPU,轉而選擇英特爾Gaudi 3加速器。
    的頭像 發(fā)表于 10-10 17:21 ?777次閱讀

    Inflection AI攜手英特爾推出企業(yè)級AI系統(tǒng)

    近日,AI初創(chuàng)企業(yè)Inflection AI英特爾聯(lián)合宣布了一項重大合作——推出基于英特爾Gaudi
    的頭像 發(fā)表于 10-09 16:40 ?753次閱讀

    英特爾調降明年AI服務芯片出貨目標

    近日,有消息稱英特爾為應對內部策略調整及終端需求變化,已對其旗下AI服務芯片Gaudi 3的明年出貨目標進行了大幅調整。
    的頭像 發(fā)表于 10-08 15:38 ?571次閱讀

    英特爾發(fā)布Gaudi3 AI加速器,押注低成本優(yōu)勢挑戰(zhàn)市場

    英特爾近期震撼發(fā)布了專為AI工作負載設計的Gaudi3加速器,這款新芯片雖在速度上不及英偉達熱門型號H100與H200 GPU,但英特爾巧妙
    的頭像 發(fā)表于 09-26 16:16 ?1196次閱讀

    IBM Cloud將部署英特爾Gaudi 3 AI芯片

    近日,科技巨頭IBM與英特爾宣布了一項重大合作計劃,雙方將共同在IBM Cloud平臺上部署英特爾最新的Gaudi 3 AI芯片,預計該服務將于2025年初正式上線。此次合作標志著兩家
    的頭像 發(fā)表于 09-03 15:52 ?666次閱讀

    從運動員到開發(fā)者: 英特爾以開放式AI系統(tǒng)應對多重挑戰(zhàn)

    打造的生成式AI(GenAI)檢索增強生成(RAG)解決方案。該成果深度展示了英特爾如何通過基于英特爾?至強?處理英特爾??
    的頭像 發(fā)表于 07-25 09:28 ?539次閱讀
    從運動員到開發(fā)者: <b class='flag-5'>英特爾</b>以開放式<b class='flag-5'>AI</b>系統(tǒng)應對多重挑戰(zhàn)

    英特爾以生成式AI RAG解決方案,為巴黎奧運健兒提供便捷體驗

    的生成式AI(GenAI)檢索增強生成(RAG)解決方案。該成果深度展示了英特爾如何通過基于英特爾至強處理英特爾?
    的頭像 發(fā)表于 07-19 19:43 ?2067次閱讀
    <b class='flag-5'>英特爾</b>以生成式<b class='flag-5'>AI</b> RAG解決方案,為巴黎奧運健兒提供便捷體驗