一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

未來的AI計算領域,將是CPU、GPU、IPU并行

如意 ? 來源:OFweek電子工程網(wǎng) ? 作者:Ai芯天下 ? 2020-10-19 16:04 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

前言:

AI近些年的大火,直接促進了CPUGPU的發(fā)展,而英偉達的GPU真正借此迅速成為AI市場的主流產(chǎn)品之一,其勢頭甚至蓋過了CPU。

而AI應用需要專門的處理器,而IPU正是這樣的處理器。目前,AI在各行各業(yè)均得到廣泛應用,IPU可以基于自身優(yōu)勢為世界的智能化進程增添不竭動力。

未來的AI計算領域,將是CPU、GPU、IPU并行

英偉達專注的GPU優(yōu)勢逐漸縮小

從專注圖像渲染崛起的英偉達的GPU,走的也是相當于ASIC的技術路線,但隨著游戲、視頻渲染以及AI加速需要的出現(xiàn),英偉達的GPU也在向著GPGPU的方向演進。

當硬件更多的需要與軟件生態(tài)掛鉤時,市場大多數(shù)參與者便會倒下。在競爭清理過后,GPU形成了如今的雙寡頭市場,并且步入相當成熟的階段。

ASIC本身的成本、靈活性缺失,以及應用范圍很窄的特點,都導致它無法采用最先進制程: 即便它們具備性能和能效優(yōu)勢,一旦無法采用最先進制程,則這一優(yōu)勢也將不再明顯。

為保持其在GPU領域的寡頭地位,使得英偉達必須一直保持先進的制程工藝,保持其通用性,但是要犧牲一定的效能優(yōu)勢。

相比于來自類GPU的競爭,英偉達不應該忽視Graphcore的IPU,特別是Graphcore一直都在強調(diào)其是為AI而生,面向的應用也是CPU、GPU不那么擅長的AI應用。

未來的AI計算領域,將是CPU、GPU、IPU并行

利用AI計算打側(cè)面競爭戰(zhàn)

不管CPU還是GPU都無法從根本上解決AI問題,因為AI是一個面向計算圖的任務、與CPU的標量計算和GPU的矢量計算區(qū)別很大。

而另一邊的IPU,則為AI計算提供了全新的技術架構(gòu),同時將訓練和推理合二為一,兼具處理二者工作的能力。

作為標準的神經(jīng)網(wǎng)絡處理芯片,IPU可以支持多種神經(jīng)網(wǎng)絡模型,因其具備數(shù)以千計到數(shù)百萬計的頂點數(shù)量,遠遠超過GPU的頂點規(guī)模,可以進行更高潛力的并行計算工作。

未來的AI計算領域,將是CPU、GPU、IPU并行

計算加上數(shù)據(jù)的突破可以讓IPU在原生稀疏計算中展現(xiàn)出領先IPU 10-50倍的性能優(yōu)勢,到了數(shù)據(jù)稀疏以及動態(tài)稀疏時,IPU就有了比GPU越來越顯著的優(yōu)勢。

此外,如果是在IPU更擅長的分組卷積內(nèi)核中,組維度越少,IPU的性能優(yōu)勢越明顯,總體而言,有4-100倍的吞吐量提升。

5G網(wǎng)絡切片和資源管理中需要用到的強化學習,用IPU訓練吞吐量也能夠提升最多13倍。

兩種芯片勢能英偉達與Graphcore的較量

Graphcore成立于2016年,是一家專注于機器智能、同時也代表著全新計算負載的芯片制造公司,其包括IPU在內(nèi)的產(chǎn)品研發(fā)擅長大規(guī)模并行計算、稀疏的數(shù)據(jù)結(jié)構(gòu)、低精度計算、數(shù)據(jù)參數(shù)復用以及靜態(tài)圖結(jié)構(gòu)。

英偉達的潛在競爭對手Graphcore的第二代IPU在多個主流模型上的表現(xiàn)優(yōu)于A100 GPU,兩者將在超大規(guī)模數(shù)據(jù)中心正面競爭。

未來,IPU可能在一些新興的AI應用中展現(xiàn)出更大的優(yōu)勢。

未來的AI計算領域,將是CPU、GPU、IPU并行

第二代IPU相比第一代IPU有兩倍峰值算力的提升,在典型的CV還有NLP的模型中,第二代IPU相比第一代IPU則展現(xiàn)出了平均8倍的性能提升。

如果對比英偉達基于8個最新A100 GPU的DGX-A100,Graphcore 8個M2000組成的系統(tǒng)的FP32算力是DGX-A100的12倍,AI計算是3倍,AI存儲是10倍。

AI計算未來有三種計算平臺

第一種平臺是CPU,它還會持續(xù)存在,因為一些業(yè)務在CPU上的表現(xiàn)依然不錯;

第二種平臺是GPU,它還會持續(xù)發(fā)展,會有適合GPU的應用場景。

第三種平臺是就是Graphcore的IPU。

IPU旨在幫助創(chuàng)新者在AI應用上實現(xiàn)新的突破,幫助用戶應對當前在CPU、GPU上表現(xiàn)不太好的任務或者阻礙大家創(chuàng)新的場景?!北R濤副總指出。

目前GPU在全球已是大規(guī)模的商用部署,其次是Google的TPU通過內(nèi)部應用及TensorFlow的生態(tài)占第二大規(guī)模,IPU處于第三,是量產(chǎn)的、部署的平臺。

與此同時,Graphcore也在中國積極組建其創(chuàng)新社區(qū)。Graphcore已在微信、知乎、微博和GitHub開通了官方頻道,旨在與開發(fā)者、創(chuàng)新者、研究者更好地交流和互動。

關于未來的AI計算領域,未來會是 “CPU、GPU、IPU并行” 的時代,GPU或部分CPU專注于業(yè)務場景的實現(xiàn)和落地,而IPU專為AI創(chuàng)新者帶來更多突破。

未來的AI計算領域,將是CPU、GPU、IPU并行

構(gòu)建生態(tài)鏈條IPU仍在路上

IPU想要在AI計算中擁有挑戰(zhàn)GPU地位的資格,除了在性能和價格上面證明自己的優(yōu)勢之外,還需要在為機器學習框架提供的軟件棧上提供更多選擇,獲得主流AI算法廠商的支持。

在標準生態(tài)、操作系統(tǒng)上也需要有廣泛的支持,對于開發(fā)者有更方便的開發(fā)工具和社區(qū)內(nèi)容的支持,才能從實際應用中壯大IPU的開發(fā)生態(tài)。

一個AI芯片從產(chǎn)出到大規(guī)模應用必須要經(jīng)過一系列的中間環(huán)節(jié),包括像上面提到的支持主流算法框架的軟件庫、工具鏈、用戶生態(tài)等等,打通這樣一條鏈條都會面臨一個巨大挑戰(zhàn)。

目前申請使用Graphcore IPU開發(fā)者云的主要是商業(yè)用戶和高校,個人研究者比較少。IPU開發(fā)者云支持當前一些最先進和最復雜的AI算法模型的訓練和推理。

和本世紀初的GPU市場一樣,在AI芯片市場步入弱編程階段,如今百家爭鳴的局面預計也將很快結(jié)束,市場在一輪廝殺后會剩下為數(shù)不多的參與者做最終對決。

現(xiàn)在要看的是在發(fā)展初期的逐一擊破階段,Graphcore是否真有定義并主控第三類芯片的魄力了。

不過從創(chuàng)新的架構(gòu)到芯片再到成為革命性的產(chǎn)品,Graphcore從芯片到落地之間的距離,需要易用的軟件和豐富的工具來支持,特別是對軟件生態(tài)依賴程度比較到的云端芯片市場。

結(jié)尾:

IPU不是GPU,這個可能是最大的一個挑戰(zhàn),但同時也是最大的一個機會。IPU并不是GPU的替代品或者類似品,所以不能拿GPU的邏輯來套用IPU的邏輯。

近兩年,AI 芯片出現(xiàn)了各種品類的井噴,可以預計未來IPU在各類AI應用中將具有更大的優(yōu)勢。
責編AJX

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • cpu
    cpu
    +關注

    關注

    68

    文章

    11076

    瀏覽量

    216998
  • gpu
    gpu
    +關注

    關注

    28

    文章

    4943

    瀏覽量

    131202
  • AI
    AI
    +關注

    關注

    88

    文章

    35093

    瀏覽量

    279456
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    AI芯片:加速人工智能計算的專用硬件引擎

    人工智能(AI)的快速發(fā)展離不開高性能計算硬件的支持,而傳統(tǒng)CPU由于架構(gòu)限制,難以高效處理AI任務中的大規(guī)模并行計算需求。因此,專為
    的頭像 發(fā)表于 07-09 15:59 ?124次閱讀

    邊緣AI廣泛應用推動并行計算崛起及創(chuàng)新GPU滲透率快速提升

    是時候重新教育整個生態(tài)了。邊緣AI未來不屬于那些高度優(yōu)化但功能狹窄的芯片,而是屬于可編程的、可適配的并行計算平臺,它們能與智能軟件共同成長并擴展。
    的頭像 發(fā)表于 06-11 14:57 ?239次閱讀

    Imagination與澎峰科技攜手推動GPU+AI解決方案,共拓計算生態(tài)

    的繁榮發(fā)展。 本次合作將聚焦以下兩大方向: 聯(lián)合打造面向AI應用的高性能計算解決方案 ? 依托 Imagination GPU并行計算和能效
    發(fā)表于 05-21 09:40 ?997次閱讀

    超越CPU/GPU:NPU如何讓AI“輕裝上陣”?

    電子發(fā)燒友網(wǎng)報道(文/李彎彎)NPU是一種專門為人工智能(AI計算設計的處理器,主要用于高效執(zhí)行神經(jīng)網(wǎng)絡相關的運算(如矩陣乘法、卷積、激活函數(shù)等)。相較于傳統(tǒng)CPU/GPU,NPU在
    的頭像 發(fā)表于 04-18 00:05 ?2094次閱讀

    摩爾線程GPU原生FP8計算助力AI訓練

    訓練和推理,顯著提升了訓練效率與穩(wěn)定性。摩爾線程是國內(nèi)率先原生支持FP8計算精度的國產(chǎn)GPU企業(yè),此次開源不僅為AI訓練和推理提供了全新的國產(chǎn)化解決方案,更對推動國產(chǎn)GPU
    的頭像 發(fā)表于 03-17 17:05 ?600次閱讀
    摩爾線程<b class='flag-5'>GPU</b>原生FP8<b class='flag-5'>計算</b>助力<b class='flag-5'>AI</b>訓練

    FPGA+AI王炸組合如何重塑未來世界:看看DeepSeek東方神秘力量如何預測......

    ? 異構(gòu)計算的興起:FPGA與CPUGPU、ASIC等其他計算單元的融合成為趨勢。通過異構(gòu)計算架構(gòu),F(xiàn)PGA能夠充分發(fā)揮其
    發(fā)表于 03-03 11:21

    GPU加速計算平臺的優(yōu)勢

    傳統(tǒng)的CPU雖然在日常計算任務中表現(xiàn)出色,但在面對大規(guī)模并行計算需求時,其性能往往捉襟見肘。而GPU加速計算平臺憑借其獨特的優(yōu)勢,吸引了行業(yè)
    的頭像 發(fā)表于 02-23 16:16 ?427次閱讀

    當我問DeepSeek AI爆發(fā)時代的FPGA是否重要?答案是......

    并行架構(gòu)使其在處理深度學習中的矩陣運算、卷積運算等任務時,效率遠高于傳統(tǒng)的CPUGPU。例如,在圖像識別任務中,F(xiàn)PGA可以通過并行處理多個卷積核,顯著加速特征提取過程。 ? 低延遲
    發(fā)表于 02-19 13:55

    GPU 加速計算:突破傳統(tǒng)算力瓶頸的利刃

    ,猶如一把利刃,成功突破了傳統(tǒng)算力的瓶頸。 傳統(tǒng)的 CPU 計算在面對大規(guī)模并行計算任務時,往往顯得力不從心。CPU 核心數(shù)量有限,且設計側(cè)重于復雜的邏輯控制和串行處理,無法高效處理海
    的頭像 發(fā)表于 02-17 10:36 ?290次閱讀

    GPU渲染才是大勢所趨?CPU渲染與GPU渲染的現(xiàn)狀與未來

    在3D建模和渲染領域,隨著技術的發(fā)展,CPU渲染和GPU渲染這兩種方法逐漸呈現(xiàn)出各自獨特的優(yōu)勢,并且在不同的應用場景中各有側(cè)重。盡管當前我們處在一個CPU渲染和
    的頭像 發(fā)表于 02-06 11:04 ?675次閱讀
    <b class='flag-5'>GPU</b>渲染才是大勢所趨?<b class='flag-5'>CPU</b>渲染與<b class='flag-5'>GPU</b>渲染的現(xiàn)狀與<b class='flag-5'>未來</b>

    《算力芯片 高性能 CPUGPUNPU 微架構(gòu)分析》第3篇閱讀心得:GPU革命:從圖形引擎到AI加速器的蛻變

    CPU、GPU的演進歷程,AI專用芯片或?qū)⒁I未來計算平臺的新方向。正如愛因斯坦所說:\"想象力比知識更重要\" —— 在芯片設計
    發(fā)表于 11-24 17:12

    【「算力芯片 | 高性能 CPU/GPU/NPU 微架構(gòu)分析」閱讀體驗】--了解算力芯片GPU

    每個CUDA單元在 OpenCL 編程框架中都有對應的單元。 倒金字塔結(jié)構(gòu)GPU存儲體系 共享內(nèi)存是開發(fā)者可配置的編程資源,使用門檻較高,編程上需要更多的人工顯式處理。 在并行計算架構(gòu)中,線程
    發(fā)表于 11-03 12:55

    GPU加速計算平臺是什么

    GPU加速計算平臺,簡而言之,是利用圖形處理器(GPU)的強大并行計算能力來加速科學計算、數(shù)據(jù)分析、機器學習等復雜
    的頭像 發(fā)表于 10-25 09:23 ?588次閱讀

    為什么ai模型訓練要用gpu

    GPU憑借其強大的并行處理能力和高效的內(nèi)存系統(tǒng),已成為AI模型訓練不可或缺的重要工具。
    的頭像 發(fā)表于 10-24 09:39 ?957次閱讀

    名單公布!【書籍評測活動NO.43】 算力芯片 | 高性能 CPU/GPU/NPU 微架構(gòu)分析

    ,即大模型專用AI超級計算機的中樞核心。 作者介紹: 濮元愷,曾就職于中關村在線核心硬件事業(yè)部,負責CPUGPU類產(chǎn)品評測,長期關注GPGPU
    發(fā)表于 09-02 10:09