黄色一级Aaaaaaaaaa,青春草公开免费视频

電子發(fā)燒友網(wǎng)報道（文/李彎彎）大模型的訓練和推理需要高性能的算力支持。以ChatGPT為例，據(jù)估算，在訓練方面，1746億參數(shù)的GPT-3模型大約需要375-625臺8卡DGXA100服務器訓練10天左右，對應A100GPU數(shù)量約3000-5000張。

在推理方面，如果以A100GPU單卡單字輸出需要350ms為基準計算，假設每日訪問客戶數(shù)量高達5,000萬人時，按單客戶每日發(fā)問ChatGPT應用10次，單次需要50字回答，則每日消耗GPU的計算時間將會高達243萬個小時，對應的GPU需求數(shù)量將超過10萬個。

大模型的訓練和推理依賴通用GPU

算力即計算能力，具體指硬件對數(shù)據(jù)收集、傳輸、計算和存儲的能力，算力的大小表明了對數(shù)字化信息處理能力的強弱，常用計量單位是FLOPS（Floating-pointoperationspersecond），表示每秒浮點運算次數(shù)。

當前大模型的訓練和推理多采用GPGPU。GPGPU是一種由GPU去除圖形處理和輸出，僅保留科學計算、AI訓練和推理功能的GPU。GPU芯片最初用于計算機系統(tǒng)圖像顯示的運算，但因其相比于擅長橫向計算的CPU更擅長于并行計算，在涉及到大量的矩陣或向量計算的AI計算中很有優(yōu)勢，GPGPU應運而生。

在這波ChatGPT浪潮中長期押注AI的英偉達可以說受益最多，ChatGPT、包括各種大模型的訓練和推理，基本都采用英偉達的GPU。目前國內多個廠商都在布局GPGPU，包括天數(shù)智芯、燧原科技、壁仞科技、登臨科技等，不過當前還較少能夠應用于大模型。

事實上業(yè)界認為，隨著模型參數(shù)越來越大，GPU在提供算力支持上也存在瓶頸。在GPT-2之前的模型時代，GPU內存還能滿足AI大模型的需求，近年來，隨著Transformer模型的大規(guī)模發(fā)展和應用，模型大小每兩年平均增長240倍，實際上GPT-3等大模型的參數(shù)增長已經(jīng)超過了GPU內存的增長。傳統(tǒng)的設計趨勢已經(jīng)不能適應當前的需求，芯片內部、芯片之間或AI加速器之間的通信成為了AI計算的瓶頸。

存算一體技術如何突破算力瓶頸

而存算一體作為一種新型架構形式受到關注，存算一體將存儲和計算有機結合，直接在存儲單元中處理數(shù)據(jù)，避免了在存儲單元和計算單元之間頻繁轉移數(shù)據(jù)，減少了不必要的數(shù)據(jù)搬移造成的開銷，不僅大幅降低了功耗，還可以利用存儲單元進行邏輯計算提高算力，顯著提升計算效率。

大模型的訓練和部署不僅對算力提出了高要求，對能耗的要求也很高，從這個角度來看，存算一體降低功耗，提升計算效率等特性在大模型方面確實更具優(yōu)勢。

因為獨具優(yōu)勢，過去幾年已經(jīng)有眾多企業(yè)進入到存算一體領域，包括知存科技、千芯科技、蘋芯科技、后摩智能、億鑄科技等。各企業(yè)的技術方向也有所不同，從介質層面來看，有的采用NORFlash，有的采用SRAM，也有的采用RRAM。

從目前的情況來看，基于NORFlash的存算一體產品，在算力上難以做大，應用場景主要是對算力要求不高，對功耗要求高的可穿戴設備等領域；基于SRAM的存算一體算力可以更大些，能夠用于自動駕駛領域；而真正能夠在算力上實現(xiàn)突破，可以稱之為大算力AI芯片的，目前只有億鑄科技主推的基于RRAM的存算一體技術。

在大模型對大算力的需求背景下，億鑄科技近期更是提出了存算一體超異構計算。超異構計算能夠把更多的異構計算整合重構，從而各類型處理器間充分地、靈活地進行數(shù)據(jù)交互而形成的計算。

簡單來說，就是結合DSA、GPU、CPU、CIM等多個類型引擎的優(yōu)勢，實現(xiàn)性能的飛躍：DSA負責相對確定的大計算量的工作；GPU負責應用層有一些性能敏感的并且有一定彈性的工作；CPU啥都能干，負責兜底；CIM就是存內計算，超異構和普通異構的主要區(qū)別就是加入了CIM，由此可以實現(xiàn)同等算力，更低能耗，同等能耗，更高算力。另外，CIM由于器件的優(yōu)勢，能負擔比DSA更大的算力。

億鑄科技創(chuàng)始人、董事長兼CEO熊大鵬博士表示,存算一體超異構計算的好處在于：一是在系統(tǒng)層,能夠把整體的效率做到最優(yōu)；二是在軟件層,能夠實現(xiàn)跨平臺架構統(tǒng)一。

基于存算一體超異構概念，億鑄科技提出了自己的技術暢想：若能把新型憶阻器技術(RRAM)、存算一體架構、芯粒技術（Chiplet）、3D封裝等技術結合，將會實現(xiàn)更大的有效算力、放置更多的參數(shù)、實現(xiàn)更高的能效比、更好的軟件兼容性、從而突破性能瓶頸，抬高AI大算力芯片的發(fā)展天花板。

圖源：億鑄科技

目前國內已公開的能夠實現(xiàn)存算一體AI大算力的芯片公司僅有億鑄科技，其基于RRAM的存算一體AI大算力芯片將在今年回片。

小結

無論是大模型的訓練還是部署，對大算力芯片的需求都很大，從目前的情況來看，大模型的訓練在很長時間都將要依賴于英偉達的GPU芯片。

而在大模型的推理部署方面，除了GPU,存算一體將是非常合適的選擇。未來大模型的部署規(guī)模會很大，從前不久英偉達專門推出適合大型語言模型部署的芯片平臺也能看出來。據(jù)億鑄科技透露，公司規(guī)劃的產品，在同等功耗下，性能將超越英偉達H100系列的推理芯片。

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

AI

AI

+關注

關注
87

文章
33554

瀏覽量
274264
大數(shù)據(jù)

大數(shù)據(jù)

+關注

關注
64

文章
8941

瀏覽量
139147
存算一體

存算一體

+關注

關注
0

文章
106

瀏覽量
4558
大模型

大模型

+關注

關注
2

文章
2941

瀏覽量
3685

DeepSeek推動AI算力需求：800G光模塊的關鍵作用

力集群的部署過程中，帶寬瓶頸成為制約算力發(fā)揮的關鍵因素，而光模塊的速率躍升

發(fā)表于 03-25 12:00

存力接棒算力，慧榮科技以主控技術突破AI存儲極限

電子發(fā)燒友網(wǎng)報道（文/黃山明）在AI的高速增長下，尤其是以DeepSeek為代表的AI大模型推動存儲需求激增，算力增長倒逼存力升級。而存儲是

發(fā)表于 03-19 01:29 ?1467次閱讀

<b class='flag-5'>存</b><b class='flag-5'>力</b>接棒<b class='flag-5'>算</b><b class='flag-5'>力</b>，慧榮科技以主控<b class='flag-5'>技術</b><b class='flag-5'>突破</b>AI存儲極限

【一文看懂】什么是端側算力？

隨著物聯(lián)網(wǎng)（IoT）、人工智能和5G技術的快速發(fā)展，端側算力正逐漸成為智能設備性能提升和智能化應用實現(xiàn)的關鍵技術。什么是端側

發(fā)表于 02-24 12:02 ?855次閱讀

【<b class='flag-5'>一</b>文看懂】什么是端側<b class='flag-5'>算</b><b class='flag-5'>力</b>？

濟南市中區(qū)存算一體化智算中心上線DeepSeek

濟南市中未來產業(yè)發(fā)展有限公司（簡稱“市中產發(fā)”）聯(lián)合華為、北京昇騰和清昴智能基于市中區(qū)存算一體化智算中心（國家大學科技園節(jié)點）昇騰算

發(fā)表于 02-19 10:38 ?456次閱讀

云 GPU 加速計算：突破傳統(tǒng)算力瓶頸的利刃

，猶如一把利刃，成功突破了傳統(tǒng)算力的瓶頸。傳統(tǒng)的 CPU 計算在面對大規(guī)模并行計算任務時，往往顯得力不從心。CPU 核心數(shù)量有限，且設計側

發(fā)表于 02-17 10:36 ?206次閱讀

澎峰科技發(fā)布DeepSeek智算一體機

人工智能普惠化迎來里程碑式突破!澎峰科技發(fā)布業(yè)內“首款”萬元級別DeepSeek智算一體機，本地運行671B滿血模型。

發(fā)表于 02-15 16:29 ?1297次閱讀

存算一體行業(yè)2024年回顧與2025年展望

2024年，大模型技術的迅猛發(fā)展成為人工智能領域的核心驅動力，其對硬件算力和存儲效率的極致需求，促使存

發(fā)表于 01-23 11:24 ?800次閱讀

存算一體化與邊緣計算：重新定義智能計算的未來

隨著數(shù)據(jù)量爆炸式增長和智能化應用的普及，計算與存儲的高效整合逐漸成為科技行業(yè)關注的重點。數(shù)據(jù)存儲和處理需求的快速增長推動了對計算架構的重新設計，“存算一體化”

發(fā)表于 11-12 01:05 ?567次閱讀

存算一體架構創(chuàng)新助力國產大算力AI芯片騰飛

在灣芯展SEMiBAY2024《AI芯片與高性能計算（HPC）應用論壇》上，億鑄科技高級副總裁徐芳發(fā)表了題為《存算一體架構創(chuàng)新助力國產大算力

發(fā)表于 10-23 14:48 ?696次閱讀

科技新突破：首款支持多模態(tài)存算一體AI芯片成功問世

存算一體介質，通過存儲單元和計算單元的深度融合，采用22nm成熟工藝制程，有效把控制造成本。與傳統(tǒng)架構下的AI芯片相比，該款芯片在算力、能效

發(fā)表于 09-26 13:51 ?586次閱讀

大模型時代的算力需求

現(xiàn)在AI已進入大模型時代，各企業(yè)都爭相部署大模型，但如何保證大模型的算力，以及相關的穩(wěn)定性和性能

發(fā)表于 08-20 09:04

后摩智能推出邊端大模型AI芯片M30，展現(xiàn)出存算一體架構優(yōu)勢

了基于M30芯片的智算模組(SoM)和力謀??AI加速卡。 ? 后摩智能存算一體架構芯片產品 ? 后摩智能是

發(fā)表于 07-03 00:58 ?4822次閱讀

知存科技助力AI應用落地：WTMDK2101-ZT1評估板實地評測與性能揭秘

中得到彰顯。存算一體架構的突破傳統(tǒng)馮·諾依曼架構的范式探索成為重要趨勢。這種架構改變了存

發(fā)表于 05-16 16:38

探索存內計算—基于 SRAM 的存內計算與基于 MRAM 的存算一體的探究

本文深入探討了基于SRAM和MRAM的存算一體技術在計算領域的應用和發(fā)展。首先，介紹了基于SRAM的存內邏輯計算

發(fā)表于 05-16 16:10 ?3903次閱讀

知存科技攜手北大共建存算一體化技術實驗室，推動AI創(chuàng)新

揭牌儀式結束后，王紹迪在北大集成電路學院舉辦的“未名·芯”論壇上做了主題演講，分享了他對于多模態(tài)大模型時代存內計算發(fā)展的見解。他強調了存算

發(fā)表于 05-08 17:25 ?1278次閱讀

一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

搜索歷史

奔向大模型時代，存算一體成為突破算力瓶頸的關鍵技術？

評論

DeepSeek推動AI算力需求：800G光模塊的關鍵作用

存力接棒算力，慧榮科技以主控技術突破AI存儲極限

【一文看懂】什么是端側算力？

濟南市中區(qū)存算一體化智算中心上線DeepSeek

云 GPU 加速計算：突破傳統(tǒng)算力瓶頸的利刃

澎峰科技發(fā)布DeepSeek智算一體機

存算一體行業(yè)2024年回顧與2025年展望

存算一體化與邊緣計算：重新定義智能計算的未來

存算一體架構創(chuàng)新助力國產大算力AI芯片騰飛

科技新突破：首款支持多模態(tài)存算一體AI芯片成功問世

大模型時代的算力需求

后摩智能推出邊端大模型AI芯片M30，展現(xiàn)出存算一體架構優(yōu)勢

知存科技助力AI應用落地：WTMDK2101-ZT1評估板實地評測與性能揭秘

探索存內計算—基于 SRAM 的存內計算與基于 MRAM 的存算一體的探究

知存科技攜手北大共建存算一體化技術實驗室，推動AI創(chuàng)新

搜索歷史

奔向大模型時代，存算一體成為突破算力瓶頸的關鍵技術？

評論

奔向大模型時代，存算一體成為突破算力瓶頸的關鍵技術？