軟件一直是智能應(yīng)用領(lǐng)域的創(chuàng)新助推器,而硬件正迅速成為人工智能(AI)領(lǐng)域的核心引擎。人臉識(shí)別、自動(dòng)駕駛、虛擬輔助,以及眾多其他應(yīng)用都要依賴AI硬件。預(yù)計(jì)到2025年,AI的市場規(guī)模將達(dá)到650億美元。
神經(jīng)網(wǎng)絡(luò)等并行計(jì)算系統(tǒng)對(duì)于能夠處理海量數(shù)據(jù)并執(zhí)行自我迭代訓(xùn)練有著巨大的需求,硬件也因此成為這一領(lǐng)域的主導(dǎo)力量。在這個(gè)數(shù)據(jù)量巨大的環(huán)境中,AI加速器等硬件系統(tǒng)占據(jù)了舞臺(tái)中心。
AI加速器具有如下眾多優(yōu)勢:
● 能效相較于通用型計(jì)算設(shè)備顯著提高
● 降低計(jì)算延遲以支持實(shí)時(shí)應(yīng)用
● 具備可擴(kuò)展性,能夠取得性能速度改善,其程度甚至能與所用的內(nèi)核數(shù)達(dá)成線性擴(kuò)展
● 異構(gòu)架構(gòu)支持系統(tǒng)容納多個(gè)專用處理器以執(zhí)行特定任務(wù)
AI加速器支持?jǐn)?shù)據(jù)中心和邊緣
AI加速器主要在兩大領(lǐng)域發(fā)揮作用:數(shù)據(jù)中心和邊緣?,F(xiàn)在的數(shù)據(jù)中心需要大規(guī)模的可拓展計(jì)算架構(gòu),尤其是那些可支持多達(dá)數(shù)千臺(tái)物理服務(wù)器和數(shù)百萬臺(tái)虛擬機(jī)的超大規(guī)模數(shù)據(jù)中心,對(duì)大規(guī)??蓴U(kuò)展計(jì)算架構(gòu)的需求極為迫切,這一市場需求使得一些企業(yè)憑借加速AI工作負(fù)載這一業(yè)務(wù)發(fā)展壯大。例如,Cerebras為Cerebras CS-1深度學(xué)習(xí)系統(tǒng)創(chuàng)造了晶圓級(jí)引擎(WSE)。WSE面積為46,225mm2,擁有1.2 萬億個(gè)晶體管和40萬個(gè)經(jīng)過AI優(yōu)化的內(nèi)核,是迄今為止最大的芯片。WSE可提供更大的算力、存儲(chǔ)和通信帶寬,能夠支持AI研究達(dá)到前所未有的速度和規(guī)模。與之相對(duì)的是硬件基板面有限且節(jié)能至為關(guān)鍵的邊緣應(yīng)用。如果邊緣SoC內(nèi)部集成了AI加速器IP ,則它可以快速提供必要的智能功能從而支持各種應(yīng)用,例如智能手機(jī)或自動(dòng)化工廠機(jī)器人中運(yùn)行的交互式程序。對(duì)于在邊緣提供智能應(yīng)用,支持它們的 AI加速器必須經(jīng)過優(yōu)化,以具備諸如實(shí)時(shí)計(jì)算延遲、超高能效、失效安全運(yùn)行以及高度可靠性等特征。
并不是所有AI應(yīng)用都需要像WSE這么大的芯片,例如以下類型的硬件AI加速器:
● 能夠執(zhí)行時(shí)間神經(jīng)網(wǎng)絡(luò)處理的圖形處理單元 (GPU)
● Google張量處理單元 (TPU) 等空間加速器
● Sambanova的DataScale等粗粒度可重構(gòu)計(jì)算架構(gòu) (CGRA)
● 經(jīng)過向量處理擴(kuò)展的大規(guī)模多核標(biāo)量處理器
所有此類芯片均可以幾十個(gè)或幾百個(gè)組合使用,形成更大的系統(tǒng),處理更大型的神經(jīng)網(wǎng)絡(luò)。比如說,如果將Google的TPU合并到pod配置中,那么可以帶來超過100 petaFLOPS的處理能力來訓(xùn)練神經(jīng)網(wǎng)絡(luò)模型。NVIDIA旗下應(yīng)用深度學(xué)習(xí)研究團(tuán)隊(duì)推出的Megatron創(chuàng)造了一個(gè)帶有83億參數(shù)轉(zhuǎn)換器的語言模型,可提供8路模型并行和64路數(shù)據(jù)并行功能用于自然語言處理。要執(zhí)行這一模型,就必須開發(fā)出具有 312 teraFLOP FP16計(jì)算能力的NVIDIA A100 GPU。另一種新興的硬件類型是 CGRA,它能在編程不同網(wǎng)絡(luò)時(shí),在性能、能效與靈活性方面巧妙地實(shí)現(xiàn)權(quán)衡。
在這場關(guān)于AI硬件的討論中,軟件棧是不容忽視的存在,因?yàn)樗軐?shí)現(xiàn)系統(tǒng)級(jí)性能表現(xiàn),并確保充分利用硬件。TensorFlow等開源軟件平臺(tái)為開發(fā)人員提供各類工具、庫和其他資源,幫助他們輕松構(gòu)建和部署機(jī)器學(xué)習(xí)應(yīng)用。Facebook Glow等機(jī)器學(xué)習(xí)編譯器不斷涌現(xiàn),有助于促成高級(jí)軟件框架與各種AI加速器的連接。
種類全面的AI設(shè)計(jì)產(chǎn)品組合
硬件已經(jīng)成為AI應(yīng)用的關(guān)鍵組件,但此類組件仍然面臨特有的設(shè)計(jì)難題,在云和邊緣應(yīng)用想要突破當(dāng)前硅技術(shù)的功耗、性能和面積(PPA)極限時(shí)尤其如此。對(duì)數(shù)據(jù)中心來說,件設(shè)計(jì)呈現(xiàn)多級(jí)物理分層、局部同步和全局異步架構(gòu)、尺寸龐大和布局分散等特征。在邊緣應(yīng)用中, AI設(shè)計(jì)必須能夠處理數(shù)以百計(jì)的設(shè)計(jì)角,以滿足超低功耗要求,實(shí)現(xiàn)異構(gòu)集成并具備超乎尋常的多變性。
新思科技能夠?yàn)锳I硬件設(shè)計(jì)人員提供業(yè)內(nèi)最為全面的AI設(shè)計(jì)產(chǎn)品組合,幫助他們攻克此類難題。我們的產(chǎn)品,以邊緣設(shè)備IP、Zebu Server 4仿真系統(tǒng),全面輻射整個(gè)范圍,并能快速將載復(fù)雜的工作負(fù)載引入到Fusion Design Platform,實(shí)現(xiàn)全流程的、且經(jīng)AI改進(jìn)結(jié)果質(zhì)量(QoR)和結(jié)果轉(zhuǎn)化時(shí)間(TTR)的IC設(shè)計(jì)。
新思科技還推出DSO.ai(設(shè)計(jì)空間優(yōu)化AI),這是業(yè)內(nèi)首款針對(duì)芯片設(shè)計(jì)的自主AI應(yīng)用。DSO.ai 在非常大的芯片設(shè)計(jì)解決方案范圍內(nèi)尋找優(yōu)化目標(biāo)。它減少了設(shè)計(jì)工作流中自動(dòng)執(zhí)行的間接決策,從而大幅加快了專用AI加速器的設(shè)計(jì)進(jìn)度。
隨著AI應(yīng)用更加深入地融入我們的生活,AI加速器等硬件將會(huì)繼續(xù)發(fā)揮關(guān)鍵作用,實(shí)現(xiàn)實(shí)時(shí)響應(yīng),為智能設(shè)備和系統(tǒng)創(chuàng)造更大價(jià)值。
原文標(biāo)題:AI加速器,實(shí)現(xiàn)人工智能創(chuàng)新的核心引擎
文章出處:【微信公眾號(hào):新思科技】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
責(zé)任編輯:haq
-
加速器
+關(guān)注
關(guān)注
2文章
827瀏覽量
39115 -
AI
+關(guān)注
關(guān)注
88文章
35136瀏覽量
279759 -
人工智能
+關(guān)注
關(guān)注
1806文章
49014瀏覽量
249428
原文標(biāo)題:AI加速器,實(shí)現(xiàn)人工智能創(chuàng)新的核心引擎
文章出處:【微信號(hào):Synopsys_CN,微信公眾號(hào):新思科技】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
粒子加速器?——?科技前沿的核心裝置

是德科技推出AI數(shù)據(jù)中心構(gòu)建器
適用于數(shù)據(jù)中心和AI時(shí)代的800G網(wǎng)絡(luò)
小型加速器中子源監(jiān)測系統(tǒng)解決方案

FPGA+AI王炸組合如何重塑未來世界:看看DeepSeek東方神秘力量如何預(yù)測......
當(dāng)我問DeepSeek AI爆發(fā)時(shí)代的FPGA是否重要?答案是......
數(shù)據(jù)中心中的FPGA硬件加速器

cmp在數(shù)據(jù)處理中的應(yīng)用 如何優(yōu)化cmp性能

AMD Alveo V80計(jì)算加速器網(wǎng)絡(luò)研討會(huì)
PCIe加速卡在數(shù)據(jù)中心的應(yīng)用
EPSON差分晶振SG3225VEN頻點(diǎn)312.5mhz應(yīng)用于AI加速卡
適用于數(shù)據(jù)中心應(yīng)用中的硬件加速器的直流/直流轉(zhuǎn)換器解決方案

半導(dǎo)體存儲(chǔ)器在數(shù)據(jù)中心中的應(yīng)用
下一代高功能新一代AI加速器(DRP-AI3):10x在高級(jí)AI系統(tǒng)高級(jí)AI中更快的嵌入處理

評(píng)論