最近,隨著人工智能的大肆宣傳,我們注意到大多數(shù)人都默認(rèn)所有人工智能工作負(fù)載將始終在 GPU 上運(yùn)行。對(duì)于這一思路,我們認(rèn)為,隨著更廣泛的芯片發(fā)揮作用,現(xiàn)實(shí)情況可能會(huì)有所不同。
需要明確的是,GPU 非常適合人工智能工作,并且不會(huì)對(duì) Nvidia 的股價(jià)構(gòu)成威脅。我們所說(shuō)的人工智能實(shí)際上是應(yīng)用統(tǒng)計(jì)學(xué),更具體地說(shuō)是非常先進(jìn)的統(tǒng)計(jì)回歸模型。
這些問題的核心是矩陣代數(shù),涉及相當(dāng)簡(jiǎn)單的數(shù)學(xué)問題,例如一個(gè)數(shù)字乘以另一個(gè)數(shù)字,但需要大規(guī)模完成。GPU 的設(shè)計(jì)采用較小的內(nèi)核(更簡(jiǎn)單的數(shù)學(xué)),且數(shù)量較多(大規(guī)模)。因此,使用這些處理器代替具有較少數(shù)量較大內(nèi)核的 CPU 是有意義的。
現(xiàn)在,這種情況變得有點(diǎn)模糊了。其一,GPU 變得更加昂貴。他們更擅長(zhǎng)人工智能數(shù)學(xué),但在某些時(shí)候轉(zhuǎn)向 CPU 開始在經(jīng)濟(jì)上變得有意義。
人工智能半導(dǎo)體市場(chǎng)實(shí)際上分為三個(gè)部分:訓(xùn)練、云推理和邊緣推理。目前的訓(xùn)練基本上與 Nvidia 相當(dāng),但這只是市場(chǎng)的一小部分。云推理將是一個(gè)更大的市場(chǎng)——隨著越來(lái)越多的人使用這些人工智能模型,對(duì)推理的需求將會(huì)增長(zhǎng),目前大部分工作將在云中完成。對(duì)于許多公司來(lái)說(shuō),擴(kuò)大產(chǎn)能的成本似乎非常昂貴。半導(dǎo)體分析師迪倫·帕特爾(Dylan Patel)像往常一樣,對(duì)這個(gè)數(shù)學(xué)進(jìn)行了最好的闡述,但足以說(shuō)明推理費(fèi)用可能會(huì)成為未來(lái)一年左右消費(fèi)者采用人工智能的主要障礙。
“考慮到 GPU 的成本和相對(duì)稀缺性,我們認(rèn)為許多公司將開始探索 GPU 的替代品來(lái)運(yùn)行推理工作負(fù)載,特別是對(duì)于將這些 AI 結(jié)果與其他功能(如搜索或社交媒體)相結(jié)合的公司,這些工作負(fù)載在很大程度上仍然運(yùn)行得最好無(wú)論如何,在CPU上?!盌ylan Patel說(shuō)。
展望未來(lái),我們懷疑人工智能的經(jīng)濟(jì)學(xué)將需要更多的推理工作來(lái)進(jìn)行邊緣計(jì)算,這意味著消費(fèi)者需要付費(fèi)購(gòu)買設(shè)備。這意味著手機(jī)和 PC 將需要人工智能功能,這可能意味著它們?cè)?CPU 和移動(dòng) SoC 上運(yùn)行。
AMD 最近推出了內(nèi)置于其客戶端 CPU 中的人工智能功能,而蘋果公司的 A 系列移動(dòng)處理器和 M 系列 CPU 中都配備了神經(jīng)引擎。我們預(yù)計(jì)這很快就會(huì)在邊緣設(shè)備中普及。
當(dāng)然,許多公司正在尋求構(gòu)建人工智能加速器——專門用于進(jìn)行人工智能數(shù)學(xué)計(jì)算的專用芯片。但事實(shí)證明,這僅適用于像谷歌這樣控制其所有軟件的公司。這些專用芯片的一個(gè)重要問題是,它們往往針對(duì)一組特定的工作負(fù)載或人工智能模型進(jìn)行過(guò)度設(shè)計(jì),當(dāng)這些模型發(fā)生變化時(shí),這些芯片就會(huì)失去性能優(yōu)勢(shì)。
所有這些都導(dǎo)致了半導(dǎo)體領(lǐng)域最不為人知的領(lǐng)域之一——FPGA。這些是“可編程”芯片(“P”代表可編程),這意味著它們?cè)谏a(chǎn)后可以重新用于不同的任務(wù)。這些與專門構(gòu)建的 ASIC 處于相反的一端,專為 AI 加速器等特定任務(wù)而設(shè)計(jì)。
FPGA 已經(jīng)存在多年了。半導(dǎo)體的經(jīng)濟(jì)學(xué)通常意味著,超過(guò)一定的容量閾值,ASIC 更有意義,但對(duì)于工業(yè)和航空航天系統(tǒng)等小容量應(yīng)用,它們的工作效果非常好。因此,F(xiàn)PGA 無(wú)處不在,涉及數(shù)十個(gè)終端市場(chǎng),但我們對(duì)它們不太熟悉,因?yàn)樗鼈兺ǔ2粫?huì)出現(xiàn)在普通消費(fèi)者每天使用的大批量電子產(chǎn)品中。
人工智能的出現(xiàn)稍微改變了這種計(jì)算方式。對(duì)于這些工作負(fù)載,F(xiàn)PGA 可能對(duì)底層模型頻繁變化的人工智能推理需求有意義。在這里,F(xiàn)PGA 的可編程性超過(guò)了 FPGA 使用的典型經(jīng)濟(jì)性。需要明確的是,我們認(rèn)為 FPGA 不會(huì)成為使用數(shù)千個(gè) GPU 的大規(guī)模人工智能系統(tǒng)的有力競(jìng)爭(zhēng)對(duì)手,但我們確實(shí)認(rèn)為,隨著人工智能進(jìn)一步滲透到電子領(lǐng)域,F(xiàn)PGA 的應(yīng)用范圍將會(huì)擴(kuò)大。
簡(jiǎn)而言之,GPU 可能仍然是大部分人工智能領(lǐng)域的主導(dǎo)芯片,尤其是對(duì)于高調(diào)、大容量的模型。但除此之外,我們認(rèn)為替代芯片的使用將成為生態(tài)系統(tǒng)的重要組成部分,這是一個(gè)比今天看起來(lái)更大的機(jī)會(huì)。
-
gpu
+關(guān)注
關(guān)注
28文章
4949瀏覽量
131321 -
人工智能
+關(guān)注
關(guān)注
1807文章
49035瀏覽量
249754 -
AI芯片
+關(guān)注
關(guān)注
17文章
1983瀏覽量
35935
原文標(biāo)題:AI芯片,就是GPU嗎?
文章出處:【微信號(hào):晶揚(yáng)電子,微信公眾號(hào):晶揚(yáng)電子】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
AI芯片:加速人工智能計(jì)算的專用硬件引擎
【「算力芯片 | 高性能 CPU/GPU/NPU 微架構(gòu)分析」閱讀體驗(yàn)】+NVlink技術(shù)從應(yīng)用到原理
GPU按需計(jì)費(fèi)的優(yōu)勢(shì)
ASIC和GPU的原理和優(yōu)勢(shì)

NVIDIA和GeForce RTX GPU專為AI時(shí)代打造
GPU是如何訓(xùn)練AI大模型的
《算力芯片 高性能 CPUGPUNPU 微架構(gòu)分析》第3篇閱讀心得:GPU革命:從圖形引擎到AI加速器的蛻變
GPU服務(wù)器AI網(wǎng)絡(luò)架構(gòu)設(shè)計(jì)

【「算力芯片 | 高性能 CPU/GPU/NPU 微架構(gòu)分析」閱讀體驗(yàn)】--了解算力芯片GPU
為什么ai模型訓(xùn)練要用gpu
【「算力芯片 | 高性能 CPU/GPU/NPU 微架構(gòu)分析」閱讀體驗(yàn)】--全書概覽
名單公布!【書籍評(píng)測(cè)活動(dòng)NO.43】 算力芯片 | 高性能 CPU/GPU/NPU 微架構(gòu)分析
AI芯片的混合精度計(jì)算與靈活可擴(kuò)展
自動(dòng)駕駛?cè)笾髁?b class='flag-5'>芯片架構(gòu)分析

評(píng)論