位置、位置、位置,這并不只是房地產(chǎn)界的核心詞。為了滿足人工智能(AI)和機(jī)器學(xué)習(xí)應(yīng)用的需求,這個詞被越來越多地應(yīng)用于數(shù)據(jù)存儲,如數(shù)據(jù)存儲的位置以及存放數(shù)據(jù)的存儲器。
但解決這種位置的挑戰(zhàn)不只是存儲器供應(yīng)商應(yīng)做的工作,與AI相關(guān)的供應(yīng)商也扮演著重要角色。盡管存儲距離計算越來越近,但解決方案的很大一部分在于存儲互連。Rambus研究員Steve Woo最近在AI硬件峰會上主持了一次在線圓桌論壇,討論了存儲器互連的挑戰(zhàn)和解決方案,他說:“我們都在為AI的不同方面而工作?!?/p>
Marvell的ASIC事業(yè)部CTO Igor Arsovski在17年前曾經(jīng)做過SRAM設(shè)計工程師。他說,慕尼黑啤酒節(jié)(Oktoberfest)因?yàn)樾鹿诜窝滓咔槿∠?,而把存儲互連比做啤酒很合適。參加啤酒節(jié),可以很容易喝到啤酒?!岸鳶RAM就好像近在身邊的啤酒一樣。它隨手可得,不需要耗費(fèi)多少能量,而且只要您需要,它就在那兒,就像擁有一個不錯的高性能加速器?!钡?,如果沒有足夠的存儲空間,就需要走遠(yuǎn)一點(diǎn),同時也需要花費(fèi)更多能量來獲取它,就好像必須走更遠(yuǎn)才能買到大桶啤酒一樣。
Arsovski 說,對存儲器而言,大桶啤酒就好像高帶寬存儲器(HBM),它正越來越多地被AI所采用?!霸L問這種存儲器需要花費(fèi)約60倍的能量。那里容量雖然大得多,但訪問它的帶寬卻很少。”將啤酒類比擴(kuò)展到LPDDR之類的技術(shù),這種技術(shù)比SRAM更先進(jìn)。他說:“LPDDR功耗明顯更高,但容量更大。這就像沿著那條路走到您最喜愛的酒吧,在那里有幾桶啤酒等著您?!?/p>
Arsovski表示,下一代加速器的發(fā)展方向是將那些存儲器放在加速器正上方,讓存儲離計算更近。MLCommons執(zhí)行董事David Kanter補(bǔ)充說,這個啤酒類比概述了不同的封裝途徑以及在何處安放不同的硅片。MLCommons是一個提供機(jī)器學(xué)習(xí)標(biāo)準(zhǔn)和AI推理基準(zhǔn)的組織,其成員涵蓋學(xué)術(shù)界和工業(yè)界。他說道:“這使我們對不同的工作負(fù)載有非常全面的了解。MLCommons正在開始采取一些措施,其中重點(diǎn)之一就是建立咨詢委員會,以吸收特定應(yīng)用領(lǐng)域的一些資深專家?!?/p>
Kanter說,對存儲器而言,整個系統(tǒng)環(huán)境至關(guān)重要?!澳仨毧紤]系統(tǒng)要實(shí)現(xiàn)什么,這將決定要考慮的問題?!彼f,當(dāng)涉及到存儲器的位置和連接時,芯片、封裝和電路板都是必須考慮的要素?!霸陉嚵薪Y(jié)構(gòu)、單元類型以及距離方面,有很多地方可以優(yōu)化。”
Kanter說,明白哪里需要帶寬以及非易失性也是關(guān)鍵的考量因素?!跋M@將引導(dǎo)做出正確的選擇。”
對于那些傳統(tǒng)上并不屬于存儲系統(tǒng)構(gòu)建流程的公司而言,這些考量因素至關(guān)重要。Google軟件工程師Sameer Kumar花費(fèi)大量時間在編譯器和可擴(kuò)展系統(tǒng)上,這些系統(tǒng)的網(wǎng)絡(luò)和存儲帶寬對不同的機(jī)器學(xué)習(xí)模型非常重要,包括其大規(guī)模批量操作的能力。他說:“人工智能訓(xùn)練涉及許多存儲方面的優(yōu)化,”這是在編譯器中獲得極高效率的最關(guān)鍵步驟,它意味著存儲也需要更加智能。
Woo認(rèn)為,數(shù)據(jù)移動實(shí)際上已經(jīng)開始主宰AI應(yīng)用的某些階段,所以存儲互連變得越來越重要?!靶阅芎湍苄С蔀槿找嬷匾膯栴}”,提高數(shù)據(jù)速率極具挑戰(zhàn)性,因?yàn)樗腥硕枷M麑?shù)據(jù)移動速度加倍,能效也加倍?!拔覀円郧八蕾嚨脑S多技巧和技術(shù)都已不再適用,或者正在被慢慢淘汰。我們有極好的機(jī)會來思考新的體系架構(gòu),并在移動數(shù)據(jù)的方式上進(jìn)行創(chuàng)新?!?/p>
Woo表示,創(chuàng)新不僅在存儲器件本身上,而且還包括封裝,以及堆疊等新技術(shù)。在創(chuàng)新的同時,還要確保數(shù)據(jù)的安全性,這是Rambus目前越來越關(guān)注的。
Rambus感受到業(yè)界對3D堆棧的極大興趣,但如果帶寬不隨堆棧容量增加而相應(yīng)增加的話,其可用性會受到限制。(圖片來源:Rambus)
Arsovski表示,Marvell花費(fèi)了大量時間為客戶建立AI系統(tǒng),為客戶提供帶寬相關(guān)信息,如每個芯片邊緣有多少帶寬可以用于數(shù)據(jù)移動,以及有多少帶寬可以用于訪問存儲器。他說:“到目前為止,我們已經(jīng)可以看到,客戶需要更多的存儲帶寬和更多的I / O帶寬。如果看看封裝級別的互連,可以看到存在很大的不匹配。我們現(xiàn)在已經(jīng)到達(dá)瓶頸,高端芯片-芯片連接的需求壓力持續(xù)增大?!?/p>
Arsovski表示,從存儲器的角度來看,對于那些無法在裸片上直接構(gòu)建AI模型的設(shè)計師來說,其下一步考慮應(yīng)該是HBM或GDDR。但是也有很多轉(zhuǎn)而采用3D堆疊,以嘗試獲得更大的帶寬,因?yàn)樵谛酒吘壱苿訑?shù)據(jù)的容量有限?!翱蛻粝M玫皆絹碓蕉嗟腎/O帶寬,而我們在邊緣數(shù)據(jù)移動上遇到了瓶頸?!?/p>
Kanter說,即使在機(jī)器學(xué)習(xí)的世界中,也存在著“很大的多樣性”,這對生態(tài)系統(tǒng)既有制約,也有促進(jìn),記住這一點(diǎn)很重要。對于常規(guī)DRAM來說,隨機(jī)查找龐大的數(shù)據(jù)結(jié)構(gòu)不適合單個節(jié)點(diǎn),這意味著如果您想將數(shù)據(jù)真正保存在存儲器中,則需要構(gòu)建一個非常大的系統(tǒng)集群。他說:“與傳統(tǒng)的面向視覺的模型相比,其特征和屬性完全不同。在存儲方面要牢記這一多樣性,這一點(diǎn)非常重要?!?/p>
Kanter說,當(dāng)需要將大量存儲和計算整合在一起時,就需要互連了。“要進(jìn)行大規(guī)模訓(xùn)練,迫切需要既適合客戶又適合要解決問題的互連方案?!彼f,對于前沿應(yīng)用來說,互連將特別重要?!叭绻幌霝橐粋€小型網(wǎng)絡(luò)訓(xùn)練一個GPU,那么關(guān)鍵因素可能就是存儲帶寬。”
Kumar說,更多的存儲帶寬可以實(shí)現(xiàn)不同種類的優(yōu)化,但是如果模型特別受存儲限制,就有必要引入更多的計算。“如果有更多的存儲吞吐量可用,甚至有更多的互連吞吐量可用,將可能會使模型設(shè)計更加靈活,而且可以啟用新功能,并一起構(gòu)建各種類型的模型?!?/p>
Woo表示,Rambus感受到大家對3D堆棧興趣濃厚,但隨著堆棧越來越高,增加進(jìn)出堆棧的帶寬也變得越來越困難?!叭绻皇窃黾佣褩H萘?,但沒有增加相應(yīng)的帶寬,那方案的實(shí)用性就成問題了?!?/p>
他說,關(guān)鍵點(diǎn)在于尋找合適的方案,既能保持填充頻率,又能利用堆疊能效方面的優(yōu)勢,從而使帶寬與容量和堆疊之間具有相對恒定的比率。
Kumar和Arsovski都認(rèn)為需要一個平衡、可擴(kuò)展的系統(tǒng),這種系統(tǒng)具有精心設(shè)計的軟件堆棧。 Arsovski說,“我們所說的是一種可以良好擴(kuò)展的類腦結(jié)構(gòu)?!彼仨毜凸那揖哂写罅窟B接,而現(xiàn)在,3D堆疊是我們能做到最接近的結(jié)構(gòu),但仍然存在功耗、封裝和機(jī)械結(jié)構(gòu)方面的挑戰(zhàn)。 “我們需要研究出一個高度并行的系統(tǒng),其每個層級的功耗都極低,而不必?fù)?dān)心要為冷卻耗費(fèi)數(shù)千瓦的功率?!?/p>
他說,是時候開始尋找適合AI系統(tǒng)的下一個基本構(gòu)建模塊了?!耙恢币詠?,我們都采用晶體管作為基本單元,迄今為止,它們都發(fā)揮出色。我們通常會依賴我們所知道和喜愛的技術(shù),并且希望它持續(xù)發(fā)展。但現(xiàn)在我們需要重頭開始設(shè)計了。”
(參考原文:AI Drives Memory Interconnect Evolution)
編輯:hfy
-
存儲器
+關(guān)注
關(guān)注
38文章
7653瀏覽量
167488 -
數(shù)據(jù)存儲
+關(guān)注
關(guān)注
5文章
999瀏覽量
51756 -
AI
+關(guān)注
關(guān)注
88文章
35194瀏覽量
280316 -
深度學(xué)習(xí)
+關(guān)注
關(guān)注
73文章
5561瀏覽量
122825
發(fā)布評論請先 登錄
AI驅(qū)動新型存儲器技術(shù),國內(nèi)新興存儲企業(yè)進(jìn)階

硬件永不止步 · 互連進(jìn)無止境 | Samtec于Keysight開放日北京站的總結(jié)

AI時代的無源元件挑戰(zhàn)和解決方案

AI正在對硬件互連提出“過分”要求 | Samtec于Keysight開放日深度分享

PCIe 6.0時代的測試挑戰(zhàn)和解決方案

EMMC存儲器故障檢測及解決方案
EMMC存儲器應(yīng)用場景分析
大算力芯片面臨的技術(shù)挑戰(zhàn)和解決策略
內(nèi)存儲器分為隨機(jī)存儲器和什么
MCT8316A-設(shè)計挑戰(zhàn)和解決方案應(yīng)用說明

MCF8316A-設(shè)計挑戰(zhàn)和解決方案應(yīng)用說明

FPGA設(shè)計面臨的挑戰(zhàn)和解決方案
M31攜手高塔半導(dǎo)體,成功研發(fā)65納米低功耗存儲器解決方案
ram存儲器和rom存儲器的區(qū)別是什么
探索通用互連解決方案的強(qiáng)大之處

評論