一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

GPT模型推動存儲廠商加速PIM進(jìn)程

E4Life ? 來源:電子發(fā)燒友網(wǎng) ? 作者:周凱揚(yáng) ? 2023-04-10 05:09 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

電子發(fā)燒友網(wǎng)報道(文/周凱揚(yáng))存內(nèi)計算這個概念從被提出開始,就選定了AI作為主要應(yīng)用領(lǐng)域,但苦于當(dāng)時的需求并不算高,技術(shù)也還在完善成熟中,我們更多是在一些學(xué)術(shù)論壇和行業(yè)會議上見到存儲廠商和AI芯片廠商對其高談闊論。

可誰知道2023年我們迎來了消費(fèi)級存儲市場的萎靡,卻又在ChatGPT的應(yīng)援之下帶火了高帶寬內(nèi)存。這不,三星、SK海力士等廠商紛紛迎來了HBM訂單和單價的瘋漲,也使得他們打算加速推進(jìn)PIM的開發(fā)進(jìn)度。

SK海力士的AiM方案

SK海力士在近期提出了他們的首個PIM方案,AiM。AiM是一個基于GDDR6的存內(nèi)計算方案,專門為了加速內(nèi)存負(fù)載密集的機(jī)器學(xué)習(xí)應(yīng)用而設(shè)計。而GDDR6作為當(dāng)下GPU產(chǎn)品的主要顯存形式之一,提供了足夠的帶寬,但并沒有提供額外的計算能力,更別說卸載CPU、GPU的運(yùn)算任務(wù)了。


AiM存內(nèi)加速器方案/ SK海力士


而在機(jī)器學(xué)習(xí)應(yīng)用中,SK海力士的AiM方案可以卸載96%的計算任務(wù),交由DRAM的存內(nèi)計算單元來完成,實現(xiàn)了超高的內(nèi)存bank并行度,顯著減少了CPU與內(nèi)存之間的數(shù)據(jù)移動,而且相比HBM,GDDR6明顯是一個成本更低的方案。

正是因為有了這些優(yōu)勢,AiM可以說是專為GPT類應(yīng)用打造的,SK海力士也給出了在GPT模型下的性能評估。對于GPT-2和GPT-3乃至現(xiàn)在的GPT-4來說,都屬于內(nèi)存負(fù)載密集型的應(yīng)用,所以也更容易遇到內(nèi)存墻的問題。

SK海力士AiM的另一大優(yōu)勢在于他們已經(jīng)實現(xiàn)了全套軟件棧,包括設(shè)備驅(qū)動、runtime庫、框架和應(yīng)用等,也支持AiM軟件仿真器,支持用戶自行開發(fā)AI應(yīng)用,而無需硬件評估板。

三星的PIM進(jìn)程


其實其他廠商也早有在PIM上布局,尤其是三星。早在2021年初推出HBM2E后,三星就已經(jīng)開始規(guī)劃如何充分利用這些高帶寬內(nèi)存的性能,其中之一就是PIM。與SK海力士不同的是,三星打造的首個PIM為HBM-PIM,在內(nèi)存核心中了集成了名為可編程計算單元的AI引擎,用于處理一部分的邏輯功能。

同年的HotChips大會上,三星展示了將其HBM-PIM集成到Xilinx的AlveoAI加速器系統(tǒng)中。根據(jù)三星提供的數(shù)據(jù),該方案提供了2.5倍的系統(tǒng)性能提升,同時將功耗降低了60%。從三星半導(dǎo)體的PIM技術(shù)展示也來看,他們也計劃將這一技術(shù)應(yīng)用到GDDR和LPDDR中,不過這幾年間的主要技術(shù)公開展示都集中在HBM-PIM上。

除了這種將PIM集成到商用AI加速器的方案以外,三星也同時推出了直接將PIM集成到DRAM模塊中的方案AXDIMM,通過直接在DRAM模塊中對多組內(nèi)存芯片進(jìn)行并行運(yùn)算,減少了CPU和DRAM之間的大量數(shù)據(jù)移動。

三星稱在基于AI的推薦應(yīng)用中,AXDIMM可以使得整體系統(tǒng)能效提高40%,不過對于GPT這種生成式AI類的應(yīng)用能夠帶來多少提升我們就不得而知了,畢竟三星的PIM方案推出時大部分AI應(yīng)用還停留在圖片分類、文字翻譯和語音識別上。

小結(jié)

從這些PIM產(chǎn)品的布局來看,集成式的方案或許對AI加速器廠商來說更有吸引力,不管這些計算單元是CPU、GPU、FPGA還是ASIC芯片。但無論是三星還是SK海力士,這些方案落地到產(chǎn)品上都需要一定的時間,所以我們可能得等到下一代產(chǎn)品中,才能看到存內(nèi)計算的存在。

但不得不說,對于已有布局存內(nèi)計算的存儲廠商來說,這無疑是一大利好。過去這種和負(fù)責(zé)計算的邏輯芯片搶活干的設(shè)計無疑是自砸招牌,但現(xiàn)在看來卻已經(jīng)成了一種趨勢,這類存儲廠商對于市場波動的抵抗力也會更強(qiáng)一些。只不過目前看來這類PIM技術(shù)目前還是優(yōu)先針對功耗相對較高的內(nèi)存,未來要想在移動市場有所成就,還得看這些存儲廠商后續(xù)會推出怎樣的LPDDR-PIM方案。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • pim
    pim
    +關(guān)注

    關(guān)注

    0

    文章

    69

    瀏覽量

    20989
  • GPT
    GPT
    +關(guān)注

    關(guān)注

    0

    文章

    368

    瀏覽量

    16012
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    2025存儲國產(chǎn)化進(jìn)程加速存儲芯片主要廠商介紹

    在全球供應(yīng)鏈緊張和國產(chǎn)替代需求推動下,國產(chǎn)存儲芯片產(chǎn)業(yè)快速發(fā)展,形成設(shè)計到封測一體化的完整生態(tài)。北京君正、兆易創(chuàng)新、紫光國芯、東芯股份、普冉股份和佰維存儲等六大上市公司在NOR/NANDFlash
    的頭像 發(fā)表于 05-12 16:01 ?1410次閱讀
    2025<b class='flag-5'>存儲</b>國產(chǎn)化<b class='flag-5'>進(jìn)程</b><b class='flag-5'>加速</b>:<b class='flag-5'>存儲</b>芯片主要<b class='flag-5'>廠商</b>介紹

    Gupshup加速企業(yè)AI應(yīng)用進(jìn)程

    Gupshup-Gupshup推出預(yù)構(gòu)建、行業(yè)訓(xùn)練有素的多模態(tài)AI代理,加速企業(yè)AI應(yīng)用進(jìn)程 印度尼西亞雅加達(dá)2025年2月14日?/美通社/ -- 全球領(lǐng)先的對話式AI平臺Gupshup今天宣布
    的頭像 發(fā)表于 02-14 16:04 ?282次閱讀

    OpenAI即將發(fā)布GPT-4.5與GPT-5

    ,GPT-4.5將在未來幾周內(nèi)率先亮相,它將是OpenAI通用GPT-4模型的繼承者。這款新的算法在技術(shù)上進(jìn)行了諸多優(yōu)化和升級,旨在為用戶提供更加精準(zhǔn)、高效的AI服務(wù)。 而在GPT-4
    的頭像 發(fā)表于 02-13 13:43 ?620次閱讀

    OpenAI即將推出GPT-5模型

    OpenAI首席執(zhí)行官奧爾特曼近日宣布了一項重要消息:OpenAI將在今年未來幾個月內(nèi)推出全新的GPT-5模型。這一消息引起了業(yè)界的廣泛關(guān)注和期待。 據(jù)了解,GPT-5模型將整合Ope
    的頭像 發(fā)表于 02-13 11:21 ?566次閱讀

    OpenAI GPT-5開發(fā)滯后:訓(xùn)練成本高昂

    近日,據(jù)最新消息,OpenAI在推進(jìn)其備受期待的下一代旗艦模型GPT-5的開發(fā)進(jìn)程上遇到了困難。由于計算成本高昂且高質(zhì)量訓(xùn)練數(shù)據(jù)稀缺,GPT-5的開發(fā)已經(jīng)落后于原定計劃半年之久。 據(jù)悉
    的頭像 發(fā)表于 12-23 11:04 ?692次閱讀

    【「大模型啟示錄」閱讀體驗】如何在客服領(lǐng)域應(yīng)用大模型

    訓(xùn)練模型如BERT、GPT等。這些模型在理解自然語言、生成文本、處理對話等方面具有不同的能力。因此,在選擇模型時,需要了解每個模型的特點和優(yōu)
    發(fā)表于 12-17 16:53

    三星與SK海力士攜手推進(jìn)LPDDR6-PIM產(chǎn)品標(biāo)準(zhǔn)化

    據(jù)外媒最新報道,韓國兩大存儲芯片巨頭三星電子與SK海力士已正式結(jié)盟,共同致力于推動LPDDR6的存內(nèi)計算(Processing In Memory,簡稱PIM)產(chǎn)品的標(biāo)準(zhǔn)化進(jìn)程。此舉旨
    的頭像 發(fā)表于 12-03 10:42 ?717次閱讀

    PIM天線的定義和作用

    PIM是指在無線通信系統(tǒng)中,由于無源組件(如天線、連接器、電纜等)的非線性特性,兩個或多個射頻信號在這些組件中相互作用,產(chǎn)生新的頻率成分,這些新頻率成分稱為互調(diào)產(chǎn)物。在天線中,低PIM這個特性使用者經(jīng)常會考量。本期將圍繞低PIM
    的頭像 發(fā)表于 11-22 09:09 ?802次閱讀

    深信服發(fā)布安全GPT4.0數(shù)據(jù)安全大模型

    近日,深信服在數(shù)據(jù)安全領(lǐng)域邁出了重要一步,正式發(fā)布了安全GPT4.0數(shù)據(jù)安全大模型。這一創(chuàng)新的大模型技術(shù),旨在為用戶提供更高效、精準(zhǔn)的數(shù)據(jù)安全解決方案。
    的頭像 發(fā)表于 10-29 11:12 ?589次閱讀

    AI驅(qū)動存儲需求激增,企業(yè)級SSD市場迎來國內(nèi)廠商崛起

    隨著人工智能(AI)應(yīng)用的迅速普及,市場對高性能、高可靠性的存儲產(chǎn)品的需求日益增長,企業(yè)級固態(tài)硬盤(SSD)因此受到了前所未有的關(guān)注。當(dāng)前,全球SSD市場主要由五大原廠主導(dǎo),但在中國,隨著AI浪潮的推動,企業(yè)級SSD產(chǎn)業(yè)鏈上的國內(nèi)廠商
    的頭像 發(fā)表于 10-28 14:18 ?1144次閱讀

    如何尋找PIM源?TS無源互調(diào)PIM排查方案精準(zhǔn)定位與高效尋源

    一、方案背景 PIM問題嚴(yán)重威脅著通信系統(tǒng)的安全、正常工作,同時也制約著通信技術(shù)的進(jìn)一步發(fā)展。目前,無線網(wǎng)絡(luò)變得更加復(fù)雜。當(dāng)各種信號組合后,便會產(chǎn)生PIM源,很容易對LTE信號造成干擾的失真。PIM
    的頭像 發(fā)表于 08-05 10:29 ?536次閱讀
    如何尋找<b class='flag-5'>PIM</b>源?TS無源互調(diào)<b class='flag-5'>PIM</b>排查方案精準(zhǔn)定位與高效尋源

    LLM大模型推理加速的關(guān)鍵技術(shù)

    LLM(大型語言模型)大模型推理加速是當(dāng)前人工智能領(lǐng)域的一個研究熱點,旨在提高模型在處理復(fù)雜任務(wù)時的效率和響應(yīng)速度。以下是對LLM大模型推理
    的頭像 發(fā)表于 07-24 11:38 ?1729次閱讀

    OpenAI 推出 GPT-4o mini 取代GPT 3.5 性能超越GPT 4 而且更快 API KEY更便宜

    OpenAI推出了GPT-4o mini模型,用來取代GPT-3.5.這是目前市場上最具成本效益的小模型。 ? 該模型在MMLU上得分為82
    的頭像 發(fā)表于 07-21 10:20 ?1644次閱讀
    OpenAI 推出 <b class='flag-5'>GPT</b>-4o mini 取代<b class='flag-5'>GPT</b> 3.5 性能超越<b class='flag-5'>GPT</b> 4 而且更快 API KEY更便宜

    GPT的定義和演進(jìn)歷程

    GPT,全稱Generative Pretrained Transformer,是OpenAI公司在自然語言處理(NLP)領(lǐng)域的一項重大創(chuàng)新。這一模型不僅推動了AI技術(shù)的邊界,還深刻影響了我們與機(jī)器交互的方式。本文將從
    的頭像 發(fā)表于 07-10 10:41 ?3120次閱讀

    llm模型和chatGPT的區(qū)別

    ,有許多不同的LLM模型,如BERT、GPT、T5等。 ChatGPT是一種基于GPT(Generative Pre-trained Transformer)模型的聊天機(jī)器人。
    的頭像 發(fā)表于 07-09 09:55 ?1938次閱讀