一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

為AI推理打造高達(dá)24Gb/s的GDDR6 PHY,Rambus全面支持中國市場的AI升級

花茶晶晶 ? 來源:電子發(fā)燒友網(wǎng) ? 作者:黃晶晶 ? 2023-05-26 16:38 ? 次閱讀

人工智能在通過大量的數(shù)據(jù)進(jìn)行訓(xùn)練之后,神經(jīng)網(wǎng)絡(luò)打造的完整模型將被集成在邊緣或?qū)嶋H應(yīng)用場之中,往往大量的AI正是應(yīng)用在于邊緣AI推理。與AI訓(xùn)練需要大量的數(shù)據(jù)和算力不同,AI推理對算力的需求大幅下降,但對成本和功耗更為敏感。

在AI推理應(yīng)用越來越多的趨勢下,Rambus率先研判與推出GDDR6 IP產(chǎn)品組合。Rambus IP核產(chǎn)品營銷高級總監(jiān)Frank Ferro先生表示,作為更加理想的方案,GDDR6有著高帶寬以及低時(shí)延的特性,能夠幫助邊緣端更好地處理數(shù)據(jù)。

Rambus GDDR6 PHY以及控制器的配套產(chǎn)品,已經(jīng)達(dá)到了業(yè)界領(lǐng)先的24Gb/s的數(shù)據(jù)傳輸速率,這也是全新的一個(gè)行業(yè)標(biāo)桿,可以為AI推理等應(yīng)用場景帶來巨大性能優(yōu)勢和收益。

除性能之外,另一大優(yōu)勢是對功耗的管理。因?yàn)楫?dāng)設(shè)備在高速和高帶寬環(huán)境下運(yùn)行時(shí),良好的功耗管理非常重要。

還有系統(tǒng)層面的設(shè)計(jì)。如果要確保系統(tǒng)在24Gb/s環(huán)境下運(yùn)行,需要良好的系統(tǒng)級信號完整性。Rambus信號完整性的工程師,也會(huì)與客戶進(jìn)行非常緊密的從設(shè)計(jì)初期開始的合作,能夠確??蛻暨\(yùn)行系統(tǒng)的時(shí)候達(dá)到最高的性能。

另外,Rambus提供的產(chǎn)品已經(jīng)實(shí)現(xiàn)了PHY以及控制器的完整集成。在客戶收到產(chǎn)品之后,可以直接對這些子系統(tǒng)進(jìn)行定制化應(yīng)用。

GDDR6內(nèi)存接口子系統(tǒng)的結(jié)構(gòu)


下圖的結(jié)構(gòu)包括PHY物理層、控制器、DRAM以及客戶端的ASIC



Frank Ferro解析,PHY的物理層與DRAM進(jìn)行直接連接,這個(gè)接口是由兩個(gè)16位的插槽所組成,加起來是32位。

另外一側(cè)是DFI接口與內(nèi)存的控制器進(jìn)行連接,控制器直接接入到整個(gè)系統(tǒng)的邏輯控制。Rambus提供的是中間標(biāo)藍(lán)的兩個(gè)非常重要的環(huán)節(jié),也就是完整的子系統(tǒng),Rambus會(huì)根據(jù)客戶具體應(yīng)用場景和實(shí)際的訴求對子系統(tǒng)來進(jìn)行優(yōu)化,并將其作為完整的子系統(tǒng)來交付給客戶。

GDDR的“G”代表的是graphic (圖形),因此它可以用于圖形處理,同時(shí)也可以用于人工智能以及機(jī)器學(xué)習(xí)算法中,以及網(wǎng)絡(luò)應(yīng)用等。

在GDDR6擁有的諸多特點(diǎn)中,值得一提的是clamshell模式,具體指的是每個(gè)信道可以支持兩個(gè)GDDR6的設(shè)備。換句話說,在clamshell模式之下整個(gè)容量是直接翻倍乘以2的。



另外,GDDR6現(xiàn)在已經(jīng)支持比較先進(jìn)的FinFET工藝節(jié)點(diǎn),實(shí)際上從2019年開始Rambus就已經(jīng)支持非常先進(jìn)的制程工藝。

同時(shí),也會(huì)針對PCB以及封裝提供相關(guān)的參考設(shè)計(jì)。在內(nèi)部有專門的信號完整度和邊緣完整性的專家,來幫助客戶去完成整個(gè)的設(shè)計(jì)工作。

Frank Ferro表示,Rambus的GDDR6接口子系統(tǒng)可以實(shí)現(xiàn)高達(dá)24Gb/s的卓越性能,可以為每個(gè)GDDR6內(nèi)存設(shè)備提供最高達(dá)到96Gb/s的帶寬。GDDR6是在AI應(yīng)用場景下比較合理的產(chǎn)品和選擇,因?yàn)榭梢栽诔杀竞托阅苤g達(dá)成不錯(cuò)的平衡。

邊緣AI推理,GDDR6是更合適的選擇


實(shí)際上內(nèi)存的形式有很多種,DDR、LPDDR、GDDR以及HBM等,那么邊緣AI推理用哪種內(nèi)存最合適,在Frank Ferro看來GDDR6將是脫穎而出的那一個(gè)。

他說,GDDR6有著優(yōu)秀的數(shù)據(jù)傳輸速率,可適用于很多AI推理場景。尤其在一些網(wǎng)絡(luò)應(yīng)用中,GDDR6能具有重要作用?!艾F(xiàn)在非常多的具體網(wǎng)絡(luò)應(yīng)用場景都已經(jīng)開始在邊緣端實(shí)現(xiàn)了。尤其是有的應(yīng)用要求所有傳入的數(shù)據(jù)必須在本地進(jìn)行實(shí)時(shí)處理,這種需求的增加對本身產(chǎn)品架構(gòu)的要求會(huì)很高。因此傳統(tǒng)的DDR方案已經(jīng)遠(yuǎn)遠(yuǎn)不能滿足要求,因?yàn)樾枰泻芏嗟腄DR設(shè)備。而部署GDDR6在邊緣設(shè)備,能夠大幅度降低網(wǎng)絡(luò)邊緣設(shè)備對DDR數(shù)量的需求?!?br />
一般來說,AI推理對帶寬的需求在200到500Gb/s的范圍之間。而每一個(gè)GDDR6設(shè)備的帶寬可以達(dá)到96Gb/s,通過將4-5個(gè)GDDR6設(shè)備組合,就可以輕松滿足500Gb/s及以下的帶寬需求。

以DDR4為例,它的速度可能最高能達(dá)到3.2Gb/s。雖然它的成本相對較低,但是速度是一大劣勢。GDDR技術(shù)在幾年前就能夠?qū)崿F(xiàn)16Gb/s的帶寬,已經(jīng)超過DDR技術(shù)的三到四倍之多。當(dāng)然,DDR、GDDR和LPDDR這些不同的產(chǎn)品都是以標(biāo)準(zhǔn)的DRAM為基礎(chǔ),LPDDR更關(guān)注低功耗管理,DDR本身的數(shù)據(jù)存儲(chǔ)密度會(huì)更高一點(diǎn),而GDDR是更關(guān)注于速度。

此外,如果用到一個(gè)HBM3設(shè)備就能夠達(dá)到接近800Gb的帶寬,但它會(huì)使得成本增加3至4倍。因此,對于對帶寬和低延遲有很高要求的AI訓(xùn)練場景,HBM可能是更好的選擇。而對于需要更大容量、更高帶寬的AI推理場景,則GDDR6是更合適的選擇。

全面的產(chǎn)品組合,滿足中國客戶不同的AI需求

Rambus作為一家業(yè)界領(lǐng)先的半導(dǎo)體IP和芯片供應(yīng)商,技術(shù)實(shí)力強(qiáng)勁,擁有3000多項(xiàng)技術(shù)專利,企業(yè)使命是讓數(shù)據(jù)傳輸更快、更安全。經(jīng)過三十多年的發(fā)展和創(chuàng)新,Rambus現(xiàn)在的主要業(yè)務(wù)包含基礎(chǔ)專利授權(quán)、芯片IP授權(quán)和內(nèi)存接口芯片。Rambus的技術(shù)和產(chǎn)品面向的市場是數(shù)據(jù)密集型市場,包括數(shù)據(jù)中心5G、物聯(lián)網(wǎng)IoT、汽車等細(xì)分市場。其產(chǎn)品組合,與AIGC應(yīng)用對數(shù)據(jù)傳輸?shù)男枨笫制鹾稀?br />


以ChatGPT為代表的AIGC應(yīng)用熱潮襲卷到中國,我們可以看到中國不少互聯(lián)網(wǎng)大廠都發(fā)布了自己的AI大模型。那么Rambus如何支持中國客戶的AI數(shù)據(jù)傳輸需求呢?

Rambus大中華區(qū)總經(jīng)理蘇雷先生長期投身中國市場,他表示Rambus在和芯片廠商的溝通中發(fā)現(xiàn)更多廠商聚焦于AI訓(xùn)練,因此他們的方案更多需求在于HBM;在與云廠商的溝通中,他們更多是關(guān)注數(shù)據(jù)中心推出的一系列產(chǎn)品,即中國式ChatGPT產(chǎn)品,他們需要更多的算力。在內(nèi)存產(chǎn)品上,Rambus有非常好的接口芯片,向云廠商提供我們的服務(wù)和產(chǎn)品。



還有一類客戶是中國的OEM和ODM廠商,他們把目光轉(zhuǎn)向了當(dāng)前非常新的技術(shù)CXL。因?yàn)镃XL可以帶來更多內(nèi)存帶寬和內(nèi)存容量,所以我們正在緊密合作提供方案,以加大整個(gè)系統(tǒng)內(nèi)存的帶寬,幫助他們的產(chǎn)品推向市場。

蘇雷說,Rambus China立足于中國市場,愿意更多、更緊密地支持中國公司在ChatGPT產(chǎn)業(yè)的發(fā)展,以最好的技術(shù)、最快的響應(yīng)和最好的技術(shù)支持來服務(wù)中國市場,給廣大客戶保駕護(hù)航。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • Rambus
    +關(guān)注

    關(guān)注

    0

    文章

    62

    瀏覽量

    18976
  • PHY
    PHY
    +關(guān)注

    關(guān)注

    2

    文章

    310

    瀏覽量

    52372
  • GDDR6
    +關(guān)注

    關(guān)注

    0

    文章

    52

    瀏覽量

    11428
收藏 人收藏

    評論

    相關(guān)推薦

    首創(chuàng)開源架構(gòu),天璣AI開發(fā)套件讓端側(cè)AI模型接入得心應(yīng)手

    ,聯(lián)發(fā)科帶來了全面升級的天璣AI開發(fā)套件2.0,在模型庫規(guī)模、架構(gòu)開放程度、前沿端側(cè)AI技術(shù)支持和端側(cè)LoRA訓(xùn)練落地等方面均迎來
    發(fā)表于 04-13 19:52

    曙光存儲(chǔ)全新升級AI存儲(chǔ)方案

    近日,曙光存儲(chǔ)全新升級AI存儲(chǔ)方案,秉持“AI加速”理念,面向AI訓(xùn)練、AI推理
    的頭像 發(fā)表于 03-31 11:27 ?324次閱讀

    BK200-800S24GB1N6 BK200-800S24GB1N6

    電子發(fā)燒友網(wǎng)你提供AIPULNION(AIPULNION)BK200-800S24GB1N6相關(guān)產(chǎn)品參數(shù)、數(shù)據(jù)手冊,更有BK200-800S24GB1N6的引腳圖、接線圖、封裝手冊、中文資料、英文
    發(fā)表于 03-21 18:40
    BK200-800<b class='flag-5'>S24GB1N6</b> BK200-800<b class='flag-5'>S24GB1N6</b>

    Banana Pi 發(fā)布 BPI-AI2N &amp; BPI-AI2N Carrier,助力 AI 計(jì)算與嵌入式開發(fā)

    RZ/V2N——近期在嵌入式世界2025上新發(fā)布, AI 計(jì)算、嵌入式系統(tǒng)及工自動(dòng)化提供強(qiáng)大支持。這款全新的計(jì)算平臺旨在滿足開發(fā)者和企業(yè)用戶對高性能、低功耗和靈活擴(kuò)展的需求。 []() 領(lǐng)先的計(jì)算
    發(fā)表于 03-19 17:54

    正點(diǎn)原子ESP32S3系列開發(fā)板全面支持小智AI

    可能大家覺得AI離我們很遠(yuǎn),但是小智AI可以把這個(gè)距離拉得很近。正點(diǎn)原子ESP32S3系列開發(fā)板全面支持小智
    發(fā)表于 02-14 17:01

    蘋果加速推進(jìn)中國市場AI戰(zhàn)略

    據(jù)彭博社等多家財(cái)經(jīng)媒體報(bào)道,全球科技巨頭蘋果公司正在積極謀劃針對中國市場的本土化人工智能戰(zhàn)略部署。 據(jù)知情人士透露,蘋果公司技術(shù)團(tuán)隊(duì)正全力以赴,加速研發(fā)適配中國市場AI功能模塊。這一舉措旨在滿足
    的頭像 發(fā)表于 02-14 14:27 ?399次閱讀

    生成式AI推理技術(shù)、市場與未來

    OpenAI o1、QwQ-32B-Preview、DeepSeek R1-Lite-Preview的相繼發(fā)布,預(yù)示著生成式AI研究正從預(yù)訓(xùn)練轉(zhuǎn)向推理(Inference),以提升AI邏輯推理
    的頭像 發(fā)表于 01-20 11:16 ?694次閱讀
    生成式<b class='flag-5'>AI</b><b class='flag-5'>推理</b>技術(shù)、<b class='flag-5'>市場</b>與未來

    英特爾2025上半年將推24GB顯存銳炫B580顯卡

    近日,據(jù)最新報(bào)道,英特爾計(jì)劃在2025年上半年推出其全新獨(dú)立顯卡產(chǎn)品——銳炫B580 24GB。這款顯卡將采用英特爾的“Battlemage”架構(gòu),配備高達(dá)24GB的顯存容量,以滿足用戶對高性能圖形
    的頭像 發(fā)表于 01-03 10:46 ?1523次閱讀

    英特爾2025上半年或推24GB顯存銳炫B580顯卡

    備受矚目的顯卡將延續(xù)現(xiàn)有銳炫B580 12GB的成功之路,同樣基于先進(jìn)的BMG-G21 GPU核心打造。為了滿足日益增長的圖形處理需求,英特爾這款顯卡配備了高達(dá)12顆16
    的頭像 發(fā)表于 01-02 11:07 ?1091次閱讀

    李開復(fù):中國擅長打造經(jīng)濟(jì)實(shí)惠的AI推理引擎

    10月22日上午,零一萬物公司的創(chuàng)始人兼首席執(zhí)行官李開復(fù)在與外媒的交流中透露,其公司旗下的Yi-Lightning(閃電模型)在推理成本上已實(shí)現(xiàn)了顯著優(yōu)勢,比OpenAI的GPT-4o模型低了31倍。他強(qiáng)調(diào),中國擅長打造經(jīng)濟(jì)實(shí)惠
    的頭像 發(fā)表于 10-22 16:54 ?602次閱讀

    三星推出業(yè)界首款24Gb(3GBGDDR7 DRAM內(nèi)存芯片

    三星推出了業(yè)內(nèi)首款24Gb(即3GBGDDR7 DRAM內(nèi)存芯片,其超高速度可達(dá)42.5Gbps,專為下一代圖形處理單元(GPU)打造。據(jù)三星介紹,得益于多項(xiàng)改進(jìn)與更新,該芯片相比前
    的頭像 發(fā)表于 10-22 15:13 ?1524次閱讀

    三星發(fā)布業(yè)界首款24Gb GDDR7 DRAM

    近日,存儲(chǔ)芯片巨頭三星電子宣布了一項(xiàng)重大突破:成功開發(fā)出業(yè)界首款24Gb GDDR7 DRAM。這款新品不僅在容量上達(dá)到了業(yè)界最高水平,更在速度上實(shí)現(xiàn)了顯著提升,成為下一代AI計(jì)算應(yīng)用的理想解決方案。
    的頭像 發(fā)表于 10-18 16:58 ?1033次閱讀

    英偉達(dá)推出搭載GDDR6顯存的GeForce RTX 4070顯卡

    面對全球GDDR6X顯存供應(yīng)的嚴(yán)峻挑戰(zhàn),英偉達(dá)今日宣布了一項(xiàng)靈活應(yīng)變的市場策略:正式推出搭載GDDR6顯存的GeForce RTX 4070顯卡,旨在有效緩解市場對這一熱門型號顯卡的急
    的頭像 發(fā)表于 08-21 15:09 ?921次閱讀

    美光出樣業(yè)界容量密度最高新一代 GDDR7 顯存

    β(1-beta)DRAM 技術(shù)和創(chuàng)新架構(gòu),以優(yōu)化的功耗設(shè)計(jì)打造了速率高達(dá) 32 Gb/s 的高性能內(nèi)存。美光 GDDR7 的系統(tǒng)帶寬超過
    的頭像 發(fā)表于 06-05 16:52 ?1218次閱讀

    進(jìn)一步解讀英偉達(dá) Blackwell 架構(gòu)、NVlink及GB200 超級芯片

    )降低5倍,企業(yè)處理和分析大規(guī)模數(shù)據(jù)提供強(qiáng)大支持。 GB200 NVL72 規(guī)格 GB200 NVL 72 推理能力和速度對比
    發(fā)表于 05-13 17:16