一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

華人學(xué)者Nature上發(fā)表最新成果 世界最快光子AI加速器

工程師鄧生 ? 來源:《Light: Science & App ? 作者:徐興元 ? 2021-01-11 15:51 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

人工神經(jīng)網(wǎng)絡(luò)廣泛應(yīng)用于人臉識別、語音翻譯、醫(yī)療診斷、自動駕駛等重要領(lǐng)域,其性能主要由硬件算力決定,目前所廣泛應(yīng)用的神經(jīng)網(wǎng)絡(luò)硬件都基于數(shù)字電子架構(gòu)。然而,該架構(gòu)的兩個本質(zhì)局限—馮諾曼依瓶頸與電子速率瓶頸,極大限制了神經(jīng)網(wǎng)絡(luò)硬件的潛在算力。首先,數(shù)字架構(gòu)中,數(shù)據(jù)的存儲和運(yùn)算是分布式的,因而在計算過程中,會有大量的能源和算力消耗在數(shù)據(jù)的反復(fù)讀取和存儲中,此限制被稱為馮諾曼依瓶頸。其次,由于電子微處理器中的寄生電容和互聯(lián)時延問題,電子系統(tǒng)存在著本質(zhì)的帶寬限制,導(dǎo)致電子微處理器的主頻事實(shí)上在過去十年已沒有明顯提升,此限制也被稱為電子速率瓶頸。

光子神經(jīng)網(wǎng)絡(luò)工作于模擬架構(gòu)中,即數(shù)據(jù)在硬件系統(tǒng)中的實(shí)時位置與進(jìn)行運(yùn)算的位置相同,因而規(guī)避了馮諾曼依瓶頸。此外,寬達(dá)數(shù)十太赫茲的光譜也為高速運(yùn)算提供了充足的帶寬。目前已有來自加州大學(xué)、麻省理工學(xué)院、明斯特大學(xué)等單位的研究團(tuán)隊做出了一系列在網(wǎng)絡(luò)尺度、可集成性、片上存儲等方面的突破,然而尚未能實(shí)現(xiàn)較高運(yùn)算速度與高維數(shù)據(jù)處理能力,光子神經(jīng)網(wǎng)絡(luò)的超高運(yùn)算潛力尚未得到證實(shí)。

近日,澳大利亞研究人員徐興元博士(莫納什大學(xué))、譚朦曦博士、David Moss教授(斯文本科技大學(xué))、Arnan Mitchell教授(皇家墨爾本理工大學(xué))等首次提出并實(shí)現(xiàn)了基于波長、時間交織的光子卷積加速器。該文章以“ 11 TOPS photonic convolutional accelerator for optical neural networks”為題發(fā)表在Nature。

研究人員通過采用集成高品質(zhì)因素、高非線性微環(huán)與波導(dǎo)色散調(diào)控,實(shí)現(xiàn)了高相干度、易于產(chǎn)生的集成克爾孤子晶體光頻梳。

研究人員將該光頻梳進(jìn)行頻域整形并且與高速光電調(diào)制相結(jié)合,實(shí)現(xiàn)了輸入數(shù)據(jù)在并行波長通道上的組播與加權(quán),然后采用光學(xué)色散介質(zhì)作為緩存,對組播信號進(jìn)行了步進(jìn)延時(步長為單個碼元時長),從而在時域上對齊了不同波長通道中需要加權(quán)求和的碼元,最后通過光電轉(zhuǎn)換實(shí)現(xiàn)處理結(jié)果的高速實(shí)時讀取(如圖1所示)。通過這一系列步驟,波長構(gòu)架的卷積窗口(感知域)即可在時域以超過60GBaud的速率滑動,結(jié)合克爾光頻梳所實(shí)現(xiàn)的高并行度(C波段90個波長通道),實(shí)現(xiàn)了11 TOPS(太運(yùn)算每秒)的運(yùn)算速度,即每秒可完成11萬億次運(yùn)算。

1610351104722.jpg

圖1 卷積加速器工作原理

圖源:Nature 589, 44–51 (2021)。 Fig 1

通過這一系列步驟,數(shù)學(xué)模型抽象的神經(jīng)元突觸就被光頻梳在實(shí)際物理系統(tǒng)中實(shí)現(xiàn),其中突觸連接的權(quán)重由光頻梳的光功率體現(xiàn)。最終實(shí)驗驗證了高維圖片處理(實(shí)驗結(jié)果如圖2所示)以及深度學(xué)習(xí)光子卷積神經(jīng)網(wǎng)絡(luò)(實(shí)驗結(jié)果如圖3所示)。

1610351144513.jpg

圖2 卷積圖像處理結(jié)果

圖源:Nature 589, 44–51 (2021)。 Fig 3

在國際相關(guān)研究成果的基礎(chǔ)上實(shí)現(xiàn)了數(shù)個突破,包括:

1. 由于集成克爾光頻梳所提供的大量波長通道,運(yùn)算速度首次突破到11 TOPS以上;

2. 首次實(shí)現(xiàn)了利用光學(xué)手段進(jìn)行高維數(shù)據(jù)處理(25萬像素點(diǎn)),為光子神經(jīng)網(wǎng)絡(luò)的進(jìn)一步實(shí)際應(yīng)用如人臉識別等展現(xiàn)了可能;

3. 實(shí)現(xiàn)了500張MINIST手寫數(shù)字圖片的高速分類預(yù)測,準(zhǔn)確率達(dá)到88%以上;

4. 實(shí)現(xiàn)了具備高速光電接口的硬件加速器,速度可達(dá)64G Baud以上,并且可與現(xiàn)有電子或者光學(xué)硬件兼容互聯(lián);

5. 結(jié)合應(yīng)用了集成克爾光頻梳,為實(shí)現(xiàn)光子神經(jīng)網(wǎng)絡(luò)的單片集成奠定了基礎(chǔ)。

1610351182692.jpg

圖3 卷積神經(jīng)網(wǎng)絡(luò)50張手寫數(shù)字識別結(jié)果。上圖為全連接層神經(jīng)元輸出幅度,下圖為混淆矩陣。

圖源:Nature 589, 44–51 (2021)。 Fig 6

后續(xù),研究人員將繼續(xù)優(yōu)化本方案的性能指標(biāo),如處理速度、并行度、體積與可集成性、功耗等。本工作實(shí)驗證明了光子神經(jīng)網(wǎng)絡(luò)硬件的運(yùn)算潛力,并且具有高速光電接口,未來可作為通用卷積特征提取前端與其他光電模數(shù)架構(gòu)互聯(lián),在卷積神經(jīng)網(wǎng)絡(luò)中可承擔(dān)70%以上的運(yùn)算負(fù)荷,大幅提升系統(tǒng)整體算力,在未來實(shí)時人工智能應(yīng)用場景如無人駕駛、醫(yī)療診斷等方面有重要應(yīng)用。

責(zé)任編輯:PSY

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 晶體管
    +關(guān)注

    關(guān)注

    77

    文章

    10017

    瀏覽量

    141549
  • 人工智能
    +關(guān)注

    關(guān)注

    1806

    文章

    48992

    瀏覽量

    249178
  • 光子芯片
    +關(guān)注

    關(guān)注

    3

    文章

    102

    瀏覽量

    24833
  • AI加速器
    +關(guān)注

    關(guān)注

    1

    文章

    70

    瀏覽量

    9086
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    粒子加速器?——?科技前沿的核心裝置

    粒子加速器全稱“荷電粒子加速器”,是一種利用電磁場在高真空環(huán)境中對帶電粒子(如電子、質(zhì)子、離子)進(jìn)行加速和控制,使其獲得高能量的特種裝置。粒子加速器技術(shù)現(xiàn)已發(fā)展成為集高能物理、核物理、
    的頭像 發(fā)表于 06-19 12:05 ?430次閱讀
    粒子<b class='flag-5'>加速器</b>?——?科技前沿的核心裝置

    基于雙向塊浮點(diǎn)量化的大語言模型高效加速器設(shè)計

    本文提出雙向塊浮點(diǎn)(BBFP)量化格式及基于其的LLMs加速器BBAL,通過雙向移位與重疊位設(shè)計顯著降低量化誤差,提升非線性計算效率,實(shí)現(xiàn)精度、吞吐量和能效的顯著優(yōu)化,相關(guān)成果被國際頂級會議 DAC 2025 接收。
    的頭像 發(fā)表于 05-14 13:40 ?1607次閱讀
    基于雙向塊浮點(diǎn)量化的大語言模型高效<b class='flag-5'>加速器</b>設(shè)計

    光子 AI 處理的核心原理及突破性進(jìn)展

    電子發(fā)燒友網(wǎng)(文 / 李彎彎)光子 AI 處理,作為一種借助光子執(zhí)行信息處理與人工智能(AI)計算的新型硬件設(shè)備,正逐漸嶄露頭角。與傳統(tǒng)基
    的頭像 發(fā)表于 04-19 00:40 ?2620次閱讀

    曦智科技時隔八年再登《Nature》,光電混合計算架構(gòu)首次公開

    英國倫敦時間4月9日,全球頂級學(xué)術(shù)期刊《自然》(Nature)刊載了曦智科技的光電混合計算成果:《超低延遲大規(guī)模集成光子加速器》(An integrated large-scale p
    發(fā)表于 04-10 09:50 ?347次閱讀
     曦智科技時隔八年再登《<b class='flag-5'>Nature</b>》,光電混合計算架構(gòu)首次公開

    嵌入式AI加速器DRP-AI 詳細(xì)介紹

    的嵌入式設(shè)備。此外,人工智能正在不斷發(fā)展,新的算法不時被開發(fā)出來。 在人工智能快速發(fā)展的過程中,瑞薩開發(fā)了人工智能加速器(DRP-AI)和軟件(DRP-AI翻譯),既提供高性能又提供
    的頭像 發(fā)表于 03-15 16:13 ?1001次閱讀
    嵌入式<b class='flag-5'>AI</b><b class='flag-5'>加速器</b>DRP-<b class='flag-5'>AI</b> 詳細(xì)介紹

    FPGA+AI王炸組合如何重塑未來世界:看看DeepSeek東方神秘力量如何預(yù)測......

    。? AI加速器的開發(fā):FPGA被廣泛用于開發(fā)專為AI算法優(yōu)化的加速器,例如深度學(xué)習(xí)推理加速器。這種定制化的硬件設(shè)計能夠顯著提升
    發(fā)表于 03-03 11:21

    消息稱AMD Instinct MI400 AI加速器將配備8個計算芯片

    近日,據(jù)外媒 videocardz 報道,參考 AMD 最新推出的 AMD - GFX 補(bǔ)丁程序,其中暗示 AMD 旗下的 Instinct MI400 AI 加速器設(shè)計將有重大變革,其將配備 8
    的頭像 發(fā)表于 02-05 15:07 ?942次閱讀

    蘋果加入UALink聯(lián)盟,共推AI加速器新標(biāo)準(zhǔn)

    蘋果公司已正式成為Ultra Accelerator Link(UALink)聯(lián)盟的一員,并獲得了該聯(lián)盟董事會席位。UALink聯(lián)盟由超過65家成員組成,專注于開發(fā)下一代人工智能加速器架構(gòu),旨在推動AI技術(shù)的快速發(fā)展。
    的頭像 發(fā)表于 01-22 18:18 ?755次閱讀

    英偉達(dá)AI加速器新藍(lán)圖:集成硅光子I/O,3D垂直堆疊 DRAM 內(nèi)存

    加速器設(shè)計的愿景。 英偉達(dá)認(rèn)為未來整個 AI 加速器復(fù)合體將位于大面積先進(jìn)封裝基板之上,采用垂直供電,集成硅光子 I/O 器件,GPU 采用多模塊設(shè)計,3D 垂直堆疊 DRAM 內(nèi)存
    的頭像 發(fā)表于 12-13 11:37 ?690次閱讀
    英偉達(dá)<b class='flag-5'>AI</b><b class='flag-5'>加速器</b>新藍(lán)圖:集成硅<b class='flag-5'>光子</b>I/O,3D垂直堆疊 DRAM 內(nèi)存

    從版本控制到全流程支持:揭秘Helix Core如何成為您的創(chuàng)意加速器

    加速器
    龍智DevSecOps
    發(fā)布于 :2024年11月26日 13:42:47

    IBM與AMD攜手部署MI300X加速器,強(qiáng)化AI與HPC能力

    舉措預(yù)計將于2025年上半年正式推出。 此次合作的核心目標(biāo)是提升通用人工智能(AI)模型的性能與能效,并為企業(yè)客戶提供高性能計算(HPC)應(yīng)用的強(qiáng)大支持。AMD的Instinct MI300X加速器憑借其
    的頭像 發(fā)表于 11-21 11:07 ?719次閱讀

    IBM將在云平臺部署AMD加速器

    IBM與AMD近期宣布了一項重要合作協(xié)議,根據(jù)協(xié)議,IBM將在其云平臺上部署AMD Instinct MI300X加速器。這一舉措旨在提升企業(yè)客戶在生成式AI模型方面的性能和能效,進(jìn)一步推動AI技術(shù)的創(chuàng)新與應(yīng)用。
    的頭像 發(fā)表于 11-19 16:24 ?594次閱讀

    英特爾發(fā)布Gaudi3 AI加速器,押注低成本優(yōu)勢挑戰(zhàn)市場

    英特爾近期震撼發(fā)布了專為AI工作負(fù)載設(shè)計的Gaudi3加速器,這款新芯片雖在速度上不及英偉達(dá)熱門型號H100與H200 GPU,但英特爾巧妙地將競爭優(yōu)勢聚焦于其更為親民的價格與總擁有成本(TCO)
    的頭像 發(fā)表于 09-26 16:16 ?1176次閱讀

    SiFive發(fā)布MX系列高性能AI加速器IP

    AI技術(shù)日新月異的今天,RISC-V IP設(shè)計領(lǐng)域的領(lǐng)軍企業(yè)SiFive再次引領(lǐng)行業(yè)潮流,正式推出了其革命性的SiFive Intelligence XM系列高性能AI加速器IP。這一創(chuàng)新產(chǎn)品專為
    的頭像 發(fā)表于 09-24 14:46 ?817次閱讀

    下一代高功能新一代AI加速器(DRP-AI3):10x在高級AI系統(tǒng)高級AI中更快的嵌入處理

    電子發(fā)燒友網(wǎng)站提供《下一代高功能新一代AI加速器(DRP-AI3):10x在高級AI系統(tǒng)高級AI中更快的嵌入處理.pdf》資料免費(fèi)下載
    發(fā)表于 08-15 11:06 ?0次下載
    下一代高功能新一代<b class='flag-5'>AI</b><b class='flag-5'>加速器</b>(DRP-<b class='flag-5'>AI</b>3):10x在高級<b class='flag-5'>AI</b>系統(tǒng)高級<b class='flag-5'>AI</b>中更快的嵌入處理