一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Flex Logix公司稱它解決了深度學(xué)習(xí)的DRAM問題

IEEE電氣電子工程師 ? 來源:未知 ? 作者:李倩 ? 2018-11-08 14:12 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

深度學(xué)習(xí)有一個DRAM問題。設(shè)計用來實時處理復(fù)雜任務(wù)(比如,在汽車的備份攝像頭視頻流中分辨貓和孩子)的系統(tǒng),不斷地將構(gòu)成神經(jīng)網(wǎng)絡(luò)內(nèi)容的數(shù)據(jù)從存儲器傳送到處理器。

根據(jù)初創(chuàng)公司Flex Logix的說法,問題并不是缺乏存儲這些數(shù)據(jù)的空間,而是處理器和存儲器之間缺乏帶寬。為了將數(shù)百千兆比特的數(shù)據(jù)提供給處理器,有些系統(tǒng)需要4個甚至8個DRAM芯片,這既使占用的空間增加了不少,又消耗了大量的電能。Flex Logix表示,它為可重構(gòu)芯片開發(fā)的互連技術(shù)和tile-based架構(gòu)將使AI系統(tǒng)只需要1個DRAM芯片的帶寬,且功耗僅為十分之一。

圖片來源:Flex Logix

NMAX512tile的架構(gòu)。

位于加州山景城的Flex Logix公司已經(jīng)開始將一種新的嵌入式現(xiàn)場可編程門陣列(eFPGA)架構(gòu)商業(yè)化。但經(jīng)過一番探索后,其創(chuàng)始人之一Cheng C. Wang意識到,這項技術(shù)可以加快神經(jīng)網(wǎng)絡(luò)的速度。

神經(jīng)網(wǎng)絡(luò)由連接和表示連接強度的“權(quán)重”組成。另一位創(chuàng)始人Geoff Tate解釋說,一個好的AI芯片需要兩樣?xùn)|西。一種是一些做關(guān)鍵“推斷”計算(即乘法和累加)的電路。“但更困難的是,你必須非常擅長引入所有這些權(quán)重,以便其乘法器總能得到它們需要的數(shù)據(jù),從而進(jìn)行所需的數(shù)學(xué)運算。Wang意識到我們在FPGA的互連方面所擁有的技術(shù),他可以對它做適應(yīng)性改造,來創(chuàng)建一種非常擅長快速高效地加載權(quán)重、高性能和低功耗的架構(gòu)?!?/p>

需要快速連續(xù)地將數(shù)百萬個權(quán)重加載到網(wǎng)絡(luò)中,這就是每秒要做數(shù)萬億次到數(shù)十萬億次運算的AI系統(tǒng)為什么需要那么多DRAM芯片的原因。DRAM芯片上的每個引腳每秒最多可以傳輸4Gb數(shù)據(jù),因此要達(dá)到所需的每秒數(shù)百Gb的數(shù)據(jù)傳輸速度,就需要多個芯片。

在為FPGA開發(fā)最初的技術(shù)時,Wang注意到,這些芯片有約80%的面積互連,因此他尋求一種能夠縮小互連面積并考慮到更多邏輯的架構(gòu)。他和他在加州大學(xué)洛杉磯分校的同事對一種稱為folded-Bene?網(wǎng)絡(luò)的電信架構(gòu)做了適應(yīng)性改造來完成這項工作。這使得FPGA架構(gòu)看起來像一堆邏輯和SRAM的瓦片(tile)。

圖片來源:Flex Logix

Flex Logix公司表示,在芯片中構(gòu)建分布式SRAM可加快計算速度并降低功耗。

Tate說,在這種專用互連方案中使用分布式SRAM最終會對深度學(xué)習(xí)的DRAM帶寬問題產(chǎn)生重大影響?!拔覀冋谟眯酒系腟RAM取代DRAM帶寬?!?/p>

圖片來源:Flex Logix

若干NMAXtile可以置于一個芯片上并連在一起,以擴大計算能力。

用于Flex Logix的AI產(chǎn)品的tile稱為NMAX,采用了臺積電的16納米技術(shù),面積不到2平方毫米。每個tile都由一組核心組成,這些核心這些核心負(fù)責(zé)關(guān)鍵的乘法和累加計算、控制數(shù)據(jù)的處理和流動的可編程邏輯以及SRAM。這涉及三種不同類型的互連技術(shù)。一種tile上的所有零件連接在一起。另一種將tile與位于tile之間的附加SRAM及外部的DRAM相連接。第三種將相鄰的tile連接在一起。

在深度學(xué)習(xí)領(lǐng)域,很難進(jìn)行真正的橫向比較。但Flex Logix的分析顯示,將使用1個DRAM芯片的模擬的6×6tile的NMAX512陣列與使用8個DRAM的Nvidia Tesla T4進(jìn)行比較,結(jié)果是新架構(gòu)每秒能識別4,600張圖像,而Nvidia每秒識別3,920張圖像。在一項名為YOLOv3的實時視頻處理測試中,同樣大小的NMAX陣列可達(dá)到每秒22萬億次運算,而使用的DRAM帶寬是其他系統(tǒng)的十分之一。

Tate表示,首批NMAX芯片的設(shè)計將于2019年下半年送至代工廠以便進(jìn)行制造。

Flex Logix將波音公司視作其高吞吐量嵌入式FPGA產(chǎn)品的客戶之一。但Tate承認(rèn),與神經(jīng)網(wǎng)絡(luò)相比,嵌入式FPGA是個很難賣的產(chǎn)品?!扒度胧紽PGA是一項很好的業(yè)務(wù),但是推理可能很快就會超越它?!盩ate說。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • DRAM
    +關(guān)注

    關(guān)注

    40

    文章

    2348

    瀏覽量

    185606
  • 神經(jīng)網(wǎng)絡(luò)

    關(guān)注

    42

    文章

    4814

    瀏覽量

    103554
  • 深度學(xué)習(xí)
    +關(guān)注

    關(guān)注

    73

    文章

    5561

    瀏覽量

    122783

原文標(biāo)題:Flex Logix公司稱它解決了深度學(xué)習(xí)的DRAM問題

文章出處:【微信號:IEEE_China,微信公眾號:IEEE電氣電子工程師】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    ADI收購一家eFPGA公司,可重構(gòu)芯片成為FPGA發(fā)展新風(fēng)向?

    ? 電子發(fā)燒友網(wǎng)報道(文/吳子鵬)日前,Flex Logix在其官網(wǎng)發(fā)文,該公司已將其技術(shù)資產(chǎn)出售給一家大型上市公司,其技術(shù)資產(chǎn)和技術(shù)團(tuán)隊
    的頭像 發(fā)表于 11-12 01:22 ?2860次閱讀
    ADI收購<b class='flag-5'>了</b>一家eFPGA<b class='flag-5'>公司</b>,可重構(gòu)芯片成為FPGA發(fā)展新風(fēng)向?

    如何使用flex-builder構(gòu)建aruco庫?

    我正在嘗試構(gòu)建 libopencv-aruco,通常附帶新版本的 OpenCV。當(dāng)我運行 bld -c opencv 時,我沒有看到正在構(gòu)建此庫。 誰能提供一些關(guān)于如何使用 flex-builder 構(gòu)建 aruco 庫的指導(dǎo)?
    發(fā)表于 03-31 06:13

    軍事應(yīng)用中深度學(xué)習(xí)的挑戰(zhàn)與機遇

    人工智能尤其是深度學(xué)習(xí)技術(shù)的最新進(jìn)展,加速不同應(yīng)用領(lǐng)域的創(chuàng)新與發(fā)展。深度學(xué)習(xí)技術(shù)的發(fā)展深刻影響了軍事發(fā)展趨勢,導(dǎo)致戰(zhàn)爭形式和模式發(fā)生重大變
    的頭像 發(fā)表于 02-14 11:15 ?530次閱讀

    BP神經(jīng)網(wǎng)絡(luò)與深度學(xué)習(xí)的關(guān)系

    ),是一種多層前饋神經(jīng)網(wǎng)絡(luò),通過反向傳播算法進(jìn)行訓(xùn)練。BP神經(jīng)網(wǎng)絡(luò)由輸入層、一個或多個隱藏層和輸出層組成,通過逐層遞減的方式調(diào)整網(wǎng)絡(luò)權(quán)重,目的是最小化網(wǎng)絡(luò)的輸出誤差。 二、深度學(xué)習(xí)的定義與發(fā)展
    的頭像 發(fā)表于 02-12 15:15 ?850次閱讀

    羅克韋爾自動化推出Logix SIS,開拓安全新格局

    作為工業(yè)自動化、信息化和數(shù)字化轉(zhuǎn)型領(lǐng)域的全球領(lǐng)先企業(yè)之一,?羅克韋爾自動化近日推出了 Logix SIS,進(jìn)一步豐富其行業(yè)領(lǐng)先的安全技術(shù)產(chǎn)品組合。Logix SIS 是一款精心打造的安全儀表系統(tǒng)
    的頭像 發(fā)表于 11-25 09:38 ?785次閱讀

    NPU在深度學(xué)習(xí)中的應(yīng)用

    隨著人工智能技術(shù)的飛速發(fā)展,深度學(xué)習(xí)作為其核心驅(qū)動力之一,已經(jīng)在眾多領(lǐng)域展現(xiàn)出了巨大的潛力和價值。NPU(Neural Processing Unit,神經(jīng)網(wǎng)絡(luò)處理單元)是專門為深度學(xué)習(xí)
    的頭像 發(fā)表于 11-14 15:17 ?1901次閱讀

    ADI收購Flex Logix,強化數(shù)字產(chǎn)品組合

    近日,全球領(lǐng)先的半導(dǎo)體公司ADI(Analog Devices, Inc.)宣布完成了對美國創(chuàng)新企業(yè)Flex Logix的收購。Flex Logix
    的頭像 發(fā)表于 11-12 14:17 ?781次閱讀

    今日看點丨ADI收購eFPGA公司Flex Logix;業(yè)界首款!湖北發(fā)布高性能車規(guī)級芯片DF30

    1. ADI 收購eFPGA 公司Flex Logix ? 設(shè)計可重構(gòu)AI芯片的美國創(chuàng)企Flex Logix的官網(wǎng)顯示,該
    發(fā)表于 11-11 11:26 ?991次閱讀

    Pytorch深度學(xué)習(xí)訓(xùn)練的方法

    掌握這 17 種方法,用最省力的方式,加速你的 Pytorch 深度學(xué)習(xí)訓(xùn)練。
    的頭像 發(fā)表于 10-28 14:05 ?651次閱讀
    Pytorch<b class='flag-5'>深度</b><b class='flag-5'>學(xué)習(xí)</b>訓(xùn)練的方法

    GPU深度學(xué)習(xí)應(yīng)用案例

    GPU在深度學(xué)習(xí)中的應(yīng)用廣泛且重要,以下是一些GPU深度學(xué)習(xí)應(yīng)用案例: 一、圖像識別 圖像識別是深度學(xué)習(xí)
    的頭像 發(fā)表于 10-27 11:13 ?1342次閱讀

    激光雷達(dá)技術(shù)的基于深度學(xué)習(xí)的進(jìn)步

    信息。這使得激光雷達(dá)在自動駕駛、無人機、機器人等領(lǐng)域具有廣泛的應(yīng)用前景。 二、深度學(xué)習(xí)技術(shù)的發(fā)展 深度學(xué)習(xí)是機器學(xué)習(xí)的一個分支,
    的頭像 發(fā)表于 10-27 10:57 ?1059次閱讀

    FPGA加速深度學(xué)習(xí)模型的案例

    :DE5Net_Conv_Accelerator 應(yīng)用場景 :面向深度學(xué)習(xí)的開源項目,實現(xiàn)AlexNet的第一層卷積運算加速。 技術(shù)特點 : 采用了Verilog語言進(jìn)行編程,與PCIe接口相集成,可以直接插入到
    的頭像 發(fā)表于 10-25 09:22 ?1220次閱讀

    AI大模型與深度學(xué)習(xí)的關(guān)系

    人類的學(xué)習(xí)過程,實現(xiàn)對復(fù)雜數(shù)據(jù)的學(xué)習(xí)和識別。AI大模型則是指模型的參數(shù)數(shù)量巨大,需要龐大的計算資源來進(jìn)行訓(xùn)練和推理。深度學(xué)習(xí)算法為AI大模型提供
    的頭像 發(fā)表于 10-23 15:25 ?2877次閱讀

    FPGA做深度學(xué)習(xí)能走多遠(yuǎn)?

    ,共同進(jìn)步。 歡迎加入FPGA技術(shù)微信交流群14群! 交流問題(一) Q:FPGA做深度學(xué)習(xí)能走多遠(yuǎn)?現(xiàn)在用FPGA做深度學(xué)習(xí)加速成為一個熱門,深鑒科技,商湯,曠視科技等都有基于FPG
    發(fā)表于 09-27 20:53

    PyTorch深度學(xué)習(xí)開發(fā)環(huán)境搭建指南

    PyTorch作為一種流行的深度學(xué)習(xí)框架,其開發(fā)環(huán)境的搭建對于深度學(xué)習(xí)研究者和開發(fā)者來說至關(guān)重要。在Windows操作系統(tǒng)上搭建PyTorch環(huán)境,需要綜合考慮多個方面,包括軟件安裝、
    的頭像 發(fā)表于 07-16 18:29 ?2513次閱讀