一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

IBM研制可兼顧高精度學(xué)習(xí)和低精度推理的深度學(xué)習(xí)芯片

EdXK_AI_News ? 來源:未知 ? 作者:胡薇 ? 2018-07-10 08:56 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

IBM正在研制一種可兼顧高精度學(xué)習(xí)和低精度推理的深度學(xué)習(xí)芯片。

深度學(xué)習(xí)領(lǐng)域仍在不斷發(fā)展,特別地,專家們認(rèn)識到如果芯片能夠使用低精度的計算方式得出近似答案,神經(jīng)網(wǎng)絡(luò)就可以用很少的資源完成大量的計算。這在移動設(shè)備和其他功率受限的設(shè)備中尤其有用。但對某些任務(wù),尤其是訓(xùn)練神經(jīng)網(wǎng)絡(luò)去完成某些事情的任務(wù)來說,精確性仍然是必需的。IBM最近在IEEE VLSI研討會上展示了其最新的解決方案(目前仍然是原型):一款在上述兩方面都有良好表現(xiàn)的芯片。

訓(xùn)練神經(jīng)網(wǎng)絡(luò)與使用該網(wǎng)絡(luò)執(zhí)行其功能(稱為推理)的需求之間存在脫節(jié),這對那些從事于設(shè)計芯片以加速AI功能的人來說是一個巨大的挑戰(zhàn)。IBM的新型AI加速器芯片能夠滿足該公司提出的所謂范圍精度(scaled precision)要求。也就是說,它可以在32位、16位,甚至1位或2位模式下進(jìn)行訓(xùn)練和推理。

IBM約克鎮(zhèn)高地(Yorktown Heights)研究中心的杰出技術(shù)人員、該項工作的領(lǐng)導(dǎo)者Kailash Gopalakrishnan解釋說:“在訓(xùn)練中,你能夠使用的最好精度是16位,而在推理中可以應(yīng)用的最好精度是2位。這個芯片可能涵蓋了目前已知的最佳訓(xùn)練和最好推理?!?/p>

該芯片能夠獲得上述表現(xiàn)的原因來自于兩項創(chuàng)新,而這兩項創(chuàng)新的目標(biāo)都是實(shí)現(xiàn)相同的結(jié)果——保持所有處理器組件能夠得到數(shù)據(jù)和工作。

Gopalakrishnan說:“在深度學(xué)習(xí)方面,傳統(tǒng)芯片架構(gòu)面臨的挑戰(zhàn)之一是利用率一般非常低?!币簿褪钦f,即使芯片可能具有非常高的峰值性能,通常只有20%到30%的資源能夠被用于解決問題。IBM始終將所有任務(wù)的目標(biāo)定為90%。

利用率低通常是因?yàn)榇嬖谟谛酒車臄?shù)據(jù)流瓶頸。為了突破這些信息障礙,Gopalakrishnan的團(tuán)隊開發(fā)了一個“定制”的數(shù)據(jù)流系統(tǒng)。該數(shù)據(jù)流系統(tǒng)是一種網(wǎng)絡(luò)方案,可以加速數(shù)據(jù)從一個處理引擎到下一個處理引擎的傳輸過程。它還針對要處理的是學(xué)習(xí)任務(wù)還是推理任務(wù)以及不同的精度進(jìn)行了優(yōu)化。

第二項創(chuàng)新是使用專門設(shè)計的“便箋本”形式的片上存儲器,而不是CPUGPU上的傳統(tǒng)高速緩沖存儲器。構(gòu)建高速緩存是為了遵守某些對一般計算有意義的規(guī)則,但會導(dǎo)致深度學(xué)習(xí)的延遲。例如,在某些情況下,緩存會將一大塊數(shù)據(jù)推送到計算機(jī)的主存儲器(強(qiáng)制推送),但如果神經(jīng)網(wǎng)絡(luò)的推理或?qū)W習(xí)過程需要用到該數(shù)據(jù),則系統(tǒng)將不得不保持等待狀態(tài),直到可以從主存儲器中檢索到該數(shù)據(jù)。

便箋本遵循不同的規(guī)則。構(gòu)建它的目標(biāo)是為了保持?jǐn)?shù)據(jù)流經(jīng)芯片的處理引擎,并確保數(shù)據(jù)在恰當(dāng)?shù)臅r間處于正確的位置。為了獲得90%的利用率,IBM必須使設(shè)計出的便箋本具有巨大的讀/寫帶寬(每秒192千兆字節(jié))。

由此產(chǎn)生的芯片可以執(zhí)行當(dāng)前所有的三種主要深度學(xué)習(xí)AI:卷積神經(jīng)網(wǎng)絡(luò)(CNN)、多層感知器(MLP)和長-短期記憶(LSTM)。Gopalakrishnan解釋說,這些技術(shù)共同主導(dǎo)了語言、視覺和自然語言處理。在16位精度(尤其是針對訓(xùn)練)情況下,IBM的新芯片能夠在每秒鐘內(nèi)執(zhí)行1.5萬億次浮點(diǎn)運(yùn)算;在2位精度下(推理的最佳設(shè)置)則躍升到每秒12萬億次運(yùn)算。

Gopalakrishnan指出,由于芯片是采用先進(jìn)的硅CMOS工藝(GlobalFoundries的14納米工藝)制造的,每秒鐘內(nèi)發(fā)生的所有這些操作都被限制在一個相當(dāng)小的區(qū)域內(nèi)。為了推理出一個CNN網(wǎng)絡(luò),該芯片可以在每平方毫米內(nèi)每秒執(zhí)行平均1.33萬億次操作。這個數(shù)字很重要,“因?yàn)樵诤芏鄳?yīng)用中,你的成本受到尺寸的限制,”他說。

新的架構(gòu)也證明了IBM研究人員幾年來一直在探索的東西:如果以高得多的精度訓(xùn)練神經(jīng)網(wǎng)絡(luò),真正低精度的推理就無法正常進(jìn)行。Gopalakrishnan說:“當(dāng)?shù)陀?位時,訓(xùn)練與推理將開始直接相互影響。一個在16位模式下訓(xùn)練但以1位模式部署的神經(jīng)網(wǎng)絡(luò)系統(tǒng)將出現(xiàn)無法接受的重大錯誤。因此,以與最終部署方式類似的精度訓(xùn)練網(wǎng)絡(luò)將帶來最好的結(jié)果?!?/p>

尚無任何消息披露這項技術(shù)什么時候可能以Watson或其他形式進(jìn)行商業(yè)化,但Gopalakrishnan的領(lǐng)導(dǎo)、IBM半導(dǎo)體研究所的副總裁Mukesh Khare表示希望它能夠發(fā)展和改進(jìn)。他說:“這只是冰山一角,我們正在進(jìn)行更多創(chuàng)新。”

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • IBM
    IBM
    +關(guān)注

    關(guān)注

    3

    文章

    1823

    瀏覽量

    75828
  • 深度學(xué)習(xí)
    +關(guān)注

    關(guān)注

    73

    文章

    5561

    瀏覽量

    122795

原文標(biāo)題:IBM正在研制通用型深度學(xué)習(xí)芯片

文章出處:【微信號:AI_News,微信公眾號:人工智能快報】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    微米級精度,毫米級響應(yīng)——高精度位移傳感新標(biāo)桿

    邊界,成為行業(yè)升級的“隱形推手”。 精度與速度的雙重突破:技術(shù)硬實(shí)力 傳統(tǒng)位移傳感器常面臨精度與響應(yīng)速度難以兼顧的困境:高精度往往犧牲響應(yīng)效率,快速響應(yīng)又難以保證測量穩(wěn)定性。而這款新型
    的頭像 發(fā)表于 05-23 08:32 ?149次閱讀
    微米級<b class='flag-5'>精度</b>,毫米級響應(yīng)——<b class='flag-5'>高精度</b>位移傳感新標(biāo)桿

    云翎智能單北斗定制RTK高精度記錄儀如何賦能鐵路巡檢安全

    云翎智能國產(chǎn)化RTK高精度記錄儀通過深度融合北斗系統(tǒng)技術(shù)特性與鐵路巡檢實(shí)際需求,從定位精度、數(shù)據(jù)安全、智能分析到應(yīng)急響應(yīng)等多維度賦能鐵路巡檢保障,具體體現(xiàn)在以下方面:云翎智能單北斗
    的頭像 發(fā)表于 04-16 14:06 ?343次閱讀
    云翎智能單北斗<b class='flag-5'>可</b>定制RTK<b class='flag-5'>高精度</b>記錄儀如何賦能鐵路巡檢安全

    如何對電壓進(jìn)行高精度測試

    VS系列電壓傳感器 是一種量程覆蓋35kV及以下的直流、交流、周期性脈沖以及各種不規(guī)則波形的電壓傳感器,也是我們國內(nèi)的 湖南銀河電氣 自主研發(fā)的高精度電壓傳感器,完全替代瑞士的LEM,精度
    的頭像 發(fā)表于 03-17 11:08 ?471次閱讀
    如何對電壓進(jìn)行<b class='flag-5'>高精度</b>測試

    BMS芯片高精度方向持續(xù)發(fā)展

    實(shí)時數(shù)據(jù)精度(如電壓±1mV級誤差)?。 ? 這些都需要有高精度BMS芯片的助力,高精度的BMS芯片能夠更準(zhǔn)確地監(jiān)測電池的電壓、電流和溫度,
    的頭像 發(fā)表于 03-07 01:03 ?3451次閱讀
    BMS<b class='flag-5'>芯片</b>向<b class='flag-5'>高精度</b>方向持續(xù)發(fā)展

    ads1278高速模式和高精度模式下所能得到的最高精度是多少?

    差分電路是正確的嗎,好像和ths4521的datasheet里面的單端轉(zhuǎn)差分原理圖(如下圖)不一致吧。 另外,想請教一下ads1278高速模式和高精度模式下所能得到的最高精度是多少。根據(jù)你們給的信噪比和精度之間換算的公式,
    發(fā)表于 01-16 07:41

    請問ADS1263能做到多高精度?實(shí)現(xiàn)高精度應(yīng)該注意什么?

    我想實(shí)現(xiàn)每通道10K以上采樣率,測量范圍為-500mV ~+500mV,請問ADS1263能做到多高精度?實(shí)現(xiàn)高精度應(yīng)該注意什么,比如電壓基準(zhǔn)源應(yīng)該選用什么器件?應(yīng)該選用什么電源器件?還有PCB設(shè)計應(yīng)該注意什么?不需要復(fù)雜的回答,希望能知道幾個關(guān)鍵點(diǎn)。謝謝。
    發(fā)表于 01-01 06:28

    ADS7142如果保證其高精度呢?

    從ADS7142的Datasheet來看,應(yīng)該是一個16位的高精度AD,但參考的基準(zhǔn)電壓卻是用的電源,那么如果保證其高精度呢?因?yàn)槌S玫腖DO的精度普遍大于1%且存在溫漂,如果用基
    發(fā)表于 12-16 07:07

    高精度電位器的特點(diǎn)和用途

    至關(guān)重要。 低溫度系數(shù) : 高精度電位器的溫度系數(shù)非常,這意味著在溫度變化時,其電阻值的變化非常小,從而保持了電阻值的穩(wěn)定性。 低噪聲 : 高精度電位器在調(diào)整過程中產(chǎn)生的噪聲非常,
    的頭像 發(fā)表于 12-03 15:31 ?1124次閱讀

    GPU深度學(xué)習(xí)應(yīng)用案例

    能力,可以顯著提高圖像識別模型的訓(xùn)練速度和準(zhǔn)確性。例如,在人臉識別、自動駕駛等領(lǐng)域,GPU被廣泛應(yīng)用于加速深度學(xué)習(xí)模型的訓(xùn)練和推理過程。 二、自然語言處理 自然語言處理(NLP)是深度
    的頭像 發(fā)表于 10-27 11:13 ?1377次閱讀

    激光雷達(dá)技術(shù)的基于深度學(xué)習(xí)的進(jìn)步

    信息。這使得激光雷達(dá)在自動駕駛、無人機(jī)、機(jī)器人等領(lǐng)域具有廣泛的應(yīng)用前景。 二、深度學(xué)習(xí)技術(shù)的發(fā)展 深度學(xué)習(xí)是機(jī)器學(xué)習(xí)的一個分支,它通過模擬人
    的頭像 發(fā)表于 10-27 10:57 ?1070次閱讀

    AI大模型與深度學(xué)習(xí)的關(guān)系

    人類的學(xué)習(xí)過程,實(shí)現(xiàn)對復(fù)雜數(shù)據(jù)的學(xué)習(xí)和識別。AI大模型則是指模型的參數(shù)數(shù)量巨大,需要龐大的計算資源來進(jìn)行訓(xùn)練和推理。深度學(xué)習(xí)算法為AI大模型
    的頭像 發(fā)表于 10-23 15:25 ?2893次閱讀

    FPGA做深度學(xué)習(xí)能走多遠(yuǎn)?

    的應(yīng)用場景。 ? 重構(gòu)性:在深度學(xué)習(xí)高速迭代的情況下,F(xiàn)PGA 比一些專用芯片(如 ASIC)具有更強(qiáng)的靈活性。當(dāng)深度
    發(fā)表于 09-27 20:53

    物聯(lián)網(wǎng)系統(tǒng)中高精度RTK定位方案的實(shí)現(xiàn)_高精度定位模塊

    物聯(lián)網(wǎng)系統(tǒng)中為什么要使用高精度定位模塊 物聯(lián)網(wǎng)系統(tǒng)中使用高精度定位模塊的原因主要體現(xiàn)在以下幾個方面: 提高定位精度 厘米級高精度高精度定位
    的頭像 發(fā)表于 09-26 17:53 ?2949次閱讀
    物聯(lián)網(wǎng)系統(tǒng)中<b class='flag-5'>高精度</b>RTK定位方案的實(shí)現(xiàn)_<b class='flag-5'>高精度</b>定位模塊

    VS高精度電壓傳感器

    ? ? ? ? VS系列電壓傳感器是一種量程覆蓋35kV及以下的直流、交流、周期性脈沖以及各種不規(guī)則波形的電壓傳感器,精度高達(dá)0.05%FS、帶寬高達(dá)100kHz,滿足寬頻帶、高精度電壓測試需求
    的頭像 發(fā)表于 09-19 15:55 ?866次閱讀
    VS<b class='flag-5'>高精度</b>電壓傳感器

    國產(chǎn)AFE兼容ADS1248助力工業(yè)實(shí)現(xiàn)超高精度的模擬性能

    國產(chǎn)AFE兼容ADS1248助力工業(yè)實(shí)現(xiàn)超高精度的模擬性能
    的頭像 發(fā)表于 08-15 09:50 ?898次閱讀
    國產(chǎn)AFE<b class='flag-5'>可</b>兼容ADS1248助力工業(yè)實(shí)現(xiàn)超<b class='flag-5'>高精度</b>的模擬性能