一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Hot Chips 2017——人工智能近期的發(fā)展及其對計算機(jī)系統(tǒng)設(shè)計的影響(附PPT資料下載)

m3Fp_almosthuma ? 來源:機(jī)器之心 ? 作者:機(jī)器之心 ? 2017-08-24 17:42 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

在剛剛結(jié)束的 2017 年國際高性能微處理器研討會(Hot Chips 2017)上,微軟、百度、英特爾等公司都發(fā)布了一系列硬件方面的新信息,比如微軟的 Project Brainwave、百度的 XPU、英特爾的 14nm FPGA 解決方案等。谷歌也不例外,在大會 keynote 中 Jeff Dean 介紹了人工智能近期的發(fā)展及其對計算機(jī)系統(tǒng)設(shè)計的影響,同時他也對 TPU、TensorFlow 進(jìn)行了詳細(xì)介紹。文末提供了該演講資料的下載地址。

在演講中,Jeff Dean 首先介紹了深度學(xué)習(xí)的崛起(及其原因),谷歌在自動駕駛、醫(yī)療健康等領(lǐng)域取得的最新進(jìn)展。

Jeff Dean 表示,隨著深度學(xué)習(xí)的發(fā)展,我們需要更多的計算能力,而深度學(xué)習(xí)也正在改變我們設(shè)計計算機(jī)的能力。

我們知道,谷歌設(shè)計了 TPU 專門進(jìn)行神經(jīng)網(wǎng)絡(luò)推斷。Jeff Dean 表示,TPU 在谷歌產(chǎn)品中的應(yīng)用已經(jīng)超過了 30 個月,用于搜索、神經(jīng)機(jī)器翻譯、DeepMind 的 AlphaGo 系統(tǒng)等。

但部署人工智能不只是推斷,還有訓(xùn)練階段。TPU 能夠助力推斷,我們又該如何加速訓(xùn)練?訓(xùn)練的加速非常的重要:無論是對產(chǎn)品化還是對解決大量的難題。

為了同時加速神經(jīng)網(wǎng)絡(luò)的推斷與訓(xùn)練,谷歌設(shè)計了 TPU 二代。TPU 二代芯片的性能如下圖所示:

除了上圖所述意外,TPU 二代的特點(diǎn)還有:

  • 每秒的浮點(diǎn)運(yùn)算是 180 teraflops,64 GB 的 HBM 存儲,2400 GB/S 的存儲帶寬

  • 設(shè)計上,TPU 二代可以組合連接成大型配置

下圖是 TPU 組成的大型配置:由 64 塊 TPU 二代組成,每秒 11.5 千萬億次浮點(diǎn)運(yùn)算,4 太字節(jié)的 HBM 存儲。

在擁有強(qiáng)大的硬件之后,我們需要更強(qiáng)大的深度學(xué)習(xí)框架來支持這些硬件和編程語言,因?yàn)榭焖僭鲩L的機(jī)器學(xué)習(xí)和深度學(xué)習(xí)需要硬件和軟件都能具備強(qiáng)大的擴(kuò)展能力。因此,Jeff Dean 還詳細(xì)介紹了最開始由谷歌開發(fā)的深度學(xué)習(xí)框架 TensorFlow。

深度學(xué)習(xí)框架 TensorFlow

TensorFlow 是一種采用數(shù)據(jù)流圖(data flow graphs),用于數(shù)值計算的開源軟件庫。其中 Tensor 代表傳遞的數(shù)據(jù)為張量(多維數(shù)組),F(xiàn)low 代表使用計算圖進(jìn)行運(yùn)算。數(shù)據(jù)流圖用「節(jié)點(diǎn)」(nodes)和「邊」(edges)組成的有向圖來描述數(shù)學(xué)運(yùn)算。

TensorFlow 的目標(biāo)是建立一個可以表達(dá)和分享機(jī)器學(xué)習(xí)觀點(diǎn)與系統(tǒng)的公共平臺。該平臺是開源的,所以它不僅是谷歌的平臺,同時是所有機(jī)器學(xué)習(xí)開發(fā)者和研究人員的平臺,谷歌和所有機(jī)器學(xué)習(xí)開源社區(qū)的研究者都在努力使 TensorFlow 成為研究和產(chǎn)品上最好的機(jī)器學(xué)習(xí)平臺。

下面是 TensorFlow 項目近年來在 Github 上的關(guān)注度,我們可以看到 TensorFlow 是所有同類深度學(xué)習(xí)框架中關(guān)注度最大的項目。

TensorFlow:一個充滿活力的開源社區(qū)

TensorFlow 發(fā)展迅速,有很多谷歌外部的開發(fā)人員

  • 超過 800 多位 TensorFlow 開發(fā)人員(非谷歌人員)。

  • 21 個月內(nèi) Github 上有超過 21000 多條貢獻(xiàn)和修改。

  • 許多社區(qū)編寫了 TensorFlow 的教程、模型、翻譯和項目

  • 超過 16000 個 Github 項目在項目名中包含了「TensorFlow」字段

社區(qū)與 TensorFlow 團(tuán)隊之間的直接聯(lián)合

  • 5000+已回答的 Stack Overflow 問題

  • 80+ 每周解答的社區(qū)提交的 GitHub 問題

通過 TensorFlow 編程

在 TensorFlow 中,一個模型可能只需要一點(diǎn)點(diǎn)修改就能在 CPU、GPU 或 TPU 上運(yùn)行。前面我們已經(jīng)看到 TPU 的強(qiáng)大之處,Jeff Dean 表明,對于從事開放性機(jī)器學(xué)習(xí)研究的科學(xué)家,谷歌可以免費(fèi)提供 1000 塊云 TPU 來支持他們的研究。Jeff Dean 說:「我們很高興研究者能在更強(qiáng)勁的計算力下進(jìn)行更杰出的研究」

TensorFlow Research Cloud 申請地址:https://services.google.com/fb/forms/tpusignup/

機(jī)器學(xué)習(xí)需要在各種環(huán)境中運(yùn)行,我們可以在下面看到 TensorFlow 所支持的各種平臺和編程語言。

除此之外,TensorFlow 還支持各種編程語言,如 Python、C++、Java、C#、R、Go 等。

TensorFlow 非常重要的一點(diǎn)就是計算圖,我們一般需要先定義整個模型需要的計算圖,然后再執(zhí)行計算圖進(jìn)行運(yùn)算。在計算圖中,「節(jié)點(diǎn)」一般用來表示施加的數(shù)學(xué)操作,但也可以表示數(shù)據(jù)輸入的起點(diǎn)和輸出的終點(diǎn),或者是讀取/寫入持久變量(persistent variable)的終點(diǎn)。邊表示節(jié)點(diǎn)之間的輸入/輸出關(guān)系。這些數(shù)據(jù)邊可以傳送維度可動態(tài)調(diào)整的多維數(shù)據(jù)數(shù)組,即張量(tensor)。

如下是使用 TensorFlow 和 Python 代碼定義一個計算圖:

在 Tensorflow 中,所有不同的變量和運(yùn)算都儲存在計算圖。所以在我們構(gòu)建完模型所需要的圖之后,還需要打開一個會話(Session)來運(yùn)行整個計算圖。在會話中,我們可以將所有計算分配到可用的 CPU 和 GPU 資源中。

如下所示代碼,我們聲明兩個常量 a 和 b,并且定義一個加法運(yùn)算。但它并不會輸出計算結(jié)果,因?yàn)槲覀冎皇嵌x了一張圖,而沒有運(yùn)行它:

a=tf.constant([1,2],name="a")
b=tf.constant([2,4],name="b")
result = a+b
print(result)

#輸出:Tensor("add:0", shape=(2,), dtype=int32)

下面的代碼才會輸出計算結(jié)果,因?yàn)槲覀冃枰獎?chuàng)建一個會話才能管理 TensorFlow 運(yùn)行時的所有資源。但計算完畢后需要關(guān)閉會話來幫助系統(tǒng)回收資源,不然就會出現(xiàn)資源泄漏的問題。下面提供了使用會話的兩種方式:

a=tf.constant([1,2,3,4])
b=tf.constant([1,2,3,4])
result=a+b
sess=tf.Session()
print(sess.run(result))
sess.close

#輸出 [2 4 6 8]

with tf.Session() as sess:
  a=tf.constant([1,2,3,4])
  b=tf.constant([1,2,3,4])
  result=a+b
  print(sess.run(result))
  
#輸出 [2 4 6 8]

TensorFlow + XLA 編譯器

XLA(Accelerated Linear Algebra)是一種特定領(lǐng)域的編譯器,它極好地支持線性代數(shù),所以能很大程度地優(yōu)化 TensorFlow 的計算。使用 XLA 編譯器,TensorFlow 的運(yùn)算將在速度、內(nèi)存使用和概率計算上得到大幅度提升。

  • XLA 編譯器詳細(xì)介紹: https://www.tensorflow.org/performance/xla/

  • XLA 編譯器開源代碼: https://github.com/tensorflow/tensorflow/tree/master/tensorflow/compiler

TensorFlow 的優(yōu)勢

高性能機(jī)器學(xué)習(xí)模型

對于大型模型來說,模型并行化處理是極其重要的,因?yàn)閱蝹€模型的訓(xùn)練時間太長以至于我們很難對這些模型進(jìn)行反復(fù)的修改。因此,在多個計算設(shè)備中處理模型并取得優(yōu)秀的性能就十分重要了。如下所示,我們可以將模型分割為四部分,運(yùn)行在四個 GPU 上。

高性能強(qiáng)化學(xué)習(xí)模型

通過強(qiáng)化學(xué)習(xí)訓(xùn)練的 Placement 模型將圖(graph)作為輸入,并且將一組設(shè)備、輸出設(shè)備作為圖中的節(jié)點(diǎn)。在 Runtime 中,給定強(qiáng)化學(xué)習(xí)的獎勵信號而度量每一步的時間,然后再更新 Placement。

通過強(qiáng)化學(xué)習(xí)優(yōu)化設(shè)備部署(Device Placement Optimization with Reinforcement Learning,ICML 2017)

  • 論文地址:https://arxiv.org/abs/1706.04972

通過強(qiáng)化學(xué)習(xí)優(yōu)化設(shè)備部署

降低推斷成本

開發(fā)人員最怕的就是「我們有十分優(yōu)秀的模型,但它卻需要太多的計算資源而不能部署到邊緣設(shè)備中!」

Geoffrey Hinton 和 Jeff Dean 等人曾發(fā)表過論文 Distilling the Knowledge in a Neural Network。在該篇論文中,他們詳細(xì)探討了將知識壓縮到一個集成的單一模型中,因此能使用不同的壓縮方法將復(fù)雜模型部署到低計算能力的設(shè)備中。他們表示這種方法顯著地提升了商業(yè)聲學(xué)模型部署的性能。

  • 論文地址:https://arxiv.org/abs/1503.02531

這種集成方法實(shí)現(xiàn)成一個從輸入到輸出的映射函數(shù)。我們會忽略集成中的模型和參數(shù)化的方式而只關(guān)注于這個函數(shù)。以下是 Jeff Dean 介紹這種集成。

訓(xùn)練模型的幾個趨勢

1. 大型、稀疏激活式模型

之所以想要訓(xùn)練這種模型是想要面向大型數(shù)據(jù)集的大型模型容量,但同時也想要單個樣本只激活大型模型的一小部分。

逐個樣本路徑選擇圖

這里,可參考谷歌 Google Brain ICLR 2017 論文《OUTRAGEOUSLY LARGE NEURAL NETWORKS: THE SPARSELY-GATED MIXTURE-OF-EXPERTS LAYER》。

2. 自動機(jī)器學(xué)習(xí)

Jeff Dean 介紹說,目前的解決方式是:機(jī)器學(xué)習(xí)專家+數(shù)據(jù)+計算。這種解決方案人力的介入非常大。我們能不能把解決方案變成:數(shù)據(jù)+100 倍的計算。

有多個信號讓我們看到,這種方式是可行的:

  • 基于強(qiáng)化學(xué)習(xí)的架構(gòu)搜索

  • 學(xué)習(xí)如何優(yōu)化

如 Google Brain ICLR 2017 論文《Neural Architecture Search with Reinforcement Learning》,其思路是通過強(qiáng)化學(xué)習(xí)訓(xùn)練的模型能夠生成模型。

在此論文中,作者們生成了 10 個模型,對它們進(jìn)行訓(xùn)練(數(shù)個小時),使用生成模型的損失函數(shù)作為強(qiáng)化學(xué)習(xí)的信號。

在 CIFAR-10 圖像識別任務(wù)上,神經(jīng)架構(gòu)搜索的表現(xiàn)與其他頂級成果的表現(xiàn)對比如上圖所示。

上圖是正常的 LSTM 單元與架構(gòu)搜索所發(fā)現(xiàn)的單元圖。

此外,學(xué)習(xí)優(yōu)化更新規(guī)則也是自動機(jī)器學(xué)習(xí)趨勢中的一個信號。通常我們使用的都是手動設(shè)計的優(yōu)化器,如下圖所示。

而 Google Brain 在 ICML 2017 的論文《Neural Optimizer Search with Reinforcement Learning》中,就講到了一種學(xué)習(xí)優(yōu)化更新規(guī)則的技術(shù)。神經(jīng)優(yōu)化器搜索如下圖所示:

總結(jié)

最后,Jeff Dean 總結(jié)說,未來人工智能的發(fā)展可能需要結(jié)合以上介紹的所有思路:需要大型、但稀疏激活的模型;需要解決多種任務(wù)的單個模型;大型模型的動態(tài)學(xué)習(xí)和成長路徑;面向機(jī)器學(xué)習(xí)超級計算的特定硬件,以及高效匹配這種硬件的機(jī)器學(xué)習(xí)方法。

當(dāng)然,目前在機(jī)器學(xué)習(xí)與系統(tǒng)/計算機(jī)架構(gòu)的交叉領(lǐng)域還存在一些開放問題,例如:

  • 極為不同的數(shù)值是否合理(例如,1-2 位的激勵值/參數(shù))?

  • 我們?nèi)绾胃咝У奶幚矸浅討B(tài)的模型(每個輸入樣本都有不同的圖)?特別是在特大型機(jī)器上。

  • 有沒有方法能夠幫助我們解決當(dāng) batch size 更大時,回報變小的難題?

  • 接下來 3-4 年中,重要的機(jī)器學(xué)習(xí)算法、方法是什么?

如今,神經(jīng)網(wǎng)絡(luò)與其他方法隨數(shù)據(jù)、模型大小變化的準(zhǔn)確率對比圖如下:

未來,可能又是一番境況。

演講PPT地址:http://pan.baidu.com/s/1kVyxeB1

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • FPGA
    +關(guān)注

    關(guān)注

    1645

    文章

    22046

    瀏覽量

    618281
  • 微處理器
    +關(guān)注

    關(guān)注

    11

    文章

    2383

    瀏覽量

    84164
  • AI
    AI
    +關(guān)注

    關(guān)注

    88

    文章

    35109

    瀏覽量

    279591
  • 人工智能
    +關(guān)注

    關(guān)注

    1806

    文章

    49011

    瀏覽量

    249350

原文標(biāo)題:Jeff Dean「Hot Chips 2017」演講:AI對計算機(jī)系統(tǒng)設(shè)計的影響

文章出處:【微信號:almosthuman2014,微信公眾號:機(jī)器之心】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    計算機(jī)網(wǎng)絡(luò)入門指南

    計算機(jī)網(wǎng)絡(luò)是指將地理位置不同且具有獨(dú)立功能的多臺計算機(jī)及其外部設(shè)備,通過通信線路連接起來,在網(wǎng)絡(luò)操作系統(tǒng)、網(wǎng)絡(luò)管理軟件及網(wǎng)絡(luò)通信協(xié)議的管理和協(xié)調(diào)下,實(shí)現(xiàn)資源共享和信息傳遞的
    的頭像 發(fā)表于 04-22 14:29 ?1080次閱讀
    <b class='flag-5'>計算機(jī)</b>網(wǎng)絡(luò)入門指南

    嵌入式和人工智能究竟是什么關(guān)系?

    領(lǐng)域,如工業(yè)控制、智能家居、醫(yī)療設(shè)備等。 人工智能計算機(jī)科學(xué)的一個分支,它研究如何使計算機(jī)具備像人類一樣思考、學(xué)習(xí)、推理和決策的能力。人工智能
    發(fā)表于 11-14 16:39

    risc-v在人工智能圖像處理應(yīng)用前景分析

    RISC-V和Arm內(nèi)核及其定制的機(jī)器學(xué)習(xí)和浮點(diǎn)運(yùn)算單元,用于處理復(fù)雜的人工智能圖像處理任務(wù)。 四、未來發(fā)展趨勢 隨著人工智能技術(shù)的不斷發(fā)展
    發(fā)表于 09-28 11:00

    信號繼電器在計算機(jī)系統(tǒng)中的應(yīng)用

    信號繼電器在計算機(jī)系統(tǒng)中的應(yīng)用是一個重要且復(fù)雜的領(lǐng)域,它作為電氣控制的關(guān)鍵元件,在計算機(jī)系統(tǒng)中發(fā)揮著信號轉(zhuǎn)換、隔離、放大以及控制等多種作用。以下將從信號繼電器的基本概念、工作原理、特性、在計算機(jī)系統(tǒng)中的應(yīng)用場景、優(yōu)勢以及未來
    的頭像 發(fā)表于 09-27 16:29 ?936次閱讀

    計算機(jī)存儲系統(tǒng)的工作原理和功能

    計算機(jī)存儲系統(tǒng)作為計算機(jī)系統(tǒng)中至關(guān)重要的組成部分,其原理和功能對于理解計算機(jī)的運(yùn)行機(jī)制具有關(guān)鍵意義。以下將詳細(xì)闡述計算機(jī)存儲
    的頭像 發(fā)表于 09-26 16:42 ?2942次閱讀

    計算機(jī)系統(tǒng)的硬件組成和主要部件

    計算機(jī)系統(tǒng)的硬件組成是計算機(jī)運(yùn)行的基礎(chǔ),它包含了多個關(guān)鍵部件,這些部件相互協(xié)作,共同實(shí)現(xiàn)計算機(jī)的各種功能。
    的頭像 發(fā)表于 09-10 11:41 ?6858次閱讀

    計算機(jī)存儲器的分類及其區(qū)別

    計算機(jī)存儲器是計算機(jī)系統(tǒng)中不可或缺的重要部分,用于存放程序和數(shù)據(jù)。隨著科技的進(jìn)步,存儲器的種類越來越多,功能和性能也日益豐富。一般來說,計算機(jī)存儲器可以按照不同的分類標(biāo)準(zhǔn)進(jìn)行分類,以下是詳細(xì)的分類
    的頭像 發(fā)表于 09-05 10:40 ?3978次閱讀

    簡述計算機(jī)總線的分類

    計算機(jī)總線作為計算機(jī)系統(tǒng)中連接各個功能部件的公共通信干線,其結(jié)構(gòu)和分類對于理解計算機(jī)硬件系統(tǒng)的工作原理至關(guān)重要。以下是對計算機(jī)總線結(jié)構(gòu)和分類
    的頭像 發(fā)表于 08-26 16:23 ?5169次閱讀

    存儲器在微型計算機(jī)系統(tǒng)中的作用

    存儲器在微型計算機(jī)系統(tǒng)中扮演著至關(guān)重要的角色,它是計算機(jī)存儲和處理數(shù)據(jù)的核心部件。以下將詳細(xì)介紹存儲器在微型計算機(jī)系統(tǒng)中的作用,包括其分類、功能、特性以及與其他系統(tǒng)組件的交互。
    的頭像 發(fā)表于 08-22 14:25 ?4198次閱讀

    微處理器如何控制計算機(jī)系統(tǒng)

    微處理器,作為計算機(jī)系統(tǒng)的核心部件,承擔(dān)著控制整個計算機(jī)系統(tǒng)運(yùn)行的重要任務(wù)。它不僅是計算機(jī)的運(yùn)算中心,還是控制中心,負(fù)責(zé)執(zhí)行程序指令、處理數(shù)據(jù)以及協(xié)調(diào)計算機(jī)各部件之間的工作。以下將詳細(xì)
    的頭像 發(fā)表于 08-22 14:21 ?975次閱讀

    簡述微型計算機(jī)系統(tǒng)的組成

    微型計算機(jī)系統(tǒng),簡稱微機(jī)系統(tǒng),是一個集硬件和軟件于一體的復(fù)雜系統(tǒng),旨在高效處理信息、存儲數(shù)據(jù)和執(zhí)行用戶指令。下面將從硬件和軟件兩大方面對微型計算機(jī)系統(tǒng)的組成進(jìn)行詳細(xì)闡述。
    的頭像 發(fā)表于 08-22 12:37 ?8482次閱讀

    計算機(jī)視覺有哪些優(yōu)缺點(diǎn)

    計算機(jī)視覺作為人工智能領(lǐng)域的一個重要分支,旨在使計算機(jī)能夠像人類一樣理解和解釋圖像和視頻中的信息。這一技術(shù)的發(fā)展不僅推動了多個行業(yè)的變革,也帶來了諸多優(yōu)勢,但同時也伴隨著一些挑戰(zhàn)和局限
    的頭像 發(fā)表于 08-14 09:49 ?2037次閱讀

    FPGA在人工智能中的應(yīng)用有哪些?

    定制化的硬件設(shè)計,提高了硬件的靈活性和適應(yīng)性。 綜上所述,F(xiàn)PGA在人工智能領(lǐng)域的應(yīng)用前景廣闊,不僅可以用于深度學(xué)習(xí)的加速和云計算的加速,還可以針對特定應(yīng)用場景進(jìn)行定制化計算,為人工智能
    發(fā)表于 07-29 17:05

    計算機(jī)系統(tǒng)的組成和功能

    計算機(jī)系統(tǒng)是一個復(fù)雜而龐大的概念,它涵蓋了計算機(jī)硬件、軟件以及它們之間相互作用的所有元素。為了全面而深入地探討計算機(jī)系統(tǒng),本文將從定義、組成、功能、發(fā)展歷程以及未來趨勢等方面進(jìn)行詳細(xì)闡
    的頭像 發(fā)表于 07-24 17:41 ?2391次閱讀

    人工智能計算機(jī)視覺

    人工智能教學(xué)資料
    發(fā)表于 07-18 11:31 ?0次下載