一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

用于智能邊緣計算的嵌入式深度學習推理解決方案

我快閉嘴 ? 來源:千家網(wǎng) ? 作者:蒙光偉 ? 2020-09-04 12:21 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

在過去的幾年中,人工智能領域已進入高速增長階段,這在很大程度上受諸如深度學習(DL)和強化學習(RL)之類的機器學習方法的推動。這些技術的組合展示了在解決各種問題方面的空前性能,這些問題從以超人的角度玩Go到像專家一樣診斷癌癥。

在我們以前的博客中,智能物聯(lián)網(wǎng)和霧計算趨勢以及物聯(lián)網(wǎng)中無處不在的計算機視覺的興起,我們談到了物聯(lián)網(wǎng)中DL的一些有趣用例。應用將是廣泛而深入的。它們將在未來幾十年內刺激對新型處理器的需求。

深度學習工作流程概述

DL / RL創(chuàng)新正以驚人的速度發(fā)生(每年在眾多與AI相關的會議上發(fā)表數(shù)千篇有關新算法的論文)。盡管預測最終的解決方案為時尚早,但硬件公司正在爭相構建處理器、工具和框架。他們試圖利用多年研究人員的經(jīng)驗來確定DL工作流程中的痛點和瓶頸。

訓練DL模型的平臺

讓我們從培訓平臺開始?;趫D形處理單元(GPU)的系統(tǒng)通常是訓練高級DL模型的選擇。Nvidia早已意識到將GPU用于通用高性能計算的優(yōu)勢。

GPU有數(shù)百個計算核心,它們支持大量的硬件線程和高吞吐量的浮點計算。 Nvidia開發(fā)了Compute Unified Device Architecture(CUDA)編程框架,使GPU友好地供科學家和機器學習專家使用。

CUDA工具鏈改善了耗時問題,為研究人員提供了一種靈活而友好的方式來實現(xiàn)高度復雜的算法。幾年前,Nvidia恰當?shù)匕l(fā)現(xiàn)了DL的機會,并為大多數(shù)DL運營不斷開發(fā)CUDA支持。 Caffe、Torch和Tensorflow等標準框架均支持CUDA。

在AWS之類的云服務中,開發(fā)人員可以選擇使用CPU還是GPU(更具體地說是Nvidia GPU)。平臺的選擇取決于神經(jīng)網(wǎng)絡的復雜性、預算和時間?;贕PU的系統(tǒng)通??梢员菴PU減少訓練時間幾倍,但價格更高。

GPU / CPU的替代品

替代品來了。 Khronos在2009年提出了OpenCL,這是一種用于在各種硬件(例如CPU、GPU、DSPFPGA)上進行并行計算的開放標準。它將使其他處理器(如AMD GPU)進入DL培訓市場,為開發(fā)人員提供更多選擇。

但是,它在DL庫支持方面仍落后于CUDA。希望這種情況在未來幾年內會有所改善。英特爾還通過收購Nervana開發(fā)了針對DL培訓定制的處理器。

DL推理的競爭格局

DL推理是一個競爭激烈的市場。通??梢愿鶕?jù)用例的要求在多個級別上部署應用:

云/企業(yè):圖像分類、網(wǎng)絡安全、文本分析、NLP等。

智能網(wǎng)關:生物識別、語音識別、智能代理等。

邊緣端點:移動設備、智能相機等。

云推理

在Google、Facebook、百度或阿里巴巴等互聯(lián)網(wǎng)巨頭的大力推動下,云推理市場將實現(xiàn)巨大的增長。例如,Google Cloud和Microsoft Azure提供了非常強大的圖像分類、自然語言處理和面部識別API,開發(fā)人員可以輕松地將其集成到他們的云應用中。

云推理平臺將需要可靠地支持數(shù)百萬并發(fā)用戶。擴展吞吐量的能力至關重要。此外,降低能耗是控制服務運營成本的另一個重中之重。

在云推理空間上,除GPU外,數(shù)據(jù)中心還使用FPGA或定制處理器來使云推理應用更具成本效益和功效。例如,Microsoft Project Brainwave使用英特爾FPGA來證明在運行諸如CNN、LSTM等的DL算法時的強大性能和靈活性。

FPGA具有優(yōu)勢。硬件邏輯、計算內核和內存配置可針對特定類型的神經(jīng)網(wǎng)絡進行定制,從而使其更有效地處理預訓練模型。但是,一個缺點是與CPU或CUDA相比編程困難。如上一節(jié)所述,OpenCL將有助于使FPGA對軟件開發(fā)人員更加友好。

除了FPGA之外,Google還制造了定制的處理器,稱為TPU。它是一種專注于高效矩陣計算的ASIC。但是,僅Google自己的服務支持該功能。

用于智能邊緣計算的嵌入式DL推理

在邊緣,DL推理解決方案需要解決針對不同用例和市場的多種需求。

自動駕駛平臺

自動駕駛平臺目前是最熱門的市場,最新的DL和RL方法正在應用中,以實現(xiàn)最高水平的自動駕駛。 Nvidia一直領導著從Tegra到Xavier的幾類DL SoC市場。 例如,Xavier SoC內置于Nvidia的Drive PX平臺中,該平臺可實現(xiàn)多達320個TFLOP。 它的目標是5級自動駕駛。

移動處理器

另一個快速增長的領域是移動應用處理器。 DL啟用了智能手機上以前無法實現(xiàn)的新功能。 一個例子是蘋果將神經(jīng)引擎集成到A11 Bionic芯片中,從而使其能夠在iPhone X上添加高精度面部鎖定。

中國芯片制造海思半導體還發(fā)布了麒麟970處理器,該處理器具有神經(jīng)處理單元(NPU)。 華為的一些最新智能手機(圖4)已經(jīng)使用新的DL處理器進行了設計。 例如,使用NPU,智能手機相機會“知道”正在查看的內容,并會根據(jù)場景的主體(例如人、植物、風景等)自動調整相機設置。

新架構

值得一提的是,有一類新的處理器,稱為神經(jīng)形態(tài)處理器,它緊密模仿人類大腦神經(jīng)元和突觸的機制。他們可以實現(xiàn)一種稱為“脈沖神經(jīng)網(wǎng)絡(SNN)”的神經(jīng)網(wǎng)絡,它可以在空間和時間域中學習。

原則上,與現(xiàn)有的DL架構相比,它們具有更高的能源效率,并且在解決在線機器學習問題方面具有優(yōu)勢。

IBM的TrueNorth和英特爾的Loihi基于神經(jīng)形態(tài)架構。研究人員正在探索這些芯片的功能,顯示出一些潛力。目前尚不清楚何時將新型處理器準備用于廣泛的商業(yè)用途。諸如Applied Brain Research和Brainchip之類的許多初創(chuàng)公司也專注于這一領域,開發(fā)工具和IP。

這是一個有趣的時代

在短短的幾年內,AI / DL / RL / ML已成為許多行業(yè)的重要工具。從IP、處理器、系統(tǒng)設計到工具鏈和軟件方法論的底層生態(tài)系統(tǒng)已經(jīng)進入了快速的創(chuàng)新周期。新的處理器將支持許多以前無法實現(xiàn)的新物聯(lián)網(wǎng)應用。

但是,物聯(lián)網(wǎng)和機器學習應用仍在不斷發(fā)展。芯片設計人員和開發(fā)人員將需要幾代處理器才能提出正確的架構組合,從而滿足各種市場的需求。在以后的文章中,我們將更深入地研究各種垂直領域的計算平臺。
責任編輯:tzh

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 處理器
    +關注

    關注

    68

    文章

    19893

    瀏覽量

    235177
  • 物聯(lián)網(wǎng)

    關注

    2931

    文章

    46243

    瀏覽量

    392453
  • 機器學習
    +關注

    關注

    66

    文章

    8503

    瀏覽量

    134603
  • 深度學習
    +關注

    關注

    73

    文章

    5561

    瀏覽量

    122794
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    聚徽智控——從嵌入式邊緣計算:平板工控電腦的技術進化論

    在工業(yè)數(shù)字化轉型的浪潮中,平板工控電腦作為核心終端設備,正經(jīng)歷從嵌入式系統(tǒng)到邊緣計算架構的范式革命。這一進化不僅重塑了設備的技術形態(tài),更推動了工業(yè)互聯(lián)從“數(shù)據(jù)采集”向“智能決策”的跨越
    的頭像 發(fā)表于 06-13 13:48 ?243次閱讀

    嵌入式開發(fā)入門指南:從零開始學習嵌入式

    特定功能的計算機系統(tǒng),廣泛應用于智能家居、工業(yè)控制、醫(yī)療設備、車載系統(tǒng)等領域。 2. 學習嵌入式開發(fā)的前置知識熟悉C語言編程掌握基本的數(shù)據(jù)結
    發(fā)表于 05-15 09:29

    飛凌嵌入式「2025嵌入式邊緣AI技術論壇」議程公布

    4月22日,飛凌嵌入式“2025嵌入式邊緣AI技術論壇”將在深圳舉行,論壇以“新生態(tài),智未來”為主題,旨在匯聚行業(yè)智慧,探討嵌入式技術與邊緣
    的頭像 發(fā)表于 04-02 15:12 ?636次閱讀
    飛凌<b class='flag-5'>嵌入式</b>「2025<b class='flag-5'>嵌入式</b>及<b class='flag-5'>邊緣</b>AI技術論壇」議程公布

    瑞芯微嵌入式方案概述

    瑞芯微(Rockchip)是一家專注于高性能、低功耗芯片設計的中國半導體公司,其嵌入式解決方案廣泛應用于智能終端、物聯(lián)網(wǎng)、工業(yè)控制、多媒體處理等領域。以下是瑞芯微
    的頭像 發(fā)表于 03-28 12:11 ?498次閱讀
    瑞芯微<b class='flag-5'>嵌入式</b><b class='flag-5'>方案</b>概述

    新生態(tài) 智未來「飛凌嵌入式2025嵌入式邊緣AI技術論壇」開啟報名!

    在這個技術日新月異的時代,每一場思想的碰撞都可能成為推動行業(yè)前行的力量,每一次深度對話都可能迸發(fā)出改變時代的強光——2025年4月22日,飛凌嵌入式將在深圳舉辦“2025嵌入式邊緣A
    的頭像 發(fā)表于 03-28 08:05 ?614次閱讀
    新生態(tài) 智未來「飛凌<b class='flag-5'>嵌入式</b>2025<b class='flag-5'>嵌入式</b>及<b class='flag-5'>邊緣</b>AI技術論壇」開啟報名!

    Banana Pi 發(fā)布 BPI-AI2N &amp; BPI-AI2N Carrier,助力 AI 計算嵌入式開發(fā)

    助力 AI、智能制造和物聯(lián)網(wǎng)行業(yè)的發(fā)展。未來,Banana Pi 將繼續(xù)深化與Renesas的技術合作,推動更多高性能嵌入式解決方案的落地。 ” BPI-AI2N開發(fā)板賦能多場景應用,結合豐富接口與高效
    發(fā)表于 03-19 17:54

    電子發(fā)燒友榮獲飛凌嵌入式“2024年度最具價值媒體”獎

    ://www.www27dydycom.cn/d/c2448642 作為國內領先的嵌入式解決方案提供商,飛凌嵌入式始終以“技術開放、生態(tài)共贏”為理念,通過電子發(fā)燒友社區(qū)小組深度連接開發(fā)者社
    發(fā)表于 02-28 15:20

    嵌入式機器學習的應用特性與軟件開發(fā)環(huán)境

    設備和智能傳感器)上,這些設備通常具有有限的計算能力、存儲空間和功耗。本文將您介紹嵌入式機器學習的應用特性,以及常見的機器學習開發(fā)軟件與開發(fā)
    的頭像 發(fā)表于 01-25 17:05 ?660次閱讀
    <b class='flag-5'>嵌入式</b>機器<b class='flag-5'>學習</b>的應用特性與軟件開發(fā)環(huán)境

    新手怎么學嵌入式?

    基本的概念。嵌入式系統(tǒng)是一種將計算機技術嵌入到特定設備中的系統(tǒng),它通常具有特定的功能和有限的資源。你需要學習一些計算機基礎知識,如數(shù)據(jù)結構、
    發(fā)表于 12-12 10:51

    什么是嵌入式人工智能

    嵌入式人工智能是指將人工智能技術應用于嵌入式系統(tǒng)中的一種技術。嵌入式系統(tǒng)是
    的頭像 發(fā)表于 12-11 09:23 ?996次閱讀
    什么是<b class='flag-5'>嵌入式</b>人工<b class='flag-5'>智能</b>

    嵌入式和人工智能究竟是什么關系?

    、連接主義和深度學習等不同的階段。目前,人工智能已經(jīng)廣泛應用于各種領域,如自然語言處理、計算機視覺、智能
    發(fā)表于 11-14 16:39

    嵌入式學習建議

    很多彎路,也會使你對嵌入式系統(tǒng)感到畏懼。等你軟件硬件基礎打好了,再學習就感到容易理解。實際上,許多嵌入式應用并不需要操作系統(tǒng)。也可以根據(jù)實際項目需要,再
    發(fā)表于 10-22 11:41

    為何嵌入式控制器首選ARMxy?深度解析

    嵌入式ARM控制器是一種基于ARM架構的嵌入式系統(tǒng)控制器,廣泛應用于各種嵌入式系統(tǒng)中,包括工業(yè)物聯(lián)網(wǎng)關、邊緣
    的頭像 發(fā)表于 09-21 10:09 ?698次閱讀
    為何<b class='flag-5'>嵌入式</b>控制器首選ARMxy?<b class='flag-5'>深度</b>解析

    AMD分析嵌入式邊緣AI的發(fā)展

    隨著人工智能( AI )技術廣泛應用于各行各業(yè),從云到邊緣解決方案逐漸成為信息技術領域新的熱點。嵌入式
    的頭像 發(fā)表于 09-18 09:30 ?615次閱讀
    AMD分析<b class='flag-5'>嵌入式</b><b class='flag-5'>邊緣</b>AI的發(fā)展

    ARMxy ARM嵌入式計算機搭載 1 TOPS NPU支持深度學習

    ARMxy ARM嵌入式計算機BL410系列內置了1TOPS算力 NPU,它每秒可以執(zhí)行高達一萬億次的浮點運算,這為復雜的圖像處理和深度學習任務提供了充足的計算資源。在產(chǎn)品缺陷檢測領域
    的頭像 發(fā)表于 08-20 11:53 ?849次閱讀
    ARMxy ARM<b class='flag-5'>嵌入式計算</b>機搭載 1 TOPS NPU支持<b class='flag-5'>深度</b><b class='flag-5'>學習</b>