一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

嵌入式神經(jīng)網(wǎng)絡(luò)賦予人工智能視覺、聽覺和分析能力

電子工程師 ? 來源:未知 ? 作者:鄧佳佳 ? 2018-03-28 10:22 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

工智能(AI)潛在的應(yīng)用與日俱增。不同的神經(jīng)網(wǎng)絡(luò)(NN)架構(gòu)能力經(jīng)過測(cè)試、調(diào)整和改進(jìn),解決了不同的問題,也開發(fā)出以AI優(yōu)化數(shù)據(jù)分析的各種方法。當(dāng)今大部份的AI應(yīng)用,例如Google翻譯(Google Translate)和亞馬遜(Amazon) Alexa語音識(shí)別和視覺識(shí)別系統(tǒng),都利用了云端的力量。

藉由依賴常時(shí)連網(wǎng)(always-on)的因特網(wǎng)聯(lián)機(jī)、高帶寬鏈路和網(wǎng)絡(luò)服務(wù),物聯(lián)網(wǎng)(IoT)產(chǎn)品和智能手機(jī)應(yīng)用也可以整合AI功能。到目前為止,大部份的注意力都集中在基于視覺的人工智能上,部份原因在于它易于出現(xiàn)在新聞報(bào)導(dǎo)和視頻中,另外一部份的原因則是它更類似于人類的活動(dòng)。

在影像識(shí)別中,針對(duì)一個(gè)2D影像進(jìn)行分析——每次處理一組像素,透過神經(jīng)網(wǎng)絡(luò)的連續(xù)層識(shí)別更大的特征點(diǎn)。一開始檢測(cè)到的邊緣是具有高對(duì)比度差異的部份。以人臉為例,最早識(shí)別的部位是在眼睛、鼻子和嘴巴等特征外圍。隨著檢測(cè)過程深入神經(jīng)網(wǎng)絡(luò),將會(huì)檢測(cè)到整個(gè)臉部的特征。

而在最后階段,結(jié)合這些特征及其位置信息,就能在可用的數(shù)據(jù)庫中識(shí)別到具有最匹配的一張?zhí)囟ㄈ四槨?/span>

神經(jīng)網(wǎng)絡(luò)的特征提取

為了匹配經(jīng)由相機(jī)拍攝或擷取的物體,希望能透過神經(jīng)網(wǎng)絡(luò)在其數(shù)據(jù)庫中找到匹配機(jī)率最高的人臉。其巧妙之處在于擷取物體時(shí)并不需要與數(shù)據(jù)庫中的照片拍攝角度或場(chǎng)景完全相同,也不必處于相同的光線條件下。

AI這么快就流行起來,在很大程度上是因?yàn)殚_放的軟件工具(也稱為架構(gòu)),使得建構(gòu)和訓(xùn)練神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)目標(biāo)應(yīng)用變得容易起來,即使是使用各種不同的編程語言。兩個(gè)常見的通用架構(gòu)是TensorFlow和Caffe。對(duì)于已知的識(shí)別目標(biāo),可以脫機(jī)定義和訓(xùn)練神經(jīng)網(wǎng)絡(luò)。一旦訓(xùn)練完成,神經(jīng)網(wǎng)絡(luò)就可以很容易地部署到嵌入式平臺(tái)上。這是一種很聰明的劃分方式,能夠藉由開發(fā)PC或云端的力量來訓(xùn)練神經(jīng)網(wǎng)絡(luò),而功耗敏感的嵌入式處理器只需為了識(shí)別目的而使用訓(xùn)練數(shù)據(jù)。

這種類似人類的人/物識(shí)別能力與流行的應(yīng)用密切相關(guān),例如工業(yè)機(jī)器人自動(dòng)駕駛車。然而,人工智能在音頻領(lǐng)域同樣具有吸引力和強(qiáng)大的能力。它采用和影像特征分析同樣的方式,可以將音頻分解成特征點(diǎn)而饋入神經(jīng)網(wǎng)絡(luò)。其中一種方法是使用梅爾頻率倒譜系數(shù)(MFCC)將音頻分解成有用的特性。一開始,音頻樣本被分解成短時(shí)間的訊框,例如20ms,然后再對(duì)信號(hào)進(jìn)行傅利葉轉(zhuǎn)換(Fourier transforms),使用重迭三角窗將音頻頻譜的功率映像到非線性尺度上。

聲音神經(jīng)網(wǎng)絡(luò)分解圖

透過這些提取的特征,神經(jīng)網(wǎng)絡(luò)可以用來確定音頻樣本和音頻樣本數(shù)據(jù)庫中詞匯或者語音的相似度。就像影像識(shí)別一樣,神經(jīng)網(wǎng)絡(luò)為特定詞匯在數(shù)據(jù)庫中提取了可能的匹配。對(duì)于那些想要復(fù)制Google和亞馬遜的‘OK Google’或‘Alexa’語音觸發(fā)(VT)功能的業(yè)者來說,KITT.AI透過Snowboy提供了一個(gè)解決方案。觸發(fā)關(guān)鍵詞可以上傳到他們的平臺(tái)進(jìn)行分析,導(dǎo)出一個(gè)檔案后再整合進(jìn)嵌入式平臺(tái)上的Snowboy應(yīng)用程序,這樣語音觸發(fā)(VT)的關(guān)鍵詞在脫機(jī)情況下也可以被檢測(cè)到。音頻識(shí)別并不局限于語言識(shí)別。TensorFlow提供了一個(gè)iOS上的示例,可以區(qū)分男性和女性的聲音。

另一個(gè)替代應(yīng)用是檢測(cè)我們居住的城市和住宅周圍動(dòng)物和其他聲音。這已經(jīng)由安裝在英國(guó)倫敦伊麗莎白女王奧林匹克公園(Queen Elizabeth Olympic Park)的深度學(xué)習(xí)蝙蝠監(jiān)控系統(tǒng)驗(yàn)證過了。它提供了將視覺和聽覺識(shí)別神經(jīng)網(wǎng)絡(luò)整合于一個(gè)平臺(tái)的可能性。例如透過音頻識(shí)別別特定的聲音,可以用來觸發(fā)安全系統(tǒng)進(jìn)行錄像。

有很多基于云端的AI應(yīng)用是不實(shí)際的,一方面存在數(shù)據(jù)隱私的問題,另一方面由于數(shù)據(jù)連接性差或帶寬不夠造成服務(wù)不能持續(xù)。另外,實(shí)時(shí)性能也是一個(gè)值得關(guān)注的問題。例如工業(yè)制造系統(tǒng)需要實(shí)時(shí)響應(yīng),以便實(shí)時(shí)操作生產(chǎn)線,如果連接云端服務(wù)的延遲就太長(zhǎng)了。

因此,將AI功能移動(dòng)到“邊緣”(edge)越來越受到關(guān)注。也就是說,在使用中的裝置上發(fā)揮人工智能的力量。很多IP供貨商都提供了解決方案,如CEVA的CEVA-X2和NeuPro IP核心和配套軟件,都很容易和現(xiàn)有的神經(jīng)網(wǎng)絡(luò)架構(gòu)進(jìn)行整合。這為開發(fā)具備人工智能的嵌入式系統(tǒng)提供了可能性,同時(shí)提供了低功耗處理器的靈活性。以一個(gè)語音識(shí)別系統(tǒng)為例,可以利用整合在芯片上的功耗優(yōu)化人工智能,以識(shí)別一個(gè)語音觸發(fā)關(guān)鍵詞和語音命令(VC)的最小化組合。更復(fù)雜的語音命令和功能,可以在應(yīng)用從低功耗的語音觸發(fā)狀態(tài)下喚醒之后,由基于云端的AI完成。

最后,卷積神經(jīng)網(wǎng)絡(luò)(CNN)也可以用來提高文本到語音(TTS)系統(tǒng)的質(zhì)量。一直以來,TTS用于將同一個(gè)配音員的許多高質(zhì)量錄音片段,整合成連續(xù)的聲音。雖然所輸出的結(jié)果是人類可以理解的,但由于輸出結(jié)果存在奇怪的語調(diào)和音調(diào),仍然感覺像是機(jī)器人的聲音。如果試圖表現(xiàn)出不同的情緒則需要一組全新的錄音。Google的WaveNet改善了當(dāng)前的情況,透過CNN以每秒16,000個(gè)樣本產(chǎn)生TTS波形。與之前的聲音樣本相比,其輸出結(jié)果是無縫連接的,明顯表現(xiàn)出更自然、更高質(zhì)量的聲音。


聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 嵌入式
    +關(guān)注

    關(guān)注

    5149

    文章

    19659

    瀏覽量

    317352
  • 神經(jīng)網(wǎng)絡(luò)

    關(guān)注

    42

    文章

    4814

    瀏覽量

    103550
  • 人工智能
    +關(guān)注

    關(guān)注

    1806

    文章

    49007

    瀏覽量

    249274

原文標(biāo)題:嵌入式神經(jīng)網(wǎng)絡(luò)賦予機(jī)器視覺、聽覺和分析能力

文章出處:【微信號(hào):robot-1hjqr,微信公眾號(hào):1號(hào)機(jī)器人網(wǎng)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    開售RK3576 高性能人工智能主板

    ZYSJ-2476B 高性能智能主板,采用瑞芯微 RK3576 高性能 AI 處理器、神經(jīng)網(wǎng)絡(luò)處理器 NPU, Android 14.0/debian11/ubuntu20.04 操作系統(tǒng)
    發(fā)表于 04-23 10:55

    【「芯片通識(shí)課:一本書讀懂芯片技術(shù)」閱讀體驗(yàn)】從deepseek看今天芯片發(fā)展

    近日有幸得到一本關(guān)于芯片制造的書籍,剛打開便被npu章節(jié)吸引,不禁感嘆芯片發(fā)展速度之快令人咂舌:如deepseek搬強(qiáng)大的人工智能,也能運(yùn)行在嵌入式soc板卡了! 這里先看書里是怎么介紹npu
    發(fā)表于 04-02 17:25

    BP神經(jīng)網(wǎng)絡(luò)的優(yōu)缺點(diǎn)分析

    自學(xué)習(xí)能力 : BP神經(jīng)網(wǎng)絡(luò)能夠通過訓(xùn)練數(shù)據(jù)自動(dòng)調(diào)整網(wǎng)絡(luò)參數(shù),實(shí)現(xiàn)對(duì)輸入數(shù)據(jù)的分類、回歸等任務(wù),無需人工進(jìn)行復(fù)雜的特征工程。 泛化能力強(qiáng)
    的頭像 發(fā)表于 02-12 15:36 ?908次閱讀

    人工神經(jīng)網(wǎng)絡(luò)的原理和多種神經(jīng)網(wǎng)絡(luò)架構(gòu)方法

    在上一篇文章中,我們介紹了傳統(tǒng)機(jī)器學(xué)習(xí)的基礎(chǔ)知識(shí)和多種算法。在本文中,我們會(huì)介紹人工神經(jīng)網(wǎng)絡(luò)的原理和多種神經(jīng)網(wǎng)絡(luò)架構(gòu)方法,供各位老師選擇。 01 人工
    的頭像 發(fā)表于 01-09 10:24 ?1178次閱讀
    <b class='flag-5'>人工</b><b class='flag-5'>神經(jīng)網(wǎng)絡(luò)</b>的原理和多種<b class='flag-5'>神經(jīng)網(wǎng)絡(luò)</b>架構(gòu)方法

    開源項(xiàng)目 ! 利用邊緣計(jì)算打造便攜視覺識(shí)別系統(tǒng)

    的物品 硬件 Khadas VIM4 單板計(jì)算機(jī) :配備具備 3.2 萬億次每秒(TOPS)算力的神經(jīng)網(wǎng)絡(luò)處理器(NPU),為人工智能運(yùn)算提供強(qiáng)大動(dòng)力。 Khadas IMX415 攝像頭 :像素為
    發(fā)表于 12-16 16:31

    RT-Thread Smart 嵌入式人工智能師資培訓(xùn)通知

    隨著AI技術(shù)的不斷成熟和發(fā)展,人工智能正成為推動(dòng)經(jīng)濟(jì)社會(huì)發(fā)展的新引擎,被廣泛應(yīng)用于各行業(yè)。嵌入式人工智能人工智能落地的重要形式,人工智能
    的頭像 發(fā)表于 12-12 18:45 ?970次閱讀
    RT-Thread Smart <b class='flag-5'>嵌入式</b><b class='flag-5'>人工智能</b>師資培訓(xùn)通知

    什么是嵌入式人工智能

    。嵌入式人工智能的目標(biāo)是使嵌入式系統(tǒng)具備智能化的感知、分析和響應(yīng)能力,從而實(shí)現(xiàn)自主決策、自適應(yīng)學(xué)
    的頭像 發(fā)表于 12-11 09:23 ?993次閱讀
    什么是<b class='flag-5'>嵌入式</b><b class='flag-5'>人工智能</b>

    嵌入式人工智能究竟是什么關(guān)系?

    人工智能的結(jié)合,無疑是科技發(fā)展中的一場(chǎng)革命。在人工智能硬件加速中,嵌入式系統(tǒng)以其獨(dú)特的優(yōu)勢(shì)和重要性,發(fā)揮著不可或缺的作用。通過深度學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)等算法,
    發(fā)表于 11-14 16:39

    Moku人工神經(jīng)網(wǎng)絡(luò)101

    不熟悉神經(jīng)網(wǎng)絡(luò)的基礎(chǔ)知識(shí),或者想了解神經(jīng)網(wǎng)絡(luò)如何優(yōu)化加速實(shí)驗(yàn)研究,請(qǐng)繼續(xù)閱讀,探索基于深度學(xué)習(xí)的現(xiàn)代智能化實(shí)驗(yàn)的廣闊應(yīng)用前景。什么是神經(jīng)網(wǎng)絡(luò)?“人工
    的頭像 發(fā)表于 11-01 08:06 ?661次閱讀
    Moku<b class='flag-5'>人工</b><b class='flag-5'>神經(jīng)網(wǎng)絡(luò)</b>101

    如何利用FPGA技術(shù)革新視覺人工智能應(yīng)用?

    嵌入式視覺人工智能應(yīng)用通過在邊緣實(shí)現(xiàn)高度復(fù)雜的實(shí)時(shí)視頻流處理和決策,正在為各行各業(yè)帶來變革。這些應(yīng)用范圍從自動(dòng)駕駛到智能制造,其中快速分析
    的頭像 發(fā)表于 10-16 08:03 ?859次閱讀
    如何利用FPGA技術(shù)革新<b class='flag-5'>視覺</b><b class='flag-5'>人工智能</b>應(yīng)用?

    【飛凌嵌入式OK3576-C開發(fā)板體驗(yàn)】RKNN神經(jīng)網(wǎng)絡(luò)-車牌識(shí)別

    LPRNet基于深層神經(jīng)網(wǎng)絡(luò)設(shè)計(jì),通過輕量級(jí)的卷積神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)車牌識(shí)別。它采用端到端的訓(xùn)練方式,不依賴字符分割,能夠直接處理整張車牌圖像,并輸出最終的字符序列。這種設(shè)計(jì)提高了識(shí)別的實(shí)時(shí)性和準(zhǔn)確性
    發(fā)表于 10-10 16:40

    【飛凌嵌入式OK3576-C開發(fā)板體驗(yàn)】RKNPU圖像識(shí)別測(cè)試

    RKNPU在深度學(xué)習(xí)運(yùn)算能力上有了顯著的提升。 2.3、技術(shù)特點(diǎn) 高性能 :RKNPU采用專門的硬件架構(gòu)和優(yōu)化算法,能夠?qū)崿F(xiàn)高效的神經(jīng)網(wǎng)絡(luò)計(jì)算,滿足復(fù)雜場(chǎng)景下的實(shí)時(shí)處理需求。 低功耗 :RKNPU在提供
    發(fā)表于 10-10 09:27

    matlab 神經(jīng)網(wǎng)絡(luò) 數(shù)學(xué)建模數(shù)值分析

    matlab神經(jīng)網(wǎng)絡(luò) 數(shù)學(xué)建模數(shù)值分析 精通的可以討論下
    發(fā)表于 09-18 15:14

    嵌入式系統(tǒng)的未來趨勢(shì)有哪些?

    嵌入式系統(tǒng)是指將我們的操作系統(tǒng)和功能軟件集成于計(jì)算機(jī)硬件系統(tǒng)之中,形成一個(gè)專用的計(jì)算機(jī)系統(tǒng)。那么嵌入式系統(tǒng)的未來趨勢(shì)有哪些呢? 1. 人工智能與機(jī)器學(xué)習(xí)的整合 隨著現(xiàn)代人工智能(AI)
    發(fā)表于 09-12 15:42

    機(jī)器視覺嵌入式中的應(yīng)用

    對(duì)物體或場(chǎng)景的識(shí)別、測(cè)量和分析的技術(shù)。隨著計(jì)算機(jī)技術(shù)、圖像處理技術(shù)和人工智能技術(shù)的快速發(fā)展,機(jī)器視覺技術(shù)在各個(gè)領(lǐng)域得到了廣泛應(yīng)用,特別是在嵌入式系統(tǒng)中,其應(yīng)用前景非常廣闊。
    的頭像 發(fā)表于 07-16 10:30 ?967次閱讀