一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

關(guān)于語音識別在人工智能時代作用和分析介紹

英特爾物聯(lián)網(wǎng) ? 來源:djl ? 2019-09-11 10:39 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

智能時代,語音識別

神經(jīng)網(wǎng)絡(luò),深度學(xué)習(xí)

語音識別技術(shù)方便于長輩們?nèi)谌牒A繑?shù)據(jù)的互聯(lián)網(wǎng)時代,成為長輩們與外界交流的一大利器。不過,千萬不要認為在未來人工智能時代中的語音識別僅僅是單純運用到手機聊天中的識別錄入文字。語音識別技術(shù)隨著深度學(xué)習(xí)及高性能計算的不斷發(fā)展,正逐漸從實驗室邁向工業(yè)領(lǐng)域。

語音識別簡史

1952年,美國AT&T貝爾實驗室開發(fā)出了第一個基于電子計算機的語音識別系統(tǒng)Audrey,其可以識別10個英文數(shù)字,準確率為98%;進入60年代,語音識別領(lǐng)域的兩大突破是線性預(yù)測編碼,以及動態(tài)時間規(guī)整技術(shù);

在60年代后期,隱馬爾可夫模型被Leonard E. Baum等人提出,HMM的提出是語音識別歷史上的一個重大突破,使當(dāng)時語音識別的錯誤率大大降低;李開復(fù)等人則在1988年第一次實現(xiàn)了基于HMM的大詞匯量語音識別系統(tǒng)Sphinx。

另一方面,早在上世紀80年代,人工神經(jīng)網(wǎng)絡(luò)已經(jīng)被引入語音識別。起初人工神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)多為簡單的多層感知機,但受限于當(dāng)時的計算能力以及語音數(shù)據(jù)的稀少,人工神經(jīng)網(wǎng)絡(luò)并沒有在識別率上帶來很大的提升。

近年來,隨著計算能力的提升和語音數(shù)據(jù)的增加,神經(jīng)網(wǎng)絡(luò)被廣泛應(yīng)用于語音識別任務(wù)中。深度神經(jīng)網(wǎng)絡(luò)技術(shù)的出現(xiàn),也進一步提高了大規(guī)模連續(xù)語音識別的性能,目前已經(jīng)成為學(xué)術(shù)界和工業(yè)界研究的熱點內(nèi)容之一。

語音識別的技術(shù)支持

目前,在語音識別領(lǐng)域廣泛采用的神經(jīng)網(wǎng)絡(luò)有時延神經(jīng)網(wǎng)絡(luò)、深度神經(jīng)網(wǎng)絡(luò)、卷積神經(jīng)網(wǎng)絡(luò)、遞歸神經(jīng)網(wǎng)絡(luò)以及基于長短期記憶的RNN等。

通常將這些深度神經(jīng)網(wǎng)絡(luò)模型與HMM模型結(jié)合構(gòu)建完整的聲學(xué)模型,并結(jié)合語言模型等提升語音識別性能。

在語言模型方面,雖然傳統(tǒng)的N元模型一直是主流技術(shù),但基于神經(jīng)網(wǎng)絡(luò)的語言模型從2012年開始被較為廣泛的研究,如RNN-LM、LSTM-LM等。

鑒于基于神經(jīng)網(wǎng)絡(luò)的語言模型的計算量較大,一般先利用N元模型初始化,然后再用基于神經(jīng)網(wǎng)絡(luò)的語言模型重打分,即神經(jīng)網(wǎng)絡(luò)語言模型并不直接用于解碼,而是在基線系統(tǒng)解碼結(jié)果的基礎(chǔ)上進行得分重估。

同時,RNN-CTC的出現(xiàn)使得語音識別擺脫了傳統(tǒng)方法中聲學(xué)模型、語言模型、解碼器等模塊化的束縛,通過采用對輸入輸出序列直接建模的方法,只需訓(xùn)練一個神經(jīng)網(wǎng)絡(luò)模型即可進行識別,因此被稱為端到端語音識別。

端到端的模型可以解決傳統(tǒng)方法中各個模型訓(xùn)練目標不一致的問題。另外,由于實際中可獲取的文本數(shù)據(jù)比語音數(shù)據(jù)多得多,所以往往還會用文本數(shù)據(jù)訓(xùn)練一個更好的語言模型,與CTC神經(jīng)網(wǎng)絡(luò)結(jié)合使用。

深度神經(jīng)網(wǎng)絡(luò)用于人工智能應(yīng)用的問題在于其實時率等性能指標還需有待提高,但是端到端語音識別開辟了人工智能的一個新方向,而且訓(xùn)練的過程相對簡單,因此人工智能方向上的端到端識別將會是未來的技術(shù)趨勢之一。此外人工智能再進一步改進網(wǎng)絡(luò)結(jié)構(gòu)、改進訓(xùn)練方法,逐步使人工智能性能達到工業(yè)水平和要求,進入商用階段指日可待。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 神經(jīng)網(wǎng)絡(luò)

    關(guān)注

    42

    文章

    4814

    瀏覽量

    103601
  • 語音識別
    +關(guān)注

    關(guān)注

    39

    文章

    1781

    瀏覽量

    114226
  • 人工智能
    +關(guān)注

    關(guān)注

    1806

    文章

    49014

    瀏覽量

    249433
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    最新人工智能硬件培訓(xùn)AI 基礎(chǔ)入門學(xué)習(xí)課程參考2025版(大模型篇)

    人工智能大模型重塑教育與社會發(fā)展的當(dāng)下,無論是探索未來職業(yè)方向,還是更新技術(shù)儲備,掌握大模型知識都已成為新時代的必修課。從職場上輔助工作的智能助手,到課堂用于學(xué)術(shù)研究的智能工具,大模
    發(fā)表于 07-04 11:10

    【「嵌入式系統(tǒng)設(shè)計與實現(xiàn)」閱讀體驗】+ 基于語音識別智能杯墊

    項目二維碼下圖 該作品通過采集飲水?dāng)?shù)據(jù),多種交互方式,數(shù)據(jù)分析處理,提醒用戶定期飲水,達到保持健康的作用。 主要功能是語音識別。 ASR-PRO語音
    發(fā)表于 01-02 18:15

    基于語音識別智能會議系統(tǒng)具備哪些交互功能

    標貝科技專注智能語音交互領(lǐng)域多年,在語音識別語音合成領(lǐng)域有著多項大型企業(yè)合作案例,標貝與多個智能
    的頭像 發(fā)表于 12-20 10:35 ?586次閱讀

    標貝智能語音識別在智能會議場景中的落地案例

    標貝科技專注智能語音交互領(lǐng)域多年,在語音識別語音合成領(lǐng)域有著多項大型企業(yè)合作案例,標貝與多個智能
    的頭像 發(fā)表于 12-20 10:31 ?750次閱讀
    標貝<b class='flag-5'>智能</b><b class='flag-5'>語音</b><b class='flag-5'>識別在</b><b class='flag-5'>智能</b>會議場景中的落地案例

    語音識別在智能家居中的應(yīng)用

    隨著科技的飛速發(fā)展,智能家居逐漸成為人們生活中不可或缺的一部分。智能家居系統(tǒng)通過物聯(lián)網(wǎng)技術(shù)將家中的各種設(shè)備連接起來,實現(xiàn)遠程控制和自動化管理。在眾多的控制方式中,語音識別技術(shù)因其便捷性
    的頭像 發(fā)表于 11-26 09:31 ?1379次閱讀

    ASR語音識別技術(shù)應(yīng)用

    ASR(Automatic Speech Recognition)語音識別技術(shù),是計算機科學(xué)與人工智能領(lǐng)域的重要突破,能將人類語音轉(zhuǎn)換為文本,廣泛應(yīng)用于
    的頭像 發(fā)表于 11-18 15:12 ?2068次閱讀

    嵌入式和人工智能究竟是什么關(guān)系?

    人工智能的結(jié)合,無疑是科技發(fā)展中的一場革命。在人工智能硬件加速中,嵌入式系統(tǒng)以其獨特的優(yōu)勢和重要性,發(fā)揮著不可或缺的作用。通過深度學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)等算法,嵌入式系統(tǒng)能夠高效地處理大量數(shù)據(jù),從而實現(xiàn)
    發(fā)表于 11-14 16:39

    《AI for Science:人工智能驅(qū)動科學(xué)創(chuàng)新》第6章人AI與能源科學(xué)讀后感

    探討了人工智能如何通過技術(shù)創(chuàng)新推動能源科學(xué)的進步,為未來的可持續(xù)發(fā)展提供了強大的支持。 首先,書中通過深入淺出的語言,介紹人工智能在能源領(lǐng)域的基本概念和技術(shù)原理。這使得我對人工智能
    發(fā)表于 10-14 09:27

    AI for Science:人工智能驅(qū)動科學(xué)創(chuàng)新》第4章-AI與生命科學(xué)讀后感

    很幸運社區(qū)給我一個閱讀此書的機會,感謝平臺。 《AI for Science:人工智能驅(qū)動科學(xué)創(chuàng)新》第4章關(guān)于AI與生命科學(xué)的部分,為我們揭示了人工智能技術(shù)在生命科學(xué)領(lǐng)域中的廣泛應(yīng)用和深遠影響。在
    發(fā)表于 10-14 09:21

    《AI for Science:人工智能驅(qū)動科學(xué)創(chuàng)新》第一章人工智能驅(qū)動的科學(xué)創(chuàng)新學(xué)習(xí)心得

    人工智能:科學(xué)研究的加速器 第一章清晰地闡述了人工智能作為科學(xué)研究工具的強大功能。通過機器學(xué)習(xí)、深度學(xué)習(xí)等先進技術(shù),AI能夠處理和分析海量數(shù)據(jù),發(fā)現(xiàn)傳統(tǒng)方法難以捕捉的模式和規(guī)律。這不僅極大地提高了數(shù)據(jù)處理
    發(fā)表于 10-14 09:12

    【飛凌嵌入式OK3576-C開發(fā)板體驗】RKNPU圖像識別測試

    和突觸的處理器,特別擅長處理人工智能任務(wù),能夠大大降低CPU和GPU的負擔(dān)。 功能 :RKNPU負責(zé)處理需要高計算性能的人工智能任務(wù),如圖像識別、語音
    發(fā)表于 10-10 09:27

    risc-v在人工智能圖像處理應(yīng)用前景分析

    RISC-V在人工智能圖像處理領(lǐng)域的應(yīng)用前景十分廣闊,這主要得益于其開源性、靈活性和低功耗等特點。以下是對RISC-V在人工智能圖像處理應(yīng)用前景的詳細分析: 一、RISC-V的基本特點 RISC-V
    發(fā)表于 09-28 11:00

    人工智能ai 數(shù)電 模電 模擬集成電路原理 電路分析

    人工智能ai 數(shù)電 模電 模擬集成電路原理 電路分析 想問下哪些比較容易學(xué) 不過好像都是要學(xué)的
    發(fā)表于 09-26 15:24

    名單公布!【書籍評測活動NO.44】AI for Science:人工智能驅(qū)動科學(xué)創(chuàng)新

    活的世界? 編輯推薦 《AI for Science:人工智能驅(qū)動科學(xué)創(chuàng)新》聚焦于人工智能與材料科學(xué)、生命科學(xué)、電子科學(xué)、能源科學(xué)、環(huán)境科學(xué)五大領(lǐng)域的交叉融合,通過深入淺出的語言和諸多實際應(yīng)用案例,介紹
    發(fā)表于 09-09 13:54

    FPGA在人工智能中的應(yīng)用有哪些?

    FPGA(現(xiàn)場可編程門陣列)在人工智能領(lǐng)域的應(yīng)用非常廣泛,主要體現(xiàn)在以下幾個方面: 一、深度學(xué)習(xí)加速 訓(xùn)練和推理過程加速:FPGA可以用來加速深度學(xué)習(xí)的訓(xùn)練和推理過程。由于其高并行性和低延遲特性
    發(fā)表于 07-29 17:05