一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

詳談機(jī)器學(xué)習(xí)的智能語(yǔ)音處理技術(shù)

如意 ? 來(lái)源:今日頭條 ? 作者:華章科技 ? 2021-01-27 16:08 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

機(jī)器學(xué)習(xí)的快速發(fā)展,為智能語(yǔ)音處理奠定了堅(jiān)實(shí)的理論和技術(shù)基礎(chǔ)。智能語(yǔ)音處理的主要特點(diǎn)是從大量的語(yǔ)音數(shù)據(jù)中學(xué)習(xí)和發(fā)現(xiàn)其中蘊(yùn)含的規(guī)律,可以有效解決經(jīng)典語(yǔ)音處理難以解決的非線性問(wèn)題,從而顯著提升傳統(tǒng)語(yǔ)音應(yīng)用的性能,也為語(yǔ)音新應(yīng)用提供性能更好的解決方案。

01 智能語(yǔ)音處理的基本概念

為簡(jiǎn)化處理,經(jīng)典的語(yǔ)音處理方法一般都建立在線性平穩(wěn)系統(tǒng)的理論基礎(chǔ)之上,這是以短時(shí)語(yǔ)音具有相對(duì)平穩(wěn)性為前提條件的。但是,嚴(yán)格來(lái)講,語(yǔ)音信號(hào)是一種典型的非線性、非平穩(wěn)隨機(jī)過(guò)程,這就使得采用經(jīng)典的處理方法難以進(jìn)一步提升語(yǔ)音處理系統(tǒng)的性能,如語(yǔ)音識(shí)別系統(tǒng)的識(shí)別率等。

隨著機(jī)器人技術(shù)的不斷發(fā)展,以機(jī)器人智能語(yǔ)音交互為代表的語(yǔ)音新應(yīng)用迫切要求發(fā)展新的語(yǔ)音處理技術(shù)與手段,以提高語(yǔ)音處理系統(tǒng)的性能水平。

近十年來(lái),人工智能技術(shù)正以前所未有的速度向前發(fā)展,機(jī)器學(xué)習(xí)領(lǐng)域不斷涌現(xiàn)的新技術(shù)、新算法,特別是新型神經(jīng)網(wǎng)絡(luò)深度學(xué)習(xí)技術(shù)等極大地推動(dòng)了語(yǔ)音處理的發(fā)展,為語(yǔ)音處理的研究提供了新的方法和技術(shù)手段,智能語(yǔ)音處理應(yīng)運(yùn)而生。

至今為止,智能語(yǔ)音處理還沒(méi)有一個(gè)精確的定義。廣義上來(lái)說(shuō),在語(yǔ)音處理算法或系統(tǒng)實(shí)現(xiàn)中全部或部分采用智能化的處理技術(shù)或手段均可稱為智能語(yǔ)音處理。

02 智能語(yǔ)音處理的基本框架

“聲源-濾波器”模型雖然能夠有效地區(qū)分聲源激勵(lì)和聲道濾波器,對(duì)它們進(jìn)行高效的估計(jì),但語(yǔ)音產(chǎn)生時(shí)發(fā)聲器官存在著協(xié)同動(dòng)作,存在緊耦合關(guān)系,采用簡(jiǎn)單的線性模型無(wú)法準(zhǔn)確描述語(yǔ)音的細(xì)節(jié)特征。

同時(shí),語(yǔ)音是一種富含信息的信號(hào)載體,它承載了語(yǔ)義、說(shuō)話人、情緒、語(yǔ)種、方言等諸多信息,分離、感知這些信息需要對(duì)語(yǔ)音進(jìn)行十分精細(xì)的分析,對(duì)這些信息的判別也不再是簡(jiǎn)單的規(guī)則描述,單純對(duì)發(fā)聲機(jī)理、信號(hào)的簡(jiǎn)單特征采用人工手段去分析并不現(xiàn)實(shí)。

類似于人類語(yǔ)言學(xué)習(xí)的思路,采用機(jī)器學(xué)習(xí)手段,讓機(jī)器通過(guò)“聆聽(tīng)”大量的語(yǔ)音數(shù)據(jù),并從語(yǔ)音數(shù)據(jù)中學(xué)習(xí)蘊(yùn)含其中的規(guī)律,是有效提升語(yǔ)音信息處理性能的主要手段。與經(jīng)典語(yǔ)音處理方法僅限于通過(guò)提取人為設(shè)定特征參數(shù)進(jìn)行處理不同,智能語(yǔ)音處理最重要的特點(diǎn)就是在語(yǔ)音處理過(guò)程或算法中體現(xiàn)從數(shù)據(jù)中學(xué)習(xí)規(guī)律的思想。

圖1-5給出了智能語(yǔ)音處理的三種基本框架,圖中虛線框部分有別于經(jīng)典語(yǔ)音處理方法,包含了從數(shù)據(jù)中學(xué)習(xí)的思想,是智能語(yǔ)音處理的核心模塊。

詳談機(jī)器學(xué)習(xí)的智能語(yǔ)音處理技術(shù)

▲圖1-5 智能語(yǔ)音處理的基本框架

其中,圖1-5a是在經(jīng)典語(yǔ)音處理特征提取的基礎(chǔ)上,在特征映射部分融入了智能處理,是機(jī)器學(xué)習(xí)的經(jīng)典形式,圖1-5b和圖1-5c是表示學(xué)習(xí)的基本框架,其中圖1-5c是深度學(xué)習(xí)的典型框架,“深度層次化的抽象特征”是通過(guò)分層的深度神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)來(lái)實(shí)現(xiàn)的。

03 智能語(yǔ)音處理的基本模型

智能語(yǔ)音處理是智能信息處理的一個(gè)重要研究領(lǐng)域,智能信息處理涉及的模型、方法、技術(shù)均可應(yīng)用于智能語(yǔ)音處理。智能語(yǔ)音處理的基本模型和技術(shù)主要來(lái)源于人工智能,機(jī)器學(xué)習(xí)作為人工智能的重要領(lǐng)域,是目前智能語(yǔ)音處理中最常用的手段,而機(jī)器學(xué)習(xí)中的表示學(xué)習(xí)和深度學(xué)習(xí)則是智能語(yǔ)音處理中目前最為成功的智能處理技術(shù)。

詳談機(jī)器學(xué)習(xí)的智能語(yǔ)音處理技術(shù)

▲圖1-6 AI/ML/RL/DL的關(guān)系圖

圖1-6展示了人工智能(Artificial Intelligence,AI)、機(jī)器學(xué)習(xí)(Machine Learning,ML)、表示學(xué)習(xí)(Representation Learning,RL)及深度學(xué)習(xí)(Deep Learning,DL)的相互關(guān)系。

下面列出了近年來(lái)在智能語(yǔ)音處理中常見(jiàn)的模型和技術(shù)。

1. 稀疏與壓縮感知

一個(gè)事物的表示形式?jīng)Q定了認(rèn)知該事物的難度。在信息處理中,具有稀疏特性的信號(hào)表示更易于被感知和辨別,反之則難以辨別。因此,尋找信號(hào)的稀疏表示是高效解決信息處理問(wèn)題的一個(gè)重要手段。

利用冗余字典,可以學(xué)習(xí)信號(hào)自身的特點(diǎn),構(gòu)造信號(hào)的稀疏表示,并進(jìn)一步降低采樣和處理的難度。這種字典學(xué)習(xí)方法為信息處理提供了新的視角。對(duì)語(yǔ)音信號(hào)采用字典學(xué)習(xí),構(gòu)造語(yǔ)音的稀疏表示,為語(yǔ)音編碼、語(yǔ)音分離等應(yīng)用提供了新的研究思路。

2. 隱變量模型

語(yǔ)音的所有信息都包含在語(yǔ)音波形中,隱變量模型假設(shè)這些信息是隱含在觀測(cè)信號(hào)之后的隱變量。通過(guò)利用高斯建模、隱馬爾可夫建模等方法,隱變量模型建立了隱變量和觀測(cè)變量之間的數(shù)學(xué)描述,并給出了從觀測(cè)變量學(xué)習(xí)各模型參數(shù)的方法。

通過(guò)參數(shù)學(xué)習(xí),可以將隱變量的變化規(guī)律挖掘出來(lái),從而得到各種需要的隱含信息。隱變量模型大大提高了語(yǔ)音識(shí)別、說(shuō)話人識(shí)別等應(yīng)用的性能,在很長(zhǎng)一段時(shí)間內(nèi)都是智能語(yǔ)音處理的主流手段。

3. 組合模型

組合模型認(rèn)為語(yǔ)音是多種信息的組合,這些信息可以采用線性疊加、相乘、卷積等不同方式組合在一起。具體的組合方式中需要采用一系列模型參數(shù),這些模型參數(shù)可以通過(guò)學(xué)習(xí)方式從大量語(yǔ)音數(shù)據(jù)中學(xué)得。這類模型的提出,有效改善了語(yǔ)音分離、語(yǔ)音增強(qiáng)等應(yīng)用的性能。

4. 人工神經(jīng)網(wǎng)絡(luò)與深度學(xué)習(xí)

人類面臨大量感知數(shù)據(jù)時(shí),總能以一種靈巧的方式獲取值得注意的重要信息。模仿人腦高效、準(zhǔn)確地表示信息一直是人工智能領(lǐng)域的核心挑戰(zhàn)。

人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Network,ANN)通過(guò)神經(jīng)元連接成網(wǎng)的方式,模擬了哺乳類動(dòng)物大腦皮層的神經(jīng)通路。和生物的神經(jīng)系統(tǒng)一樣,ANN通過(guò)對(duì)環(huán)境輸入的感知和學(xué)習(xí),可以不斷優(yōu)化性能。

隨著ANN的結(jié)構(gòu)越來(lái)越復(fù)雜、層數(shù)越來(lái)越多,網(wǎng)絡(luò)的表示能力也越來(lái)越強(qiáng),基于ANN進(jìn)行深度學(xué)習(xí)成為ANN研究的主流,其性能相對(duì)于很多傳統(tǒng)的機(jī)器學(xué)習(xí)方法有較大幅度的提高。但同時(shí),深度學(xué)習(xí)對(duì)輸入數(shù)據(jù)的要求也越來(lái)越高,通常需要有海量數(shù)據(jù)的支撐。

ANN很早就應(yīng)用到了語(yǔ)音處理領(lǐng)域,但由于早期受到計(jì)算資源的限制,神經(jīng)網(wǎng)絡(luò)層數(shù)較少,語(yǔ)音處理應(yīng)用性能難以提升,直到近年來(lái)深層神經(jīng)網(wǎng)絡(luò)的計(jì)算資源、學(xué)習(xí)方法有了突破之后,基于神經(jīng)網(wǎng)絡(luò)的語(yǔ)音處理性能才有了顯著的提升。

深度神經(jīng)網(wǎng)絡(luò)可以學(xué)到語(yǔ)音信號(hào)中各種信息間的非線性關(guān)系,解決了傳統(tǒng)語(yǔ)音處理方法難以解決的問(wèn)題,已經(jīng)成為當(dāng)前智能語(yǔ)音處理的重要技術(shù)手段。
責(zé)編AJX

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 模型
    +關(guān)注

    關(guān)注

    1

    文章

    3521

    瀏覽量

    50428
  • 機(jī)器學(xué)習(xí)

    關(guān)注

    66

    文章

    8503

    瀏覽量

    134628
  • 智能語(yǔ)音
    +關(guān)注

    關(guān)注

    11

    文章

    804

    瀏覽量

    49529
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    明遠(yuǎn)智睿SSD2351開(kāi)發(fā)板:語(yǔ)音機(jī)器人領(lǐng)域的變革力量

    在人工智能快速發(fā)展的今天,語(yǔ)音機(jī)器人逐漸成為人們生活和工作中的得力助手。明遠(yuǎn)智睿SSD2351開(kāi)發(fā)板憑借強(qiáng)大性能與豐富功能,為語(yǔ)音機(jī)器人的發(fā)
    發(fā)表于 05-28 11:36

    【TL6748 DSP申請(qǐng)】基于DSP的語(yǔ)音識(shí)別技術(shù)研究及實(shí)現(xiàn)

    申請(qǐng)理由:在校大三學(xué)生,電子信息工程信號(hào)處理方向,特別想學(xué)習(xí)一下DSP信號(hào)處理技術(shù)學(xué)習(xí)過(guò)隨機(jī)信號(hào)分析、信號(hào)系統(tǒng)課程并且正在
    發(fā)表于 10-09 15:08

    智能語(yǔ)音機(jī)器

    ` 本帖最后由 星希望532 于 2015-12-2 20:06 編輯 作品名稱:基于微型操作系統(tǒng)的智能多平臺(tái)控制語(yǔ)音機(jī)器人http://v.youku.com/v_show
    發(fā)表于 12-02 19:08

    基于深度學(xué)習(xí)技術(shù)智能機(jī)器

    ——工業(yè)機(jī)器人的智能化程度要求也越來(lái)越高,采用深度學(xué)習(xí)技術(shù)為工業(yè)機(jī)器人賦能是目前各大廠商的統(tǒng)一認(rèn)知。本文結(jié)合實(shí)際案例,簡(jiǎn)要說(shuō)明一下
    發(fā)表于 05-31 09:36

    請(qǐng)問(wèn)電銷機(jī)器智能語(yǔ)音識(shí)別的原理是什么?

    一個(gè)人們最為關(guān)心的問(wèn)題大概就是,電銷機(jī)器人如何做到語(yǔ)音識(shí)別,通俗來(lái)講,就是電銷機(jī)器人如何“聽(tīng)懂”人們說(shuō)話?其實(shí)語(yǔ)音識(shí)別技術(shù)是人工
    發(fā)表于 06-12 14:03

    人工智能機(jī)器學(xué)習(xí)的前世今生

    如何傳授給計(jì)算機(jī)的過(guò)程。任何機(jī)器使用算法以智能方式執(zhí)行任務(wù),這就是展現(xiàn)的人工智能。機(jī)器學(xué)習(xí)是人工智能
    發(fā)表于 08-27 10:16

    人工智能——MATLAB圖像處理機(jī)器學(xué)習(xí)

    視覺(jué)、通訊、計(jì)算金融學(xué)、控制設(shè)計(jì)、機(jī)器人學(xué)等等。 為了幫助大家更好的學(xué)習(xí)機(jī)器學(xué)習(xí)和圖像處理,我們上線了《人工智能—MATLAB圖像
    發(fā)表于 07-01 15:05

    【 平頭哥CB5654語(yǔ)音開(kāi)發(fā)板試用連載】智能取貨機(jī)器人語(yǔ)音交互模組

    項(xiàng)目名稱:智能取貨機(jī)器人語(yǔ)音交互模組試用計(jì)劃:申請(qǐng)理由本人在機(jī)器人控制有七年多的學(xué)習(xí)和開(kāi)發(fā)經(jīng)驗(yàn),曾參與設(shè)計(jì)過(guò)類似巡檢機(jī)器人,參與語(yǔ)音交互硬件
    發(fā)表于 02-25 16:05

    AI智能語(yǔ)音機(jī)器人 揭秘讓企業(yè)電銷輕松拓客神器

    AI智能語(yǔ)音機(jī)器人是一款基于人工智能開(kāi)發(fā)的,適用于產(chǎn)品業(yè)務(wù)或服務(wù)推廣需求的語(yǔ)音營(yíng)銷服務(wù)平臺(tái)!通過(guò)精準(zhǔn)語(yǔ)音
    發(fā)表于 07-21 22:54

    機(jī)器技術(shù)機(jī)器學(xué)習(xí)

    機(jī)器技術(shù)機(jī)器學(xué)習(xí)正成為嵌入式系統(tǒng)硬件和軟件供應(yīng)商的下一個(gè)重大事件。嵌入式系統(tǒng)可以通過(guò)網(wǎng)絡(luò)連接和物聯(lián)網(wǎng)(IoT)來(lái)傳遞信息、共享資源。無(wú)論是智能
    發(fā)表于 12-20 06:03

    什么是人工智能機(jī)器學(xué)習(xí)、深度學(xué)習(xí)和自然語(yǔ)言處理?

    垂直領(lǐng)域得到廣泛應(yīng)用。根據(jù)2020年的一項(xiàng)估計(jì),37% 的組織已經(jīng)在使用這種或那種形式的人工智能。大多數(shù)人工智能的應(yīng)用是特定的技術(shù),如計(jì)算機(jī)視覺(jué)、自然語(yǔ)言處理、
    發(fā)表于 03-22 11:19

    《移動(dòng)終端人工智能技術(shù)與應(yīng)用開(kāi)發(fā)》人工智能的發(fā)展與AI技術(shù)的進(jìn)步

    人工智能打發(fā)展是算法優(yōu)先于實(shí)際應(yīng)用。近幾年隨著人工智能的不斷普及,許多深度學(xué)習(xí)算法涌現(xiàn),從最初的卷積神經(jīng)網(wǎng)絡(luò)(CNN)到機(jī)器學(xué)習(xí)算法的時(shí)代。
    發(fā)表于 02-17 11:00

    智能語(yǔ)音機(jī)器人的使用誤區(qū)你知道嗎

    電銷機(jī)器人=AI人工智能+語(yǔ)音識(shí)別技術(shù)+語(yǔ)音知識(shí)庫(kù)+話術(shù)邏輯+智能
    發(fā)表于 07-04 14:29 ?1298次閱讀

    機(jī)器學(xué)習(xí)可以分為哪幾類?機(jī)器學(xué)習(xí)技術(shù)有哪些?

    機(jī)器學(xué)習(xí)可以分為哪幾類?機(jī)器學(xué)習(xí)技術(shù)有哪些 機(jī)器學(xué)習(xí)
    的頭像 發(fā)表于 08-17 16:11 ?6569次閱讀

    機(jī)器學(xué)習(xí)技術(shù)是什么?機(jī)器學(xué)習(xí)技術(shù)在新型電力系統(tǒng)安全穩(wěn)定中的應(yīng)用

    一些能夠推斷未知數(shù)據(jù)的規(guī)則和模型。機(jī)器學(xué)習(xí)技術(shù)目前已經(jīng)廣泛應(yīng)用于許多領(lǐng)域,如圖像和語(yǔ)音識(shí)別、自然語(yǔ)言處理、金融風(fēng)險(xiǎn)管理等等。 在電力系統(tǒng)安全
    的頭像 發(fā)表于 08-17 16:30 ?1467次閱讀