一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

百度端對(duì)端語(yǔ)音識(shí)別專利揭秘

汽車玩家 ? 來(lái)源: 愛集微 ? 作者: 愛集微 ? 2020-01-08 11:17 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

百度公司提出的端對(duì)端神經(jīng)網(wǎng)絡(luò)模型來(lái)進(jìn)行語(yǔ)音識(shí)別,成功的代替了手工工程化部件的流水線操作,這讓整個(gè)語(yǔ)音識(shí)別技術(shù)更加便捷,而使用神經(jīng)網(wǎng)絡(luò)來(lái)抽取輸入端的特征信息相當(dāng)于人功抽取特征則更加全面。

集微網(wǎng)消息,近年來(lái),語(yǔ)音識(shí)別技術(shù)得到了迅猛的發(fā)展,這得益于人工智能的快速發(fā)展,其中最為主要的學(xué)業(yè)界的各大神經(jīng)網(wǎng)絡(luò)的出現(xiàn),包括基礎(chǔ)的序列神經(jīng)網(wǎng)絡(luò)模型RNN、LSTM和GRU。語(yǔ)音識(shí)別技術(shù)也已經(jīng)進(jìn)入到各行各業(yè)中,如工業(yè)、家電、通信汽車電子等。于是,對(duì)于語(yǔ)音識(shí)別技術(shù)的要求也將更加嚴(yán)格了,更傾向于走向準(zhǔn)確化和便捷化。

以往,構(gòu)建語(yǔ)音識(shí)別模型主要是使用HMM的序列模型,再使用手工工程化部件來(lái)實(shí)現(xiàn)整個(gè)流水線操作,并且對(duì)于不同的語(yǔ)言的語(yǔ)音需要重新構(gòu)建模型的結(jié)果特征。對(duì)此,國(guó)內(nèi)語(yǔ)音識(shí)別技術(shù)第一梯隊(duì)公司百度便提出了使用端對(duì)端的神經(jīng)網(wǎng)絡(luò)模型來(lái)進(jìn)行語(yǔ)音識(shí)別工作,該專利為“端對(duì)端語(yǔ)音識(shí)別”(專利號(hào):CN107408111A)。

首先,小編在這先介紹一下神經(jīng)網(wǎng)絡(luò)端對(duì)端的學(xué)習(xí)方式。對(duì)于語(yǔ)音識(shí)別來(lái)說,端到端深度學(xué)習(xí)做的是,訓(xùn)練一個(gè)深度神經(jīng)網(wǎng)絡(luò),輸入就是一段音頻,輸出直接是聽寫文本。其中這里的端表示輸入源數(shù)據(jù)端,另外一端是神經(jīng)網(wǎng)絡(luò)處理的結(jié)果也就是我們最終需要的目標(biāo)。這種訓(xùn)練學(xué)習(xí)的方式能應(yīng)對(duì)多種語(yǔ)言的語(yǔ)音識(shí)別的場(chǎng)景構(gòu)建,因?yàn)閮H僅是需要改變輸入端和輸出端,深度神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)并不需要根據(jù)語(yǔ)言的語(yǔ)音不同而改變。

專利中提出的端對(duì)端的深度學(xué)習(xí)模型的架構(gòu)圖如圖1所示。該架構(gòu)包括訓(xùn)練以攝取語(yǔ)譜并生成文本的遞歸神經(jīng)網(wǎng)絡(luò)模型。首先,使用一個(gè)或更多個(gè)卷積層對(duì)語(yǔ)譜進(jìn)行特征提取,緊接著,使用一個(gè)或多個(gè)遞歸層(雙向GRU神經(jīng)網(wǎng)絡(luò))對(duì)語(yǔ)譜的特征進(jìn)行時(shí)序建模。最后再使用全連接層將遞歸層獲取的語(yǔ)譜信息進(jìn)行全連接作為CTC(鏈結(jié)式時(shí)間分類算法:重點(diǎn)解決輸入數(shù)據(jù)與給定標(biāo)簽的對(duì)齊問題)的輸入,經(jīng)過Softmax計(jì)算輸出各個(gè)文本標(biāo)簽的概率。

圖1端對(duì)端深度學(xué)習(xí)模型架構(gòu)圖

經(jīng)過上述端對(duì)端深度學(xué)習(xí)模型構(gòu)建后,專利中還給出了端對(duì)端深度學(xué)習(xí)模型的訓(xùn)練方法,如圖2所示。

百度端對(duì)端語(yǔ)音識(shí)別專利揭秘

圖2 端對(duì)端深度學(xué)習(xí)模型訓(xùn)練方法圖

首先需要為模型設(shè)置好,輸入端和輸出端,對(duì)于語(yǔ)音識(shí)別技術(shù)來(lái)說,輸入端為一時(shí)間序列頻譜幀的話語(yǔ)X,輸出端是與話語(yǔ)X具有相關(guān)聯(lián)的真實(shí)標(biāo)簽Y。

構(gòu)建深度神經(jīng)網(wǎng)絡(luò)模型(包括一個(gè)或多個(gè)卷積層和一個(gè)或多個(gè)遞歸層的模型)用來(lái)預(yù)測(cè)一個(gè)或多個(gè)字符也就是我們輸出端的標(biāo)簽。

根據(jù)網(wǎng)絡(luò)模型的輸出端的標(biāo)簽的概率分布與真實(shí)標(biāo)簽的誤差計(jì)算損失函數(shù),提供損失函數(shù)推出標(biāo)簽預(yù)測(cè)的誤差,再使用梯度反向傳播算法更新模型參數(shù)。從而達(dá)到網(wǎng)絡(luò)模型學(xué)習(xí)的目的。

百度公司提出的端對(duì)端神經(jīng)網(wǎng)絡(luò)模型來(lái)進(jìn)行語(yǔ)音識(shí)別,成功的代替了手工工程化部件的流水線操作,這讓整個(gè)語(yǔ)音識(shí)別技術(shù)更加便捷,而使用神經(jīng)網(wǎng)絡(luò)來(lái)抽取輸入端的特征信息相當(dāng)于人功抽取特征則更加全面,這讓整個(gè)語(yǔ)音識(shí)別技術(shù)更加準(zhǔn)確。從這兩方面來(lái)看,端對(duì)端的神經(jīng)網(wǎng)絡(luò)模型確實(shí)是讓語(yǔ)音識(shí)別技術(shù)走向了便捷化,準(zhǔn)確化。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 百度
    +關(guān)注

    關(guān)注

    9

    文章

    2335

    瀏覽量

    92237
  • 語(yǔ)音識(shí)別
    +關(guān)注

    關(guān)注

    39

    文章

    1782

    瀏覽量

    114248
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    百度在AI領(lǐng)域的最新進(jìn)展

    近日,我們?cè)谖錆h舉辦了Create2025百度AI開發(fā)者大會(huì),與全球各地的5000多名開發(fā)者,分享了百度在AI領(lǐng)域的新進(jìn)展。
    的頭像 發(fā)表于 04-30 10:14 ?622次閱讀

    上汽大眾與百度地圖達(dá)成戰(zhàn)略合作

    近日,上海國(guó)際車展期間,百度地圖與上汽大眾舉行科技X生態(tài)戰(zhàn)略合作伙伴簽約儀式,雙方將基于百度領(lǐng)先的車道級(jí)地圖產(chǎn)品,為上汽大眾千萬(wàn)車主打造更安全、高效的智能化出行體驗(yàn)。上汽大眾總經(jīng)理陶海龍、百度副總裁尚國(guó)斌等出席簽約儀式。
    的頭像 發(fā)表于 04-29 17:28 ?545次閱讀

    百度AI榮獲2025愛迪生獎(jiǎng)金獎(jiǎng)和銀獎(jiǎng)

    剛剛,百度AI在「2025愛迪生獎(jiǎng)」中獲得一金一銀兩項(xiàng)大獎(jiǎng)。
    的頭像 發(fā)表于 04-08 15:43 ?477次閱讀

    百度搜索,能否將DeepSeek變成“內(nèi)功”?

    實(shí)測(cè)之后,會(huì)發(fā)現(xiàn)百度搜索和DeepSeek稱得上“王炸組合”
    的頭像 發(fā)表于 02-21 10:04 ?2346次閱讀
    <b class='flag-5'>百度</b>搜索,能否將DeepSeek變成“內(nèi)功”?

    百度2024財(cái)報(bào)亮點(diǎn):營(yíng)收破千億,凈利潤(rùn)增21%

    百度近日發(fā)布了其2024年第四季度及全年財(cái)報(bào),亮點(diǎn)紛呈。數(shù)據(jù)顯示,百度在2024年的總營(yíng)收達(dá)到了1331億元,顯示出強(qiáng)勁的增長(zhǎng)勢(shì)頭。 其中,歸屬百度核心的凈利潤(rùn)更是高達(dá)234億元,與去年同期
    的頭像 發(fā)表于 02-19 13:47 ?462次閱讀

    百度文心大模型4月1日起全面免費(fèi)開放

    近日,百度公司正式對(duì)外宣布,其備受關(guān)注的文心大模型在經(jīng)過一系列迭代與優(yōu)化后,將于4月1日零時(shí)全面免費(fèi)開放給所有用戶。此次免費(fèi)開放的覆蓋范圍廣泛,包括所有PC及App用戶,讓用戶能夠盡情體驗(yàn)文心系
    的頭像 發(fā)表于 02-14 09:19 ?469次閱讀

    百度科啟動(dòng)“繁星計(jì)劃”

    近日,百度科攜手中國(guó)科協(xié)、中國(guó)科學(xué)院大學(xué)共同舉辦了史記2024·科學(xué)科100詞發(fā)布會(huì),并在此盛會(huì)上正式啟動(dòng)了“繁星計(jì)劃”。這一計(jì)劃的核心目標(biāo)在于利用前沿的AI技術(shù),包括數(shù)字人、智能體等,以及
    的頭像 發(fā)表于 12-31 10:26 ?721次閱讀

    ElfBoard開源項(xiàng)目|百度智能云平臺(tái)的人臉識(shí)別項(xiàng)目

    百度智能云平臺(tái)的人臉識(shí)別項(xiàng)目,旨在利用其強(qiáng)大的人臉識(shí)別服務(wù)實(shí)現(xiàn)自動(dòng)人臉識(shí)別。選擇百度智能云的原因是其高效的API接口和穩(wěn)定的服務(wù)質(zhì)量,能夠幫
    的頭像 發(fā)表于 12-24 10:54 ?1278次閱讀
    ElfBoard開源項(xiàng)目|<b class='flag-5'>百度</b>智能云平臺(tái)的人臉<b class='flag-5'>識(shí)別</b>項(xiàng)目

    百度進(jìn)軍短劇領(lǐng)域,計(jì)劃全面升級(jí)平臺(tái)

    近日,據(jù)天眼查知識(shí)產(chǎn)權(quán)信息顯示,百度在線網(wǎng)絡(luò)技術(shù)(北京)有限公司已經(jīng)正式申請(qǐng)注冊(cè)了“百度短劇”商標(biāo)。該商標(biāo)的國(guó)際分類涵蓋了網(wǎng)站服務(wù)、科學(xué)儀器以及教育娛樂等多個(gè)領(lǐng)域,且當(dāng)前商標(biāo)狀態(tài)均為等待實(shí)質(zhì)審查
    的頭像 發(fā)表于 12-19 10:25 ?636次閱讀

    百度正式回應(yīng)進(jìn)軍短劇領(lǐng)域

    近日,百度在線網(wǎng)絡(luò)技術(shù)(北京)有限公司在知識(shí)產(chǎn)權(quán)領(lǐng)域有了新的動(dòng)作,據(jù)天眼查信息顯示,該公司已申請(qǐng)注冊(cè)“百度短劇”商標(biāo),涵蓋網(wǎng)站服務(wù)、科學(xué)儀器、教育娛樂等多個(gè)國(guó)際分類,目前這些商標(biāo)均處于等待實(shí)質(zhì)審查
    的頭像 發(fā)表于 12-17 14:19 ?587次閱讀

    階躍星辰發(fā)布國(guó)內(nèi)首個(gè)千億參數(shù)語(yǔ)音大模型

    近日,階躍星辰在官方公眾號(hào)上宣布了一項(xiàng)重大突破——推出Step-1o千億參數(shù)語(yǔ)音大模型。該模型被譽(yù)為“國(guó)內(nèi)首個(gè)千億參數(shù)
    的頭像 發(fā)表于 12-17 13:43 ?751次閱讀

    百度文心大模型日均調(diào)用量超15億

    近日,百度在上海世博中心舉辦了主題為“應(yīng)用來(lái)了”的百度世界2024大會(huì)。會(huì)上,百度董事長(zhǎng)李彥宏分享了關(guān)于大模型行業(yè)的最新動(dòng)態(tài)和百度文心大模型的顯著進(jìn)展。
    的頭像 發(fā)表于 11-12 15:28 ?707次閱讀

    百度將發(fā)布AI智能眼鏡

    近日,有知情人士透露,百度旗下的人工智能品牌小計(jì)劃在即將舉行的百度世界大會(huì)上推出一款全新的AI智能眼鏡。這款眼鏡將內(nèi)置先進(jìn)的人工智能助手,并配備攝像頭,為用戶提供前所未有的智能體驗(yàn)。
    的頭像 發(fā)表于 11-11 14:50 ?928次閱讀

    百度舸AI計(jì)算平臺(tái)4.0震撼發(fā)布

    在2024年百度云智大會(huì)的璀璨舞臺(tái)上,百度智能云重磅推出了舸AI異構(gòu)計(jì)算平臺(tái)的全新力作——4.0版本。此次升級(jí),標(biāo)志著百度在AI基礎(chǔ)設(shè)施領(lǐng)域邁出了堅(jiān)實(shí)的一步,致力于為行業(yè)提供更為強(qiáng)大
    的頭像 發(fā)表于 09-26 14:46 ?894次閱讀

    百度健康推出五款大模型應(yīng)用產(chǎn)品

    百度集團(tuán)資深副總裁、百度大健康事業(yè)群組總裁何明科發(fā)表主題演講時(shí)表示,醫(yī)療行業(yè)中存在“看得上病”“看得起病”“看得好病”難以同時(shí)實(shí)現(xiàn)的“不可能三角”,AI是平衡這個(gè)“不可能三角”的關(guān)鍵點(diǎn)。
    的頭像 發(fā)表于 07-23 09:36 ?916次閱讀