一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

百度智能語音交互的產(chǎn)業(yè)化成果豐碩,推進語音技術應用落地

牽手一起夢 ? 來源:電科技 ? 作者:辛雯 ? 2020-09-16 15:20 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

9月15日,AI領域的行業(yè)盛會“百度世界2020”大會于線上隆重召開,一大波硬核技術襲來:百度創(chuàng)始人、董事長兼CEO李彥宏與總臺央視主持人康輝“虛擬人”亮相、顛覆搜索形態(tài)的“度曉曉”、沒有駕駛員的“全自動駕駛”、各行各業(yè)賦能案例……既有硬核技術,又有“接地氣”的落地應用。

在當天的百度大腦分論壇上,百度語音首席架構師賈磊重點講解了百度端到端語音交互技術。他表示,百度語音交互技術持續(xù)迭代升級,已發(fā)展成為基于深度學習技術的端到端的語音識別和語音合成技術。在語音識別層面,百度推出端到端信號聲學一體化建模的技術,語音合成方面,最新的Meitron和單人千面合成個性化技術亮相。同時交出了百度語音技術最新成績單:日均調(diào)用量超過155億次,廣泛應用在移動端、智能家居、和語音IoT等場景,智能語音產(chǎn)業(yè)化成果豐碩。

會上,賈磊分別從語音識別和語音合成兩個技術維度詳解了百度語音技術的發(fā)展迭代和最新成果。在語音識別方面,百度語音識別技術持續(xù)創(chuàng)新,從2012年首推深度學習技術,到2019年在業(yè)內(nèi)首先把注意力模型應用于在線語音識別,推出流式多級的截斷注意力模型 SMLTA;再到如今全面進化為端到端的信號聲學一體化建模技術,在助力百度自身業(yè)務發(fā)展的同時,更好地賦能多場景、多產(chǎn)業(yè)應用。

百度智能語音交互的產(chǎn)業(yè)化成果豐碩,推進語音技術應用落地

作為百度語音識別技術的最新成果,端到端的信號聲學一體化建模技術很好地解決了傳統(tǒng)數(shù)字信號處理和語音識別級聯(lián)系統(tǒng)的各種問題,拋棄了各自學科的學科假設,通過端到端的建模,大幅提升了遠場語音識別率。

據(jù)賈磊介紹,端到端的信號聲學一體化建模技術由模型波束技術和模型AEC技術組成。前者進化為多分區(qū)融合的模型波束建模技術,在國際上由百度首次提出,較單分區(qū)技術進一步提升識別性能15%以上;后者是升級為基于雙LOSS實值掩蔽的模型AEC技術,可以解決設備有非線性情況下的回波消除問題,使得設備即使在播放音樂的時候,也能夠進行成功的打斷和高精準的語音識別。

此外,賈磊還在會上介紹了百度今年推出的端側全雙工語音交互技術。據(jù)他介紹,百度端側全雙工語音交互技術將復雜的建模過程轉(zhuǎn)化為3個端到端的深度學習過程,即信號聲學一體化建模、聲學語言一體化建模以及語義置信一體化建模。通過端到端的建模,該技術能夠?qū)⒄麄€復雜的端側交互轉(zhuǎn)變成若干個深度學習計算,使得依靠一顆AI芯片就能完成端側的全雙工語音交互,從而大幅度提升車載手機等語音交互性能,顯著改善用戶體驗。

而在語音合成方面,百度自2013年啟動語音合成研發(fā),歷經(jīng)參數(shù)合成、拼接合成、深度學習語音合成和端到端的語音合成,到如今全新升級為包含個性化、多風格多角色、單人千面的語音合成系統(tǒng),百度語音合成技術始終處于升級迭代中。

會上,賈磊依次介紹了百度語音合成技術的最新成果——個性化TTS,多風格、多角色,單人千面。個性化TTS是個性化定制的Meitron語音合成系統(tǒng)的最新演進,是基于子帶分解和GAN_loss的端側神經(jīng)網(wǎng)絡聲碼器,也是業(yè)內(nèi)首個在手機端多人通用的端側的基于神經(jīng)計算的聲碼器。個性化TTS相較于傳統(tǒng)的基于信號處理和參數(shù)的聲碼器,ABX提升可以達到65:35,其已應用于地圖導航,目前每日的導航播報超過1億次。

多風格、多角色的語音合成,則是針對娛樂內(nèi)容產(chǎn)業(yè)(例如小說)中存在的多個角色交替、多種情感需求并存的播報需求而研發(fā)的新技術。此前,用單一音色播報缺乏表現(xiàn)力,播報語音和文字本身的角色情感不一致,用戶長時間聽感到單調(diào)疲倦。百度通過深度學習技術對小說文本進行分析,判斷出角色、身份、情感,再借助多風格、多角色語音合成技術去合成小說中的聲音,從而實現(xiàn)聲音自然流暢、情感表現(xiàn)力豐富、用戶體驗優(yōu)美的效果。

針對一個發(fā)音人需要用不同風格播報文本的應用場景,百度推出單人千面語音合成技術。該技術能夠把說話人的語音、文本、風格、內(nèi)容、音色都進行分離,在進行語音合成的時候自由組合,從而能夠讓一個發(fā)音人同時去播報新聞、小說、脫口秀、讀書、詩歌等不同風格。

“百度智能語音交互的產(chǎn)業(yè)化成果豐碩,目前百度智能語音的日均調(diào)用量超過155億次,廣泛應用于移動端、智能家居、智能車載、智能服務以及語音IoT,極大地提高了中國社會的智能化程度?!辟Z磊表示。語音技術作為百度大腦的重要AI能力之一,不但應用于百度搜索、百度輸入法、百度地圖、小度音箱等百度系列產(chǎn)品,更通過百度大腦AI開放平臺廣泛賦能眾多行業(yè)和場景的合作伙伴。未來,百度還將持續(xù)創(chuàng)新升級語音交互技術,推進語音技術應用落地,助力更多產(chǎn)業(yè)智能化轉(zhuǎn)型升級。

責任編輯:gt

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 百度
    +關注

    關注

    9

    文章

    2335

    瀏覽量

    92231
  • 智能家居
    +關注

    關注

    1934

    文章

    9806

    瀏覽量

    190569
  • IOT
    IOT
    +關注

    關注

    187

    文章

    4305

    瀏覽量

    201869
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    普強智能語音技術重新定義車載交互邊界

    普強憑借自主研發(fā)的智能語音技術,為某國內(nèi)頭部車企提供的語音前處理、喚醒詞、ASR、TTS等技術模塊,構建覆蓋泰語、俄語、韓語、日語等多語種的
    的頭像 發(fā)表于 07-11 14:00 ?341次閱讀

    65%央企大模型落地首選百度智能

    今天,很榮幸地分享一個好消息,百度智能云已牽手65%的央企,共同推進大模型產(chǎn)業(yè)落地。得益于全棧的AI能力,
    的頭像 發(fā)表于 06-11 15:44 ?425次閱讀

    藍牙語音遙控器:智能家居的智慧控制核心

    和低功耗特性,成為理想選擇。 藍牙語音遙控器不僅是智能家居控制的樞紐,更是技術進步的縮影。其便捷的操作、智能語音
    發(fā)表于 06-01 20:24

    明遠智睿SSD2351開發(fā)板:語音機器人領域的變革力量

    接口則讓語音機器人可以連接到互聯(lián)網(wǎng),實時獲取最新的信息,增強其智能性和交互能力。 在實際應用場景中,以智能客服語音機器人為例。SSD2351
    發(fā)表于 05-28 11:36

    芯資訊|廣州唯創(chuàng)電子WTV系列語音芯片:以技術創(chuàng)新賦能智能語音交互

    在萬物互聯(lián)的智能化時代,語音交互技術已成為人機交互的重要橋梁。廣州唯創(chuàng)電子深耕語音芯片領域多年,
    的頭像 發(fā)表于 05-21 08:45 ?210次閱讀
    芯資訊|廣州唯創(chuàng)電子WTV系列<b class='flag-5'>語音</b>芯片:以<b class='flag-5'>技術</b>創(chuàng)新賦能<b class='flag-5'>智能</b><b class='flag-5'>語音</b><b class='flag-5'>交互</b>

    智能收銀語音交互新標桿—WT3000T8語音合成芯片TTS技術應用解析

    一、行業(yè)應用背景在零售業(yè)態(tài)智能化轉(zhuǎn)型的浪潮中,收銀設備正經(jīng)歷從功能型向服務型轉(zhuǎn)變的關鍵階段。WT3000T8語音合成芯片應運而生,專為滿足新零售場景下智能收銀終端的語音
    的頭像 發(fā)表于 04-24 08:45 ?276次閱讀
    <b class='flag-5'>智能</b>收銀<b class='flag-5'>語音</b><b class='flag-5'>交互</b>新標桿—WT3000T8<b class='flag-5'>語音</b>合成芯片TTS<b class='flag-5'>技術</b>應用解析

    智能語音交互方案在客服領域的應用

    著客服行業(yè)的面貌,為企業(yè)和用戶帶來了全新的體驗。 語音識別模型優(yōu)化私部署 方案:精準高效,定制專屬服務 語音識別技術作為智能語音
    的頭像 發(fā)表于 04-11 14:35 ?298次閱讀

    格科GC7272榮獲第八屆“IC創(chuàng)新獎”成果產(chǎn)業(yè)化

    近日,中國集成電路創(chuàng)新聯(lián)盟正式公布第八屆“IC創(chuàng)新獎”獲獎名單。格科GalaxyCore自主研發(fā)的觸控顯示驅(qū)動集成芯片(TDDI)GC7272憑借超1億顆出貨規(guī)模及自主技術產(chǎn)業(yè)化成果,榮膺“成果產(chǎn)業(yè)化獎”。這一獎項不僅是對格科
    的頭像 發(fā)表于 03-25 16:55 ?550次閱讀

    基于WTVxxx語音芯片的智能清潔機器人語音交互系統(tǒng)設計方案介紹

    集成、低功耗、多控制模式及傳感器擴展能力,為智能清潔機器人提供了高效的語音交互解決方案。核心需求分析:1、實時狀態(tài)反饋:工作模式切換、電量提醒、故障報警等
    的頭像 發(fā)表于 03-06 08:27 ?357次閱讀
    基于WTVxxx<b class='flag-5'>語音</b>芯片的<b class='flag-5'>智能</b>清潔機器人<b class='flag-5'>語音</b><b class='flag-5'>交互</b>系統(tǒng)設計方案介紹

    解鎖個性化語音交互新時代:九芯智能語音云平臺,讓創(chuàng)意聲音觸手可及!

    九芯智能語音云平臺提供全面高效安全的智能語音服務,支持自定義語音內(nèi)容,簡化燒錄流程,依托AI技術
    的頭像 發(fā)表于 01-02 16:51 ?898次閱讀
    解鎖個性化<b class='flag-5'>語音</b><b class='flag-5'>交互</b>新時代:九芯<b class='flag-5'>智能</b><b class='flag-5'>語音</b>云平臺,讓創(chuàng)意聲音觸手可及!

    基于語音識別的智能會議系統(tǒng)具備哪些交互功能

    標貝科技專注智能語音交互領域多年,在語音識別和語音合成領域有著多項大型企業(yè)合作案例,標貝與多個智能
    的頭像 發(fā)表于 12-20 10:35 ?590次閱讀

    標貝智能語音識別在智能會議場景中的落地案例

    標貝科技專注智能語音交互領域多年,在語音識別和語音合成領域有著多項大型企業(yè)合作案例,標貝與多個智能
    的頭像 發(fā)表于 12-20 10:31 ?752次閱讀
    標貝<b class='flag-5'>智能</b><b class='flag-5'>語音</b>識別在<b class='flag-5'>智能</b>會議場景中的<b class='flag-5'>落地</b>案例

    基于智能語音交互智能呼叫中心工作機制

    作為實現(xiàn)智能呼叫中心的關鍵技術之一的智能語音交互技術,它通過集成自然語言處理(NLP)、
    的頭像 發(fā)表于 12-03 16:44 ?713次閱讀
    基于<b class='flag-5'>智能</b><b class='flag-5'>語音</b><b class='flag-5'>交互</b>的<b class='flag-5'>智能</b>呼叫中心工作機制

    百度世界2024公開課完美結束

    近日,以“應用來了"為主題的百度世界2024在上海召開。當天下午,百度世界33節(jié)線下AI公開課在上海世博中心開講,33位來自百度內(nèi)部的高階技術人員、外部行業(yè)專家及一線高校講師,為開發(fā)者
    的頭像 發(fā)表于 11-22 09:54 ?580次閱讀

    百度將發(fā)布AI智能眼鏡

    近日,有知情人士透露,百度旗下的人工智能品牌小計劃在即將舉行的百度世界大會上推出一款全新的AI智能眼鏡。這款眼鏡將內(nèi)置先進的人工
    的頭像 發(fā)表于 11-11 14:50 ?928次閱讀