一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

劍橋語音博士俞凱解讀智能語音技術(shù)

思必馳 ? 來源:djl ? 作者:思必馳 ? 2019-08-05 16:02 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

1 智能語音技術(shù)發(fā)展與siri

智能語音技術(shù)發(fā)展過程可以理解為兩個(gè)階段,第一是輸入和輸出階段,即識(shí)別與合成,第二是理解和思考階段,即語義理解、對(duì)話系統(tǒng)、人工智能反饋。并且每一個(gè)細(xì)分領(lǐng)域均為單獨(dú)研究,例如語音識(shí)別、自然語言處理、聲紋處理,語義解析等等。

siri 目前最大的優(yōu)勢(shì)在于語義單項(xiàng)理解的算法,在一個(gè)限定的領(lǐng)域下,siri表現(xiàn)確實(shí)很好,但在整個(gè)語音領(lǐng)域內(nèi),尤其不限定領(lǐng)域和語音識(shí)別不穩(wěn)定的情況下,顯得有些后勁不足,這也與目前技術(shù)有關(guān)。而思必馳與siri不同的地方在與交互的理論,目前思必馳以任務(wù)型對(duì)話為目標(biāo),并專注于此。

2 一體化綜合解決技術(shù)增強(qiáng)用戶體驗(yàn)

目前的智能語音基本是單獨(dú)模塊定義單獨(dú)的功能,例如語義理解、語音識(shí)別模塊,彼此之間沒有控制與調(diào)度,這也是造成目前語音延遲現(xiàn)象的部分原因,而造成延遲另外的原因是語音的處理、理解、交互系統(tǒng)設(shè)計(jì)方式。

用戶最希望的是智能語音界面能像人與人的交流一樣,語音能夠迅速反饋。但目前,雖然單獨(dú)語音識(shí)別很多單位都能做的很快,但組裝成交互系統(tǒng)之后就大都無法做到這一點(diǎn)了。目前思必馳推出的一體化解決方案,針對(duì)利于用戶體驗(yàn)方面進(jìn)行優(yōu)化,達(dá)到端到端的用戶體驗(yàn),優(yōu)化整個(gè)控制流程,在識(shí)別的基礎(chǔ)上同時(shí)進(jìn)行輸出,達(dá)到一個(gè)快速智能反饋的效果。我們是面向終端用戶體驗(yàn)去做語音交互優(yōu)化,而不僅僅提供一個(gè)模塊而已。

3 人性化交互的智能語音方向

未來的智能語音交互發(fā)展方向一定是混合發(fā)展模式,將以用戶為中心,綜合應(yīng)用全面的語音技術(shù),而不僅僅是單純的語音識(shí)別。第一,智能語音技術(shù)會(huì)與環(huán)境、語境自適應(yīng)的結(jié)合;第二,語音的發(fā)展在自然場(chǎng)景下應(yīng)用會(huì)越來越多,例如在高噪聲環(huán)境中的處理是未來的一個(gè)方向;第三,結(jié)合上下文的語義理解以及端到端的語音交互解決。目前單獨(dú)的識(shí)別以不能解決所有問題與滿足用戶需求,將識(shí)別、理解、對(duì)話的交互控制等融合,提供整套的解決方案才是最終的方向。

人工智能層面的語音技術(shù)中,單純的識(shí)別率是以科研指標(biāo)為中心,而人工智能角度與工程科研指標(biāo)在某些方面截然不同。而我們一直以用戶為中心,面向指標(biāo)是令人工智能語音真正人性化,在多類環(huán)境下準(zhǔn)確識(shí)別并反饋,以個(gè)性化色彩進(jìn)行交流。語音交互的未來應(yīng)當(dāng)是面向用戶,人性化的智能交互,而非過去模塊化的交互。

俞凱博士背景:擁有劍橋大學(xué)語音識(shí)別專業(yè)的學(xué)術(shù)背景,也是國內(nèi)學(xué)術(shù)界“青年***”里唯一一位來自智能語音技術(shù)行業(yè)領(lǐng)域的語音專家,曾多次獲得美國國家標(biāo)準(zhǔn)局和美國國防部語音識(shí)別評(píng)測(cè)冠軍,是國際最早的認(rèn)知型人機(jī)口語對(duì)話系統(tǒng)原型的主要實(shí)現(xiàn)者,在上海交通大學(xué)創(chuàng)建了智能語音實(shí)驗(yàn)室。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 人工智能
    +關(guān)注

    關(guān)注

    1806

    文章

    49028

    瀏覽量

    249511
  • 智能語音
    +關(guān)注

    關(guān)注

    11

    文章

    804

    瀏覽量

    49526
  • 思必馳
    +關(guān)注

    關(guān)注

    4

    文章

    337

    瀏覽量

    15336
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    藍(lán)牙語音遙控器:智能家居的智慧控制核心

    和低功耗特性,成為理想選擇。 藍(lán)牙語音遙控器不僅是智能家居控制的樞紐,更是技術(shù)進(jìn)步的縮影。其便捷的操作、智能語音交互和低功耗設(shè)計(jì),為用戶
    發(fā)表于 06-01 20:24

    芯資訊|廣州唯創(chuàng)電子WTV系列語音芯片:以技術(shù)創(chuàng)新賦能智能語音交互

    在萬物互聯(lián)的智能化時(shí)代,語音交互技術(shù)已成為人機(jī)交互的重要橋梁。廣州唯創(chuàng)電子深耕語音芯片領(lǐng)域多年,憑借自主研發(fā)的WTV系列語音芯片,持續(xù)為
    的頭像 發(fā)表于 05-21 08:45 ?210次閱讀
    芯資訊|廣州唯創(chuàng)電子WTV系列<b class='flag-5'>語音</b>芯片:以<b class='flag-5'>技術(shù)</b>創(chuàng)新賦能<b class='flag-5'>智能</b><b class='flag-5'>語音</b>交互

    智能收銀語音交互新標(biāo)桿—WT3000T8語音合成芯片TTS技術(shù)應(yīng)用解析

    一、行業(yè)應(yīng)用背景在零售業(yè)態(tài)智能化轉(zhuǎn)型的浪潮中,收銀設(shè)備正經(jīng)歷從功能型向服務(wù)型轉(zhuǎn)變的關(guān)鍵階段。WT3000T8語音合成芯片應(yīng)運(yùn)而生,專為滿足新零售場(chǎng)景下智能收銀終端的語音交互需求而設(shè)計(jì)。
    的頭像 發(fā)表于 04-24 08:45 ?274次閱讀
    <b class='flag-5'>智能</b>收銀<b class='flag-5'>語音</b>交互新標(biāo)桿—WT3000T8<b class='flag-5'>語音</b>合成芯片TTS<b class='flag-5'>技術(shù)</b>應(yīng)用解析

    智能語音交互方案在客服領(lǐng)域的應(yīng)用

    著客服行業(yè)的面貌,為企業(yè)和用戶帶來了全新的體驗(yàn)。 語音識(shí)別模型優(yōu)化私部署 方案:精準(zhǔn)高效,定制專屬服務(wù) 語音識(shí)別技術(shù)作為智能語音交互的基礎(chǔ),
    的頭像 發(fā)表于 04-11 14:35 ?290次閱讀

    HarmonyOS NEXT 應(yīng)用開發(fā)練習(xí):AI智能語音播報(bào)

    一、DEMO思路 在這個(gè)HarmonyOS NEXT原生應(yīng)用DEMO中,我們將使用ArkTS開發(fā)語言創(chuàng)建一個(gè)簡(jiǎn)單的AI智能語音播報(bào)應(yīng)用。 該應(yīng)用能夠接收用戶輸入的文本,并使用TTS
    發(fā)表于 01-06 15:33

    【「嵌入式系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)」閱讀體驗(yàn)】+ 基于語音識(shí)別的智能杯墊

    語音命令Q 識(shí)別,適用于智能家居控制、玩具、人機(jī)交互等多個(gè)領(lǐng)域。該模塊以其高識(shí)別率、低功耗和易于集成的特點(diǎn)受到廣大開發(fā)者的青睞。 主要技術(shù)及功能有: 磁力攪拌、重量采集、語音識(shí)別、
    發(fā)表于 01-02 18:15

    解鎖個(gè)性化語音交互新時(shí)代:九芯智能語音云平臺(tái),讓創(chuàng)意聲音觸手可及!

    九芯智能語音云平臺(tái)提供全面高效安全的智能語音服務(wù),支持自定義語音內(nèi)容,簡(jiǎn)化燒錄流程,依托AI技術(shù)
    的頭像 發(fā)表于 01-02 16:51 ?898次閱讀
    解鎖個(gè)性化<b class='flag-5'>語音</b>交互新時(shí)代:九芯<b class='flag-5'>智能</b><b class='flag-5'>語音</b>云平臺(tái),讓創(chuàng)意聲音觸手可及!

    離線語音識(shí)別技術(shù)引領(lǐng)智能語音燈具市場(chǎng)——NRK3502

    智能語音燈具集高科技與人性化設(shè)計(jì),內(nèi)置NRK3502離線語音識(shí)別芯片,支持遠(yuǎn)場(chǎng)識(shí)別與自定義指令,提供便捷智能體驗(yàn),推動(dòng)智能家居行業(yè)發(fā)展。
    的頭像 發(fā)表于 12-30 15:04 ?765次閱讀
    離線<b class='flag-5'>語音</b>識(shí)別<b class='flag-5'>技術(shù)</b>引領(lǐng)<b class='flag-5'>智能</b><b class='flag-5'>語音</b>燈具市場(chǎng)——NRK3502

    基于語音識(shí)別的智能會(huì)議系統(tǒng)具備哪些交互功能

    標(biāo)貝科技專注智能語音交互領(lǐng)域多年,在語音識(shí)別和語音合成領(lǐng)域有著多項(xiàng)大型企業(yè)合作案例,標(biāo)貝與多個(gè)智能會(huì)議系統(tǒng)廠商合作,成功將
    的頭像 發(fā)表于 12-20 10:35 ?588次閱讀

    標(biāo)貝智能語音識(shí)別在智能會(huì)議場(chǎng)景中的落地案例

    標(biāo)貝科技專注智能語音交互領(lǐng)域多年,在語音識(shí)別和語音合成領(lǐng)域有著多項(xiàng)大型企業(yè)合作案例,標(biāo)貝與多個(gè)智能會(huì)議系統(tǒng)廠商合作,成功將
    的頭像 發(fā)表于 12-20 10:31 ?751次閱讀
    標(biāo)貝<b class='flag-5'>智能</b><b class='flag-5'>語音</b>識(shí)別在<b class='flag-5'>智能</b>會(huì)議場(chǎng)景中的落地案例

    基于智能語音交互的智能呼叫中心工作機(jī)制

    作為實(shí)現(xiàn)智能呼叫中心的關(guān)鍵技術(shù)之一的智能語音交互技術(shù),它通過集成自然語言處理(NLP)、語音識(shí)別
    的頭像 發(fā)表于 12-03 16:44 ?713次閱讀
    基于<b class='flag-5'>智能</b><b class='flag-5'>語音</b>交互的<b class='flag-5'>智能</b>呼叫中心工作機(jī)制

    智能語音的驅(qū)動(dòng)力:揭秘8腳語音芯片在智能設(shè)備中的非凡角色

    語音技術(shù)滲透生活,8腳語音芯片以微縮體積、低功耗、卓越性能成智能設(shè)備語音功能核心,集成識(shí)別、合成、壓縮解碼等功能,實(shí)現(xiàn)精準(zhǔn)
    的頭像 發(fā)表于 12-02 14:23 ?529次閱讀

    語音識(shí)別技術(shù)的應(yīng)用與發(fā)展

    語音識(shí)別技術(shù)的發(fā)展可以追溯到20世紀(jì)50年代,但直到近年來,隨著計(jì)算能力的提升和機(jī)器學(xué)習(xí)技術(shù)的進(jìn)步,這項(xiàng)技術(shù)才真正成熟并廣泛應(yīng)用于各個(gè)領(lǐng)域。語音
    的頭像 發(fā)表于 11-26 09:20 ?1634次閱讀

    ASR語音識(shí)別技術(shù)應(yīng)用

    ASR(Automatic Speech Recognition)語音識(shí)別技術(shù),是計(jì)算機(jī)科學(xué)與人工智能領(lǐng)域的重要突破,能將人類語音轉(zhuǎn)換為文本,廣泛應(yīng)用于
    的頭像 發(fā)表于 11-18 15:12 ?2069次閱讀

    語音集成電路是指什么意思

    系統(tǒng)、智能家居等領(lǐng)域。以下是關(guān)于語音集成電路的介紹: 1. 語音集成電路的基本概念 語音集成電路是一種集成了多種語音處理功能的電子芯片。它能
    的頭像 發(fā)表于 09-30 15:44 ?891次閱讀