一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

研究證明:商業(yè)語(yǔ)音識(shí)別系統(tǒng)的錯(cuò)誤率非常高

如意 ? 來(lái)源:雷鋒網(wǎng) ? 作者:楊麗 ? 2020-10-26 16:34 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

某些語(yǔ)音識(shí)別系統(tǒng)(ASR)的準(zhǔn)確性可能要比之前假定的差很多?!边@是最近約翰·霍普金斯大學(xué)、波蘭波茲南工業(yè)大學(xué)、弗羅茨瓦夫科技大學(xué)以及初創(chuàng)公司Avaya的研究人員一項(xiàng)正在進(jìn)行的研究主要發(fā)現(xiàn)。

這項(xiàng)研究對(duì)內(nèi)部創(chuàng)建的數(shù)據(jù)集上的商業(yè)語(yǔ)音識(shí)別模型進(jìn)行了基準(zhǔn)測(cè)試。共同作者聲稱(chēng),詞錯(cuò)誤率(Word Error Rate, WER)(一種常見(jiàn)的語(yǔ)音識(shí)別性能指標(biāo))要顯著高于最佳報(bào)告結(jié)果,這可能表明自然語(yǔ)言處理(NLP)領(lǐng)域存在更多待克服的問(wèn)題。

據(jù)了解,目前ASR已廣泛應(yīng)用于諸多場(chǎng)景中,如電話會(huì)議、電子郵件、智能設(shè)備等。ASR模型的綜合基準(zhǔn)中,標(biāo)準(zhǔn)語(yǔ)料庫(kù)的WER僅有2%~3%,而正是這一統(tǒng)計(jì)數(shù)據(jù)遭到了上述作者的質(zhì)疑。他們聲稱(chēng),大多數(shù)ASR的交互場(chǎng)景都是在“類(lèi)似于聊天機(jī)器人”的背景下進(jìn)行的,說(shuō)話人往往因?yàn)橐庾R(shí)到跟他們的交互對(duì)象是聊天機(jī)器人,因此通常會(huì)將命令簡(jiǎn)化成結(jié)構(gòu)緊湊的簡(jiǎn)短詞語(yǔ),而非正常的自然對(duì)話。作者基于來(lái)自1595個(gè)供應(yīng)商和1261個(gè)客戶的50個(gè)呼叫中心對(duì)話數(shù)據(jù)集對(duì)幾套ASR系統(tǒng)進(jìn)行了評(píng)估。其通常時(shí)間長(zhǎng)達(dá)8.5個(gè)小時(shí),其中2.2個(gè)小時(shí)是對(duì)話。通過(guò)測(cè)試,作者發(fā)現(xiàn)ASR系統(tǒng)的錯(cuò)誤率基本在15%以下,這與基準(zhǔn)測(cè)試中的2%相悖。

研究證明:商業(yè)語(yǔ)音識(shí)別系統(tǒng)的錯(cuò)誤率非常高

而基于保險(xiǎn)、通信、預(yù)定等金融行業(yè)的語(yǔ)料庫(kù)中,作者發(fā)現(xiàn)其WER的測(cè)試結(jié)果高達(dá)23.31%。其中,預(yù)定和通信的錯(cuò)誤率最高,可能是因?yàn)閷?duì)話涉及特定的日期、時(shí)間、訂單金額、地點(diǎn)、產(chǎn)品和公司名稱(chēng)等。但在所有領(lǐng)域的測(cè)試中,其錯(cuò)誤率均高于13.73%。

研究人員將這一問(wèn)題歸結(jié)為領(lǐng)域適應(yīng)性問(wèn)題——基準(zhǔn)測(cè)試使用了單一性語(yǔ)料,例如Librispeech(1000小時(shí)英語(yǔ)有聲讀物錄音)、WSJ(新聞口述的談話)和Switchboard(電話交談),這些都可能太過(guò)簡(jiǎn)單而無(wú)法真正挑戰(zhàn)ASR系統(tǒng)的可靠性。

而且,盡管他們?cè)噲D刻意模仿真實(shí)、自發(fā)的對(duì)話,但本質(zhì)上還是受約束的,比如需要配音演員,就某一合適主題進(jìn)行腳本/半腳本對(duì)話,而且正是由于配音演員的存在,幾乎都不需要考慮因性別、母語(yǔ)因素而產(chǎn)生的發(fā)音問(wèn)題。

作為一種補(bǔ)救措施,研究人員建議ASR和NLP社區(qū)收集和注釋音頻數(shù)據(jù)集,使其更好地與ASR系統(tǒng)的實(shí)際應(yīng)用場(chǎng)景保持一致,他們還呼吁建立更具包容性的聲學(xué)模型,更廣泛的方言語(yǔ)料庫(kù),這些改變將會(huì)促進(jìn)音頻信號(hào)處理的技術(shù)改進(jìn)。

因此,這些問(wèn)題并非無(wú)法克服?!皩W(xué)界和工業(yè)界應(yīng)該深思熟慮,考慮可以創(chuàng)建高質(zhì)量的測(cè)試數(shù)據(jù)集。我們認(rèn)為,對(duì)ASR準(zhǔn)確性的過(guò)于樂(lè)觀會(huì)損害NLP領(lǐng)域下游應(yīng)用程序的開(kāi)發(fā)?!毖芯咳藛T最后表示。
責(zé)編AJX

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 軟件
    +關(guān)注

    關(guān)注

    69

    文章

    5152

    瀏覽量

    89209
  • 語(yǔ)音識(shí)別
    +關(guān)注

    關(guān)注

    39

    文章

    1780

    瀏覽量

    114220
  • ASR
    ASR
    +關(guān)注

    關(guān)注

    2

    文章

    44

    瀏覽量

    19133
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    工地AI行為識(shí)別系統(tǒng)作用

    等),并即時(shí)預(yù)警,幫助工地實(shí)現(xiàn)從“人防”到“技防”的轉(zhuǎn)型升級(jí)。 為什么工地需要AI行為識(shí)別系統(tǒng)? 1、事故頻發(fā),安全難保障 工地環(huán)境復(fù)雜,工人違規(guī)操作、防護(hù)缺失等問(wèn)題頻出,傳統(tǒng)人工巡檢難以及時(shí)發(fā)現(xiàn)風(fēng)險(xiǎn)。 2、監(jiān)管成本,效率低 2
    的頭像 發(fā)表于 05-08 12:00 ?271次閱讀

    景區(qū)AI行為識(shí)別系統(tǒng)作用

    景區(qū)AI行為識(shí)別系統(tǒng)作用 景區(qū)AI行為識(shí)別系統(tǒng)是什么? 景區(qū)AI行為識(shí)別系統(tǒng)是利用人工智能技術(shù)(如視頻分析、人臉識(shí)別)構(gòu)建的智能管理方案。通過(guò)部署攝像頭+AI算法,實(shí)時(shí)監(jiān)控游客行為,自
    的頭像 發(fā)表于 05-07 15:32 ?299次閱讀
    景區(qū)AI行為<b class='flag-5'>識(shí)別系統(tǒng)</b>作用

    工廠園區(qū)AI行為識(shí)別系統(tǒng)作用

    工廠園區(qū)AI行為識(shí)別系統(tǒng)作用 工廠園區(qū)AI行為識(shí)別系統(tǒng)是什么? 工廠園區(qū)AI行為識(shí)別系統(tǒng)是基于人工智能技術(shù)的智能化管理方案,通過(guò)攝像頭與AI算法融合,實(shí)時(shí)監(jiān)控人員行為、設(shè)備操作寄環(huán)境狀態(tài),自動(dòng)
    的頭像 發(fā)表于 05-06 17:49 ?237次閱讀

    普強(qiáng)信息入選2024語(yǔ)音識(shí)別技術(shù)公司TOP30榜單

    企業(yè)數(shù)字化升級(jí),這一榮譽(yù)不僅體現(xiàn)了普強(qiáng)在語(yǔ)音交互、語(yǔ)義理解、多語(yǔ)種識(shí)別等核心技術(shù)上的領(lǐng)先優(yōu)勢(shì),更是對(duì)普強(qiáng)自主研發(fā)的端到端語(yǔ)音識(shí)別系統(tǒng)噪聲
    的頭像 發(fā)表于 04-18 17:25 ?631次閱讀

    岸橋箱號(hào)識(shí)別系統(tǒng)的工作原理 #人工智能 #識(shí)別系統(tǒng)

    識(shí)別系統(tǒng)
    jf_60141436
    發(fā)布于 :2025年03月24日 09:28:11

    OpenAI攻克Sora視頻創(chuàng)建錯(cuò)誤率高難題

    在人工智能與多媒體技術(shù)的交叉領(lǐng)域,OpenAI近期宣布了一項(xiàng)重要進(jìn)展:成功解決了Sora視頻創(chuàng)建過(guò)程中錯(cuò)誤率的問(wèn)題。這一突破不僅標(biāo)志著OpenAI在視頻處理技術(shù)上取得了顯著進(jìn)步,也為廣大用戶帶來(lái)
    的頭像 發(fā)表于 12-31 10:37 ?533次閱讀

    RFID識(shí)別系統(tǒng)

    隨著信息技術(shù)的快速發(fā)展,RFID(射頻識(shí)別)技術(shù)在各行各業(yè)的應(yīng)用日益廣泛,其中RFID識(shí)別系統(tǒng)作為核心應(yīng)用,已經(jīng)成為智能化管理不可或缺的基石。通過(guò)無(wú)線射頻信號(hào)的非接觸式識(shí)別與數(shù)據(jù)傳輸,RFID
    的頭像 發(fā)表于 12-06 17:57 ?1089次閱讀
    RFID<b class='flag-5'>識(shí)別系統(tǒng)</b>

    多目標(biāo)智能識(shí)別系統(tǒng)

    智慧華盛恒輝多目標(biāo)智能識(shí)別系統(tǒng)是一種利用現(xiàn)代計(jì)算機(jī)視覺(jué)技術(shù)和人工智能算法,從圖像或視頻中同時(shí)識(shí)別和分類(lèi)多個(gè)目標(biāo)物體的系統(tǒng)。這種系統(tǒng)廣泛應(yīng)用于自動(dòng)駕駛、智能監(jiān)控、人機(jī)交互、軍事偵察、災(zāi)害
    的頭像 發(fā)表于 07-16 10:42 ?3.4w次閱讀