一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

借助 NVIDIA GPU,亞馬遜Alexa語義識別模型的識別準確度提高了15%

NVIDIA英偉達企業(yè)解決方案 ? 來源:YXQ ? 2019-05-09 15:01 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

近期,來自于約翰霍普金斯大學(xué)(John Hopkins University)和亞馬遜(Amazon)的研究人員們發(fā)布了一篇論文,介紹他們是如何通過訓(xùn)練一個深度學(xué)習(xí)系統(tǒng)來幫助亞馬遜Alexa語音助手識別并忽略那些并非是對她說的話,從而將其語義識別模型的識別準確度提高了15%。

研究人員在他們的論文中指出,“諸如Amazon Echo和Google Home的這類家用聲控設(shè)備都面臨著一個問題,那就是當周圍存在干擾聲源的時候,設(shè)備如何能夠照常地識別指令?!?/p>

為了讓Alexa更好地識別指令,研究人員訓(xùn)練了一個神經(jīng)網(wǎng)絡(luò),來匹配和識別“喚醒詞”(通常是“Alexa”)以及緊隨其后的指令,并忽略那些來自于其他人或媒體設(shè)備的干擾。

研究人員介紹說:“這項任務(wù)的挑戰(zhàn)在于需要從含有特定詞匯的話語片段中學(xué)習(xí)使用者的語言習(xí)慣。借助于兩種不同的神經(jīng)網(wǎng)絡(luò)架構(gòu),我們最終實現(xiàn)了這一目標。兩個神經(jīng)網(wǎng)絡(luò)架構(gòu)都是具有注意機制的序列到序列編碼器 - 解碼器網(wǎng)絡(luò)的變體?!?/p>

借助于NVIDIA V100 GPU和OpenSeq2Seq工具,用于序列到序列模型的分布式和混合精度訓(xùn)練,使用TensorFlow建立,團隊用1,200小時來自于Amazon Echo的實時英文數(shù)據(jù)訓(xùn)練他們的算法。

通過改進所開發(fā)的基線網(wǎng)絡(luò),該團隊還添加了一個額外的輸入端,能夠通過優(yōu)先處理類似于錨字的語音來增強注意機制。研究人員總結(jié)說: “在訓(xùn)練期間,注意機制會自動學(xué)習(xí)喚醒詞的哪些聲學(xué)特征,以便在隨后的演講中尋找?!?/p>

該團隊還開發(fā)了一個mask-based模型,該模型能夠更加明確地將輸入語音與錨字的聲學(xué)輪廓相匹配。

最后的測試結(jié)果顯示:第一種方法的性能更好,達到了15%的改進;第二種模型也達到了13%的改進。

根據(jù)研究人員介紹,該算法在訓(xùn)練和推理過程中都采用了NVIDIA GPU。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5309

    瀏覽量

    106412
  • 亞馬遜
    +關(guān)注

    關(guān)注

    8

    文章

    2696

    瀏覽量

    84680

原文標題:借助AI研究,將亞馬遜Alexa語義識別準確度提高15%

文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    關(guān)于CAPSENSE?每個 Vref 電壓的準確度的疑問求解

    我認為CAPSENSE?在感應(yīng)電容時使用 Vref 電壓值。 根據(jù)組件數(shù)據(jù)表,Vref 電壓值根據(jù) VDDA 設(shè)置而變化。 PSoC? 4 電容式感應(yīng) ( CAPSENSE? ) 您能否告訴我們每個 Vref 電壓(從 1.2V 到 2.743V)的準確度?
    發(fā)表于 07-15 07:35

    電工儀表準確度等級詳解

    一、準確度等級的定義 以下是“JJF1001-2011通用計量術(shù)語”對準確度準確度等級的相關(guān)定義: 1、測量準確度 measurement accuracy,sccuracy
    的頭像 發(fā)表于 05-19 10:20 ?854次閱讀
    電工儀表<b class='flag-5'>準確度</b>等級詳解

    亞馬遜升級版Alexa推遲發(fā)布

    。 此次延遲發(fā)布的原因之一,在于升級后的Alexa在測試階段暴露出了一些問題。據(jù)一位匿名的亞馬遜員工透露,盡管升級版Alexa在智能交互和語音識別等方面取得了顯著進步,但在實際應(yīng)用中卻
    的頭像 發(fā)表于 02-17 14:02 ?703次閱讀

    《CST Studio Suite 2024 GPU加速計算指南》

    監(jiān)控/利用率、選擇可用GPU卡子集等內(nèi)容。 6. 故障排除:針對NVIDIA驅(qū)動安裝、多GPU設(shè)置、GPU模式、硬件識別、CUDA錯誤、TC
    發(fā)表于 12-16 14:25

    如何提升人臉門禁一體機的識別準確率?

    人臉門禁一體機作為現(xiàn)代安全管理的重要設(shè)備,廣泛應(yīng)用于企業(yè)、學(xué)校、社區(qū)等多個場所。其高效便捷的特性讓人們可以快速通過門禁,然而,識別準確率的高低直接影響到使用體驗與安全性。為了提高人臉門禁一體機的
    的頭像 發(fā)表于 12-10 15:05 ?1005次閱讀
    如何提升人臉門禁一體機的<b class='flag-5'>識別</b><b class='flag-5'>準確</b>率?

    語音識別技術(shù)在醫(yī)療領(lǐng)域的應(yīng)用

    轉(zhuǎn)換醫(yī)療病歷。這一過程不僅提高了病歷的準確性和完整性,還方便了醫(yī)生和患者的隨時查閱。電子病歷還可以實現(xiàn)自動分類和歸檔,極大地提高了醫(yī)療管理效率。此外,醫(yī)生可以通過口述快速記錄患者信息,節(jié)省手寫時間,從而將更多
    的頭像 發(fā)表于 11-26 09:35 ?1213次閱讀

    語音識別技術(shù)的應(yīng)用與發(fā)展

    語音識別技術(shù)的發(fā)展可以追溯到20世紀50年代,但直到近年來,隨著計算能力的提升和機器學(xué)習(xí)技術(shù)的進步,這項技術(shù)才真正成熟并廣泛應(yīng)用于各個領(lǐng)域。語音識別技術(shù)的應(yīng)用不僅提高了工作效率,也極大地改善了用戶
    的頭像 發(fā)表于 11-26 09:20 ?1634次閱讀

    AFE4404可否用于運動時心率檢測?準確度如何?

    AFE4404可否用于運動時心率檢測?準確度如何?
    發(fā)表于 11-19 08:26

    ASR與傳統(tǒng)語音識別的區(qū)別

    識別技術(shù)。 構(gòu)建更深更復(fù)雜的神經(jīng)網(wǎng)絡(luò)模型,利用大量數(shù)據(jù)進行訓(xùn)練。 提高了語音識別準確率和穩(wěn)定性。 傳統(tǒng)語音
    的頭像 發(fā)表于 11-18 15:22 ?1352次閱讀

    亞馬遜基于人工智能的Alexa發(fā)布計劃延期至明年

    11月1日外媒報道稱,亞馬遜已將基于人工智能技術(shù)全新打造的正版Alexa發(fā)布計劃延期至明年。   亞馬遜最初于去年9月公開了新版Alexa的規(guī)劃,意在通過集成AI大
    的頭像 發(fā)表于 11-01 15:19 ?1012次閱讀

    隧道門禁人臉識別系統(tǒng)是專為隧道安全管理設(shè)計的先進技術(shù)系統(tǒng)

    ,有效防止了誤識別和漏識別的情況發(fā)生。 多角度識別:支持多角度的人臉采集和識別,施工人員在不同的行走姿態(tài)和角度下靠近門禁時,系統(tǒng)都能快速準確
    的頭像 發(fā)表于 10-29 14:51 ?649次閱讀
    隧道門禁人臉<b class='flag-5'>識別</b>系統(tǒng)是專為隧道安全管理設(shè)計的先進技術(shù)系統(tǒng)

    GPU深度學(xué)習(xí)應(yīng)用案例

    能力,可以顯著提高圖像識別模型的訓(xùn)練速度和準確性。例如,在人臉識別、自動駕駛等領(lǐng)域,GPU被廣泛
    的頭像 發(fā)表于 10-27 11:13 ?1368次閱讀

    AI大模型在圖像識別中的優(yōu)勢

    模型借助高性能的計算硬件和優(yōu)化的算法,能夠在短時間內(nèi)完成對大量圖像數(shù)據(jù)的處理和分析,顯著提高了圖像識別的效率。 識別
    的頭像 發(fā)表于 10-23 15:01 ?2437次閱讀

    【飛凌嵌入式OK3576-C開發(fā)板體驗】RKNN神經(jīng)網(wǎng)絡(luò)-車牌識別

    LPRNet基于深層神經(jīng)網(wǎng)絡(luò)設(shè)計,通過輕量級的卷積神經(jīng)網(wǎng)絡(luò)實現(xiàn)車牌識別。它采用端到端的訓(xùn)練方式,不依賴字符分割,能夠直接處理整張車牌圖像,并輸出最終的字符序列。這種設(shè)計提高了識別的實時性和準確
    發(fā)表于 10-10 16:40

    魔搭社區(qū)借助NVIDIA TensorRT-LLM提升LLM推理效率

    “魔搭社區(qū)是中國最具影響力的模型開源社區(qū),致力給開發(fā)者提供模型即服務(wù)的體驗。魔搭社區(qū)利用NVIDIA TensorRT-LLM,大大提高了大語言模型
    的頭像 發(fā)表于 08-23 15:48 ?1140次閱讀