借助 NVIDIA GPU,亞馬遜Alexa語義識別模型的識別準確度提高了15%

近期，來自于約翰霍普金斯大學(xué)（John Hopkins University）和亞馬遜（Amazon）的研究人員們發(fā)布了一篇論文，介紹他們是如何通過訓(xùn)練一個深度學(xué)習(xí)系統(tǒng)來幫助亞馬遜Alexa語音助手識別并忽略那些并非是對她說的話，從而將其語義識別模型的識別準確度提高了15%。

研究人員在他們的論文中指出，“諸如Amazon Echo和Google Home的這類家用聲控設(shè)備都面臨著一個問題，那就是當周圍存在干擾聲源的時候，設(shè)備如何能夠照常地識別指令?！?/p>

為了讓Alexa更好地識別指令，研究人員訓(xùn)練了一個神經(jīng)網(wǎng)絡(luò)，來匹配和識別“喚醒詞”（通常是“Alexa”）以及緊隨其后的指令，并忽略那些來自于其他人或媒體設(shè)備的干擾。

研究人員介紹說：“這項任務(wù)的挑戰(zhàn)在于需要從含有特定詞匯的話語片段中學(xué)習(xí)使用者的語言習(xí)慣。借助于兩種不同的神經(jīng)網(wǎng)絡(luò)架構(gòu)，我們最終實現(xiàn)了這一目標。兩個神經(jīng)網(wǎng)絡(luò)架構(gòu)都是具有注意機制的序列到序列編碼器 - 解碼器網(wǎng)絡(luò)的變體?！?/p>

借助于NVIDIA V100 GPU和OpenSeq2Seq工具，用于序列到序列模型的分布式和混合精度訓(xùn)練，使用TensorFlow建立，團隊用1,200小時來自于Amazon Echo的實時英文數(shù)據(jù)訓(xùn)練他們的算法。

通過改進所開發(fā)的基線網(wǎng)絡(luò)，該團隊還添加了一個額外的輸入端，能夠通過優(yōu)先處理類似于錨字的語音來增強注意機制。研究人員總結(jié)說： “在訓(xùn)練期間，注意機制會自動學(xué)習(xí)喚醒詞的哪些聲學(xué)特征，以便在隨后的演講中尋找?！?/p>

該團隊還開發(fā)了一個mask-based模型，該模型能夠更加明確地將輸入語音與錨字的聲學(xué)輪廓相匹配。

最后的測試結(jié)果顯示：第一種方法的性能更好，達到了15%的改進；第二種模型也達到了13%的改進。

根據(jù)研究人員介紹，該算法在訓(xùn)練和推理過程中都采用了NVIDIA GPU。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

NVIDIA

NVIDIA

+關(guān)注

關(guān)注
14

文章
5309

瀏覽量
106412
亞馬遜

亞馬遜

+關(guān)注

關(guān)注
8

文章
2696

瀏覽量
84680

原文標題：借助AI研究，將亞馬遜Alexa語義識別準確度提高15%

文章出處：【微信號：NVIDIA-Enterprise，微信公眾號：NVIDIA英偉達企業(yè)解決方案】歡迎添加關(guān)注！文章轉(zhuǎn)載請注明出處。

NVIDIA英偉達企業(yè)解決方案
專欄

0 文章 0 閱讀 0 粉絲 0 點贊

關(guān)注個人主頁

Hot NVIDIA將深度學(xué)習(xí)引入計算機圖形領(lǐng)域以推動行業(yè)發(fā)展
Hot 一文講述Quadro RTX 5000帶來的性能提升

New 全新NVIDIA AI Blueprint精準檢測信用卡交易欺詐
New 通過NVIDIA Cosmos模型增強機器人學(xué)習(xí)

精選推薦
更多

文章

資料

帖子

AI通話的N種新玩法，讓科幻照進現(xiàn)實

腦極體
4小時前

170 閱讀

RKDC2025 | 視美泰亮相瑞芯微2025開發(fā)者大會，共探AIoT新藍海

視美泰
10小時前

277 閱讀

老化測試效率提升，高壓干簧繼電器究竟做對了什么？

Standexe_2021
10小時前

292 閱讀

光儲邊緣智能的核心演進方向:MCU + AFE + 通信 + AI 一體化設(shè)計

eeDesigner
12小時前

421 閱讀

線性穩(wěn)壓器和開關(guān)穩(wěn)壓器、串聯(lián)穩(wěn)壓器的區(qū)別

東芝半導(dǎo)體
12小時前

380 閱讀

電子報2011第18期

1132490654
9.37 MB

免費

0下載

應(yīng)用LMV232峰值系數(shù)不變的檢測器的基站閉環(huán)射頻功率控制

disobey
388 KB

1積分

0下載

vertx-pac4j Vert.x 3 Web應(yīng)用的安全庫

qjqb
0.03 MB

2積分

1下載

github-profile-summary GitHub資料?可視化展示工具

王剛
0.08 MB

2積分

1下載

TSSCrollStatusBar仿微博的下拉提示

石飛鵬
2.62 MB

2積分

1下載

省錢+環(huán)保+個性：打造一臺永不“過時”的自定義電腦！

早知
1天前

157 閱讀

【BPI-CanMV-K230D-Zero開發(fā)板體驗】+溫度大氣壓檢測及顯示

jinglixixi
1天前

370 閱讀

【RA-Eco-RA6M4開發(fā)板評測】+01+開箱測評+UART+PWM+LED

jf_18702540
2天前

344 閱讀

【VisionFive 2單板計算機試用體驗】2、打造復(fù)古游戲機（Batocera鏡像+FBNeo虛擬機，多款游戲ROM分享）

左岸cpx
2天前

356 閱讀

【BPI-CanMV-K230D-Zero開發(fā)板體驗】+兩種開發(fā)板間的比較

jinglixixi
2天前

317 閱讀

推薦專欄
更多

企業(yè)產(chǎn)品

資料

方案
更多

一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

搜索歷史

借助 NVIDIA GPU,亞馬遜Alexa語義識別模型的識別準確度提高了15%

評論