完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>
標(biāo)簽 > 語音識別
語音識別是一門交叉學(xué)科。近二十年來,語音識別技術(shù)取得顯著進(jìn)步,開始從實驗室走向市場。人們預(yù)計,未來10年內(nèi),語音識別技術(shù)將進(jìn)入工業(yè)、家電、通信、汽車電子、醫(yī)療、家庭服務(wù)、消費電子產(chǎn)品等各個領(lǐng)域。 語音識別聽寫機在一些領(lǐng)域的應(yīng)用被美國新聞界評為1997年計算機發(fā)展十件大事之一。
文章:1479個 瀏覽:114081次 帖子:332個
利用機器學(xué)習(xí)算法中的深度神經(jīng)網(wǎng)絡(luò),識別音樂類型等聽覺任務(wù)上模擬人類表現(xiàn)的模型
當(dāng)神經(jīng)網(wǎng)絡(luò)在20世紀(jì)80年代首次出現(xiàn)時,神經(jīng)科學(xué)家們希望這種系統(tǒng)可以用來模擬人腦。然而,來自那個時代的計算機不夠強大,無法建立足夠大的模型來進(jìn)行一些實際...
2018-04-30 標(biāo)簽:神經(jīng)網(wǎng)絡(luò)語音識別機器學(xué)習(xí) 4385 0
除了使用了depth-wise可分離卷積層以外,殘差連接以及在每一層上都采取了批歸一化的技巧對訓(xùn)練有促進(jìn)作用,整個網(wǎng)絡(luò)共有約500萬個參數(shù)。
圖靈機器人有三個基本功能: (1)語音識別:將語音識別成相應(yīng)的文本。 (2)語義理解:將文本識別成領(lǐng)域相關(guān)的語義結(jié)果。 (3)語音合成 : 將文本轉(zhuǎn)化成...
在某一時刻,我們現(xiàn)在知道的Windows計算機是由MS-DOS操作系統(tǒng)組成的,Windows是一個在操作系統(tǒng)之上運行的圖形用戶界面(GUI),因此GUI...
一種改進(jìn)的前饋序列記憶神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
最早提出的FSMN的模型結(jié)構(gòu)如圖1(a)所示,其本質(zhì)上是一個前饋全連接神經(jīng)網(wǎng)絡(luò),通過在隱層旁添加一些記憶模塊(memory block)來對周邊的上下文...
2018-03-19 標(biāo)簽:神經(jīng)網(wǎng)絡(luò)語音識別 7393 0
感應(yīng)應(yīng)用的物理體積越來越小。無論您是設(shè)計出需要在工廠中收集的遠(yuǎn)程工業(yè)傳感器節(jié)點(圖1),抑或是下一個智能穿戴式設(shè)備的傳感器,空間正成為一種稀缺資源。 另...
語音控制和操作的游戲和玩具、幫助殘疾人的語音識別系統(tǒng)、車輛行駛中一些非關(guān)鍵功能的語音控制,如車載交通路況控制系統(tǒng)、音響系統(tǒng)。
大聯(lián)推出基于新唐科技的智能語音識別設(shè)計方案
致力于亞太地區(qū)市場的領(lǐng)先半導(dǎo)體元器件分銷商---大聯(lián)大控股宣布,其旗下品佳推出基于新唐科技(Nuvoton)ISD9160+Cyberon算法的語音識別...
當(dāng)今的消費者對技術(shù)的要求日益提升,這一點在用于與設(shè)備進(jìn)行互動的界面技術(shù)上體現(xiàn)得尤為明顯。人們對包括手機、車載電子、家用網(wǎng)絡(luò)和辦公環(huán)境下的設(shè)備要求越來越高...
在大多數(shù)傳統(tǒng)的自動語音識別(automatic speech recognition,ASR)系統(tǒng)中,不同的語言(方言)是被獨立考慮的,一般會對每種語言...
2018-02-04 標(biāo)簽:語音識別技術(shù)語音識別 7181 0
基于AVR的語音識別助老助殘室內(nèi)行走服務(wù)系統(tǒng)設(shè)計方案
全世界60歲以上的老年人口已達(dá)到6億左右,人口老齡化已成為世界范圍的重大社會問題。我國60歲及以上老年人口已達(dá)1.32億,占全國總?cè)丝诘?0%,并以年均...
10種常見的軟件體系架構(gòu)模式分析以及它們的用法、優(yōu)缺點
架構(gòu)模式是一個通用的、可重用的解決方案,用于在給定上下文中的軟件體系結(jié)構(gòu)中經(jīng)常出現(xiàn)的問題。架構(gòu)模式與軟件設(shè)計模式類似,但具有更廣泛的范圍。
2018-01-31 標(biāo)簽:編程數(shù)據(jù)庫語音識別 2.2萬 0
基于Cortex-M處理器上實現(xiàn)高精度關(guān)鍵詞語音識別
我們可以對神經(jīng)網(wǎng)絡(luò)架構(gòu)進(jìn)行優(yōu)化,使之適配微控制器的內(nèi)存和計算限制范圍,并且不會影響精度。我們將在本文中解釋和探討深度可分離卷積神經(jīng)網(wǎng)絡(luò)在 Cortex-...
確定最佳深度可以降低運算成本,同時可以進(jìn)一步提高精度。針對深度置信網(wǎng)絡(luò)深度選擇的問題,文章分析了通過設(shè)定閾值方法選擇最佳深度的不足之處。
2018-04-04 標(biāo)簽:語音識別深度學(xué)習(xí) 4103 0
本文主要介紹了人機交互的方式有哪些_未來的人機交互方式淺談。人機交互技術(shù)是指通過計算機輸入、輸出設(shè)備,以有效的方式實現(xiàn)人與計算機對話的技術(shù)?,F(xiàn)在的人機交...
介紹一種適合家電遙控器應(yīng)用的語音識別算法,該算法使用雙模塊和兩級端點檢測方法,能有效地提高識別和穩(wěn)健性;介紹利用該技術(shù)實現(xiàn)的一種新型學(xué)習(xí)型遙控器,展現(xiàn)了...
基于模糊神經(jīng)網(wǎng)絡(luò)的語音識別系統(tǒng)
語音識別技術(shù)是近年來高速發(fā)展的一項技術(shù),由于其重要的理論價值與廣闊的應(yīng)用前景,受到人們的廣泛重視。語音是一個復(fù)雜的非線性過程,基于線性系統(tǒng)理論的語音識別...
2017-12-31 標(biāo)簽:語音識別模糊神經(jīng)網(wǎng)絡(luò) 5544 0
對于谷歌應(yīng)用傳統(tǒng)的自動語音識別(ASR)系統(tǒng)的解析
目前,谷歌的各種語音搜索應(yīng)用還在使用傳統(tǒng)的自動語音識別(ASR)系統(tǒng),它包括一個包括聲學(xué)模型(AM )、一個發(fā)音模型(PM)和一個語言模型(LM),它們...