語音識別技術原理
語音識別系統(tǒng)提示客戶在新的場合使用新的口令密碼,這樣使用者不需要記住固定的口令,系統(tǒng)也不會被錄音欺騙。文本相關的聲音識別方法可以分為動態(tài)時間伸縮或隱馬爾可夫模型方法。文本無關聲音識別已經被研究很長時間了,不一致環(huán)境造成的性能下降是應用中的一個很大的障礙。
其工作原理:
動態(tài)時間伸縮方法使用瞬間的、變動倒頻。1963年Bogertetal出版了《回聲的時序倒頻分析》。通過交換字母順序,他們用一個含義廣泛的詞匯定義了一個新的信號處理技術,倒頻譜的計算通常使用快速傅立葉變換。
從1975年起,隱馬爾可夫模型變得很流行。運用隱馬爾可夫模型的方法,頻譜特征的統(tǒng)計變差得以測量。文本無關語音識別方法的例子有平均頻譜法、矢量量化法和多變量自回歸法。
平均頻譜法使用有利的倒頻距離,語音頻譜中的音位影響被平均頻譜去除。使用矢量量化法,語者的一套短期訓練的特征向量可以直接用來描繪語者的本質特征。但是,當訓練向量的數(shù)量很大時,這種直接的描繪是不切實際的,因為存儲和計算的量變得離奇的大。所以嘗試用矢量量化法去尋找有效的方法來壓縮訓練數(shù)據(jù)。Montacieetal在倒頻向量的時序中應用多變量自回歸模式來確定語者特征,取得了很好的效果。
想騙過語音識別系統(tǒng)要有高質量的錄音機,那不是很容易買到的。一般的錄音機不能記錄聲音的完整頻譜,錄音系統(tǒng)的質量損失也必須是非常低的。對于大多數(shù)的語音識別系統(tǒng),模仿的聲音都不會成功。用語音識別來辨認身份是非常復雜的,所以語音識別系統(tǒng)會結合個人身份號碼識別或芯片卡。
語音識別系統(tǒng)得益于廉價的硬件設備,大多數(shù)的計算機都有聲卡和麥克風,也很容易使用。但語音識別還是有一些缺點的。語音隨時間而變化,所以必須使用生物識別模板。語音也會由于傷風、嗓音沙啞、情緒壓力或是青春期而變化。語音識別系統(tǒng)比指紋識別系統(tǒng)有著較高的誤識率,因為人們的聲音不像指紋那樣獨特和唯一。對快速傅立葉變換計算來說,系統(tǒng)需要協(xié)同處理器和比指紋系統(tǒng)更多的效能。目前語音識別系統(tǒng)不適合移動應用或以電池為電源的系統(tǒng)。
更多精彩閱讀:
語音識別的兩個方法_語音識別的應用有哪些
語音識別的優(yōu)缺點_語音識別功能介紹
語音識別算法有哪些_語音識別特征提取方法
怎么實現(xiàn)語音識別_手機語音識別怎么設置
語音識別設置能刪除嗎_語音識別系統(tǒng)工作流程
-
語音識別技術
+關注
關注
0文章
55瀏覽量
13070
發(fā)布評論請先 登錄
普強信息入選2024語音識別技術公司TOP30榜單
語音識別技術在通信領域中的應用實例
離線語音識別技術引領智能語音燈具市場——NRK3502

基于語音識別的智能會議系統(tǒng)具備哪些交互功能
語音識別技術在醫(yī)療領域的應用
語音識別技術的應用與發(fā)展
基于語音識別技術的智能家居控制系統(tǒng)

ASR語音識別技術應用
基于Arm Neoverse N2實現(xiàn)自動語音識別技術

評論