語音識別技術(shù)的目標(biāo)是將人們語音中的詞匯內(nèi)容轉(zhuǎn)換為計算機(jī)可讀輸入,如按鈕、二進(jìn)制編碼或字符序列。語音識別就像一個“機(jī)器的聽覺系統(tǒng)”,它允許設(shè)備根據(jù)識別和理解將語音信號轉(zhuǎn)換為相應(yīng)的文本或指令。語音識別技術(shù)正逐漸成為計算機(jī)信息處理技術(shù)中的關(guān)鍵技術(shù)。
語音識別芯片的基本原理
語音識別芯片是將語音信號轉(zhuǎn)換為相應(yīng)的文本信息。該系統(tǒng)主要包括四個部分:特征提取、聲學(xué)模型、語言模型及其詞典和解碼。為了更有效地提取特征,通常需要對收集到的聲音信號進(jìn)行過濾、幀分析等預(yù)處理,從原始信號中提取要分析的信號;之后,特征提取工作將聲音信號從時域轉(zhuǎn)換為頻域,為聲學(xué)模型提供適當(dāng)?shù)奶卣飨蛄?聲學(xué)模型根據(jù)聲學(xué)特征計算每個特征向量在聲學(xué)特征中的評分;語言模型根據(jù)語言學(xué)相關(guān)理論計算聲音信號對應(yīng)短語序列的概率;最后,根據(jù)現(xiàn)有詞典對短語序列進(jìn)行解碼,獲得最終可能的文本表示。
語音識別芯片有三個原理:
1、語音信號中的語言信息編碼是根據(jù)幅度譜的時間變化進(jìn)行的;
2、由于語音是可以閱讀的,也就是說聲學(xué)信號可以在不考慮說話人說話傳達(dá)的信息內(nèi)容的前提下用多個具有區(qū)別性的、離散的符號來表示;
3、語音交互是一個認(rèn)知過程,因此不能與語法、詞義、術(shù)語規(guī)范等方面分開。
語音識別技術(shù)的工作流程
一般來說,一個完整的語音識別系統(tǒng)的工作過程分為七個步驟:
1、分析和處理語音信號,去除冗余信息。
2、獲取影響語音識別的重要信息和表達(dá)語言含義的特征信息。
3、圍繞特征信息,用最小單元識別單詞。
4、根據(jù)不同語言的各自語法,按順序識別單詞。
5、把前后含義為協(xié)助識別鑒定標(biāo)準(zhǔn),有利于分析識別。
6、根據(jù)語義分析,將重要信息劃分為段落,取出被識別的單詞并相互連接,并根據(jù)句子的含義調(diào)整句子的組成。
7、整合詞義,具體分析前后文的相互依存,適當(dāng)調(diào)整目前正在處理的句子。
英尚微所提供的超低功耗的離線智能語音識別芯片,集成了先進(jìn)的語音活動監(jiān)測(VAD)、聲紋識別、自動消噪神經(jīng)網(wǎng)絡(luò),擁有高效的電源管理模塊、數(shù)字和模擬語音信號輸入接口以及ARM Cortex-M0內(nèi)核,并且搭配了GPIO、UART、SPI、I2C、I2S 等片內(nèi)外設(shè)。在藍(lán)牙耳機(jī)、智能遙控、智能家居等場景中,能以更小的體積、極低的功耗實現(xiàn)離線語音識別功能。
審核編輯:湯梓紅
-
芯片
+關(guān)注
關(guān)注
460文章
52520瀏覽量
441057 -
語音識別
+關(guān)注
關(guān)注
39文章
1782瀏覽量
114249 -
語音識別芯片
+關(guān)注
關(guān)注
1文章
168瀏覽量
12351
發(fā)布評論請先 登錄
鐵路車號識別系統(tǒng)的基本原理與應(yīng)用

語音控制模塊工作原理

無刷電機(jī)電調(diào)的基本原理
NX CAD軟件:數(shù)字化工作流程解決方案(CAD工作流程)

AI工作流自動化是做什么的
用CPLD控制ADS7229,工作流程是怎么樣的?
ASR語音識別技術(shù)應(yīng)用
RNN的基本原理與實現(xiàn)
淺談無刷電機(jī)的工作流程

語音識別機(jī)器人的工作原理
物聯(lián)網(wǎng)系統(tǒng)智能控制產(chǎn)品的語音識別方案_離線語音識別芯片分析

智能玩具用離線語音識別芯片有什么優(yōu)勢

評論