完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>
標(biāo)簽 > 語音識別
語音識別是一門交叉學(xué)科。近二十年來,語音識別技術(shù)取得顯著進(jìn)步,開始從實(shí)驗(yàn)室走向市場。人們預(yù)計(jì),未來10年內(nèi),語音識別技術(shù)將進(jìn)入工業(yè)、家電、通信、汽車電子、醫(yī)療、家庭服務(wù)、消費(fèi)電子產(chǎn)品等各個領(lǐng)域。 語音識別聽寫機(jī)在一些領(lǐng)域的應(yīng)用被美國新聞界評為1997年計(jì)算機(jī)發(fā)展十件大事之一。
文章:1479個 瀏覽:114075次 帖子:332個
人工智能是從一開始就伴隨著電子計(jì)算機(jī)的發(fā)明而興起的。但是直到2012年,深度學(xué)習(xí)在圖像識別上引發(fā)突破,機(jī)器學(xué)習(xí)的應(yīng)用才變得如此普遍。
人機(jī)交互設(shè)計(jì)原則是什么 人機(jī)交互常用的交互方式
人機(jī)交互設(shè)計(jì)原則是指為了提高用戶體驗(yàn)和效果,指導(dǎo)設(shè)計(jì)師在設(shè)計(jì)用戶界面和交互過程中應(yīng)遵循的一系列原則。以下是一些常見的人機(jī)交互設(shè)計(jì)原則: 1. 可用...
Vuzix AR眼鏡支持簡單的 AI 運(yùn)算,比如圖片識別、人臉識別、瑕疵檢測、語音識別、語音轉(zhuǎn)文字等,提供更加多樣化的服務(wù)。在汽車設(shè)計(jì)過程中,AR眼鏡可...
語音應(yīng)用中Transformer和循環(huán)神經(jīng)網(wǎng)絡(luò)的比較
在Transformer中,注意力圖的某些頭部并不總是像Tacotron 2中那樣是對角線的。因此,我們需要選擇在哪些位置應(yīng)用引導(dǎo)性注意力損失[24]。...
2023-07-24 標(biāo)簽:變壓器神經(jīng)網(wǎng)絡(luò)語音識別 1202 0
基于Kaldi的語音識別引擎的架構(gòu)設(shè)計(jì)方案
58自研語音識別引擎,最初是基于Kaldi框架進(jìn)行開發(fā),在自研初期上線了架構(gòu)1.0版本,后續(xù)以降低機(jī)器資源、提升資源利用率、優(yōu)化性能為目標(biāo)進(jìn)行了升級重構(gòu)...
【英飛凌PSoC 6 RTT開發(fā)板試用】語音識別之一:移植CMSIS-DSP庫-FFT測試
后面會基于本開發(fā)板實(shí)現(xiàn)語音識別,需要使用到FFT等關(guān)鍵算法,所以先移植CMSIS-DSP庫,并進(jìn)行FFT的測試。
本篇文章就采用華為云提供的在線語音識別服務(wù)給瀏覽器設(shè)計(jì)一個語音自動搜索的功能,編程語言采用C++,軟件框架采用QT設(shè)計(jì),瀏覽器內(nèi)核采用QWebEngin...
2023-07-10 標(biāo)簽:物聯(lián)網(wǎng)AI語音識別 2163 0
智能語音識別藍(lán)牙耳機(jī)設(shè)計(jì)方案
隨著智能手機(jī)的普及,使用藍(lán)牙耳機(jī)的用戶越來越多,尤其是騎行或步行用戶。由于藍(lán)牙耳機(jī)體型較小,按鍵很少,一些藍(lán)牙耳機(jī)需要按組合鍵來完成相應(yīng)操作,因此造成藍(lán)...
2023-07-04 標(biāo)簽:電路設(shè)計(jì)藍(lán)牙耳機(jī)AI 2217 0
常見的音頻處理技術(shù)有哪些 音頻處理技術(shù)的應(yīng)用領(lǐng)域
音頻處理技術(shù)在手機(jī)通話、視頻會議、語音助手等通信和語音識別領(lǐng)域發(fā)揮著重要作用,提供清晰的聲音傳輸和準(zhǔn)確的語音識別功能。
頻譜的應(yīng)用十分廣泛,涵蓋了信號處理、通信、音頻處理、故障診斷、圖像處理等多個領(lǐng)域,為我們理解和處理不同類型信號的頻率特性提供了重要手段和工具。
2023-06-15 標(biāo)簽:信號處理通信系統(tǒng)語音識別 5082 0
語音遙控器的研發(fā)并沒有朝著“黑科技”的方向發(fā)展,而是在不斷地考慮如何降低使用門檻。如今家家戶戶都有“一老一小”,中國移動智慧家庭也聯(lián)合科大訊飛成立智能聯(lián)...
機(jī)器學(xué)習(xí)挑戰(zhàn):如何避免機(jī)器學(xué)習(xí)模型過擬合?
分類是機(jī)器學(xué)習(xí)最常見的應(yīng)用之一。 分類技術(shù)可預(yù)測離散的響應(yīng) — 例如,電子郵件是不是垃圾郵件,腫瘤是惡性還是良性的。 分類模型可將輸入數(shù)據(jù)劃分成不同類別...
車聯(lián)網(wǎng)技術(shù)用到了哪些關(guān)鍵的技術(shù)
在目前的汽車中,已經(jīng)有功能豐富多樣的傳感器,來監(jiān)測汽車的整體運(yùn)行狀態(tài),包括空調(diào)系統(tǒng)傳感器、空氣流量傳感器(MAF)、進(jìn)氣歧管壓力傳感器(MAP)、曲軸位...
語音識別技術(shù)自20世紀(jì)50年代起開始出現(xiàn)在我們身邊。那時(shí)貝爾實(shí)驗(yàn)室的工程師創(chuàng)建了一款可以識別單個數(shù)字的系統(tǒng)。然而,語音識別只是完整語音接口技術(shù)的一部...
20世紀(jì)無線電通信模式的衰落 傳統(tǒng)廣播頻段將會發(fā)生什么?
收音機(jī)也已經(jīng)數(shù)字化了,對于歐洲來說,DAB在200 MHz左右的頻段,但我們?nèi)匀粨碛幸粋€相當(dāng)繁榮的FM頻段,即使各國政府對將FM電臺改為數(shù)字電臺發(fā)出了噪音。
人機(jī)界面設(shè)計(jì)包括哪些方面_人機(jī)交互方式有哪五種
人機(jī)界面設(shè)計(jì)包括以下幾個方面: 用戶需求分析:首先需要分析用戶的需求和使用場景,確定人機(jī)界面的功能和特性。 信息架構(gòu)設(shè)計(jì):根據(jù)用戶需...
2023-03-16 標(biāo)簽:人機(jī)界面語音識別增強(qiáng)現(xiàn)實(shí) 7339 0
大概的流程就是,先把你的語音錄制成文件,然后發(fā)送給服務(wù)器,服務(wù)器識別后得到數(shù)據(jù),最后返回給你,全程不涉及語音識別,但是卻完成了語音識別功能。
編輯推薦廠商產(chǎn)品技術(shù)軟件/工具OS/語言教程專題
電機(jī)控制 | DSP | 氮化鎵 | 功率放大器 | ChatGPT | 自動駕駛 | TI | 瑞薩電子 |
BLDC | PLC | 碳化硅 | 二極管 | OpenAI | 元宇宙 | 安森美 | ADI |
無刷電機(jī) | FOC | IGBT | 逆變器 | 文心一言 | 5G | 英飛凌 | 羅姆 |
直流電機(jī) | PID | MOSFET | 傳感器 | 人工智能 | 物聯(lián)網(wǎng) | NXP | 賽靈思 |
步進(jìn)電機(jī) | SPWM | 充電樁 | IPM | 機(jī)器視覺 | 無人機(jī) | 三菱電機(jī) | ST |
伺服電機(jī) | SVPWM | 光伏發(fā)電 | UPS | AR | 智能電網(wǎng) | 國民技術(shù) | Microchip |
Arduino | BeagleBone | 樹莓派 | STM32 | MSP430 | EFM32 | ARM mbed | EDA |
示波器 | LPC | imx8 | PSoC | Altium Designer | Allegro | Mentor | Pads |
OrCAD | Cadence | AutoCAD | 華秋DFM | Keil | MATLAB | MPLAB | Quartus |
C++ | Java | Python | JavaScript | node.js | RISC-V | verilog | Tensorflow |
Android | iOS | linux | RTOS | FreeRTOS | LiteOS | RT-THread | uCOS |
DuerOS | Brillo | Windows11 | HarmonyOS |