一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

一個改變人機交互方式的全新切入點:語音接口

電子設計 ? 2018-03-06 18:25 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

語音接口已經(jīng)成為一個改變人機交互方式的全新切入點。這些系統(tǒng)如何工作?打造這樣一款設備在硬件方面有什么要求?隨著語音控制接口變得越來越普及,德州儀器TI)的一位工程師對此技術進行了深入的了解,并分享了其對這項技術的認識和看法。

語音接口是什么?

語音識別技術自20世紀50年代起開始出現(xiàn)在我們身邊。那時貝爾實驗室的工程師創(chuàng)建了一款可以識別單個數(shù)字的系統(tǒng)。然而,語音識別只是完整語音接口技術的一部分。語音接口包含傳統(tǒng)用戶接口的所有方面:它能呈現(xiàn)信息并為用戶提供一種操控方式。在語音接口中,操控或者甚至一些信息的呈現(xiàn)都將通過語音實現(xiàn)。在一些如按鈕或顯示屏等傳統(tǒng)的用戶接口上,也可能配置語音接口這一選項。

大部分人遇到的第一款語音接口設備很有可能是移動電話,或者是個人電腦上非?;A的將語言轉換成文字的程序。然而,這些設備的運行都非常緩慢、識別不精確且可識別的詞匯有限。

那是什么將語音識別從一種附屬性功能變成了計算機世界炙手可熱的技術呢?首先,如今的計算能力和算法性能都有顯著的提高(如果你對隱馬爾科夫模型有所了解,對此你會有更直觀的認識)。其次,云技術和大數(shù)據(jù)分析的應用也改進了語音識別效果,并且提高了識別的速度和準確性。

為你的設備添加語音識別功能

一些人常常會對如何為項目添加某種語音接口存在疑問。實際上,TI供應幾種不同的語音接口產品,包括ARM?處理器的Sitara?系列產品和C5000? DSP系列產品,這些產品都具備語音處理的能力。兩種系列的產品各有千秋,分別適用于不同的應用。

在選擇DSP和ARM這兩種解決方案時,考慮的關鍵因素在于這款設備能否或將如何利用云語音平臺。當中有三種應用場景:第一種是離線,所有的處理過程都在本地設備上發(fā)生。第二種是在線,通過基于云端的語音處理設備,如亞馬遜的Alexa,谷歌助手或IBM Watson;第三種是兩者混合。

離線:車載語音控制

從目前的發(fā)展趨勢來看,人們似乎希望所有事物都能夠連接至互聯(lián)網(wǎng)。然而,無論是出于成本考慮或是缺乏可靠的網(wǎng)絡連接,在某些應用中,連接網(wǎng)絡的意義其實不大。在現(xiàn)代的汽車應用中,許多娛樂信息系統(tǒng)就采用了離線語音接口系統(tǒng)。這些語音接口系統(tǒng)通常只能使用有限的命令集,如“撥打電話”、“播放音樂”和“提高或降低音量”。雖然傳統(tǒng)處理器的語音識別算法取得了重大進展,但仍有不盡如人意之處。遇到這樣的情況,例如C55xx等DSP可能夠為系統(tǒng)提供最佳的性能。

在線智能家庭中樞

關于語音接口的很多熱議主要圍繞于例如Google Home和亞馬遜 Alexa等互聯(lián)設備。由于亞馬遜允許第三方進入其已配備Alex語音服務的語音處理生態(tài)系統(tǒng),他們在這方面的發(fā)展備受矚目。另外,如Microsoft Azur等其它的云服務也可以提供語音識別服務和類似功能。值得注意的是,這些設備的聲音處理過程全部發(fā)生在云端。

是否值得為了這種便捷的集成而向語音服務供應商提供上行數(shù)據(jù)完全取決于用戶。但是,云服務供應商承擔了主要的工作,設備商需要做的很簡單,實際上,由于接口的語音合成部分也發(fā)生在云端,Alexa只要完成最簡單的功能,即播放并記錄錄音文件。既然不需要特別的信號處理功能,ARM處理器足以處理接口工作。這意味著,如果你的設備已配備ARM處理器,你就可能集成云計算語音接口。

事實上,關注Alexa等不能提供的服務也是非常重要的。Alexa不直接執(zhí)行任何一種設備控制或云集成。驅動Alexa的許多“智能設備”都具備云計算功能,該功能由開發(fā)商提供,可以利用Alexa的語音處理能力將驅動輸入至現(xiàn)有的云應用。例如,如果你告訴Alexa需要訂一個披薩,你最喜愛的披薩店則需要為Alexa編制一項“技能”。該項技能是一個可以在你訂披薩時定義工作內容的代碼。當你每次訂披薩時,Alexa都會調用該技能。該技能嵌入了可以為你下單的在線訂購系統(tǒng)。同樣,智能家居設備制造商必須執(zhí)行Alexa如何與本地設備和在線服務相互作用的技能。亞馬遜自帶許多這樣的技能,加上第三方開發(fā)者提供的技能,即便你沒有開發(fā)任何技能,Alexa設備仍然可以非常有用。

混合:互聯(lián)自動調溫器

有時,即使沒有連接互聯(lián)網(wǎng),我們也有保證設備的某些基礎功能可以正常使用的需求。例如:在連不上網(wǎng)的時候,如果自動調溫器不會自主調節(jié)溫度,這就會是一個很麻煩的問題。為避免這種問題的發(fā)生 ,一個好的產品設計師會設計一些本地的聲音處理功能,在功能上實現(xiàn)無縫銜接。為了實現(xiàn)此功能,系統(tǒng)必須具有DSP,例如用于本地語音處理的C55XX和用于將已連網(wǎng)的接口連接至云端的ARM處理器。

語音觸發(fā)又是什么?

你也許已經(jīng)注意到了,直到現(xiàn)在我們還沒有提及新一代語音助手真正神奇的地方:那就是始終關注“觸發(fā)詞匯”。它們將如何追蹤你在房間內任意位置所發(fā)出的聲音,或是當設備播放音頻時,又如何聽到你的聲音?實現(xiàn)這些其實并沒有什么特別神奇的地方,只需要一些智能化軟件。這類軟件獨立于云端的語音接口,也能在系統(tǒng)離線的狀態(tài)下運行。

這個系統(tǒng)最易理解的部分就是“喚醒詞匯”。喚醒詞匯是一個簡單的本地語音識別程序,通過持續(xù)性采樣,在接收的音頻信號中尋找單個詞匯。由于大多數(shù)語音服務均樂意接受不含喚醒詞匯的音頻,因此該詞匯不需要指定任何特殊的語音平臺。因為實現(xiàn)這種功能的要求相對較低,所以通過利用Sphinx或KITT.AI等開源數(shù)據(jù)庫在ARM處理器上即可完成操作。

為了聽到你在房間內任意位置發(fā)出的聲音,語音識別設備采用一個叫波束成型的流程。最重要的是,通過對比不同聲音的到達時間和麥克風間的距離來確定聲音的來源。一旦確認了目標聲音的位置,設備就會采用如空間濾波等音頻處理技術來進一步減少噪音并增強信號質量。波束成型的實現(xiàn)取決于麥克風的布局。真正實現(xiàn)360度識別則需要一個非線性麥克風陣列(通常是圓形)。對于壁掛式設備而言,僅需兩個麥克風就能啟用180度的空間辨別。

語音助手的最后一招是采用自動回波消除(AEC)。AEC在某種程度上類似于噪音消除耳機,但應用恰好相反。該算法是利用已知的音樂等輸出音頻信號來實現(xiàn)的。在噪音消除耳機利用這點來消除外部雜音,AEC消除了輸出信號對輸入信號在麥克風上的影響。該設備能忽略自身產生的音頻,且無論揚聲器播放何種內容,其都仍然能接收。實現(xiàn)AEC需要大量的計算,其中在DSP中效果最佳。

為了實施喚醒識別、波束成型和AEC等以上提及的所有功能,則要求ARM處理器配合DSP共同工作:DSP增強了所有的信號處理功能,而ARM處理器控制設備邏輯和接口。DSP可在執(zhí)行輸入數(shù)據(jù)管路方面發(fā)揮重要的作用,由此最大限度地減少處理的延遲,從而提供更好的用戶體驗。ARM可以自由運行如Linux等高級操作系統(tǒng)以控制其它設備。這樣高級的功能全部發(fā)生在本地,若使用云服務,將只接收包含最終處理結果的單個語音文件。

結論

語音接口似乎已收獲了超高的人氣,并且將在未來很長一段時間內以不同形式出現(xiàn)在我們的生活中。盡管有多種不同的處理方式可以實現(xiàn)語音接口服務,但無論你的應用需要何種裝置,TI都可以為你提供理想的選擇。


聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 人機交互
    +關注

    關注

    12

    文章

    1247

    瀏覽量

    56443
  • 語音識別
    +關注

    關注

    39

    文章

    1781

    瀏覽量

    114226
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    普強智能語音技術重新定義車載交互邊界

    普強憑借自主研發(fā)的智能語音技術,為某國內頭部車企提供的語音前處理、喚醒詞、ASR、TTS等技術模塊,構建覆蓋泰語、俄語、韓語、日語等多語種的語音交互解決方案,助力其海外車型實現(xiàn)無障礙
    的頭像 發(fā)表于 07-11 14:00 ?340次閱讀

    蘇州唯理科技神經(jīng)腕帶肌電臂環(huán)人機交互演示

    人機交互
    jf_74911425
    發(fā)布于 :2025年07月08日 22:02:34

    聲智科技全球首發(fā)新一代人機交互框架

    Moore與Anish Acharya在深度訪談中系統(tǒng)闡釋了"語音交互將成為AI應用最具突破潛力的核心接口"這戰(zhàn)略判斷,明確指出在消費級市場,
    的頭像 發(fā)表于 05-12 10:28 ?419次閱讀
    聲智科技全球首發(fā)新<b class='flag-5'>一代人機交互</b>框架

    聲學技術如何重構人機交互生態(tài)

    人機交互的底層邏輯。隨著非線性聲學計算與強化學習的深度融合,聲音交互正從“聽得見”邁向“聽得懂”,并逐漸成為 AI 時代的重要接口。
    的頭像 發(fā)表于 04-14 13:50 ?395次閱讀

    愛普生XV7021BB陀螺儀傳感器在人機交互中的應用

    在元宇宙、智能穿戴與工業(yè)自動化加速融合的今天,人機交互的核心挑戰(zhàn)已從“功能實現(xiàn)”轉向“體驗升維”。愛普生XV7021BB單軸陀螺儀傳感器憑借±400°/s高精度角速度測量0.0016°/s/°C
    的頭像 發(fā)表于 04-01 14:13 ?331次閱讀
    愛普生XV7021BB陀螺儀傳感器在<b class='flag-5'>人機交互</b>中的應用

    零知開源——ESP32語音交互系統(tǒng)(AI小智)開發(fā)教程

    小智AI聊天機器人是基于嵌入式硬件與人工智能技術深度融合的智能交互系統(tǒng)。該項目以ESP32開發(fā)板為核心,結合語音喚醒、自然語言處理、音頻解碼播放及圖形化
    的頭像 發(fā)表于 03-29 15:33 ?7083次閱讀
    零知開源——ESP32<b class='flag-5'>語音</b><b class='flag-5'>交互</b>系統(tǒng)(AI小智)開發(fā)教程

    AR互動與傳統(tǒng)的交互方式相比更加豐富多元

    AR 互動的另一個顯著特點,是其豐富多元的互動方式。與傳統(tǒng)的交互方式相比,AR 互動不再局限于鼠標、鍵盤、觸摸屏等有限的輸入方式,而是通過多
    的頭像 發(fā)表于 03-10 17:48 ?507次閱讀
    AR互動與傳統(tǒng)的<b class='flag-5'>交互</b><b class='flag-5'>方式</b>相比更加豐富多元

    為什么開關柜人機交互裝置集成鍵順控,可以替代開關柜操顯裝置

    蜀瑞創(chuàng)新科普:開關柜人機交互裝置集成鍵順控在功能集成與簡化操作、智能化與遠程監(jiān)控以及可靠性與安全性等方面均表現(xiàn)出顯著優(yōu)勢。這些優(yōu)勢使得集成鍵順控的人機交互裝置能夠替代傳統(tǒng)的開關柜智
    的頭像 發(fā)表于 03-07 10:21 ?556次閱讀
    為什么開關柜<b class='flag-5'>人機交互</b>裝置集成<b class='flag-5'>一</b>鍵順控,可以替代開關柜操顯裝置

    RTC實時語音對話:開啟人機交互新生態(tài),AI大模型智能聯(lián)動

    在當今科技飛速發(fā)展的時代,AI大模型技術的爆發(fā)讓語音交互成為了人機協(xié)同的關鍵入口。就像Gartner預測的那樣,到2028年,15%的日常工作決策將由AIAgent自主完成。但傳統(tǒng)基于Http的
    的頭像 發(fā)表于 02-26 18:23 ?1585次閱讀
    RTC實時<b class='flag-5'>語音</b>對話:開啟<b class='flag-5'>人機交互</b>新生態(tài),AI大模型智能聯(lián)動

    清華牽頭深開鴻參與:混合智能人機交互系統(tǒng)獲批立項

    近日,由清華大學牽頭、深開鴻重點參與的“面向混合智能的自然人機交互軟硬件系統(tǒng)”研發(fā)計劃項目,正式獲得了立項批準。該項目是國家“十四五”重點研發(fā)計劃“先進計算與新興軟件”專項中的
    的頭像 發(fā)表于 01-23 16:33 ?838次閱讀

    啟英泰倫新推出多意圖自然說,重塑離線人機交互新標準!

    智能語音識別技術作為人機交互領域的場革命性突破,正逐步重塑我們與智能設備的交互方式。近期,啟英泰倫新推出了多意圖自然說技術,進
    的頭像 發(fā)表于 01-03 16:01 ?548次閱讀
    啟英泰倫新推出多意圖自然說,重塑離線<b class='flag-5'>人機交互</b>新標準!

    芯??萍糉orceTouch3.0:重塑人機交互新境界

    在追求極致用戶體驗的智能時代,每次技術的革新都是對未來的深度探索。芯??萍迹鳛闃I(yè)界領先的芯片設計企業(yè),憑借其ForceTouch3.0技術,正引領著人機交互的變革,為智能手機、智能穿戴、家電乃至汽車電子等領域注入了
    的頭像 發(fā)表于 11-28 09:20 ?638次閱讀
    芯??萍糉orceTouch3.0:重塑<b class='flag-5'>人機交互</b>新境界

    新的人機交互入口?大模型加持、AI眼鏡賽道開啟百鏡大戰(zhàn)

    電子發(fā)燒友網(wǎng)報道(文/莫婷婷)隨著智能眼鏡的出現(xiàn),加之AI技術的應用,AI智能眼鏡被認為是下一代人機交互的入口。在今年,不少品牌廠商都推出了AI智能眼鏡新品,包括李未可推出的Meta Lens
    的頭像 發(fā)表于 11-21 00:57 ?3981次閱讀
    新的<b class='flag-5'>人機交互</b>入口?大模型加持、AI眼鏡賽道開啟百鏡大戰(zhàn)

    具身智能對人機交互的影響

    在人工智能的發(fā)展歷程中,人機交互直是研究的核心領域之。隨著技術的進步,人機交互方式也在不斷演變。從最初的命令行界面,到圖形用戶界面,再
    的頭像 發(fā)表于 10-27 09:58 ?959次閱讀

    聚徽-工控體機是如何實現(xiàn)人機交互

    工控體機實現(xiàn)人機交互方式是多種多樣的,結合搜索結果,我們可以歸納出以下幾種主要的實現(xiàn)方式
    的頭像 發(fā)表于 09-10 09:31 ?656次閱讀