精品国产污污免费网站在线观看,奇米777大象资源视频,国产棈品国产三级国产普通话三级

近年來，語音交互算是真正在市面上火了一把。智能手機(jī)、智能音箱、機(jī)器人，但凡是市面上我們能看到的所謂標(biāo)榜智能的產(chǎn)品，或多或少都搭載了語音交互的功能。

和觸控、按鍵、手勢等交互方式一樣，語音交互也是一種人機(jī)交互方式，并且是被業(yè)界認(rèn)為是最便捷、最符合人類交互習(xí)慣的一種交互方式，甚至有業(yè)內(nèi)人士宣稱，未來語音交互將會逐步取代按鍵和觸控，成為主流的人機(jī)交互方式。

無論是考慮到用戶的使用習(xí)慣還是市場競爭和變革的壓力，對于汽車行業(yè)來說，主機(jī)廠和車載語音供應(yīng)商都不愿意放過這個(gè)機(jī)會，致力于在車載語音交互方面實(shí)現(xiàn)從量到質(zhì)的轉(zhuǎn)變。

但，就目前大多數(shù)用戶的使用體驗(yàn)來看，類似于山東大漢怒罵車載語音服務(wù)這類讓人哭笑不得的新聞，背后反映的其實(shí)是現(xiàn)階段的車載語音恐怕還沒我們想的那樣成熟和智能。

其實(shí)也很容易理解，發(fā)展比較完善的消費(fèi)電子端的語音交互都還停留在向智能進(jìn)化的過程中，車載語音就更“低能”了。

下面是一些實(shí)際車主對于目前已經(jīng)搭載智能語音交互的車型的評價(jià)：

語音助手莫名其妙被激話，這時(shí)導(dǎo)航的語音提示會停止，如果此時(shí)你正在叉路口是不是要懵逼？

特別是語音導(dǎo)航，多人試過，沒有一次可識別的。

語音識別還湊合，主要問題是聽不懂同音字，車機(jī)可玩性差。

我們體驗(yàn)過的眾多語音識別系統(tǒng)中，雖然有支持多輪對話的，但對話節(jié)奏、語速、還有這句話說完了，多久再說下一句它還能接上，這些問題還都沒有很好的解決掉。

車載語音很雞肋，沒網(wǎng)絡(luò)用不了。語音功能不開網(wǎng)絡(luò)時(shí)幾乎就是個(gè)聾子，是不識別的話，再說下一句話，還需要你低頭還要點(diǎn)下麥克風(fēng)圖標(biāo)。

汽車的使用場景與消費(fèi)電子不同，汽車在行駛過程中一直面臨著來自各方的噪音干擾，如發(fā)動(dòng)機(jī)、車噪、胎噪、空調(diào)噪聲、風(fēng)噪、中控多媒體等。

這樣就對車載語音的拾音和降噪能力提出了很高的要求，而這也正是車載語音當(dāng)前比較難以攻克的問題。

多麥克風(fēng)陣列技術(shù)

機(jī)器在進(jìn)行語音識別時(shí)主要是通過前端的信號處理和提取，也就是拾音降噪處理，然后將接收到的聲音輸入到識別系統(tǒng)中，經(jīng)過識別系統(tǒng)執(zhí)行指令或進(jìn)行智能回復(fù)。

在語音識別前期，工程師需要對機(jī)器進(jìn)行大量的訓(xùn)練和學(xué)習(xí)。從前端的降噪處理將聲學(xué)信號進(jìn)行處理，轉(zhuǎn)變?yōu)闄C(jī)器能夠聽懂的語言，當(dāng)有了足夠的文本數(shù)據(jù)和語音之后，后端模塊將負(fù)責(zé)讓機(jī)器學(xué)習(xí)如何理解閱讀，比如每個(gè)字的讀音、什么樣的文本組合是通順的，然后提取有用的數(shù)據(jù)模型構(gòu)成數(shù)據(jù)庫。最后機(jī)器從數(shù)據(jù)庫和語言模型信息的網(wǎng)絡(luò)搜索相應(yīng)的信息解碼，輸出結(jié)果。

這只是語音識別和降噪的一個(gè)簡單過程，在實(shí)際應(yīng)用中，情況遠(yuǎn)比這更加復(fù)雜。

就拿第一步拾音這個(gè)過程，麥克風(fēng)要如何接收到不同方位的聲波？最明顯的一個(gè)問題就是現(xiàn)在中控區(qū)的語音主要是針對主駕駛員方向的，如果副駕和后座乘客想要進(jìn)行語音交互，機(jī)器能分別接收和識別到他們的聲源嗎？

答案是肯定的，實(shí)際體驗(yàn)過車載語音交互的用戶大概有所體會。當(dāng)我們坐在主副駕位置時(shí)，我們可以很輕松的使用語音交互，它可以清晰的辨別這兩個(gè)位置的聲源進(jìn)行識別。

但如果是后座的乘客想要使用中控區(qū)的語音交互就顯得有些困難，用戶需要大聲呼叫或者是身體向前傾，也就是必須要讓聲源和麥克風(fēng)的距離足夠的近，才能夠采集到聲源信息。

在這方面業(yè)內(nèi)大多采用麥克風(fēng)陣列技術(shù)進(jìn)行多位置識別，通過多個(gè)麥克風(fēng)能夠計(jì)算聲源的角度和距離，從而對目標(biāo)聲源進(jìn)行定向拾音。此外，這也涉及到麥克風(fēng)的設(shè)計(jì)位置和組合方式，比如主駕駛方位需要安放幾個(gè)麥克風(fēng)，什么樣的組合方式，副駕以及后座需要安放幾個(gè)。

通常情況下有兩種方案：單麥克風(fēng)方案和雙麥克風(fēng)方案。單麥克風(fēng)方案只接收主駕位置的聲音，對于其他方位傳來的聲音會選擇過濾屏蔽掉。雙麥克風(fēng)就是在主副駕各放置一個(gè)麥克風(fēng)，通過聲音發(fā)出的強(qiáng)弱和響度來判斷方位。

現(xiàn)在的語音廠商更多會把自家的技術(shù)優(yōu)勢和市場的需求結(jié)合起來，希望在龐大的車載語音市場里打造自己特色的語音服務(wù)。思必馳告訴高工智能汽車，每家語音廠商采用的識別方案都不盡相同，但最終的目的都是希望能提升用戶的體驗(yàn)。

在定向拾音方面，思必馳也有他們自己的方案，如主駕模式和整車模式。當(dāng)用戶設(shè)置為主駕模式時(shí)，主要針對駕駛員方向進(jìn)行識別，整車模式就是多方位拾音，包括駕駛員、副駕駛和后座乘客。背后主要依靠強(qiáng)大的軟件算法能力，實(shí)現(xiàn)定向增強(qiáng)或抑制某個(gè)方向的聲音。

車載語音的降噪

除了定向拾音，車載語音的降噪也是現(xiàn)在面臨的一大難點(diǎn)?？傮w來說汽車遇到的噪音干擾可以分為三大類，第一種是汽車硬件里面發(fā)出的底噪。第二種是車機(jī)或設(shè)備發(fā)出的聲音，如多媒體播放的音視頻、空調(diào)聲音等。第三種就是汽車外部的環(huán)境音，諸如風(fēng)噪、交通噪音等。

在我們普通人理解降噪就是對那些噪音進(jìn)行過濾和隔離，實(shí)際上廠商也確實(shí)是這樣做的。不過，它是針對不同的噪音采用不同的降噪方案。

根據(jù)思必馳介紹，第一類噪音主要是通過軟件的算法來過濾或者是調(diào)整硬件結(jié)構(gòu)的設(shè)計(jì)達(dá)到降噪的效果。

第二類噪音是通過AEC回聲消除法（即對揚(yáng)聲器信號與由它產(chǎn)生的多路徑回聲的相關(guān)性為基礎(chǔ)，建立遠(yuǎn)端信號的語音模型，利用它對回聲進(jìn)行估計(jì)，將回聲估計(jì)值從話筒的輸入信號減去，最后達(dá)到消除回聲的目的）。

第三類是針對空調(diào)、胎噪這種有固定頻率的噪音，需要采用軟件算法來消除。

在汽車實(shí)際駕駛過程中，遇到的噪音干擾只會更加復(fù)雜和多變?，F(xiàn)在的降噪方案也并不是完美的，至少從技術(shù)上來說還有很大的提升空間。

其實(shí)車載語音面臨的技術(shù)難關(guān)遠(yuǎn)不止降噪和識別，比如，在拾音后要如何識別語義進(jìn)行解析？解析之后如何對接更多豐富的信源，讓車載語音的適用范圍變得廣泛，這其中包括對聲紋、性別和場景的識別，也就是車載語音交互的情感化和智能化。

不過，在期待車載語音變得更加聰明之前，我們還是先寄希望于車載語音能夠聽得見聽得懂。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報(bào)投訴