一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

讓萬(wàn)物聽(tīng)說(shuō):亞馬遜Alexa語(yǔ)音交互系統(tǒng)背后的聲音

姚小熊27 ? 來(lái)源:與非網(wǎng) ? 作者:夏珍 ? 2020-06-17 14:41 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

“宿命”之說(shuō)

“目前音頻壓縮算法的碼率日趨降低,研究空間相對(duì)較窄,主要是在某種算法的基礎(chǔ)上對(duì)特定應(yīng)用的改進(jìn)和定制。音頻信號(hào)的研究還可以在下列更廣闊的方向開(kāi)展下去:基于信號(hào)模型的音頻內(nèi)容描述、特征提取、分類與檢索。這些研究可以作為多媒體數(shù)據(jù)庫(kù)研究的一個(gè)子課題,實(shí)現(xiàn)音頻數(shù)據(jù)庫(kù)的組織和管理,基于內(nèi)容的音頻點(diǎn)播等。在人機(jī)交互方面,音頻內(nèi)容的描述可以用于音頻一視頻信號(hào)處理(Audio 一 Visual Signal Processing),實(shí)現(xiàn)音視頻信號(hào)交互、信號(hào)對(duì)應(yīng)、信號(hào)關(guān)連等應(yīng)用?!?/p>

這段文字來(lái)源于 2003 年一篇題為《基于正弦+噪聲模型的寬帶音頻信號(hào)的表示與壓縮》的文章,是今天筆者要介紹的主人公——宋少鵬的碩士畢業(yè)論文節(jié)選。細(xì)讀這段文字,一個(gè)即將畢業(yè)的學(xué)生對(duì)音頻信號(hào)未來(lái)的發(fā)展是有積極想法的,我們似乎就可以清晰地看到這個(gè)年輕人將走上的職業(yè)生涯道路。

時(shí)間是最好的證明,這個(gè)從華南理工大學(xué)無(wú)線電系畢業(yè)的小伙子近 20 年來(lái)真的就只做了一件事,這件事就是音頻信號(hào)處理。常有人問(wèn)他為什么喜歡這個(gè)領(lǐng)域、認(rèn)定這個(gè)方向的時(shí)候,他都會(huì)笑著答道,“兒時(shí)的興趣,我一直對(duì)聲波、電波充滿興趣,小時(shí)候聽(tīng)黑膠唱片,聽(tīng)磁帶,就一直想鉆進(jìn)去看看是誰(shuí)在里面唱歌。此外,我的中文名字宋少鵬的拼音首字母縮寫是 SSP,而音頻信號(hào)處理(Sound Signal Processing)的英文首字母縮寫也是 SSP,因此這是一種宿命,很早就注定了的?!?/p>

我的職業(yè)生涯一路向前,沒(méi)有轉(zhuǎn)折

上面講到 2003 年宋少鵬碩士畢業(yè),這一年他放棄了大公司的 offer,選擇進(jìn)入一家以色列芯片公司 Zoran 做軟件開(kāi)發(fā),鉆研音頻 DSP 技術(shù)。值得一提的是,全球第一個(gè)全套杜比單芯片解決方案就來(lái)自這家公司。

2010 年,他又去了微軟亞洲硬件中心,從事硬件產(chǎn)品的研發(fā)制造,經(jīng)手產(chǎn)品包括智能攝像頭、Kinnet 體感設(shè)備等。

就在 2012 年左右,他發(fā)現(xiàn)智能手機(jī)、電視、汽車都在向聯(lián)網(wǎng)化發(fā)展,由于給用戶帶來(lái)了豐富的內(nèi)容、社交和娛樂(lè)體驗(yàn),這些產(chǎn)業(yè)得到蓬勃發(fā)展。與此同時(shí),音頻設(shè)備卻還沒(méi)有聯(lián)網(wǎng),這在一個(gè)專業(yè)音頻從業(yè)者眼中,便是機(jī)遇。而眼前急切要弄清楚的是:如何聯(lián)網(wǎng)?如何承載娛樂(lè)和社交?

帶著這些思考,還在微軟供職的宋少鵬便尋找機(jī)會(huì)開(kāi)始嘗試,這次嘗試不算成功,在他看來(lái),原因有兩點(diǎn),一是當(dāng)時(shí)行業(yè)環(huán)境還不太成熟,二是大公司的體制存在一定的限制。

宋少鵬在后來(lái)接受利器的采訪時(shí)被問(wèn)到職業(yè)生涯的轉(zhuǎn)折點(diǎn),他直言不諱地說(shuō):“我的職業(yè)生涯一路向前,沒(méi)有轉(zhuǎn)折。”因此,回溯到上述那次不太成功的嘗試,摸清原因,認(rèn)準(zhǔn)方向也是他職業(yè)道路上的收貨,當(dāng)然不止于此,他還結(jié)識(shí)了一幫志同道合的朋友。于是在 2013 年的某一天,他帶著這個(gè)團(tuán)隊(duì)毅然決然的開(kāi)始了他們的創(chuàng)業(yè)闖蕩。

2014 年,米唐在深圳這個(gè)遠(yuǎn)離中國(guó)的政治和經(jīng)濟(jì)中心的灣區(qū)成立了,他喜歡那里自發(fā)式、民營(yíng)式、創(chuàng)新型的經(jīng)濟(jì)模式,大家都來(lái)自江西、湖南、江蘇、四川、中國(guó)各地,移民所帶來(lái)的一些共同的特質(zhì),比如說(shuō)勇敢、不屈服、創(chuàng)新,這些都與他的團(tuán)隊(duì)惺惺相惜。

從產(chǎn)品到解決方案,都在用心做“耳朵”

公司成立初期,產(chǎn)業(yè)的不成熟,加上創(chuàng)業(yè)公司交付能力的有限,使得米唐沒(méi)辦法短時(shí)間內(nèi)在語(yǔ)音交互領(lǐng)域拿出產(chǎn)品化的東西,基于訊飛 SDK 和谷歌 SDK 的嘗試又均不能滿足這個(gè)團(tuán)隊(duì)對(duì)產(chǎn)品體驗(yàn)的要求,而一家公司要生存下去就必須要有良好的資金回流,于是他們的第一款產(chǎn)品“方糖音箱”放棄了語(yǔ)音的交互,只保留了兩項(xiàng)特殊的“體感”操作方式:輕拍音箱頂部開(kāi)始播放音樂(lè)或暫停,向左或向右傾斜切換上下曲目。

這款音箱通過(guò) WiFi 連接上網(wǎng),可脫離手機(jī)獨(dú)立工作,并內(nèi)置了不少音樂(lè)電臺(tái),比如豆瓣電臺(tái)、荔枝 FM、還有一些國(guó)際電臺(tái),同時(shí)它還能記錄個(gè)人喜好,進(jìn)行智能推薦。若是用戶在互動(dòng)中能會(huì)心一笑,那在宋少鵬的眼中,除了趣味更是一種關(guān)懷帶來(lái)的暖意。

“產(chǎn)品就像藝術(shù)品,源于生活,高于生活,要從生活中抽象提煉需求,發(fā)掘人性?!边@與宋少鵬以人性、人文觀點(diǎn)來(lái)思考產(chǎn)品設(shè)計(jì)的觀點(diǎn)高度契合。但生活要繼續(xù),公司更需發(fā)展,經(jīng)濟(jì)基礎(chǔ)決定上層建筑,即使方糖在 2015 年就開(kāi)始銷往海外,并推出了同樣設(shè)計(jì)的藍(lán)牙音箱,以謀取更多的利潤(rùn),一年數(shù)萬(wàn)臺(tái)的銷量還是顯得捉襟見(jiàn)肘。

作為一家始終觀察著這個(gè)領(lǐng)域的創(chuàng)業(yè)企業(yè),2015 年底,他們看到了亞馬遜的 Echo 和背后的 Alexa 語(yǔ)音交互系統(tǒng)。最初亞馬遜 Echo 以 MVP(最小可用原型)的形態(tài)交付用戶,語(yǔ)音識(shí)別和語(yǔ)義理解都僅能滿足流媒體播放的簡(jiǎn)單需求,但是經(jīng)過(guò)一兩年的打磨,到了 2016 年,Echo 的體驗(yàn)就好了很多,它既可以提供音頻內(nèi)容,也可以提供生活服務(wù),包括音樂(lè)、電臺(tái)、有聲書、新聞、天氣、鬧鐘、日程等。這時(shí)候亞馬遜也將 Alexa 語(yǔ)音交互平臺(tái)開(kāi)放出來(lái),于是米唐團(tuán)隊(duì)在第一時(shí)間找到了亞馬遜。大概花了三四個(gè)月的時(shí)間,在眾多想接入 Alexa 的競(jìng)爭(zhēng)者中,方糖成為首個(gè)通過(guò)亞馬遜認(rèn)證的第三方音箱產(chǎn)品。

“通過(guò)亞馬遜的認(rèn)證后,Alexa 團(tuán)隊(duì)的人就主動(dòng)找到了我,問(wèn)我一年能夠賣多少,我說(shuō)幾萬(wàn)臺(tái),亞馬遜就說(shuō)做他們的技術(shù)方案商,可以幫米唐一年賣幾百萬(wàn)個(gè)解決方案”,宋少鵬回憶稱這是亞馬遜幫團(tuán)隊(duì)找到了方向。于是,一個(gè)擅長(zhǎng)做技術(shù)的團(tuán)隊(duì),開(kāi)始從做 C 端產(chǎn)品轉(zhuǎn)向做 B 端的方案,并決意將自己定位為聚焦海外市場(chǎng)的語(yǔ)音交互解決方案提供商。

“讓萬(wàn)物聽(tīng)說(shuō)”是使命所在

目前,米唐的業(yè)務(wù)已擴(kuò)展到家用電器、汽車和消費(fèi)電子產(chǎn)品等多個(gè)領(lǐng)域,而其核心競(jìng)爭(zhēng)力是他們的遠(yuǎn)場(chǎng)語(yǔ)音交互算法,在響應(yīng)速度、識(shí)別率、去噪、聲源定位和產(chǎn)品良率方面均做得還不錯(cuò)。

“作為創(chuàng)業(yè)狗,在哪都能工作。出差路上的飛行和堵車時(shí)的 YY 是獲得靈感的方式,出差的時(shí)候會(huì)帶一本書,和一個(gè)趁早筆記本?!彼紊蠃i如是說(shuō),“當(dāng)你做一個(gè)事情,真正站在場(chǎng)景和用戶的角度去思考,才有可能在價(jià)值上有所突破,而當(dāng)你受制于既得利益時(shí),其實(shí)會(huì)做很多束縛手腳的事情?!?/p>

未來(lái)的米唐會(huì)發(fā)展成怎樣,沒(méi)人可以預(yù)判,但“讓萬(wàn)物聽(tīng)說(shuō)”會(huì)成為它和它背后的這個(gè)團(tuán)隊(duì)不變的使命。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • SSD
    SSD
    +關(guān)注

    關(guān)注

    21

    文章

    2984

    瀏覽量

    119604
  • 語(yǔ)音交互
    +關(guān)注

    關(guān)注

    3

    文章

    307

    瀏覽量

    28619
  • 亞馬遜
    +關(guān)注

    關(guān)注

    8

    文章

    2696

    瀏覽量

    84681
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    聯(lián)網(wǎng)設(shè)備也能‘開(kāi)口說(shuō)話’?Aircall實(shí)時(shí)通話功能讓智能交互觸手可及

    成為能‘聽(tīng)懂’需求、‘說(shuō)出’答案的智能伙伴?!?在萬(wàn)物互聯(lián)的時(shí)代,語(yǔ)音通話是最自然的交互方式。 ? Air8000工業(yè)引擎Aircall功能:將復(fù)雜的通話流程簡(jiǎn)化為三次點(diǎn)擊,為聯(lián)網(wǎng)設(shè)
    的頭像 發(fā)表于 07-07 09:26 ?157次閱讀
    <b class='flag-5'>物</b>聯(lián)網(wǎng)設(shè)備也能‘開(kāi)口說(shuō)話’?Aircall實(shí)時(shí)通話功能讓智能<b class='flag-5'>交互</b>觸手可及

    從‘指令接收器’到‘語(yǔ)音伙伴’:Aircall聯(lián)網(wǎng)設(shè)備實(shí)時(shí)通話能力落地!

    萬(wàn)物互聯(lián)的時(shí)代,語(yǔ)音通話是最自然的交互方式。 Air8000工業(yè)引擎Aircall功能: 將復(fù)雜的通話流程簡(jiǎn)化為三次點(diǎn)擊,為聯(lián)網(wǎng)設(shè)備賦予實(shí)時(shí)通話能力。其簡(jiǎn)潔的API設(shè)計(jì)大幅降低開(kāi)發(fā)門
    的頭像 發(fā)表于 07-06 16:12 ?55次閱讀
    從‘指令接收器’到‘<b class='flag-5'>語(yǔ)音</b>伙伴’:Aircall<b class='flag-5'>讓</b><b class='flag-5'>物</b>聯(lián)網(wǎng)設(shè)備實(shí)時(shí)通話能力落地!

    華為攜手產(chǎn)業(yè)伙伴共贏萬(wàn)物智聯(lián)新時(shí)代未來(lái)

    ,IoT與AI融合共生智能無(wú)處不在、無(wú)所不達(dá)。他進(jìn)一步在發(fā)言中表示“實(shí)現(xiàn)萬(wàn)物智聯(lián)需要具備三大關(guān)鍵要素:全場(chǎng)景物聯(lián),所有對(duì)象可連接;全超寬網(wǎng)絡(luò),所有數(shù)據(jù)聯(lián)云聯(lián)算;全智能加持,
    的頭像 發(fā)表于 06-23 16:53 ?463次閱讀

    芯資訊|廣州唯創(chuàng)電子WTV系列語(yǔ)音芯片:以技術(shù)創(chuàng)新賦能智能語(yǔ)音交互

    萬(wàn)物互聯(lián)的智能化時(shí)代,語(yǔ)音交互技術(shù)已成為人機(jī)交互的重要橋梁。廣州唯創(chuàng)電子深耕語(yǔ)音芯片領(lǐng)域多年,憑借自主研發(fā)的WTV系列
    的頭像 發(fā)表于 05-21 08:45 ?210次閱讀
    芯資訊|廣州唯創(chuàng)電子WTV系列<b class='flag-5'>語(yǔ)音</b>芯片:以技術(shù)創(chuàng)新賦能智能<b class='flag-5'>語(yǔ)音</b><b class='flag-5'>交互</b>

    從智能穿戴到智能家居:晶振如何賦能萬(wàn)物互聯(lián)

    當(dāng)你輕觸智能手表查看心率,或是通過(guò)語(yǔ)音指令智能家居開(kāi)啟燈光,背后都有一個(gè)微小卻至關(guān)重要的元件在默默發(fā)力——晶振。在萬(wàn)物互聯(lián)的時(shí)代浪潮下,從貼身的智能穿戴設(shè)備到全屋智能生態(tài)
    的頭像 發(fā)表于 04-22 11:08 ?224次閱讀
    從智能穿戴到智能家居:晶振如何賦能<b class='flag-5'>萬(wàn)物</b>互聯(lián)

    麻了!6440萬(wàn)物聯(lián)網(wǎng)智慧路燈,我會(huì)……

    麻了!6440萬(wàn)物聯(lián)網(wǎng)智慧路燈,我會(huì)……
    的頭像 發(fā)表于 04-10 08:43 ?286次閱讀
    麻了!6440<b class='flag-5'>萬(wàn)物</b>聯(lián)網(wǎng)智慧路燈,我會(huì)……

    WT3000T8-32N語(yǔ)音合成TTS芯片:小體積、強(qiáng)性能,重塑智能語(yǔ)音交互體驗(yàn)

    萬(wàn)物互聯(lián)的智能化浪潮中,語(yǔ)音交互已成為人機(jī)交互的核心入口。廣州唯創(chuàng)電子推出的WT3000T8-32N語(yǔ)音合成芯片,憑借其4×4mm超小封裝
    的頭像 發(fā)表于 03-21 09:20 ?423次閱讀
    WT3000T8-32N<b class='flag-5'>語(yǔ)音</b>合成TTS芯片:小體積、強(qiáng)性能,重塑智能<b class='flag-5'>語(yǔ)音</b><b class='flag-5'>交互</b>體驗(yàn)

    重慶大學(xué):研究用于語(yǔ)音識(shí)別和交互的機(jī)器學(xué)習(xí)輔助可穿戴傳感系統(tǒng)

    生物通信、人機(jī)交互(HMI)和聯(lián)網(wǎng)(IoT)應(yīng)用(包括智能家居、遠(yuǎn)程控制、身份識(shí)別和語(yǔ)音系統(tǒng))的重要組成部分。然而,基于空氣振動(dòng)的語(yǔ)音通信
    的頭像 發(fā)表于 03-14 14:59 ?1123次閱讀
    重慶大學(xué):研究用于<b class='flag-5'>語(yǔ)音</b>識(shí)別和<b class='flag-5'>交互</b>的機(jī)器學(xué)習(xí)輔助可穿戴傳感<b class='flag-5'>系統(tǒng)</b>

    DeepSeek加持,宇視科技升級(jí)發(fā)布“萬(wàn)物X”全鏈路智能引擎

    近日,宇視繼去年在全行業(yè)率先推出“萬(wàn)物搜”后,基于AIoT行業(yè)大模型-“梧桐”多模態(tài)大模型技術(shù)底座,再度重磅升級(jí)發(fā)布「萬(wàn)物X」,大模型能力價(jià)值落地廣泛真實(shí)場(chǎng)景。 「萬(wàn)物X」以梧桐大模
    的頭像 發(fā)表于 03-13 15:36 ?507次閱讀

    【智能語(yǔ)音交互新標(biāo)桿】WTK6900HC語(yǔ)音識(shí)別芯片:重新定義離線語(yǔ)音控制體驗(yàn)

    萬(wàn)物智聯(lián)時(shí)代,離線語(yǔ)音控制技術(shù)正以革命性姿態(tài)重塑智能設(shè)備交互方式。WTK6900HC語(yǔ)音識(shí)別芯片憑借其突破性的技術(shù)創(chuàng)新,為智能清潔設(shè)備領(lǐng)域帶來(lái)三大核心價(jià)值升級(jí),助力產(chǎn)品實(shí)現(xiàn)"聽(tīng)得清、
    的頭像 發(fā)表于 03-05 09:26 ?407次閱讀
    【智能<b class='flag-5'>語(yǔ)音</b><b class='flag-5'>交互</b>新標(biāo)桿】WTK6900HC<b class='flag-5'>語(yǔ)音</b>識(shí)別芯片:重新定義離線<b class='flag-5'>語(yǔ)音</b>控制體驗(yàn)

    亞馬遜升級(jí)版Alexa推遲發(fā)布

    。 此次延遲發(fā)布的原因之一,在于升級(jí)后的Alexa在測(cè)試階段暴露出了一些問(wèn)題。據(jù)一位匿名的亞馬遜員工透露,盡管升級(jí)版Alexa在智能交互語(yǔ)音
    的頭像 發(fā)表于 02-17 14:02 ?704次閱讀

    萬(wàn)物相連通訊:共繪萬(wàn)物互聯(lián)藍(lán)圖

    樹(shù)立行業(yè)標(biāo)桿,講好中國(guó)故事,傳遞中國(guó)聲音,充分展現(xiàn)騰飛的中國(guó)經(jīng)濟(jì)、崛起的民族品牌和向上的企業(yè)家精神。近日,“崛起的民族品牌”專題系列節(jié)目對(duì)話深圳市萬(wàn)物相連通訊有限公司(簡(jiǎn)稱:萬(wàn)物相連通訊)的董事長(zhǎng)
    的頭像 發(fā)表于 01-15 11:00 ?637次閱讀
    <b class='flag-5'>萬(wàn)物</b>相連通訊:共繪<b class='flag-5'>萬(wàn)物</b>互聯(lián)藍(lán)圖

    解鎖個(gè)性化語(yǔ)音交互新時(shí)代:九芯智能語(yǔ)音云平臺(tái),創(chuàng)意聲音觸手可及!

    九芯智能語(yǔ)音云平臺(tái)提供全面高效安全的智能語(yǔ)音服務(wù),支持自定義語(yǔ)音內(nèi)容,簡(jiǎn)化燒錄流程,依托AI技術(shù),助力各行業(yè)智能化升級(jí),引領(lǐng)語(yǔ)音交互革命。
    的頭像 發(fā)表于 01-02 16:51 ?899次閱讀
    解鎖個(gè)性化<b class='flag-5'>語(yǔ)音</b><b class='flag-5'>交互</b>新時(shí)代:九芯智能<b class='flag-5'>語(yǔ)音</b>云平臺(tái),<b class='flag-5'>讓</b>創(chuàng)意<b class='flag-5'>聲音</b>觸手可及!

    亞馬遜基于人工智能的Alexa發(fā)布計(jì)劃延期至明年

    11月1日外媒報(bào)道稱,亞馬遜已將基于人工智能技術(shù)全新打造的正版Alexa發(fā)布計(jì)劃延期至明年。   亞馬遜最初于去年9月公開(kāi)了新版Alexa的規(guī)劃,意在通過(guò)集成AI大模型,顯著增強(qiáng)
    的頭像 發(fā)表于 11-01 15:19 ?1013次閱讀

    聯(lián)網(wǎng)系統(tǒng)中音頻方案的“大腦”_語(yǔ)音芯片

    01 聯(lián)網(wǎng)系統(tǒng)中為什么要使用語(yǔ)音芯片 聯(lián)網(wǎng)系統(tǒng)中使用語(yǔ)音芯片的原因可以歸結(jié)為以下幾個(gè)方面:
    的頭像 發(fā)表于 09-26 14:26 ?957次閱讀
    <b class='flag-5'>物</b>聯(lián)網(wǎng)<b class='flag-5'>系統(tǒng)</b>中音頻方案的“大腦”_<b class='flag-5'>語(yǔ)音</b>芯片