一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線(xiàn)課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

語(yǔ)音交互只是處于自動(dòng)駕駛的L1級(jí)階段

電子工程師 ? 來(lái)源:未知 ? 作者:胡薇 ? 2018-11-05 16:51 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

2017 年可以看做是智能語(yǔ)音交互的元年,在這一年里小愛(ài)同學(xué)、天貓精靈紛紛上市。2018 年里語(yǔ)音交互的落地突然加速,落地的產(chǎn)品從大公司關(guān)注的智能音箱擴(kuò)展到其它品類(lèi),比如電視盒子、鬧鐘、燈、智能馬桶等。那接下來(lái)語(yǔ)音交互會(huì)如何發(fā)展?

▌?wù)Z音交互的終極目標(biāo)

語(yǔ)音交互的便利程度正好與人工智能的發(fā)展程度成正比,智能程度越高語(yǔ)音交互的等級(jí)也就越高,所以其終極形態(tài)與人工智能的終極形態(tài)類(lèi)似。

如果拋棄特別夸張的想象來(lái)說(shuō),那語(yǔ)音交互要能達(dá)成《她》或者《黑鏡》里描述的樣子:

當(dāng)你輸入數(shù)據(jù)給它后,它能夠根據(jù)輸入數(shù)據(jù)表現(xiàn)出不同的個(gè)性。

在數(shù)據(jù)的處理上它近乎是全能的,只受個(gè)人權(quán)限的限制。

如果真的賦予實(shí)體,那它可以感知周?chē)h(huán)境并作出與人類(lèi)似但很多方面會(huì)更優(yōu)秀的反應(yīng)。

今天的智能音箱和未來(lái)相對(duì)終極的語(yǔ)音交互方式以及設(shè)備相比,其差距要遠(yuǎn)大于 X86 電腦和今天 Pad 的差距。

一旦發(fā)展成以上這樣的程度,那語(yǔ)音交互就會(huì)徹底地打開(kāi)邊界,而不只是我們使用數(shù)據(jù)的一種方式,甚至?xí)蔀樯畹谋仨毱?。我們不?huì)對(duì) iPhone 產(chǎn)生依戀,但語(yǔ)音交互則會(huì)。

回顧下《黑鏡》里描述的場(chǎng)景,可以對(duì)此有更好的理解:

女主人公的丈夫去世,過(guò)于思念自己丈夫的女主人公通過(guò)公開(kāi)的自己丈夫的數(shù)據(jù)創(chuàng)建了一個(gè)有性格的,屬于自己的語(yǔ)音交互機(jī)器人。這個(gè)機(jī)器人在絕大多數(shù)方面表現(xiàn)和女主丈夫一致。女主使用一段時(shí)間后,就升級(jí)了這服務(wù),為這語(yǔ)音交互機(jī)器人賦予了和自己丈夫一樣的形體。

這看著非??苹?,但實(shí)際上一旦語(yǔ)音交互達(dá)到上述程度,那這類(lèi)事情幾乎一定發(fā)生。既然我們能接受很宅并愿意躲在家里,那就一定能接受這樣一種非真實(shí)、但更完美的電子助手進(jìn)入心靈的世界?!端愤@部電影雖然沒(méi)拍,但如果有為個(gè)性化語(yǔ)音交互系統(tǒng)塑形的服務(wù),主人公也一定會(huì)接受。

在這里反倒是互聯(lián)網(wǎng)限制了我們的想象力,因?yàn)榛ヂ?lián)網(wǎng)更多體現(xiàn)的只是工具的屬性,但實(shí)際上語(yǔ)音交互系統(tǒng)所涵蓋的范圍要比互聯(lián)網(wǎng)大的多。當(dāng)前之所以能做的還不多,主要是層級(jí)還不夠。

▌?wù)Z音交互的L1、L2、L3

我們可以這樣定義語(yǔ)音交互的 L1 階段:

能以極高的準(zhǔn)確率,在典型的環(huán)境下響應(yīng)用戶(hù)的語(yǔ)音輸入。極高的準(zhǔn)確率最低應(yīng)該在 90%+。這時(shí)承載語(yǔ)音交互的設(shè)備主要負(fù)責(zé)功能性的提示與反饋(燈與屏幕等)。

當(dāng)前所有與語(yǔ)音相關(guān)的公司,事實(shí)上都是在達(dá)成 L1 的路上。L1 的出口為語(yǔ)音交互習(xí)慣徹底樹(shù)立,人們面對(duì)每款設(shè)備的時(shí)候會(huì)首先想到用語(yǔ)音操作,而不是遙控器或者屏幕。

在 L1 階段語(yǔ)音交互更像是自動(dòng)化程度、精準(zhǔn)程度更高的搜索,但搜索的范圍擴(kuò)大了,不單是局限于已有的數(shù)字內(nèi)容,也擴(kuò)展到家電、視頻通話(huà)等正常搜索不會(huì)覆蓋的領(lǐng)域。

我們可以這樣定義 L2 階段:

能以極高的準(zhǔn)確率識(shí)別出交互的當(dāng)事人和環(huán)境,然后進(jìn)行個(gè)性化的交互。這時(shí)承載語(yǔ)音交互的設(shè)備通過(guò)攝像頭等傳感器能夠?qū)崟r(shí)感知,進(jìn)行適當(dāng)移動(dòng),初步擬人。

L2 階段體現(xiàn)的是個(gè)性化,不再是千人一面。如果 L2 得以達(dá)成,那《她》所描述的場(chǎng)景是可以實(shí)現(xiàn)的。語(yǔ)音交互可以定制出性格,而這種性格很可能確實(shí)滿(mǎn)足某個(gè)人的心理期待。

在 L2 階段,語(yǔ)音交互會(huì)打破工具的邊界,嘗試走入從來(lái)沒(méi)被搜索等介入的領(lǐng)域,比如排遣寂寞?,F(xiàn)在的各種 App 是按照領(lǐng)域來(lái)切分的,而在 L2 階段,所有 App 的邊界會(huì)被打破,信息的輸出是按照人來(lái)切分的。也就是說(shuō)不再有 BAT、頭條、美團(tuán)等,只有張三的語(yǔ)音交互助理,李四的語(yǔ)音交互助理。

我們可以這樣定義 L3 階段:

只要有數(shù)據(jù),語(yǔ)音交互系統(tǒng)的能力就可以無(wú)邊界擴(kuò)展(包括個(gè)性和能力)。交互設(shè)備可以進(jìn)行擬人化輸出。

L3 階段體現(xiàn)的是后端內(nèi)容擴(kuò)展的無(wú)邊界特性,不再是有多少智能就有多少人工,以及擬人化輸出。擬人化輸出包括移動(dòng)、說(shuō)話(huà)的語(yǔ)調(diào)、風(fēng)格、姿態(tài)等。

如果 L3 階段得以實(shí)現(xiàn),那《黑鏡》描述的場(chǎng)景是可以實(shí)現(xiàn)的。只要有一個(gè)人充分的數(shù)據(jù)描述,就可以立刻模擬這個(gè)人,然后賦予他一個(gè)真實(shí)的身體。

在 L3 階段,語(yǔ)音交互及其載體,將是社會(huì)生活、甚至家庭的一部分。

本質(zhì)上,從 L1 到 L3 體現(xiàn)的是數(shù)字化和智能程度不斷加深,同時(shí)數(shù)字和智能又按照人類(lèi)的理想形態(tài)進(jìn)行物化的過(guò)程。這一過(guò)程也是完全顛覆基于手機(jī)的移動(dòng)互聯(lián)網(wǎng)的過(guò)程。

▌?wù)Z音交互發(fā)展的核心障礙

整個(gè)行業(yè)迫切需要徹底解決下面的問(wèn)題:

解決前端聲學(xué)適配問(wèn)題,否則變成每個(gè)設(shè)備都需要調(diào)整,但真正能對(duì)其調(diào)整的人員很少。

NLP 整合足夠全的內(nèi)容資源,開(kāi)發(fā)出缺省的 Killer App,因?yàn)楫a(chǎn)品公司不可能系統(tǒng)地在產(chǎn)品周期內(nèi)整合所有內(nèi)容。

落地方式多樣化(包括純軟件、模組的)。語(yǔ)音交互和移動(dòng)應(yīng)用的根本不同是需要面對(duì)多種多樣的設(shè)備,所以其自身的落地形態(tài)必須是靈活的。

眼下不同產(chǎn)品公司的訴求差別很大,小公司希望的是 turn-key 的方案,有內(nèi)容的公司希望的是自己做部分 NLP,偏行業(yè)的公司希望的是有帶硬件可貼牌的產(chǎn)品、但自己開(kāi)發(fā)手機(jī) App,諸如此類(lèi)。

因?yàn)橛脩?hù)需求的復(fù)雜性,落地是一個(gè)相對(duì)長(zhǎng)跑且需要保持靈活的過(guò)程,不同產(chǎn)品公司需求的內(nèi)核是一樣的,但處理大品牌客戶(hù)總是需要靈活處理很多細(xì)節(jié)。這對(duì)于創(chuàng)業(yè)公司難度不大,但對(duì)巨頭會(huì)形成難以跨越的障礙。

▌未來(lái)三年必然會(huì)達(dá)成的成績(jī)

現(xiàn)在與語(yǔ)音交互相關(guān)的公司,核心在做的就是 L1 階段的事。這個(gè)階段雖然在人工智能的大趨勢(shì)里面,但本質(zhì)上智能并沒(méi)那么關(guān)鍵,關(guān)鍵的是便利以及能輸出的內(nèi)容。這兩者會(huì)推動(dòng)樹(shù)立語(yǔ)音交互這種習(xí)慣。

如果要在數(shù)量級(jí)上進(jìn)行判斷的話(huà),那三年后可以達(dá)成的目標(biāo)是:

每年有 10 億臺(tái)支持語(yǔ)音交互的設(shè)備售出。

至少故事機(jī)、電視機(jī)、電視盒子、汽車(chē)前后裝、白色家電、燈、鬧鐘等會(huì)加入這種特性。手機(jī)、Pad、電腦這些大品類(lèi)上語(yǔ)音交互的能力則會(huì)變成標(biāo)配,但使用頻次估計(jì)需要更長(zhǎng)的時(shí)間進(jìn)行提升。在最初,交互頻次會(huì)很差(這點(diǎn)在前文已提及),語(yǔ)音交互本身并非一種獨(dú)立的交互方式,而是同其背后的內(nèi)容深度綁定,我們很多的應(yīng)用實(shí)際上是針對(duì)手機(jī)和鍵盤(pán)鼠標(biāo)操作優(yōu)化過(guò)的。

凡是電子設(shè)備都可以用語(yǔ)音來(lái)進(jìn)行交互。

語(yǔ)音交互不會(huì)挑設(shè)備,同之前的交互相比,它可以更加低廉,理論上只要麥克風(fēng)并且能聯(lián)網(wǎng)就足夠了。相較于給設(shè)備加入鍵盤(pán)鼠標(biāo)或者屏幕,這個(gè)成本要低很多。這點(diǎn)上做出表率的仍然是亞馬遜,亞馬遜不停地推出新的設(shè)備,如微波爐、車(chē)載設(shè)備等。當(dāng)然不同設(shè)備上語(yǔ)音交互的層次是不同的,有些設(shè)備如白色家電,語(yǔ)音交互會(huì)限制在一到三輪以?xún)?nèi)。

在更高一級(jí)的視角下,當(dāng)前的所有努力本質(zhì)作用就一個(gè):通過(guò)便利性樹(shù)立語(yǔ)音交互的習(xí)慣。但是,習(xí)慣背后跟隨的是用戶(hù)時(shí)間,二者又會(huì)為下面的進(jìn)一步發(fā)展提供試驗(yàn)田。只有達(dá)成了這一目標(biāo),從技術(shù)到產(chǎn)品再到用戶(hù)這一循環(huán)才算真正完成了第一次迭代。

▌結(jié)語(yǔ)

語(yǔ)音交互看著太簡(jiǎn)單了,不過(guò)是說(shuō)話(huà)而已,所以很容易被誤解為,像說(shuō)話(huà)一樣的交互就是現(xiàn)在語(yǔ)音交互設(shè)備所應(yīng)該能干的事。其實(shí)不是,語(yǔ)音交互的從 L1 到 L3 有可能比自動(dòng)駕駛從 L1 到 L5 還要漫長(zhǎng)。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 人工智能
    +關(guān)注

    關(guān)注

    1807

    文章

    49029

    瀏覽量

    249607
  • 語(yǔ)音交互
    +關(guān)注

    關(guān)注

    3

    文章

    307

    瀏覽量

    28622

原文標(biāo)題:語(yǔ)音交互只是說(shuō)話(huà)?相比自動(dòng)駕駛它還在L1級(jí)!

文章出處:【微信號(hào):rgznai100,微信公眾號(hào):rgznai100】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    L3級(jí)自動(dòng)駕駛即將全面商用,眾車(chē)企蓄勢(shì)待發(fā)

    依據(jù)。 ? 到了2024年底,《北京市自動(dòng)駕駛汽車(chē)條例》通過(guò),自2025年4月1日起施行,明確了L3自動(dòng)駕駛汽車(chē)在北京市的測(cè)試和運(yùn)營(yíng)規(guī)則。與此同時(shí),《武漢市智能網(wǎng)聯(lián)汽車(chē)發(fā)展促進(jìn)條例》也
    的頭像 發(fā)表于 01-18 00:57 ?6135次閱讀

    佑駕創(chuàng)新車(chē)規(guī)級(jí)L4自動(dòng)駕駛小巴獲項(xiàng)目定點(diǎn)

    近日,深圳佑駕創(chuàng)新科技股份有限公司(2431.HK)宣布,其采用車(chē)規(guī)級(jí)方案的L4級(jí)自動(dòng)駕駛小巴獲得中國(guó)電信股份有限公司無(wú)人小巴項(xiàng)目定點(diǎn),并將于二季度完成交付。標(biāo)志著佑駕創(chuàng)新
    的頭像 發(fā)表于 05-13 17:09 ?1243次閱讀

    L0到L5自動(dòng)駕駛技術(shù)的演進(jìn)階段

    高盛(Goldman Sachs)估計(jì),到2030年,L3級(jí)自動(dòng)駕駛汽車(chē)或占全球新車(chē)銷(xiāo)量的10%。自動(dòng)駕駛汽車(chē)需要經(jīng)過(guò)多達(dá)6個(gè)層級(jí)的技術(shù)演進(jìn),才能最終實(shí)現(xiàn)上路自主
    的頭像 發(fā)表于 04-24 10:42 ?658次閱讀

    產(chǎn)業(yè)鏈起飛!L3級(jí)自動(dòng)駕駛年內(nèi)有望落地

    電子發(fā)燒友網(wǎng)報(bào)道(文/梁浩斌)近幾個(gè)月,關(guān)于L3級(jí)自動(dòng)駕駛落地的聲音越來(lái)越多。 ? 小鵬汽車(chē)董事長(zhǎng)何小鵬在社交媒體透露,2025年底將推出真L3級(jí)
    發(fā)表于 03-13 00:22 ?1238次閱讀

    佑駕創(chuàng)新成功交付L4級(jí)自動(dòng)駕駛小巴項(xiàng)目

    近日,深圳佑駕創(chuàng)新科技股份有限公司(股票代碼:2431.HK)在蘇州圓滿(mǎn)完成了基于“車(chē)路云一體化”技術(shù)的L4級(jí)自動(dòng)駕駛小巴項(xiàng)目交付。這一里程碑事件標(biāo)志著佑駕創(chuàng)新在自動(dòng)駕駛領(lǐng)域取得了重大
    的頭像 發(fā)表于 02-17 10:55 ?1031次閱讀

    從《自動(dòng)駕駛地圖數(shù)據(jù)規(guī)范》聊高精地圖在自動(dòng)駕駛中的重要性

    自動(dòng)駕駛地圖作為L3級(jí)及以上自動(dòng)駕駛技術(shù)的核心基礎(chǔ)設(shè)施,其重要性隨著智能駕駛技術(shù)的發(fā)展愈發(fā)顯著?!?b class='flag-5'>自動(dòng)駕
    的頭像 發(fā)表于 01-05 19:24 ?2319次閱讀
    從《<b class='flag-5'>自動(dòng)駕駛</b>地圖數(shù)據(jù)規(guī)范》聊高精地圖在<b class='flag-5'>自動(dòng)駕駛</b>中的重要性

    伊予鐵巴士公司啟動(dòng)L4級(jí)自動(dòng)駕駛公交商業(yè)運(yùn)營(yíng)

    近日,據(jù)報(bào)道,日本松山市的伊予鐵巴士公司正式啟動(dòng)了“Level 4”級(jí)(即L4級(jí))自動(dòng)駕駛公交巴士的商業(yè)運(yùn)營(yíng)。這一舉措標(biāo)志著自動(dòng)駕駛技術(shù)在公
    的頭像 發(fā)表于 12-27 10:50 ?1092次閱讀

    標(biāo)貝科技:自動(dòng)駕駛中的數(shù)據(jù)標(biāo)注類(lèi)別分享

    自動(dòng)駕駛訓(xùn)練模型的成熟和穩(wěn)定離不開(kāi)感知技術(shù)的成熟和穩(wěn)定,訓(xùn)練自動(dòng)駕駛感知模型需要使用大量準(zhǔn)確真實(shí)的數(shù)據(jù)。據(jù)英特爾計(jì)算,L3+級(jí)自動(dòng)駕駛每輛汽
    的頭像 發(fā)表于 11-22 15:07 ?2027次閱讀
    標(biāo)貝科技:<b class='flag-5'>自動(dòng)駕駛</b>中的數(shù)據(jù)標(biāo)注類(lèi)別分享

    標(biāo)貝科技:自動(dòng)駕駛中的數(shù)據(jù)標(biāo)注類(lèi)別分享

    自動(dòng)駕駛訓(xùn)練模型的成熟和穩(wěn)定離不開(kāi)感知技術(shù)的成熟和穩(wěn)定,訓(xùn)練自動(dòng)駕駛感知模型需要使用大量準(zhǔn)確真實(shí)的數(shù)據(jù)。據(jù)英特爾計(jì)算,L3+級(jí)自動(dòng)駕駛每輛汽
    的頭像 發(fā)表于 11-22 14:58 ?3819次閱讀
    標(biāo)貝科技:<b class='flag-5'>自動(dòng)駕駛</b>中的數(shù)據(jù)標(biāo)注類(lèi)別分享

    l4級(jí)自動(dòng)駕駛的特點(diǎn)是什么

    L4級(jí)自動(dòng)駕駛作為自動(dòng)駕駛技術(shù)的一個(gè)重要里程碑,代表了高度自動(dòng)化的駕駛模式,能夠在無(wú)需
    的頭像 發(fā)表于 10-22 14:41 ?2512次閱讀

    通用汽車(chē)正全力推進(jìn)L3級(jí)自動(dòng)駕駛系統(tǒng)的開(kāi)發(fā)

    10月6日最新消息顯示,通用汽車(chē)正積極致力于L3級(jí)自動(dòng)駕駛系統(tǒng)的研發(fā),目標(biāo)是在特定情境下讓駕駛員無(wú)需持續(xù)監(jiān)控路況也能享受自動(dòng)駕駛的便利。這一
    的頭像 發(fā)表于 10-08 17:01 ?1285次閱讀

    經(jīng)緯恒潤(rùn)全冗余R-EPS助力L4級(jí)自動(dòng)駕駛落地

    隨著L4級(jí)自動(dòng)駕駛技術(shù)的逐步成熟與商業(yè)化進(jìn)程加速,行業(yè)對(duì)車(chē)輛安全性的要求達(dá)到了新的高度。為了確保自動(dòng)駕駛車(chē)輛全天候、全路況下安全運(yùn)行,冗余系統(tǒng)的研發(fā)與應(yīng)用成為關(guān)鍵。在這一背景下,經(jīng)緯
    的頭像 發(fā)表于 09-24 08:00 ?1534次閱讀
    經(jīng)緯恒潤(rùn)全冗余R-EPS助力<b class='flag-5'>L</b>4<b class='flag-5'>級(jí)</b><b class='flag-5'>自動(dòng)駕駛</b>落地

    L4級(jí)自動(dòng)駕駛打造的車(chē)規(guī)級(jí)域控制器AD1在合肥成功下線(xiàn)

    8月13日最新消息傳來(lái),合肥經(jīng)濟(jì)技術(shù)開(kāi)發(fā)區(qū)內(nèi)的聯(lián)寶工廠迎來(lái)了一個(gè)重要里程碑——專(zhuān)為L4級(jí)自動(dòng)駕駛市場(chǎng)打造的車(chē)規(guī)級(jí)域控制器AD1在此成功下線(xiàn)。
    的頭像 發(fā)表于 08-15 14:24 ?1441次閱讀

    FPGA在自動(dòng)駕駛領(lǐng)域有哪些優(yōu)勢(shì)?

    。 硬件級(jí)安全: 自動(dòng)駕駛系統(tǒng)對(duì)安全性有極高的要求。FPGA的硬件級(jí)安全性使其能夠在硬件層面實(shí)現(xiàn)數(shù)據(jù)加密、防篡改和防攻擊等安全功能,確保自動(dòng)駕駛系統(tǒng)的穩(wěn)定運(yùn)行和數(shù)據(jù)安全。 易于集成
    發(fā)表于 07-29 17:11

    FPGA在自動(dòng)駕駛領(lǐng)域有哪些應(yīng)用?

    FPGA(Field-Programmable Gate Array,現(xiàn)場(chǎng)可編程門(mén)陣列)在自動(dòng)駕駛領(lǐng)域具有廣泛的應(yīng)用,其高性能、可配置性、低功耗和低延遲等特點(diǎn)為自動(dòng)駕駛的實(shí)現(xiàn)提供了強(qiáng)有力的支持。以下
    發(fā)表于 07-29 17:09