自蘋果Siri問世以來,智能語音似乎就是一場持續(xù)不斷的技術(shù)戰(zhàn)。亞馬遜推出自然生態(tài)語音操控產(chǎn)品Echo智能揚聲器,通過整合Alexa智能語音助手,進(jìn)一步推動智能語音嵌入式平臺發(fā)展,微軟緊隨其后推出自家Cortana小娜語音助理。為了追趕亞馬遜的步伐,谷歌今年I/O大會上也推出了新一代智能語音Assistant,三星在今年年終的時候也加緊推出Bixby。各家智能語音應(yīng)用對第三方開發(fā)者開發(fā)更是在年底集體爆發(fā),智能語音大戰(zhàn)一觸即發(fā),未來誰會在智能語音嵌入式平臺獲得長足的進(jìn)展?
?
蘋果(Siri)
Siri是一家語音公司,成立于2007年,2010年被蘋果以2億美金收購,最初是以文字聊天服務(wù)為主,隨后通過與全球最大的語音識別廠商Nuance合作,Siri實現(xiàn)了語音識別功能。
2011年,蘋果發(fā)布Siri語音助理,并集成到iPhone 4S中,作為iOS移動操作系統(tǒng)的一部分。
2012年6月12日,蘋果正式發(fā)布Siri中文版本,這是一款定位蘋果產(chǎn)品上的智能語音應(yīng)用軟件(語音助手),產(chǎn)品涵蓋蘋果iPhone4S、iPad3及以上版本。通過使用Siri語音助手,用戶可以通過聲控、文字輸入方式快速讀取文字語音短信、了解附近餐廳、詢問天氣情況、設(shè)置語音鬧鈴等等。
據(jù)悉,iPhone 4S、iPad3、The new iPad的Siri支持中文語音需要iOS6.0及以上版本。
Siri可以支持自然語言輸入,并且可以調(diào)用系統(tǒng)自帶的天氣預(yù)報、日程安排、搜索資料等應(yīng)用,還能夠不斷學(xué)習(xí)新的聲音和語調(diào),提供對話式的應(yīng)答。
在人機(jī)互動方面,Siri提供十分生動的對話接口,其針對用戶詢問所給予的回答,也不至于答非所問,有時候更是讓人有種心有靈犀的驚喜。例如使用者如果在說出、輸入的內(nèi)容包括了『喝了點』、『家』這些字(甚至不需要符合語法,相當(dāng)人性化、、、),Siri 則會判斷為喝醉酒、要回家,并自動建議是否要幫忙叫出租車。
具體來說,Siri有以下幾大功能:
1、用 Siri 播放隨機(jī)音樂
通過用戶導(dǎo)入本機(jī)音樂到“最愛”播放列表,開始播放音樂并告訴Siri播放哪一首歌、哪一個歌手曲目,Siri將會自動匹配最愛歌曲列表,實現(xiàn)歌曲隨機(jī)播放功能。
2、告訴Siri想去哪
查找路線還需要手動輸入文字?Siri會自動根據(jù)用戶語音調(diào)取Google地圖來尋找最優(yōu)路線方案,并及時反饋給用戶。
3、Siri代替手輸發(fā)送短訊
在外走路的時候不方便手動輸入短信息,想輸入短訊內(nèi)容時調(diào)取Siri語音即可。
4、Siri天氣預(yù)報
想知道最近天氣如何?問問Siri就知道了,一般情況Siri都能夠正確理解。
5、Siri智能鬧鐘
按住蘋果Home鍵并告訴Siri幾點叫醒,到預(yù)定時間Siri將會準(zhǔn)點叫醒。
6、支持新浪微博發(fā)送
7、Siri地點提醒
Siri除了“家”和“上班”兩個地點精準(zhǔn)定位外,用戶途徑某個經(jīng)常光顧的地方,說“這里”并設(shè)置好提醒,Siri在往后預(yù)定時間內(nèi)將會再次提醒。
8、使用Google日歷安排日程
9、Siri進(jìn)行答疑解惑
比如說:珠穆朗瑪峰現(xiàn)在多高?美國去年的GDP是多少?等諸如此類的科普、生活問題,Siri都會通過知識引擎尋找答案并給你反饋最終結(jié)果。
10、尋找一家合適的咖啡廳
另外,在今年6月的WWDC 2016大會上,蘋果發(fā)布了面向開發(fā)者的最新語音助手SiriKit,Siri不再局限于剛開始的基本聊天、打電話發(fā)短信基礎(chǔ)功能。SiriKit演進(jìn)到用戶可以通過喚醒語音
,并能把用戶語音識別及語意分析后,進(jìn)行應(yīng)用調(diào)取、聯(lián)系人郵件匹配發(fā)送、照片搜索、個人照片搜索、個人付款、外出打車車載語音應(yīng)用控制等多種應(yīng)用,用戶語音意圖識別度方面也會更精確、更加匹配。
今年10月份,蘋果Siri在iOS10發(fā)布時,正式開放了部分第三方應(yīng)用。
亞馬遜(Alexa)
亞馬遜開發(fā)Echo以及Alexa服務(wù)的項目可以追溯到2011年,這遠(yuǎn)遠(yuǎn)早于產(chǎn)品公之于眾的時間。Alexa機(jī)器學(xué)習(xí)的副主管兼首席科學(xué)家Rohit Prasad表示:“創(chuàng)建Alexa的靈感來源于Star Trek計算機(jī)?!睋Q句話說,亞馬遜希望創(chuàng)造出一個可以與有智慧的人類進(jìn)行交流的計算機(jī)界面。
亞馬遜認(rèn)為,Echo不應(yīng)當(dāng)僅成為一個聲控?fù)P聲器,而是應(yīng)該要徹底摒棄顯示屏。這意味著Alexa不單強(qiáng)調(diào)通過聲音進(jìn)行控制,還依靠聲音進(jìn)行100%控制。同時,Alexa項目的開發(fā)要求Alexa需要增強(qiáng)在機(jī)器學(xué)習(xí)及人工智能領(lǐng)域的專業(yè)技能。
2014年11月6日,亞馬遜正式推出Echo智能揚聲器以及聲控助手服務(wù)Alexa。據(jù)悉,Echo智能揚聲器是亞馬遜第一款引進(jìn)支持Alexa語音助手設(shè)備。與當(dāng)時蘋果推出Siri語音助理不同的是,亞馬遜將Echo定位為一款可以回應(yīng)簡單指令的智能揚聲器。用戶通過重復(fù)喚醒詞匯來叫醒Alexa,通過Echo遠(yuǎn)場麥克風(fēng)的作用,捕捉每一個任何位置發(fā)出的正常對話聲音,并在Alexa獲取相關(guān)語音指令之后作出相應(yīng)回復(fù)。
Alexa設(shè)備相比于從口袋中拿出手機(jī)更加方便,只需要在房間內(nèi)直接配備麥克風(fēng)即可。
2015年7月,亞馬遜正式對所有用戶公開出售Echo智能揚聲器,如今Echo已經(jīng)成為一個炙手可熱的消費類電子設(shè)備。根據(jù)第三方市場研究表示,Echo市場份額已經(jīng)已經(jīng)超越了頂尖的揚聲器制造商,如Bode、Logitech以及Sonos等。
從2016年1月份開始,Alexa掌握的技能已經(jīng)從原來的135個,增加到如今的4000個。譬如:你可以支付Capital One信用卡賬單,你可以要求獲得BBC的新聞簡訊,你可以詢問Good Housekeeping如何去除地毯上的紅酒污漬,你還可以讓Alexa假裝發(fā)出放屁聲。
亞馬遜推出Echo之后,繼續(xù)大力推廣Alexa。這跟谷歌的做法類似:在推出開發(fā)系統(tǒng)安卓平臺以后,就相繼推出了谷歌Nexus系列手機(jī)。谷歌做手機(jī)的目的從來就不是要成為智能手機(jī)的主要制造商,而是想利用Nexus來證明安卓的出色性能,并鼓勵其他手機(jī)制造商也使用安卓系統(tǒng)。Alexa智能揚聲器的新設(shè)計,將Alexa智能語音控制嵌入到許多智能音箱產(chǎn)品中,未來也會在很多電子設(shè)備上面看到嵌入的Alexa語音界面。
Alexa在無須打開屏幕或是按下按鈕就可以啟動,但同時也存在一系列的使用問題。如克服一些技術(shù)、設(shè)計以及社會性的難題。比如隱私問題,為了確保Alexa能被喚醒詞匯時候能夠聽到,就必須保持一直聆聽的狀態(tài),雖然亞馬遜方面表示用戶在說出“喚醒詞匯”之前的任何對話都不會被記錄及存儲下來。而且Alexa目前還無法獲悉能完成多少技能,這或多或少需要Alexa變得更加人工智能后可以準(zhǔn)確預(yù)測用戶需要的技能,并在對話中直接告訴你。
微軟(Cortana)
Cortana中文名字叫做“小娜”,是微軟隨win10系統(tǒng)推出的個人語音助理。
據(jù)悉,安卓版“小娜”公測beta版早在2015年8月的時候已經(jīng)推出,針對iPhone版的Cortana app測試也在當(dāng)年11月初開始公眾測試版本。
2015年12月10日,微軟小娜Cortana的iOS、Android以及CM系統(tǒng)版本正式版已經(jīng)在國內(nèi)5家主要應(yīng)用商店——騰訊應(yīng)用寶、百度手機(jī)助手、小米手機(jī)助手、華為應(yīng)用市場和360手機(jī)助手聯(lián)合首發(fā)。Cortana推送僅限于中國和美國兩國使用,并且僅支持iOS 8及以上版本的iPhone,以及Android 4.1.2及以上版本的Android設(shè)備。
根據(jù)微軟官方表示,智能機(jī)跟PC端的小娜一樣,擁有同樣的智能。既可以查收各類信息,又可以提供有用的建議。不過在iOS和Android系統(tǒng)上,Cortana在部分功能和喚醒方式上還是打了折扣。例如iOS系統(tǒng)上無法實現(xiàn)Windows手機(jī)包括控制系統(tǒng)設(shè)置的選項、打開各類應(yīng)用程序、以及在系統(tǒng)內(nèi)的任意位置通過“你好,小娜”的語音來喚醒微軟小娜。
微軟小娜“能夠了解用戶的喜好和習(xí)慣”,“幫助用戶進(jìn)行日程安排、問題回答等”。Cortana 可以說是微軟在機(jī)器學(xué)習(xí)和人工智能領(lǐng)域方面的嘗試。它會記錄用戶的行為和使用習(xí)慣,利用云計算、搜索引擎和“非結(jié)構(gòu)化數(shù)據(jù)”分析,讀取和“學(xué)習(xí)”包括手機(jī)中的文本文件、電子郵件、圖片、視頻等數(shù)據(jù),來理解用戶的語義和語境,從而實現(xiàn)人機(jī)交互。
2016年12月9日,微軟發(fā)布了安卓版Cortana2.0.1版本更新,新的安卓版微軟小娜采用了全新的UI設(shè)計,更加簡潔易用。此外在功能上,可以關(guān)聯(lián)手機(jī)日歷賬戶,同步日程安排等。
全球四大科技巨頭都在爭食智能語音控制市場,微軟小娜Cortana自然也不會落后,在今年12月中旬,微軟Alexa已經(jīng)對第三方硬件正式開放,這意味著外部設(shè)備也能夠利用Alexa進(jìn)行操控。
微軟宣布將面向外部設(shè)備廠商提供相關(guān)的開發(fā)包(New Devices SDK),從而讓他們植入小娜。比如外部廠商Harmon Kardon將會在明年推出基于小娜的智能音箱產(chǎn)品。
此處Cortana對外開放,微軟Cortana推出New Skills Kit和Devices SDK,兩者基本對應(yīng)于亞馬遜Alexa的技能工具包和語音服務(wù)。第三方硬件制造商也可以利用Cortana Devices SDK,來構(gòu)建包含Cortana板載的小工具,從而開發(fā)出其定制化的設(shè)備。
谷歌助手(Assistant)
谷歌今年在智能語音方面發(fā)生了一個非常重要的大事,大家猜猜看是什么?沒錯,就是2016年谷歌I/O大會上,谷歌正式發(fā)布了其首款智能語音系統(tǒng)Google Assistant(谷歌助手),此處發(fā)布也是谷歌史上的一個重要轉(zhuǎn)折點。Assistant正式登場,也為谷歌接下來的新產(chǎn)品,奠定了語音識別與人工智能的基調(diào)。
Google Assistant 可以控制智能手機(jī)、智能手表以及其他設(shè)備,通過使用自然語言與用戶對話,用于尋找信息、播放媒體內(nèi)容、執(zhí)行買電影票等任務(wù)。它能夠在不斷對話之中為你解決問題,而不像之前那樣只能用簡單的提問和回答。它還能完整地理解上下文語境,圍繞一個話題陪你一直聊下去,而不是你問一句它回一句。應(yīng)該說,這是目前最為智能的語音助手。從發(fā)表的 DEMO 來看 Google Assistant 能幫你尋找頭條新聞,幫你尋找最快的路徑,打電話給聯(lián)絡(luò)人,甚至直接在照片應(yīng)用 app 中尋找并向朋友分享照片。
其中一個例子是,當(dāng)你問 Google 今晚有什么電影時,Google Assistant 先會告訴你答案,緊接著當(dāng)你說會有孩子要去看電影時,Google 還會自動排除限制級的影片,當(dāng)你口頭確定后,Google 不僅把取票二維碼發(fā)給你,還會為你呈現(xiàn)電影的影評。
Google Assistant 可以兼容第三方服務(wù),包括 Ticketmaster、Spotify、Uber 以及 Whatsapp 等,但是亞馬遜的 Alexa在這個領(lǐng)域已經(jīng)占據(jù)優(yōu)勢。分析師認(rèn)為 Google Assistant 可以幫助谷歌更有效地與亞馬遜Echo設(shè)備對抗,同時與其他個人助理 Siri、Cortana 以及 Alexa 競爭。
12月8日,谷歌還推出了Conversation Actions系統(tǒng)工具,該工具可以幫助開發(fā)者構(gòu)建與Google Assistant配合使用的聊天機(jī)器人。據(jù)了解,通過讓第三方與聊天機(jī)器人進(jìn)行與Google用戶互動的方式,聊天機(jī)器人可以進(jìn)行問答,最終則能幫助銷售,做一些預(yù)訂方面的事。
12月9日,谷歌正式準(zhǔn)備面向第三方應(yīng)用程序開發(fā)商開放其語音助手Assistant。通過與第三方應(yīng)用程序整合,會讓谷歌Assistant在迅猛發(fā)展的語音助手領(lǐng)域變得更有競爭力。
三星(Bixby)
本來只有蘋果、亞馬遜、微軟、谷歌四家科技巨頭在智能語音領(lǐng)域方面占據(jù)主導(dǎo),但不得不提的是三星今年在智能語音控制方面也投入了不少的精力,在人工智能領(lǐng)域,發(fā)力的可不僅僅只是老生常談的幾家,眾多廠商已經(jīng)意識到智能語音領(lǐng)域未來潛在的無限能力和發(fā)展前景。
今年10月份,三星正式收購美國機(jī)器學(xué)習(xí)虛擬助手初創(chuàng)公司Viv Labs Inc。同時,還收購了Harman,位于美國紐約哈曼集團(tuán)旗下一個專門生產(chǎn)家用及車用音響的品牌,這些舉措進(jìn)一步表明三星未來在人工智能語音方面做大的決心。
Viv Labs是蘋果Siri創(chuàng)始團(tuán)隊之一,也是一家專做人工智能和虛擬助手的公司。被三星收購后,Viv Labs也帶去了最新的人工智能語音助手產(chǎn)品Viv。
據(jù)了解,Viv Labs由Siri 之父”戴格·吉特勞斯創(chuàng)辦,是一家致力于打造開放式人工智能助理平臺。
在三星的一份未來計劃報告中顯示,2017年Viv Labs旗下人工智能平臺Viv即將整合到蓋樂世智能手機(jī)中,并將語音輔助服務(wù)拓展至家電及可穿戴高科技設(shè)備。
根據(jù)最新消息稱,三星明年4月發(fā)布的三星Galaxy S8將使用上全新人工智能語音助手Bixby,Bixby基于Viv人工智能引擎,并會出現(xiàn)在Galaxy S8幾乎所有預(yù)裝應(yīng)用中,實現(xiàn)系統(tǒng)級的整合,全面取代現(xiàn)在的S Voice。
同時,Galaxy S8人工智能助理將面向開發(fā)者開放,從而能夠集成更多的新功能,并與第三方服務(wù)進(jìn)行交互。
屆時,Bixby語音助手更加先進(jìn)和智能,可以根據(jù)使用環(huán)境提供答案、輔助,比如在相冊中,你可以讓它展示滿足特定條件的照片和視頻。
小編總結(jié)
隨著四大科技巨頭蘋果Siri、亞馬遜Alexa、微軟Cortana、谷歌Assistant,還有后來者三星Bixby紛紛入局智能語音控制,智能語音嵌入式界面將會是打通語音控制的一個重要的接入點。智能語音開源將是未來語音平臺發(fā)展的下一代計算平臺,人工智能技術(shù)的崛起也將進(jìn)一步帶動智能語音的迅速發(fā)展。
評論