語(yǔ)音交互無論是人與人溝通,還是AI人工智能時(shí)代人與機(jī)器人互動(dòng)以及機(jī)器人與機(jī)器人之間的交互等都是最為基礎(chǔ)重要的一種方式。
對(duì)于今天AI人工智能時(shí)代基本的平臺(tái)載體--機(jī)器人來說,人機(jī)語(yǔ)音交互必須首先具有的主要功能之一。
盡管國(guó)內(nèi)的科大訊飛,百度以及目前最為火爆的國(guó)外Chat GPT已經(jīng)在人機(jī)語(yǔ)音交互技術(shù)上不斷地進(jìn)行突破,特別是Chat GPT給人的體驗(yàn)感。相信人機(jī)語(yǔ)音交互近年來市場(chǎng)化的應(yīng)用會(huì)帶來較大的變革與突破。但這多年實(shí)際市場(chǎng)上幾乎人機(jī)語(yǔ)音交互仍然還停留在最為初級(jí)還不足以支撐一個(gè)基本完整場(chǎng)景下的人與人交互的效果。
我們通過2016年至今2000臺(tái)左右機(jī)器人不同產(chǎn)業(yè)領(lǐng)域場(chǎng)景實(shí)際市場(chǎng)上的反饋以及人機(jī)語(yǔ)音交互市場(chǎng)化要求的不斷探索已基本上找到并驗(yàn)證過的方法與路徑。
首先我們回歸分析日常人與人語(yǔ)言交流的場(chǎng)景狀況。其主要特點(diǎn)如下:
1交談的主要內(nèi)容話題:無論是初次見面還是相識(shí)后的交流,基本上都是群體(行業(yè)/公司/朋友/親戚等)內(nèi)的相關(guān)的內(nèi)容。
2內(nèi)容的屬性:大部分溝通的內(nèi)容中是不便對(duì)外界完全可公開的。也就是說具有一定范圍群體的私密性。
3內(nèi)容的范圍延展性: 交談的內(nèi)容有些是已發(fā)生的;有些是計(jì)劃要做的;有些是即興而說的。
4內(nèi)容的頻次與關(guān)聯(lián)性:前后交流的內(nèi)容話題基本上關(guān)聯(lián)度比較高;前后之間交流內(nèi)容的跨度不大,內(nèi)容頻次較高。
5公共話題內(nèi)容:交流中也會(huì)涉及到與話題引發(fā)的公眾內(nèi)容,也就是可以對(duì)任何人不存在隱私的內(nèi)容。
6交互的時(shí)長(zhǎng)與內(nèi)容跨度:一般交流的時(shí)間與交談內(nèi)容的跨度不會(huì)很大。
然后我們?cè)賮矸治鲆幌氯藱C(jī)語(yǔ)音交互內(nèi)容的主要方法:
目前主流方法就是通過對(duì)相關(guān)大數(shù)據(jù)的訓(xùn)練并賦予模型深度學(xué)習(xí)的辦法。當(dāng)然效果要好就需要有大量的相關(guān)數(shù)據(jù)資源以及技術(shù)團(tuán)隊(duì)包括資金的支撐。
最后的結(jié)論與正確的做法路徑
1 我們從上述方法與人與人溝通的主要特點(diǎn)對(duì)比不難看出:目前主流做法訓(xùn)練出的人機(jī)語(yǔ)音交互還是不能支撐替代人與人實(shí)際交流溝通場(chǎng)景的主要內(nèi)容。
2 正確的做法就是:基于訊飛/百度/Chat GPT基礎(chǔ)上+自有系統(tǒng)上的數(shù)據(jù)庫(kù)(這個(gè)才是支撐交互溝通內(nèi)容的主要部分)而且這個(gè)數(shù)據(jù)庫(kù)的內(nèi)容也必須由用戶/相關(guān)人自己隨時(shí)根據(jù)實(shí)際需要來完善增添。
3我們近2年來通過上述辦法開發(fā)的人機(jī)語(yǔ)音交互軟件,通過實(shí)際用戶的使用體驗(yàn)以及與別家的對(duì)比;效果非常明顯;用戶體驗(yàn)感強(qiáng);愿意使用,評(píng)價(jià)較高。當(dāng)然我們會(huì)繼續(xù)按此思路不斷完善升級(jí)軟件。
-
機(jī)器人
+關(guān)注
關(guān)注
213文章
29718瀏覽量
212748 -
人機(jī)語(yǔ)音
+關(guān)注
關(guān)注
0文章
3瀏覽量
7217
發(fā)布評(píng)論請(qǐng)先 登錄
明遠(yuǎn)智睿SSD2351開發(fā)板:語(yǔ)音機(jī)器人領(lǐng)域的變革力量
盤點(diǎn)#機(jī)器人開發(fā)平臺(tái)
詳細(xì)介紹機(jī)場(chǎng)智能指路機(jī)器人的工作原理
【「# ROS 2智能機(jī)器人開發(fā)實(shí)踐」閱讀體驗(yàn)】機(jī)器人入門的引路書
大象機(jī)器人攜手進(jìn)迭時(shí)空推出 RISC-V 全棧開源六軸機(jī)械臂產(chǎn)品
零知開源——ESP32語(yǔ)音交互系統(tǒng)(AI小智)開發(fā)教程

基于WTVxxx語(yǔ)音芯片的智能清潔機(jī)器人語(yǔ)音交互系統(tǒng)設(shè)計(jì)方案介紹

廣州唯創(chuàng)電子WTK6900HC語(yǔ)音識(shí)別芯片:掃地機(jī)器人智能化的理想選擇

廣州唯創(chuàng)WTK6900HC語(yǔ)音識(shí)別芯片:掃地機(jī)器人智能化的理想選擇
開源項(xiàng)目!能夠精確地行走、跳舞和執(zhí)行復(fù)雜動(dòng)作的機(jī)器人—Tillu
【「具身智能機(jī)器人系統(tǒng)」閱讀體驗(yàn)】2.具身智能機(jī)器人大模型
【「具身智能機(jī)器人系統(tǒng)」閱讀體驗(yàn)】+數(shù)據(jù)在具身人工智能中的價(jià)值
從市場(chǎng)角度對(duì)機(jī)器人的基本解讀

評(píng)論