2025年6月12日,科大訊飛在深圳成功舉辦“交互引領(lǐng) 智啟新章”的智能交互產(chǎn)品升級(jí)發(fā)布會(huì)。
當(dāng)前,交互行業(yè)正經(jīng)歷著智能化的躍遷,但依然面臨三大核心挑戰(zhàn):多模態(tài)融合不足、垂直場(chǎng)景適配率低、實(shí)時(shí)交互延遲高。
應(yīng)對(duì)行業(yè)的交互困境,科大訊飛一口氣發(fā)布多款平臺(tái)與應(yīng)用:AIUI開(kāi)放平臺(tái)更新,新增模板智能體開(kāi)發(fā),全鏈路交互貫穿三方知識(shí)庫(kù)和私有模型;適用兒童交互的童言識(shí)別引擎登場(chǎng);三麥陣列降噪的智能眼鏡能快速分析需求,實(shí)時(shí)翻譯;機(jī)器人超腦平臺(tái)再升級(jí),智能語(yǔ)音背包實(shí)現(xiàn)即插即用;“一張照片+5分鐘”生成你的數(shù)字分身?科大訊飛推出的虛擬交互平臺(tái)支持82種語(yǔ)言生成。
大會(huì)現(xiàn)場(chǎng),科大訊飛還推出了面向辦公、人力與企業(yè)數(shù)字化等剛需場(chǎng)景的十大開(kāi)箱即用的場(chǎng)景化解決方案。同時(shí),主辦方特別設(shè)置了覆蓋100 余項(xiàng)創(chuàng)新產(chǎn)品的體驗(yàn)區(qū)。
從能聽(tīng)會(huì)說(shuō)到高情商創(chuàng)作,科大訊飛通過(guò)一系列方案更新針對(duì)性解決了人機(jī)交互中延遲慢、不精準(zhǔn)等痛點(diǎn),引領(lǐng)智能交互邁向更加高效、自然、智慧的階段。
盡管智能交互不斷進(jìn)步,用戶體驗(yàn)與預(yù)期的自然流暢卻相去甚遠(yuǎn)。
交互過(guò)程中的延遲感是首要痛點(diǎn)。而當(dāng)指令涉及多步驟任務(wù)時(shí),主流語(yǔ)音助手的完成率就更低了。智能家居場(chǎng)景中,關(guān)閉所有燈光指令若延遲,明顯的等待感不如直接手動(dòng)開(kāi)關(guān);車載語(yǔ)音系統(tǒng)在導(dǎo)航查詢時(shí),秒數(shù)級(jí)的延遲可能導(dǎo)致駕駛員錯(cuò)過(guò)關(guān)鍵路口決策時(shí)機(jī)。
用戶被迫適應(yīng)“機(jī)器的節(jié)奏”,經(jīng)常需要調(diào)整自己的表達(dá)方式來(lái)適應(yīng)設(shè)備的理解能力,比如必須使用固定句式或關(guān)鍵詞才能得到正確響應(yīng)——這無(wú)疑違背了人機(jī)交互的初衷。嘈雜環(huán)境中,語(yǔ)音識(shí)別準(zhǔn)確率大幅下降;多步驟任務(wù)中,系統(tǒng)往往只能執(zhí)行單一指令,無(wú)法理解復(fù)雜意圖。
尤其是對(duì)于發(fā)音還不夠標(biāo)準(zhǔn)、各種概念表達(dá)還不夠準(zhǔn)確的兒童來(lái)說(shuō),與智能助手對(duì)話常常面臨著各說(shuō)各話的尷尬。一方面,主流智能平臺(tái)難以從碎片化的童言中拼湊出兒童想表達(dá)的意思;另一方面,心智尚不成熟的幼兒無(wú)法像成年人一樣調(diào)整對(duì)話方式引導(dǎo)機(jī)器,可能常常面臨對(duì)話終止的尷尬。
而對(duì)企業(yè)級(jí)用戶而言,企業(yè)知識(shí)庫(kù)開(kāi)發(fā)和適應(yīng)業(yè)務(wù)需求模型微調(diào)上,企業(yè)尤為重視數(shù)據(jù)隱私安全,交互全流程自主研發(fā)難度大,私有化成本高。智能交互的場(chǎng)景適應(yīng)性差也是難點(diǎn),在展廳、工廠等嘈雜環(huán)境下的交互質(zhì)量明顯下降。并且,企業(yè)需要為每個(gè)應(yīng)用場(chǎng)景單獨(dú)開(kāi)發(fā)交互模塊,開(kāi)發(fā)周期長(zhǎng)、維護(hù)難度大。系統(tǒng)的更新也需要重新訓(xùn)練模型,影響產(chǎn)品迭代速度。這些痛點(diǎn)嚴(yán)重制約了交互產(chǎn)品的廣泛應(yīng)用和價(jià)值釋放,傳統(tǒng)交互設(shè)備呼喚著智能化的升級(jí)。
針對(duì)傳統(tǒng)人機(jī)交互領(lǐng)域的多重痛點(diǎn),科大訊飛構(gòu)建了互補(bǔ)協(xié)同的AIUI開(kāi)放平臺(tái)和機(jī)器人超腦平臺(tái)。
AIUI平臺(tái)是一套全鏈路的人機(jī)智能交互解決方案,旨在通過(guò)語(yǔ)音、圖像、手勢(shì)等自然交互方式,實(shí)現(xiàn)人與機(jī)器之間的持續(xù)、雙向、自然溝通。
該平臺(tái)自2015年上線以來(lái),持續(xù)迭代升級(jí),現(xiàn)已成為智能硬件、機(jī)器人、智能家居、車載系統(tǒng)等領(lǐng)域的核心交互技術(shù)提供商。
6月12日發(fā)布會(huì)上,科大訊飛宣布旗下AIUI開(kāi)放平臺(tái)已升級(jí)為全鏈路交互開(kāi)發(fā)平臺(tái),通過(guò)整合訊飛星火大模型,為開(kāi)發(fā)者提供更靈活、強(qiáng)大的交互能力。
一方面,AIUI平臺(tái)讓交互速度提升、精準(zhǔn)度提高。
AIUI平臺(tái)通過(guò)技術(shù)優(yōu)化,將交互響應(yīng)時(shí)間壓縮至1.6秒,結(jié)合星火大模型的AIUI增強(qiáng)了深度語(yǔ)義理解能力,用戶不再需要翻譯自己的想法為機(jī)器可理解的格式;對(duì)話體驗(yàn)上,AIUI平臺(tái)的全雙工交互技術(shù)打破了傳統(tǒng)“你說(shuō)完我再說(shuō)”的壁壘,系統(tǒng)允許用戶隨時(shí)插話、打斷或補(bǔ)充,真正做到“不搶話、不冷場(chǎng)”如同自然人際交流般流暢。為了讓開(kāi)發(fā)更簡(jiǎn)單便捷,AIUI新增模板智能體,讓開(kāi)發(fā)者通過(guò)可視化的配置即可構(gòu)建智能體。同時(shí)AIUI云端鏈路開(kāi)放了三方知識(shí)庫(kù)、智能體和私有模型的引用,企業(yè)開(kāi)發(fā)者不用上傳數(shù)據(jù)即可使用AIUI全鏈路語(yǔ)音交互技術(shù),保護(hù)了企業(yè)的數(shù)據(jù)隱私安全,復(fù)用了企業(yè)已經(jīng)開(kāi)發(fā)完備的資產(chǎn)。
針對(duì)環(huán)境噪聲,科大訊飛發(fā)布了三麥陣列降噪技術(shù),改善了用戶在廚房烹飪、戶外活動(dòng)等真實(shí)場(chǎng)景中的交互體驗(yàn)。智能眼鏡等穿戴設(shè)備借助三麥陣列降噪,突破了環(huán)境噪聲限制,實(shí)現(xiàn)了一對(duì)一私密對(duì)話。設(shè)備能精準(zhǔn)捕捉佩戴者的語(yǔ)音指令,提升了室外復(fù)雜環(huán)境下的語(yǔ)音識(shí)別成功率。騎行者無(wú)需減速停車即可通過(guò)語(yǔ)音操控導(dǎo)航和通訊功能;戶外工作者能在嘈雜的工地環(huán)境中一次性完成語(yǔ)音指令;旅行者可以在喧鬧的街道上進(jìn)行實(shí)時(shí)語(yǔ)音翻譯。
另一方面,情感計(jì)算為智能交互注入了溫度。
科大訊飛針對(duì)兒童群體首發(fā)推出了兒童專屬交互方案,當(dāng)兒童表現(xiàn)出沮喪情緒時(shí),系統(tǒng)會(huì)以溫和鼓勵(lì)的語(yǔ)調(diào)回應(yīng);當(dāng)檢測(cè)到用戶愉悅時(shí),則采用更活潑的交流方式。情感適配改變了智能設(shè)備冰冷刻板的傳統(tǒng)印象。
AI毛絨玩具采用AIUI的7911兒童交互開(kāi)發(fā)套件,優(yōu)化聲學(xué)模型與語(yǔ)義糾偏技術(shù),精準(zhǔn)識(shí)別模糊發(fā)音與跳躍式提問(wèn),支持情緒感知與寓教于樂(lè)內(nèi)容推薦。例如,孩子說(shuō)“我想看星星”,設(shè)備不僅播放科普視頻,還會(huì)引導(dǎo)孩子用英語(yǔ)描述不同星體的特征。
發(fā)布會(huì)現(xiàn)場(chǎng),幾位程序員寶爸受邀參加了一小時(shí)兒童應(yīng)用開(kāi)發(fā)比賽。他們需要依托星辰Agent平臺(tái),為手中的硬件開(kāi)發(fā)版建構(gòu)針對(duì)童言童語(yǔ)和幼兒心理的兒童交互Agent。
并且,為解決個(gè)性化不足問(wèn)題,科大訊飛構(gòu)建了對(duì)話上下文、用戶畫(huà)像和生活事件三層記憶系統(tǒng),讓設(shè)備能夠更好地理解個(gè)性化用戶習(xí)慣。智能家居領(lǐng)域,AIUI全鏈路優(yōu)化技術(shù)解決了傳統(tǒng)設(shè)備連接復(fù)雜、操作繁瑣的問(wèn)題,還通過(guò)深度理解用戶意圖,將分散的指令整合為場(chǎng)景化控制。當(dāng)用戶說(shuō)出我要看電影時(shí),系統(tǒng)自動(dòng)調(diào)暗燈光、關(guān)閉窗簾、打開(kāi)投影設(shè)備并調(diào)出??吹挠捌愋汀?/p>
2015年正式上線以來(lái),AIUI平臺(tái)日均交互量已突破3億次,鏈接生態(tài)伙伴超20萬(wàn),在電視、車載、兒童教育、機(jī)器?等領(lǐng)域建?行業(yè)標(biāo)桿。
作為科大訊飛的第二個(gè)技術(shù)引擎,機(jī)器人超腦平臺(tái)就像是機(jī)器人的智慧中樞系統(tǒng)。超腦平臺(tái)突破了傳統(tǒng)機(jī)器人單一功能執(zhí)行的局限,通過(guò)多模態(tài)感知融合與認(rèn)知決策能力的深度整合,實(shí)現(xiàn)了機(jī)器人從機(jī)械執(zhí)行到智能交互的升級(jí)。
一方面,理解能力顯著提升,機(jī)器人有了眼、嘴、大腦。整合視覺(jué)、語(yǔ)音、力覺(jué)等多維傳感數(shù)據(jù)的多模態(tài)交互系統(tǒng),使機(jī)器人能像人類一樣綜合判斷環(huán)境信息,環(huán)境感知準(zhǔn)確率提升至92%?;谛腔鸫竽P偷恼J(rèn)知理解能力,讓機(jī)器人具備社會(huì)常識(shí)和專業(yè)知識(shí)雙重理解維度,可應(yīng)對(duì)開(kāi)放場(chǎng)景下的多樣化需求。
小魚(yú)、艾米等搭載超腦平臺(tái)的穿山甲服務(wù)機(jī)器人,支持自然語(yǔ)言對(duì)話、導(dǎo)覽、送餐等功能,應(yīng)用于酒店、政務(wù)、醫(yī)療等場(chǎng)景,交互準(zhǔn)確率顯著提升;基于超腦平臺(tái)的“3D形象生成+AI語(yǔ)音合成”數(shù)字人,支持多語(yǔ)言播報(bào)、表情動(dòng)作同步,已用于新聞播報(bào)、直播帶貨等場(chǎng)景。
另一方面,機(jī)器人的行動(dòng)更加高效、流暢,實(shí)現(xiàn)了從感知到?jīng)Q策再到執(zhí)行的閉環(huán)智能。發(fā)布會(huì)上首次亮相的智能語(yǔ)音背包讓機(jī)器人即插即用,輕松開(kāi)口。采用模塊化設(shè)計(jì)的智能語(yǔ)音背包,所有功能集成一體,可快速集成到現(xiàn)有機(jī)器人或智能設(shè)備中,無(wú)需改動(dòng)硬件或額外開(kāi)發(fā)語(yǔ)音交互系統(tǒng),開(kāi)發(fā)門(mén)檻大大降低。大會(huì)現(xiàn)場(chǎng),搭載智能語(yǔ)音背包的G1文能作詩(shī)撩妹,武能拳打太極,引得現(xiàn)場(chǎng)觀眾陣陣歡呼。
服務(wù)于工業(yè)場(chǎng)景中,服務(wù)機(jī)器人通過(guò)機(jī)器人超腦的多模態(tài)感知,實(shí)現(xiàn)了高度自然的服務(wù)體驗(yàn);在銀行、醫(yī)院、政務(wù)大廳等公共服務(wù)場(chǎng)所,機(jī)器人不僅理解問(wèn)題本身,還能察覺(jué)用戶情緒,調(diào)整回應(yīng)策略;在數(shù)據(jù)高敏感的工業(yè)場(chǎng)景,端側(cè)部署大模型支持離線通話,沒(méi)有網(wǎng)絡(luò)也能及時(shí)互動(dòng);在物流倉(cāng)儲(chǔ)行業(yè),機(jī)器人復(fù)雜任務(wù)執(zhí)行成功率超過(guò)95%。
最新數(shù)據(jù)顯示,目前訊飛機(jī)器人超腦平臺(tái)產(chǎn)品覆蓋人形機(jī)器人、四足機(jī)器人、公共服務(wù)機(jī)器人等500多家機(jī)器人廠商;其中60%使用了包括麥克風(fēng)陣列降噪到語(yǔ)音交互全鏈路交互方案。
不止AIUI和機(jī)器人超腦,訊飛科大在發(fā)布會(huì)上還推出了一系列智能交互產(chǎn)品。
在2025科大訊飛智能交互發(fā)布會(huì)上亮相的虛擬人交互平臺(tái),堪稱數(shù)字分身制造機(jī)。用戶僅需上傳一張照片、錄入5分鐘語(yǔ)音,就能在分鐘級(jí)內(nèi)生成專屬虛擬形象與克隆音色,連方言口音都能精準(zhǔn)復(fù)刻。
依托星火大模型,虛擬人不僅支持82種語(yǔ)言流暢對(duì)話,還能通過(guò)手勢(shì)、眼神實(shí)現(xiàn)多模態(tài)交互,就像黃石市民之家的黃小政,能主動(dòng)識(shí)別方言為老人答疑。目前,該平臺(tái)已積累超100萬(wàn)聲音復(fù)刻用戶,滲透媒體、金融、教育等行業(yè),例如新聞主播通過(guò)文字一鍵生成播報(bào)視頻,電商虛擬主播實(shí)現(xiàn)多平臺(tái)24h帶貨,讓交互體驗(yàn)從能用升級(jí)為沉浸式陪伴。
大會(huì)現(xiàn)場(chǎng),科大訊飛開(kāi)放平臺(tái)總經(jīng)理趙艷軍就靠語(yǔ)音與照片實(shí)時(shí)生成了自己的數(shù)字分身“小趙”。大屏幕上的小趙分身不僅語(yǔ)音模仿得惟妙惟肖,還精通多門(mén)外語(yǔ),不忘詞、不結(jié)巴,讓演講者本人也直呼精妙。
不止靜態(tài)的數(shù)字分身,訊飛平臺(tái)還發(fā)布了“能說(shuō)、會(huì)動(dòng)、可感知”的移動(dòng)數(shù)字人解決方案。大會(huì)現(xiàn)場(chǎng),移動(dòng)數(shù)字人“小雨”聲動(dòng)相隨、靈活閃現(xiàn),面對(duì)隨機(jī)提問(wèn),現(xiàn)場(chǎng)嘉賓與小雨一問(wèn)一答,互動(dòng)感十足。
據(jù)悉,自訊飛星火大模型正式發(fā)布以來(lái),訊飛開(kāi)放平臺(tái)已新增超過(guò)453.6萬(wàn)開(kāi)發(fā)者,其中大模型直接相關(guān)的開(kāi)發(fā)者數(shù)量超過(guò)148.1萬(wàn),企業(yè)級(jí)用戶超過(guò)88.5萬(wàn)。海外開(kāi)發(fā)者團(tuán)隊(duì)數(shù)51.8萬(wàn)遍布新加坡、中東、日韓及歐洲。訊飛生態(tài)合作伙伴已突破1152萬(wàn)。
商業(yè)維度,科大訊飛累計(jì)中標(biāo)項(xiàng)目已超130個(gè),總金額突破14億元,中標(biāo)數(shù)量和金額均大幅領(lǐng)先行業(yè)。
今天的科大訊飛手握AIUI、機(jī)器人超腦平臺(tái)兩大技術(shù)引擎,在教育、醫(yī)療、金融、工業(yè)等多個(gè)領(lǐng)域深度賦能,真正讓AI從實(shí)驗(yàn)室走向千家萬(wàn)戶。而在時(shí)代的見(jiàn)證下,科大訊飛的智能交互之路還將走得更深、更遠(yuǎn)。
審核編輯 黃宇
-
AI
+關(guān)注
關(guān)注
88文章
34765瀏覽量
276921 -
科大訊飛
+關(guān)注
關(guān)注
19文章
840瀏覽量
62321
發(fā)布評(píng)論請(qǐng)先 登錄
評(píng)論