紅樓夢(mèng)中,只有王熙鳳足夠獨(dú)特的聲音,才能讓大觀園眾人“未見其人,先聞其聲”。
如今,借助AI語音技術(shù)與算法,就算大觀園里有人說英文,有人說德語,依然能“未見其人,先辨其聲”。
這就是聲紋識(shí)別,即根據(jù)待識(shí)別語音的聲紋特征,識(shí)別該段語音對(duì)應(yīng)的說話人。聲紋指說話人的語音生物特征,理論上,同指紋一樣,聲紋具有專屬獨(dú)特性。目前,聲紋特征也已應(yīng)用于特定人合成與變聲、特定人分離、特定人喚醒等具體的特定人應(yīng)用場(chǎng)景。
聲紋識(shí)別的核心難點(diǎn)在于系統(tǒng)的魯棒性,即無論語音文本是什么內(nèi)容、說話人用什么語言、語音信號(hào)的時(shí)間長短、聲音錄制和傳輸?shù)男诺婪绞?、聲音采集時(shí)的環(huán)境噪聲干擾等都需要能準(zhǔn)確識(shí)別說話人的身份。在實(shí)際場(chǎng)景落地中,如面對(duì)智能家居和智能機(jī)器人,說話人與智能設(shè)備交互時(shí)會(huì)有一定距離,這就屬于遠(yuǎn)場(chǎng)聲紋識(shí)別。與近場(chǎng)聲紋識(shí)別相比,其信道比更低,且伴隨有混響和噪聲,識(shí)別難度更高。目前,許多成熟的算法使得上述聲紋識(shí)別的準(zhǔn)確率和魯棒性得到了顯著的提高。
曙光所建設(shè)的“全國一體化算力服務(wù)平臺(tái)”,基于業(yè)內(nèi)首個(gè)算網(wǎng)原生資源底座,為聲紋識(shí)別技術(shù)提供大規(guī)模算力算法服務(wù),通過一體化資源協(xié)同調(diào)度系統(tǒng),智慧化、定制化地根據(jù)作業(yè)需求匹配計(jì)算資源與環(huán)境,可以點(diǎn)對(duì)點(diǎn)實(shí)現(xiàn)供需雙方的順暢對(duì)接。因聲紋識(shí)別技術(shù)有良好的準(zhǔn)確性、經(jīng)濟(jì)性和可擴(kuò)展性,擁有廣闊的發(fā)展空間,將有望大規(guī)模應(yīng)用于金融安全、公共安全、社保生存認(rèn)證、移動(dòng)互聯(lián)網(wǎng)安全、車聯(lián)網(wǎng)安全等各個(gè)領(lǐng)域。
-
互聯(lián)網(wǎng)
+關(guān)注
關(guān)注
55文章
11251瀏覽量
106465 -
曙光
+關(guān)注
關(guān)注
0文章
188瀏覽量
13704 -
識(shí)別技術(shù)
+關(guān)注
關(guān)注
0文章
211瀏覽量
20032
原文標(biāo)題:AI語音+聲紋識(shí)別 實(shí)現(xiàn)“未見其人,先辨其聲”
文章出處:【微信號(hào):sugoncn,微信公眾號(hào):中科曙光】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
“四算合一”算力平臺(tái),芯片國產(chǎn)化率超九成,兼容8種國產(chǎn)AI芯片
軟通智算中標(biāo)韶關(guān)公共算力服務(wù)平臺(tái)項(xiàng)目
AI原生架構(gòu)升級(jí):RAKsmart服務(wù)器在超大規(guī)模模型訓(xùn)練中的算力突破
智能算力最具潛力的行業(yè)領(lǐng)域

DeepSeek推動(dòng)AI算力需求:800G光模塊的關(guān)鍵作用
濟(jì)南市中區(qū)存算一體化智算中心上線DeepSeek

星凡星啟,全面助力算力集群建設(shè)

GPU算力開發(fā)平臺(tái)是什么
青云科技強(qiáng)化AI算力架構(gòu),升級(jí)產(chǎn)品與服務(wù)體系
華信一體化智能天線賦能GNSS技術(shù)應(yīng)用更便捷

評(píng)論