谷歌今天詳細(xì)介紹了一個(gè)名為WaveNetEQ的AI系統(tǒng),該系統(tǒng)最近已部署到該公司的跨平臺(tái)語音和視頻聊天應(yīng)用Duo中。
二重奏組可以現(xiàn)實(shí)地合成簡(jiǎn)短的語音片段,以替代因互聯(lián)網(wǎng)連接不穩(wěn)定而導(dǎo)致的亂碼。它的速度足夠快,可以在智能手機(jī)上運(yùn)行,??同時(shí)提供最先進(jìn)的,聽起來自然的音頻質(zhì)量,為將來針對(duì)帶寬受限的環(huán)境進(jìn)行了優(yōu)化的聊天應(yīng)用程序奠定了基礎(chǔ)。
正如Google解釋的那樣,為了確保可靠的實(shí)時(shí)通信,有必要處理接收方需要時(shí)丟失的數(shù)據(jù)包(即,格式化的數(shù)據(jù)單元)。(該公司表示,由于網(wǎng)絡(luò)問題,有99%的Duo呼叫需要處理網(wǎng)絡(luò)問題,而有10%的呼叫損失的音頻持續(xù)時(shí)間超過總音頻持續(xù)時(shí)間的8%。)
如果不連續(xù)傳送新音頻,則會(huì)出現(xiàn)可聽到的小故障和縫隙。會(huì)發(fā)生,但是重復(fù)相同的音頻并不理想,因?yàn)樗鼤?huì)產(chǎn)生偽像并降低總體通話質(zhì)量。
Google的解決方案WaveNetEQ是所謂的丟包遏制模塊,該模塊負(fù)責(zé)創(chuàng)建數(shù)據(jù)以填補(bǔ)由丟包,過度抖動(dòng)和其他事故造成的空白。
在結(jié)構(gòu)上,WaveNetEQ是DeepMind的WaveRNN的修改版本,WaveRNN是一種用于語音合成的機(jī)器學(xué)習(xí)模型,由自回歸和條件調(diào)節(jié)網(wǎng)絡(luò)組成。
自回歸網(wǎng)絡(luò)通過使每個(gè)生成的樣本取決于網(wǎng)絡(luò)的先前輸出來提供短期和中期語音結(jié)構(gòu),而調(diào)節(jié)網(wǎng)絡(luò)會(huì)影響自回歸網(wǎng)絡(luò)以產(chǎn)生與移動(dòng)速度較慢的輸入特征一致的音頻。
-
Google
+關(guān)注
關(guān)注
5文章
1789瀏覽量
58980 -
音頻
+關(guān)注
關(guān)注
29文章
3040瀏覽量
83405 -
互聯(lián)網(wǎng)
+關(guān)注
關(guān)注
55文章
11248瀏覽量
106348
發(fā)布評(píng)論請(qǐng)先 登錄
大家都在用什么AI軟件?有沒有好用的免費(fèi)的AI軟件推薦一下?
嵌入式AI技術(shù)漫談 如何組建一個(gè)AI項(xiàng)目開發(fā)小組

使用EZ-USB? SUITE構(gòu)建img文件并決定將示例程序下載到開發(fā)板時(shí),遇到一個(gè)名為“Bootloader未運(yùn)行”的錯(cuò)誤,怎么解決?
Deepseek海思SD3403邊緣計(jì)算AI產(chǎn)品系統(tǒng)
首創(chuàng)開源架構(gòu),天璣AI開發(fā)套件讓端側(cè)AI模型接入得心應(yīng)手
Banana Pi 發(fā)布 BPI-AI2N & BPI-AI2N Carrier,助力 AI 計(jì)算與嵌入式開發(fā)
《AI Agent 應(yīng)用與項(xiàng)目實(shí)戰(zhàn)》----- 學(xué)習(xí)如何開發(fā)視頻應(yīng)用
《AI Agent應(yīng)用與項(xiàng)目實(shí)戰(zhàn)》閱讀體驗(yàn)--跟著迪哥學(xué)Agent
AI助力,機(jī)構(gòu)近一個(gè)月扎堆調(diào)研半導(dǎo)體行業(yè)
定制本地的ChatFile的AI問答系統(tǒng)

BitEnergy AI公司開發(fā)出一種新AI處理方法
下一代高功能新一代AI加速器(DRP-AI3):10x在高級(jí)AI系統(tǒng)高級(jí)AI中更快的嵌入處理

評(píng)論