一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

阿里讀唇AI幫助5億聽障人士

汽車玩家 ? 來源:venturebeat ? 作者:venturebeat ? 2019-12-06 16:00 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

阿里又出黑科技。新的唇語閱讀 AI 系統(tǒng)在識別準(zhǔn)確率表現(xiàn)上不僅超越基線標(biāo)準(zhǔn),也優(yōu)于專家級人類水平,有望為全球近 5 億聽障人士帶來福音。

阿里巴巴又出黑科技,AI 看唇語知內(nèi)容!

實(shí)際上,能夠從視頻中讀取嘴唇的 AI 和機(jī)器學(xué)習(xí)算法并沒有什么不同。早在 2016 年,來自 Google 和牛津大學(xué)的研究人員就詳細(xì)介紹了一種系統(tǒng),該系統(tǒng)可以 46.8% 的準(zhǔn)確度注釋視頻錄像,這個(gè)表現(xiàn)明顯優(yōu)于專業(yè)唇語識別人士 12.4% 準(zhǔn)確度。但是,即使是最先進(jìn)的系統(tǒng),也難以克服唇語識別時(shí)的歧義問題,這使唇語 AI 的性能一直難以超越音頻語音識別。

為了追求更好的性能,浙江阿里巴巴公司和史蒂文斯理工學(xué)院的研究人員聯(lián)合設(shè)計(jì)了一種方法,稱為 LIBS,該方法利用從語音識別器中提取的特征作為唇語識別時(shí)的補(bǔ)充信息。研究人員表示,LIBS 系統(tǒng)在兩個(gè)基準(zhǔn)測試中都達(dá)到了業(yè)界領(lǐng)先的準(zhǔn)確度,在識別字符錯(cuò)誤率方面,LIBS 分別較基線性能高出 7.66% 和 2.75%。

LIBS 和其他類似的解決方案一樣,都可以幫助聽障人士觀看缺少字幕的視頻。據(jù)估計(jì),全世界有 4.66 億人患有失能性聽力障礙,約占世界人口的5%。根據(jù)世界衛(wèi)生組織的數(shù)據(jù),到 2050 年,這一數(shù)字可能會超過 9 億。

LIBS 會從說話人的視頻中以多種不同尺度提取有用的音頻信息,包括序列級、上下文級和幀級。然后,系統(tǒng)會識別這些信息之間的對應(yīng)關(guān)系,將數(shù)據(jù)與視頻數(shù)據(jù)進(jìn)行對齊(由于開頭或結(jié)尾有時(shí)會出現(xiàn)采樣率不一致、視頻和音頻序列的長度不一致等情況),并利用過濾技術(shù)來優(yōu)化蒸餾功能。


LIBS 系統(tǒng)架構(gòu)示意圖

LIBS 的語音識別器和口語閱讀器組件均基于注意力的 seq2seq 體系結(jié)構(gòu),這是一種機(jī)器翻譯方法,可將序列的輸入(即音頻或視頻)映射到帶有標(biāo)簽的輸出和注意力值上。研究人員對上述內(nèi)容在 LRS2 和 CMLR 數(shù)據(jù)集上進(jìn)行了訓(xùn)練,LRS2 包含來自 BBC 的 45000 多個(gè)口語句子,CMLR 則是最大的中文普通話口語語料庫,包括了來自中國網(wǎng)絡(luò)電視臺網(wǎng)站的 10 萬余個(gè)自然句(包括 3000 多個(gè)漢字和 20000 多個(gè)短語)。

不過,研究團(tuán)隊(duì)也表示,由于某些句子長度太短,該模型難以在 LRS2 數(shù)據(jù)集上實(shí)現(xiàn)“合理的”結(jié)果。(解碼器從少于 14 個(gè)字符的句子中提取相關(guān)信息時(shí)會遇到困難。)但是,一旦對最大長度為 16 個(gè)單詞的句子進(jìn)行了預(yù)訓(xùn)練,解碼器將可以通過對上下文級別的知識進(jìn)行設(shè)置,提高 LRS2 數(shù)據(jù)中句子結(jié)尾部分的質(zhì)量。

研究人員在描述其工作的論文中寫道:“ LIBS 減少了對無關(guān)框架的關(guān)注。” “幀級知識提煉進(jìn)一步提高了視頻幀特征的可分辨性,使注意力更加集中。”

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    88

    文章

    35143

    瀏覽量

    279817
  • 語音識別
    +關(guān)注

    關(guān)注

    39

    文章

    1782

    瀏覽量

    114228
  • 阿里
    +關(guān)注

    關(guān)注

    6

    文章

    454

    瀏覽量

    33332
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    蘋果AI中國戰(zhàn)局大逆轉(zhuǎn)!百度出局,阿里上位

    電子發(fā)燒友網(wǎng)報(bào)道(文 / 吳子鵬)據(jù)科技媒體 The Information 援引消息人士報(bào)道,蘋果公司正與阿里巴巴展開合作,共同開發(fā)并推出面向中國 iPhone 用戶的人工智能(AI)。目前,雙方
    的頭像 發(fā)表于 02-13 00:20 ?2590次閱讀

    大家都在用什么AI軟件?有沒有好用的免費(fèi)的AI軟件推薦一下?

    大家都在用什么AI軟件?有沒有好用的免費(fèi)的AI軟件推薦一下?直接發(fā)個(gè)安裝包,謝謝。比如deepseek、Chatgpt、豆包、阿里AI、百度AI
    發(fā)表于 07-09 18:30

    安森美展示專業(yè)數(shù)字助聽器和OTC輔設(shè)備解決方案

    隨著國內(nèi)老齡化程度加劇以及對群體關(guān)懷的日益增強(qiáng),功能更強(qiáng)大、體驗(yàn)更人性化的助聽器正加速進(jìn)入市場。智研咨詢公開資料顯示,當(dāng)前我國助聽器市場規(guī)模已達(dá)約65元。展望未來,隨著
    的頭像 發(fā)表于 06-17 16:55 ?519次閱讀
    安森美展示專業(yè)數(shù)字助聽器和OTC輔<b class='flag-5'>聽</b>設(shè)備解決方案

    【「零基礎(chǔ)開發(fā)AI Agent」閱讀體驗(yàn)】+《零基礎(chǔ)開發(fā)AI Agent》掌握扣子平臺開發(fā)智能體方法

    儲備。然后介紹AI Agen的主流平臺,接著說明了扣子平臺開發(fā)AI Agent的流程和策略,然后對其插件、工作流、圖像流、知識庫等功能模塊進(jìn)行了詳細(xì)概述。并就5大場景,11個(gè)開發(fā)案例分別從功能,使用場
    發(fā)表于 05-14 19:51

    阿里稱要把AI融入每一塊業(yè)務(wù) 蔡崇信稱電商和云+AI是方向

    阿里和馬云的消息總是被人關(guān)注,前幾天還有爆料稱馬云即將回歸阿里,后來被馬云辟謠。 現(xiàn)在我們看到一個(gè)關(guān)于阿里AI的消息,在第21個(gè)“阿里日”;
    的頭像 發(fā)表于 05-12 15:32 ?343次閱讀

    RDK加持的導(dǎo)盲眼鏡:視人士的“眼睛外掛”

    我國有超1700萬視人士,如何讓他們更安全、自主地出行?別擔(dān)心,智能瞳行來啦!這是一款“自帶外掛”的導(dǎo)航神器,集成了高精度視覺傳感和YOLO算法,實(shí)時(shí)識別障礙物、行人、交通標(biāo)志,并通過語音播報(bào)精準(zhǔn)
    的頭像 發(fā)表于 03-14 19:43 ?638次閱讀
    RDK加持的導(dǎo)盲眼鏡:視<b class='flag-5'>障</b><b class='flag-5'>人士</b>的“眼睛外掛”

    百度AI手語數(shù)字人助力人士“聽見”聲音

    近幾年,百度先后與天津理工大學(xué)、鯨言科技合作,共同研發(fā)出百度智能云曦靈AI手語平臺與雙向手語翻譯機(jī),讓手語的“聲音”,被更多人聽見。
    的頭像 發(fā)表于 02-21 11:29 ?844次閱讀

    巨人網(wǎng)絡(luò)與阿里云深化AI合作

    巨人網(wǎng)絡(luò)近日宣布與阿里云進(jìn)一步深化合作關(guān)系,雙方將在游戲場景的AI落地應(yīng)用及算力生態(tài)建設(shè)等領(lǐng)域展開更為緊密的合作,共同推動AI技術(shù)與巨人網(wǎng)絡(luò)業(yè)務(wù)的深度融合。 基于近年來在“游戲+AI
    的頭像 發(fā)表于 02-14 14:06 ?566次閱讀

    阿里國際站AI升級,接入DeepSeek等先進(jìn)模型

    今年春節(jié)期間,阿里國際站AI外貿(mào)產(chǎn)品傳來捷報(bào),成功助力商家接到了價(jià)值2000萬美元的中東大單。這一成就不僅彰顯了阿里國際站AI外貿(mào)產(chǎn)品的強(qiáng)大實(shí)力,也預(yù)示著其在外貿(mào)領(lǐng)域的持續(xù)深耕和創(chuàng)新。
    的頭像 發(fā)表于 02-13 09:52 ?592次閱讀

    阿里巴巴否認(rèn)投資DeepSeek

    近日,有傳聞稱阿里巴巴計(jì)劃以100美元的估值,投資10美元認(rèn)購中國AI初創(chuàng)企業(yè)DeepSeek的10%股權(quán)。然而,阿里高管顏喬迅速對此進(jìn)
    的頭像 發(fā)表于 02-08 16:47 ?658次閱讀

    阿里否認(rèn)投資DeepSeek傳聞

    近日,有關(guān)阿里巴巴投資AI大模型DeepSeek的傳聞在市場上流傳甚廣。然而,阿里巴巴方面迅速對此進(jìn)行了澄清,明確表示并未投資DeepSeek。 據(jù)阿里相關(guān)
    的頭像 發(fā)表于 02-08 09:30 ?561次閱讀

    阿里AI To C業(yè)務(wù)調(diào)整:天貓精靈與夸克融合,探索AI眼鏡

    業(yè)務(wù)。 據(jù)知情人士透露,雖然智能互聯(lián)事業(yè)群將保持獨(dú)立運(yùn)作,但天貓精靈業(yè)務(wù)中心負(fù)責(zé)人宋剛將直接向吳嘉匯報(bào)。此外,天貓精靈的硬件團(tuán)隊(duì)已經(jīng)開始與夸克產(chǎn)品團(tuán)隊(duì)進(jìn)行融合,共同規(guī)劃新一代AI產(chǎn)品,并探索如何將夸克的AI能力與天貓精
    的頭像 發(fā)表于 01-17 10:16 ?732次閱讀

    中科芯:科技之光溫暖人群

    樹立行業(yè)標(biāo)桿,講好中國故事,傳遞中國聲音,充分展現(xiàn)騰飛的中國經(jīng)濟(jì)、崛起的民族品牌和向上的企業(yè)家精神。近日,“崛起的民族品牌”專題系列節(jié)目對話天津中科芯科技有限公司(簡稱:中科芯)的創(chuàng)始人兼總經(jīng)理
    的頭像 發(fā)表于 01-13 10:54 ?554次閱讀
    中科<b class='flag-5'>聽</b>芯:科技之光溫暖<b class='flag-5'>聽</b><b class='flag-5'>障</b>人群

    阿里巴巴季報(bào)出爐 阿里云二季度營收增長6%

    調(diào)整EBITA利潤達(dá)到450.35。阿里巴巴的季度經(jīng)營業(yè)績超出市場預(yù)期。AI則是一個(gè)大亮點(diǎn);AI正推動阿里云重回增長。
    的頭像 發(fā)表于 08-16 16:45 ?791次閱讀

    Cohere融資5美元,加速AI賽道競爭步伐

    據(jù)最新金融時(shí)報(bào)報(bào)道,加拿大人工智能初創(chuàng)企業(yè)Cohere在最新一輪融資中成功籌集了高達(dá)5美元的資金,這一壯舉不僅鞏固了其在全球AI領(lǐng)域的領(lǐng)先地位,也顯著提升了其與行業(yè)巨頭如OpenAI
    的頭像 發(fā)表于 07-23 14:38 ?947次閱讀