一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

百度AI手語數(shù)字人助力聽障人士“聽見”聲音

百度 ? 來源:百度 ? 2025-02-21 11:29 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

明靜不想去醫(yī)院了。

她不想每次走進醫(yī)院時,都被護士或是分診臺導醫(yī)勸說,回家?guī)细改冈賮怼?/p>

“我只是嗓子不舒服,爸媽都65歲了,我不想這點事都讓他們陪?!?/p>

明靜是一名聽障人士。去醫(yī)院看病、接外賣電話、打一輛網(wǎng)約車或是辦一張銀行卡,每一件日常小事,對她這樣的聽障人士而言,都是困難重重。

“執(zhí)教的這幾年,我做得最常見的工作,是陪學生去醫(yī)院看病。”明靜的老師——天津理工大學聾人工學院副院長袁甜甜感慨。

這所專門面向聽障人士的高等工科特殊教育學院,人稱“聾人小清華”,這里,容納著500多名像明靜這樣的學生。

2018年,聾人工學院的老師和學生們共同啟動了智能手語翻譯項目,并孵化出成果公司“鯨言科技”。

近幾年,百度先后與天津理工大學、鯨言科技合作,共同研發(fā)出百度智能云曦靈AI手語平臺與雙向手語翻譯機,讓手語的“聲音”,被更多人聽見。

//缺失的“基礎(chǔ)設(shè)施”

理解AI手語,先要了解聽障人群面臨的問題。第二次全國殘疾人抽樣調(diào)查數(shù)據(jù)顯示,我國大約有2004萬的聽力殘疾人,是世界上聽力殘疾人數(shù)最多的國家。

然而,無論線下線上,都鮮有能真正幫助聽障人群的服務(wù)設(shè)施。據(jù)調(diào)查,我國全職從事手語翻譯職業(yè)的人員不足千人,約97%的聾人因為手語翻譯的缺失面臨就診困難的問題。

手語是大多數(shù)聽力殘疾人的第一語言。但是,作為視覺語言,手語與健全人使用的有聲語言有著天然的不同,這種不同造就了聽障人群特有的思維邏輯,也構(gòu)成了他們對有聲語言的理解困難。

袁甜甜從語言學的角度舉例,如果聽障人士說“滅火”,最先打出的手語是“火”,因為在視覺語言里最先出現(xiàn)的是所要闡述的重點人事物,聽障人士習慣于先表達人事物,再表達處理方式或多者之間的關(guān)系。

在她的課堂上也是如此,即使有實時翻譯語音的字幕,袁甜甜還是會用手語配合口語,方便同學們理解。

//會打手語的數(shù)字人

張帆在《無聲的綻放》中寫道,對于聽障問題,重要的是消除社會歧視,而非消除“不正?!?;重要的是公正,而非藥物與慈善。

為幫助聽障人群解決“從手語到口語”的交流問題,2022年,百度推出了AI手語平臺,研發(fā)了針對線上場景的AI手語數(shù)字人和針對線下場景的雙向手語翻譯機,實現(xiàn)了“手語-漢語”的智能互譯。

在手語動作的專業(yè)性方面,百度智能云曦靈數(shù)字人產(chǎn)品團隊聯(lián)合手語語言學專家、特殊教育專家以及天津理工大學聾人工學院等,制定了面向人工智能應用的自然手語標注規(guī)范,建設(shè)了大規(guī)模自然手語翻譯語料庫,使模型能夠生成符合聽障人群習慣的自然手語。

通過百度數(shù)字人4D掃描技術(shù)訓練的AI手語數(shù)字人,不僅能呈現(xiàn)出真實生動的面部表情,還能借助動作融合算法,如真人般流暢表達11000多個《國家通用手語詞典》所涵蓋的手語動作,為聽障群體打造更具情感表現(xiàn)力的溝通體驗。

目前,百度的AI手語數(shù)字人已經(jīng)能夠識別語音、打出手語,在實時直播中用數(shù)字人形象進行手語同步翻譯,在央視NBA直播、冬奧會開幕式上,都出現(xiàn)過百度的AI手語數(shù)字人主播。

//從輸出到理解,讓AI“聽懂手語”

隨著AI技術(shù)爆發(fā)與數(shù)字人的廣泛應用,大模型的對話也變得更加生動。

AI手語數(shù)字人在“打出手語”的基礎(chǔ)上,也開始嘗試“理解”聽障人士的手語表達。與只能單向輸出信息的模式相比,理解了手語的數(shù)字人能夠更好地完成雙向溝通的閉環(huán)。

從2024年開始,百度正式投入雙向手語翻譯機的研發(fā)及生產(chǎn),這是多模態(tài)AI模型的典型應用,也是百度各項AI技術(shù)的集成。

當聽障人士打出手語之后,翻譯機需要先通過視覺識別及自然語言處理技術(shù),將手語翻譯為漢語;健全人理解后,將要回復的內(nèi)容通過語音識別驅(qū)動數(shù)字人翻譯,最終以手語和文字的形式,再呈現(xiàn)給聽障人士。其中,無論是視覺識別還是自然語言處理,都是AI模型的核心能力。

不過,只有模型能力遠遠不夠。

實際使用場景中,面臨著更多的技術(shù)考驗,比如:

◎聽障人士快速打出的手語時,會導致手部輪廓細節(jié)模糊,增加模型理解成本;

◎混雜的畫面背景會分散模型對手部區(qū)域的注意力,造成識別錯誤;

◎數(shù)據(jù)采集時出現(xiàn)的手語孤立詞會增加模型識別錯誤概率;

◎手語-漢語在語義等層面是多對多的關(guān)系,和具體使用場景有很強的相關(guān)性,任何不考慮語言學規(guī)律的“蠻力”翻譯都可能會造成天差地別的錯誤,影響聾健溝通的質(zhì)量。

解決這些技術(shù)問題之后,模型還需要更多的訓練數(shù)據(jù),而數(shù)據(jù)的標注要求工作者具備手語能力。因此,手語翻譯模型訓練及測試數(shù)據(jù)的生產(chǎn)、處理、分析基本都需要由手語使用者來完成。

近幾年,百度、天津理工大學、鯨言科技在全社會范圍內(nèi)收集了近千萬自然手語(含視頻、文本、標注等)作為多模態(tài)模型訓練數(shù)據(jù),終于在2024年完成了“雙向手語翻譯機”的研發(fā)。

//聽見手語的聲音

明靜也接觸了手語數(shù)據(jù)的采集工作。對產(chǎn)品進行交互性測試之后,她非常開心,“終于有人開始做這件事了”。

她是一個很樂觀的女孩,微信個性簽名是,“我還會選擇這滾燙的人生啊”。她希望自己的人生充滿可能性,而不是恐懼。她說,愿意拾起破碎的自己,愿意釋懷,愿意活在當下,愿意相信未來會更好。

2025年1月,中國殘聯(lián)等9部門聯(lián)合印發(fā)了《關(guān)于推進科技助殘的指導意見》,其中明確提到了“推動智能手語翻譯”的助殘措施。

越來越多的聽障人士,會在充滿聲音的世界中找到自己的位置;也會有越來越多的普通人,聽到手語翻飛的聲音。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    88

    文章

    35041

    瀏覽量

    279093
  • 百度
    +關(guān)注

    關(guān)注

    9

    文章

    2333

    瀏覽量

    92161
  • 模型
    +關(guān)注

    關(guān)注

    1

    文章

    3516

    瀏覽量

    50361
  • 數(shù)字人
    +關(guān)注

    關(guān)注

    0

    文章

    153

    瀏覽量

    2286

原文標題:想用AI,幫助這2000萬人

文章出處:【微信號:baidu_2000,微信公眾號:百度】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    蘋果AI中國戰(zhàn)局大逆轉(zhuǎn)!百度出局,阿里上位

    合作開發(fā)的 AI 功能已提交給監(jiān)管機構(gòu)審批,一旦獲批,將正式搭載在中國區(qū)的 iPhone 設(shè)備上。 ? 知情人士透露,自 2023 年起,蘋果公司便開始測試來自中國開發(fā)者的不同 AI 模型,起初與
    的頭像 發(fā)表于 02-13 00:20 ?2565次閱讀

    百度地圖重磅發(fā)布地圖AI開放平臺

    近日,在WGDC25全球時空智能大會上,百度地圖重磅發(fā)布地圖AI開放平臺。百度地圖深耕20年的數(shù)據(jù)能力、引擎能力與AI技術(shù)全面開放,向開發(fā)者深度開放四大核心能力和五大場景解決方案。
    的頭像 發(fā)表于 05-26 11:26 ?561次閱讀

    百度發(fā)布文心4.5 Turbo、X1 Turbo和多款AI應用

    近日,Create2025百度AI開發(fā)者大會在武漢舉辦。百度創(chuàng)始李彥宏發(fā)布了文心大模型4.5 Turbo及深度思考模型X1 Turbo兩大模型,以及多款
    的頭像 發(fā)表于 04-30 10:16 ?526次閱讀

    百度AI領(lǐng)域的最新進展

    近日,我們在武漢舉辦了Create2025百度AI開發(fā)者大會,與全球各地的5000多名開發(fā)者,分享了百度AI領(lǐng)域的新進展。
    的頭像 發(fā)表于 04-30 10:14 ?600次閱讀

    格靈深瞳亮相Create2025百度AI開發(fā)者大會

    近日,Create2025百度AI開發(fā)者大會在武漢體育中心圓滿落幕,作為全球首個AI開發(fā)者大會,Create2025百度AI開發(fā)者大會至今已
    的頭像 發(fā)表于 04-29 16:12 ?484次閱讀

    百度AI榮獲2025愛迪生獎金獎和銀獎

    剛剛,百度AI在「2025愛迪生獎」中獲得一金一銀兩項大獎。
    的頭像 發(fā)表于 04-08 15:43 ?452次閱讀

    百度自動駕駛或進軍阿聯(lián)酋市場

    據(jù)知情人士透露,百度自動駕駛業(yè)務(wù)或?qū)⑼卣怪涟⒙?lián)酋市場。近日,迪拜王儲Hamdan bin Mohammed在迪拜與百度創(chuàng)始李彥宏進行了會面,引發(fā)了業(yè)界廣泛關(guān)注。
    的頭像 發(fā)表于 02-13 15:28 ?499次閱讀

    百度智能云四款大模型應用完成DeepSeek適配

    百度智能云在AI大模型應用方面取得了新的進展。近日,其旗下的客悅、曦靈、一見、甄知四款大模型應用產(chǎn)品已正式上線接入DeepSeek模型的新版本。 此次升級后的產(chǎn)品,將為企業(yè)智能外呼、數(shù)字
    的頭像 發(fā)表于 02-10 10:47 ?473次閱讀

    百度文庫AI功能用戶量飆升,“自由畫布”公測啟動

    近日,在備受矚目的百度AI DAY活動上,百度副總裁、文庫事業(yè)部及網(wǎng)盤事業(yè)部負責人王穎帶來了令人振奮的消息。她透露,百度文庫的AI功能月度活
    的頭像 發(fā)表于 01-23 10:36 ?523次閱讀

    百度文庫AI功能MAU突破9000萬

    百度文庫AI功能MAU突破9000萬,AI DAU年同比增長230%。
    的頭像 發(fā)表于 01-22 10:28 ?706次閱讀

    百度文庫AI用戶量飆升,付費用戶突破4000萬

    百度文庫近日傳來喜訊,其AI功能的月活躍用戶數(shù)(MAU)已成功突破9000萬大關(guān),成為國內(nèi)用戶規(guī)模最大的AI應用之一。這一數(shù)字在全球范圍內(nèi)也僅次于ChatGPT的3.1億用戶,位列全球
    的頭像 發(fā)表于 01-07 10:31 ?670次閱讀

    百度科啟動“繁星計劃”

    近日,百度科攜手中國科協(xié)、中國科學院大學共同舉辦了史記2024·科學科100詞發(fā)布會,并在此盛會上正式啟動了“繁星計劃”。這一計劃的核心目標在于利用前沿的AI技術(shù),包括
    的頭像 發(fā)表于 12-31 10:26 ?689次閱讀

    百度發(fā)布AI創(chuàng)作新物種“自由畫布”,吸引超20萬預約

    近日,百度文庫與百度網(wǎng)盤攜手推出的AI創(chuàng)作新物種——“自由畫布”正式亮相,并宣布面向公眾開放邀測。這一創(chuàng)新舉措標志著百度在內(nèi)容操作系統(tǒng)領(lǐng)域邁出了重要一步。 據(jù)悉,“自由畫布”是
    的頭像 發(fā)表于 11-14 13:45 ?1109次閱讀

    百度將發(fā)布AI智能眼鏡

    近日,有知情人士透露,百度旗下的人工智能品牌小計劃在即將舉行的百度世界大會上推出一款全新的AI智能眼鏡。這款眼鏡將內(nèi)置先進的人工智能助手,
    的頭像 發(fā)表于 11-11 14:50 ?923次閱讀

    百度AI計算平臺4.0震撼發(fā)布

    在2024年百度云智大會的璀璨舞臺上,百度智能云重磅推出了AI異構(gòu)計算平臺的全新力作——4.0版本。此次升級,標志著百度
    的頭像 發(fā)表于 09-26 14:46 ?882次閱讀