一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

首個多語種AI 虛擬主播“小晴”亮相兩會

電子工程師 ? 來源:楊湘祁 ? 作者:電子發(fā)燒友 ? 2019-03-14 17:32 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

正值2019全國兩會期間的你

每天都會收到很多專業(yè)主持人送上的新聞報道

他們或沉穩(wěn)大方或幽默智慧

還有的穩(wěn)中帶皮……

咳咳,甚至還有機(jī)器人不甘示弱

向著名主持人白巖松老師拜師學(xué)藝的——

說的就是咱們的記者助理小白

TA可是會模仿白巖松老師的聲音哦

不過有一位特殊的主播

在兩會期間也悄悄上崗了

欣賞TA專業(yè)而迷人的表現(xiàn)

優(yōu)秀!這位主播芳名“小晴”

是由科大訊飛推出的

首個多語種A.I.虛擬主播

TA聲音動聽表情自然

還兼?zhèn)渲小⒂?、日、韓等多種語言的播報能力

沒想到是個顏值才氣并存的虛擬主播

先聞其聲

聽到“小晴”的聲音,你是不是以為有個真人主播在線讀稿?

NONONO! 只需要語音合成技術(shù)就可以實(shí)現(xiàn)啦

說起語音合成,大家應(yīng)該都不會感到陌生

不論是平時使用的導(dǎo)航軟件里各種播報語音

還是大家喜愛的聽書軟件里的主播大大們

都蘊(yùn)藏著語音合成的身影

通過采集錄制真人的聲音素材

再通過聲音標(biāo)注以及機(jī)器的深度學(xué)習(xí)算法

就可以構(gòu)建出TA的發(fā)音聲學(xué)模型

在此基礎(chǔ)上

輸入任意文本即可實(shí)現(xiàn)在線播報

虛擬主播“小晴”的聲音就是這么來的哦~

去年3月,我們和南方財經(jīng)

聯(lián)合復(fù)刻主持人俎江濤的聲音

打造了一位藏在電臺里的A.I.虛擬主播

人工智能虛擬主播“俎江濤”在主持節(jié)目

今年2月

我們又在央廣中國聲音中國年特別節(jié)目里

“藏”了一位神秘嘉賓——虛擬主播“央小廣”

“央小廣”為大家說繞口令

TA可是基于金話筒主播王冠老師的語料庫復(fù)刻出來的

“央小廣”不僅可以開口說話

還可以保持實(shí)時在線,隨時播報

王冠老師在錄音

通過對技術(shù)的不斷迭代優(yōu)化

今天我們帶來的“小晴”主播不論在聲音還是形象上

都有了更好的表現(xiàn)

再觀其形

比起純語音合成播報

“小晴”逼真的形象更加吸睛

播報過程中自然的表情和精準(zhǔn)的口型

達(dá)到了以假亂真的效果

你能想到這是個AI虛擬主播在為你播報嘛~

雖然在純語音合成播報的基礎(chǔ)上加入了形象

但虛擬主播“小晴”的播報操作依舊簡單便捷

只需輸入文本就能自動輸出播報視頻

圖像+聲音兼?zhèn)?/p>

嘖嘖嘖,這個主播可真不一般~

多語種的TA,是怎么煉成的?

最難能可貴的是“小晴”

會說多種語言

可以實(shí)現(xiàn)一個聲音多語種播報!

此刻小編流下了學(xué)渣的眼淚.jpg

畢竟“小晴”可是融合了

訊飛的語音合成、語音識別以及圖像處理等多個技術(shù)能力

尤其在多語種播報上

更是依托于訊飛的機(jī)器翻譯技術(shù)

早在2014年和2015年

訊飛就已在國際機(jī)器翻譯大賽中嶄露頭角

去年10月,訊飛在IWSLT 2018中

英德方向語音翻譯任務(wù)上端到端模型顯著優(yōu)勢拿下第一

這下你明白“小晴”為什么這么厲害了吧~

這次“小晴”主播雖然現(xiàn)在還只是簡單地和大家打了個招呼

未來 TA會慢慢走近你的生活

也許不止出現(xiàn)在電視、廣播里

還有可能是在節(jié)目舞臺

歌唱比賽里

……(此處應(yīng)有無數(shù)腦洞)

所以要不要關(guān)注我們,和我們共同見證TA在未來的無限可能呢?

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    88

    文章

    35136

    瀏覽量

    279795
  • 科大訊飛
    +關(guān)注

    關(guān)注

    19

    文章

    841

    瀏覽量

    62451

原文標(biāo)題:首個多語種A.I.虛擬主播“小晴”向你問好啦!!

文章出處:【微信號:iFLYTEK1999,微信公眾號:科大訊飛】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    普強(qiáng)智能語音技術(shù)重新定義車載交互邊界

    普強(qiáng)憑借自主研發(fā)的智能語音技術(shù),為某國內(nèi)頭部車企提供的語音前處理、喚醒詞、ASR、TTS等技術(shù)模塊,構(gòu)建覆蓋泰語、俄語、韓語、日語等多語種的語音交互解決方案,助力其海外車型實(shí)現(xiàn)無障礙人機(jī)交互,更以技術(shù)突破重新定義車載語音交互的邊界。
    的頭像 發(fā)表于 07-11 14:00 ?340次閱讀

    預(yù)留存儲成本高 ,不預(yù)留風(fēng)險高!唯創(chuàng)靈活擴(kuò)展方案,解決工程師成本與擴(kuò)展大難題

    這個競爭白熱化的戰(zhàn)場上,各家廠商都在想辦法讓自己的產(chǎn)品脫穎而出。多語種、高品質(zhì)的語音提示已經(jīng)成為高端門鎖的標(biāo)配,也是基礎(chǔ)門鎖實(shí)現(xiàn)差異化的重要利器。但,有個問題一直困擾著工程師們。今天,
    的頭像 發(fā)表于 07-04 20:02 ?107次閱讀
    預(yù)留存儲成本高 ,不預(yù)留風(fēng)險高!唯創(chuàng)靈活擴(kuò)展方案,解決工程師成本與擴(kuò)展<b class='flag-5'>兩</b>大難題

    普強(qiáng)信息入選2024語音識別技術(shù)公司TOP30榜單

    企業(yè)數(shù)字化升級,這一榮譽(yù)不僅體現(xiàn)了普強(qiáng)在語音交互、語義理解、多語種識別等核心技術(shù)上的領(lǐng)先優(yōu)勢,更是對普強(qiáng)自主研發(fā)的端到端語音識別系統(tǒng)在高噪聲環(huán)境、復(fù)雜口音等極端場景下仍能保持95%以上識別準(zhǔn)確率的技術(shù)實(shí)力的肯定。
    的頭像 發(fā)表于 04-18 17:25 ?636次閱讀

    聲智科技出席G20青年企業(yè)家聯(lián)盟走進(jìn)海淀活動

    助聽器等創(chuàng)新產(chǎn)品亮相,以多語種實(shí)時翻譯、智能助聽等硬核技術(shù)成為中外企業(yè)家交流的“科技紐帶”,展現(xiàn)了AI聲學(xué)硬件在全球多元化場景中的廣闊應(yīng)用前景。
    的頭像 發(fā)表于 04-14 13:48 ?355次閱讀

    兩會”熱議“機(jī)器人和飛行汽車”,核心動力電機(jī)可能

    飛行汽車、人形機(jī)器人、自動駕駛汽車,在中國經(jīng)濟(jì)邁入高質(zhì)量發(fā)展階段后,這些高科技產(chǎn)品成為推動國內(nèi)經(jīng)濟(jì)發(fā)展的新質(zhì)生產(chǎn)力,同時也受到“兩會”代表的高度關(guān)注,成為2025年“兩會”期間的熱議話題。*附件
    發(fā)表于 03-31 13:35

    聚焦自動駕駛,全國兩會有哪些聲音?

    未來,隨著立法完善、技術(shù)突破與市場驗(yàn)證的深化,智能網(wǎng)聯(lián)汽車或?qū)⒊蔀橹袊沦|(zhì)生產(chǎn)力的重要標(biāo)志。2025年3月全國兩會,在這場關(guān)乎國家發(fā)展藍(lán)圖的重要會議上,自動駕駛與人工智能產(chǎn)業(yè)成為熱議焦點(diǎn)——從技術(shù)
    的頭像 發(fā)表于 03-18 11:13 ?956次閱讀
    聚焦自動駕駛,全國<b class='flag-5'>兩會</b>有哪些聲音?

    AI研究所丨Lex Fridman五小時聊DeepSeek:一文看懂DeepSeek的創(chuàng)新與2025AI趨勢

    DeepSeek火了之后,知名科技LexFridman,找了位嘉賓,從DeepSeek及其開源模型V3和R1談到了AI發(fā)展的地緣政治競爭,特別是中美在
    的頭像 發(fā)表于 02-20 15:30 ?1680次閱讀
    <b class='flag-5'>AI</b>研究所丨Lex Fridman五小時聊DeepSeek:一文看懂DeepSeek的創(chuàng)新與2025<b class='flag-5'>AI</b>趨勢

    訊維智能語音轉(zhuǎn)寫系統(tǒng):開啟智能會議記錄新篇章!

    隨著人工智能技術(shù)的飛速發(fā)展,智能語音轉(zhuǎn)寫系統(tǒng)逐漸走進(jìn)我們的日常生活和工作之中,成為提升工作效率、優(yōu)化信息處理的重要工具。訊維智能語音轉(zhuǎn)寫系統(tǒng),作為這一領(lǐng)域的佼佼者,憑借其高精度識別、實(shí)時轉(zhuǎn)寫、智能糾錯以及多語種支持等特性,正在深刻改變著會議記錄、教育培訓(xùn)、采訪報道和法律取證等多個領(lǐng)域的工作方式。
    的頭像 發(fā)表于 11-15 15:41 ?1117次閱讀
    訊維智能語音轉(zhuǎn)寫系統(tǒng):開啟智能會議記錄新篇章!

    HarmonyOS NEXT應(yīng)用元服務(wù)開發(fā)多語種場景

    當(dāng)對朗讀內(nèi)容進(jìn)行標(biāo)注時,須對標(biāo)注字符串進(jìn)行多語種翻譯,具體支持的語種和應(yīng)用本身界面支持的語種保持一致。若采用多個字符串進(jìn)行朗讀內(nèi)容的拼接,需考慮多語種的情況,避免拼接后朗讀錯誤,例如阿
    發(fā)表于 10-21 14:56

    HarmonyOS NEXT應(yīng)用元服務(wù)開發(fā)多語種場景

    當(dāng)對朗讀內(nèi)容進(jìn)行標(biāo)注時,須對標(biāo)注字符串進(jìn)行多語種翻譯,具體支持的語種和應(yīng)用本身界面支持的語種保持一致。若采用多個字符串進(jìn)行朗讀內(nèi)容的拼接,需考慮多語種的情況,避免拼接后朗讀錯誤,例如阿
    發(fā)表于 10-18 09:40

    智能自行車碼表:基于2605C語音芯片的創(chuàng)新開發(fā)方案

    隨著科技的飛速發(fā)展和人們對健康生活的追求,自行車騎行已成為一種廣受歡迎的綠色出行方式。智能自行車碼表作為騎行者的得力助手,不僅記錄騎行數(shù)據(jù),還逐漸融入了更多智能化功能。然而,傳統(tǒng)碼表在語音提示、多語種支持及用戶交互方面存在不足,難以滿足現(xiàn)代騎行者的多樣化需求。
    的頭像 發(fā)表于 09-21 11:20 ?739次閱讀

    思必馳AI多語種技術(shù)助力中國企業(yè)加快全球布局

    從服裝、家電、家具等為代表的“老三樣”,到如今的電動載人汽車、鋰電池、太陽能電池的“新三樣”,各個領(lǐng)域企業(yè)布局海外市場的熱情高漲,不斷推陳出新,“中國制造”正在成為“全球品牌”。
    的頭像 發(fā)表于 09-18 11:43 ?935次閱讀

    博聯(lián)AI大模型全屋智能亮相2024中國建博

    2024中國建博(廣州)在廣交會展館及保利世貿(mào)博覽館盛大啟幕。 BroadLink博聯(lián)智能攜AI大模型全屋智能以及AI商業(yè)照明解決方案驚喜亮相, 全方位展示
    的頭像 發(fā)表于 09-12 15:46 ?752次閱讀

    思必馳AI辦公本:首搭AI筆記,柔彩護(hù)眼類紙屏

    助手等進(jìn)階功能。思必馳4G柔彩AI辦公本在聽、說、讀、寫各個方面都進(jìn)行了深度優(yōu)化。其中,AI筆記、柔彩護(hù)眼屏幕、拍照處理、多語種識別作為思必馳AI辦公本的特色功能,讓人眼前一亮,為人們
    的頭像 發(fā)表于 07-25 16:38 ?842次閱讀
    思必馳<b class='flag-5'>AI</b>辦公本:首搭<b class='flag-5'>AI</b>筆記,柔彩護(hù)眼類紙屏

    NVIDIA AI Foundry 為全球企業(yè)打造自定義 Llama 3.1 生成式 AI 模型

    Retriever 微服務(wù),以實(shí)現(xiàn)準(zhǔn)確響應(yīng) 埃森哲率先使用新服務(wù),為客戶創(chuàng)建自定義 Llama 3.1 模型;Aramco、ATT 和優(yōu)步。 ? Llama 3.1 多語種大語言模型(LLM)集合是一個具有 8B、70B 和 405B 三種
    發(fā)表于 07-24 09:39 ?918次閱讀
    NVIDIA <b class='flag-5'>AI</b> Foundry 為全球企業(yè)打造自定義 Llama 3.1 生成式 <b class='flag-5'>AI</b> 模型