一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

云知聲基于語音合成技術(shù),上線方言合成功能

云知聲 ? 來源:云知聲 ? 2023-10-31 09:45 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

“少小離家老大回,鄉(xiāng)音無改鬢毛衰?!?/p>

方言,不僅是地域風(fēng)物的承載,更是人與故土聯(lián)結(jié)的情感紐帶。隨著人們對智能語音需求的越來越多元化,更具鄉(xiāng)土氣息、更具情感聯(lián)結(jié)的方言語音正成為智能語音合成的熱門方向。

近期,云知聲基于語音合成技術(shù),上線方言合成功能,以 AI 傳遞鄉(xiāng)音鄉(xiāng)情。

1AI遇上方言,“智”取鄉(xiāng)音一片

伴隨普通話的推廣普及,以及城市流動人口的增加,方言正悄悄退出人們的生活,一些地方方言甚至瀕臨失傳的境遇。讓方言走進日常,以更多樣化的形式“活”起來,已成為當前方言保護工作的重中之重。

為助力鄉(xiāng)音傳續(xù),同時也更好滿足人們對智能語音的多樣化需求,云知聲基于最新語音合成深度學(xué)習(xí)技術(shù),全面學(xué)習(xí)方言音色、風(fēng)格,合成貼近真人的“數(shù)字鄉(xiāng)音”,讓人工智能科技溫度浸潤到多個智能語音應(yīng)用場景——

智能家居而言,用熟悉的鄉(xiāng)音和用戶對話,既能夠慰藉用戶身居異地的思鄉(xiāng)之情,也有助于打造產(chǎn)品差異化優(yōu)勢,更好開拓下沉市場;在智能客服領(lǐng)域,很多老人、弱勢群體既不會講普通話,也聽不懂普通話,方言的引入能夠大大減少雙方溝通成本,提高服務(wù)效率;直播間里,搞笑幽默的方言既能夠讓直播內(nèi)容更有趣味性,也迎合了受眾聽鄉(xiāng)音、知鄉(xiāng)情的心理需求,增加了用戶黏性……

2遷移學(xué)習(xí),讓方言合成成為現(xiàn)實

讓人工智能“說”出一口普通話已然不易,合成方言更是難上加難。

一直以來,方言合成存在兩大難點:

一是難以獲取大量高質(zhì)量的語音數(shù)據(jù)和對應(yīng)的文本信息,二是不同地區(qū)的方言之間相互獨立,在音調(diào)、聲母、韻母等方面有所差異,很難進行精確的發(fā)音和韻律標注,這無疑增加了數(shù)據(jù)標注和技術(shù)開發(fā)的難度。

利用遷移學(xué)習(xí)技術(shù),云知聲解決了以上問題,得以在短時間內(nèi)將單個發(fā)音人的音色合成粵語、四川話等方言以及英語等外語。

針對部分方言的特性,云知聲先是通過超大規(guī)模的高質(zhì)量普通話數(shù)據(jù),訓(xùn)練得到端到端聲學(xué)模型和神經(jīng)網(wǎng)絡(luò)聲碼器等基礎(chǔ)模型;然后,利用較大規(guī)模低質(zhì)量的方言數(shù)據(jù)對基礎(chǔ)模型進行遷移學(xué)習(xí),使其能更好地適應(yīng)方言的語音特點;最后,使用少量較高質(zhì)量的方言數(shù)據(jù)再次對基礎(chǔ)模型進行遷移學(xué)習(xí),最終訓(xùn)練得到方言合成模型。

在遷移學(xué)習(xí)技術(shù)的支持下,云知聲TTS已實現(xiàn)粵語、四川話及純正美音的合成,可覆蓋人機對話、影視配音、直播帶貨等多種場景需求,助力更多客戶實現(xiàn)方言及個性化聲音解決方案的落地。

通過方言合成技術(shù),云知聲數(shù)字人也得以開口說“鄉(xiāng)音”,熟練“掌握”多種方言,甚至做到流暢切換。

自由切換多種方言的數(shù)字人

除了方言合成,此次,云知聲TTS還上線了rap合成功能,即使用戶五音不全,也能秒變說唱歌手,輕松玩轉(zhuǎn)freestyle。

從智能家居到呼叫中心,從生活娛樂到辦公學(xué)習(xí),云知聲智能語音技術(shù)正不斷打破場景限制,讓AI以更豐富的聲音形象融入日常。

目前,云知聲TTS已上線28種發(fā)音人音色、64種音色風(fēng)格,極大程度上滿足了用戶的多場景合成語音應(yīng)用需求。

面向未來,云知聲TTS將繼續(xù)解鎖更多音色、風(fēng)格,覆蓋更多應(yīng)用場景,全力滿足客戶的個性化、差異化定制需求。

審核編輯:湯梓紅

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    88

    文章

    35164

    瀏覽量

    279981
  • 語音合成
    +關(guān)注

    關(guān)注

    2

    文章

    92

    瀏覽量

    16498
  • 云知聲
    +關(guān)注

    關(guān)注

    0

    文章

    234

    瀏覽量

    8777

原文標題:新“聲”報道!云知聲TTS上線方言合成功能

文章出處:【微信號:云知聲,微信公眾號:云知聲】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    獸牙智能體平臺通過華為昇騰技術(shù)認證

    近日,(09678.HK)自主研發(fā)的獸牙智能體平臺v1.0成功通過華為昇騰應(yīng)用開發(fā)技術(shù)認證,獲得Ascend Native認證證書及認
    的頭像 發(fā)表于 07-11 18:20 ?677次閱讀

    在港交所成功上市

    近日,智能科技股份有限公司(以下簡稱“”)于香港聯(lián)合交易所主板掛牌上市,股份代號:0
    的頭像 發(fā)表于 07-03 17:41 ?500次閱讀

    AGI龍頭企業(yè)港股上市,市值達147億港元

    為147.44億港元。 ? 圖:創(chuàng)始人董事長CEO黃偉博士在現(xiàn)場致辭表示:從今天起,我們將以香港為支點,將中國AGI產(chǎn)品帶向全世界——用更敏捷的創(chuàng)新、更好的商業(yè)化和更開放的心胸,讓人類智慧與機器智能共振全球! ?
    的頭像 發(fā)表于 06-30 11:44 ?1578次閱讀
    AGI龍頭企業(yè)<b class='flag-5'>云</b><b class='flag-5'>知</b><b class='flag-5'>聲</b>港股上市,市值達147億港元

    與商湯科技達成戰(zhàn)略合作

    近日,智能科技股份有限公司(以下簡稱“”)與上海商湯智能科技有限公司(以下簡稱“商湯
    的頭像 發(fā)表于 06-20 14:52 ?458次閱讀

    合成與匯川技術(shù)簽署戰(zhàn)略合作協(xié)議

    近日,蘇州匯川技術(shù)有限公司(以下簡稱“匯川技術(shù)”)與合成(北京)智能科技有限公司(以下簡稱“合成
    的頭像 發(fā)表于 06-10 13:54 ?435次閱讀

    攜手南寧軌道打造智慧生活新范本

    報事報修系統(tǒng)基于獸牙智能體平臺,定制開發(fā)了專屬智能體。系統(tǒng)全面覆蓋公共報修、家政服務(wù)、知識問答、投訴建議四大應(yīng)用場景,真正實現(xiàn)了“語音下單—自動派單—實時反饋”的全流程閉環(huán)服務(wù)。
    的頭像 發(fā)表于 06-09 14:48 ?474次閱讀

    WT3000TX語音合成芯片介紹V1

    WT3000TX是一系列功能強大的高品質(zhì)語音芯片,采用了高性能32位處理器、最高頻率可達240MHz。WT3000TX高集成度的語音合成芯片,可實現(xiàn)中文、英文字母或中英文
    發(fā)表于 04-17 08:43 ?0次下載

    YX5p多功能單芯片CMOS語音合成4位微控制器中文手冊

    深圳市駿旺微電子有限公司的 YX5P 系列語音芯片數(shù)據(jù)手冊,詳細介紹了芯片的各項特性、功能、應(yīng)用及相關(guān)參數(shù),為使用者提供全面的技術(shù)參考。?產(chǎn)品概述:YX5P 系列是多功能單芯片 CMO
    發(fā)表于 04-03 11:18 ?0次下載

    【CW32模塊使用】語音合成播報模塊

    SYN6288E 中文語音合成芯片是北京宇音天下科技有限公司在 2010 年初推出的一款性/價比更高的 SYN6288 芯片的基礎(chǔ)上更改封裝方式的,效果更自然的一款中高端語音合成芯片
    的頭像 發(fā)表于 03-29 17:25 ?641次閱讀
    【CW32模塊使用】<b class='flag-5'>語音</b><b class='flag-5'>合成</b>播報模塊

    敏捷合成器的技術(shù)原理和應(yīng)用場景

    敏捷合成器,作為一種高性能的信號發(fā)生器,其技術(shù)原理和應(yīng)用場景值得深入探討。技術(shù)原理敏捷合成器的技術(shù)原理主要基于先進的頻率
    發(fā)表于 02-20 15:25

    與TCL引領(lǐng)新風(fēng)空調(diào)語音交互新時代

    近日,收到一份特別的新年禮物——一封來自TCL的感謝信,再次溫暖了團隊的心。信中特別
    的頭像 發(fā)表于 01-02 10:14 ?605次閱讀

    近期斬獲多項年度大獎

    在科技迅猛發(fā)展的當下,人工智能(AI)已成為推動各行業(yè)革新的核心動力。,以其卓越的技術(shù)實力和敏銳的市場洞察,在AI領(lǐng)域中脫穎而出,成為行業(yè)的領(lǐng)航者。近日,
    的頭像 發(fā)表于 12-24 10:26 ?548次閱讀

    與上海儀電物聯(lián)簽署戰(zhàn)略合作協(xié)議

    近日,(上海)智能科技有限公司(以下簡稱“”)與上海儀電物聯(lián)
    的頭像 發(fā)表于 11-29 18:02 ?938次閱讀

    與國信領(lǐng)英簽署戰(zhàn)略合作協(xié)議

    智能科技股份有限公司(以下簡稱“”)與蘇州國信領(lǐng)英教育科技有限公司(以下簡稱“國信領(lǐng)
    的頭像 發(fā)表于 10-12 14:16 ?746次閱讀

    口語評測技術(shù)應(yīng)用于教育領(lǐng)域

    日前,入選大連、丹東、本溪三地初中學(xué)業(yè)水平考試英語聽力口語考試智能口語評測技術(shù)服務(wù)商,并以其專業(yè)可靠的口語評測,確保三地英語考試結(jié)果的公平、客觀、準確,為教育公平和學(xué)生能力的真實
    的頭像 發(fā)表于 09-19 15:41 ?707次閱讀