一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

使用Riva自定義文本創(chuàng)建語(yǔ)音界面

星星科技指導(dǎo)員 ? 來(lái)源:NVIDIA ? 作者:About Gordana Neskovi ? 2022-03-31 16:10 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

NVIDIA 在 Riva 中發(fā)布了西班牙語(yǔ)、德語(yǔ)和俄語(yǔ)的世界級(jí)語(yǔ)音到文本模型,為企業(yè)在全球部署語(yǔ)音 AI 應(yīng)用提供了動(dòng)力。此外,企業(yè)現(xiàn)在可以使用 Riva 的可定制文本到語(yǔ)音管道創(chuàng)建富有表現(xiàn)力的語(yǔ)音界面。

NVIDIA Riva 是一款 GPU 加速語(yǔ)音 AI SDK ,用于開發(fā)實(shí)時(shí)應(yīng)用程序,如實(shí)時(shí)字幕、向基于文本的聊天機(jī)器人添加語(yǔ)音,以及在呼叫中心生成實(shí)時(shí)轉(zhuǎn)錄。為了便于實(shí)施, Riva 在 NGC 目錄中提供了高度精確的預(yù)訓(xùn)練模型。

和 TAO 工具包 ,這些模型可以為任何行業(yè)定制,包括電信、金融、統(tǒng)一通信即服務(wù)和醫(yī)療保健。開發(fā)者可以使用 Riva 開箱即用地部署這些模型。它們經(jīng)過(guò)優(yōu)化,可以在云、數(shù)據(jù)中心和邊緣在不到 300 毫秒的時(shí)間內(nèi)實(shí)時(shí)運(yùn)行。

Riva 發(fā)布亮點(diǎn)包括

西班牙語(yǔ)、德語(yǔ)和俄語(yǔ)的世界級(jí)語(yǔ)音識(shí)別技能。

可定制的文本到語(yǔ)音管道,用于表達(dá)性互動(dòng)。

TAO 工具包的低代碼微調(diào)工作流。

多種語(yǔ)言的自動(dòng)語(yǔ)音識(shí)別

從呼叫中心到虛擬助手,每一個(gè)對(duì)話人工智能應(yīng)用程序都嚴(yán)重依賴于自動(dòng)語(yǔ)音識(shí)別。企業(yè)可以通過(guò) Riva 英語(yǔ)、西班牙語(yǔ)、德語(yǔ)和俄語(yǔ)的自動(dòng)語(yǔ)音識(shí)別在全球范圍內(nèi)擴(kuò)展這些應(yīng)用程序。

圖 1:NVIDIA Riva 世界級(jí)的自動(dòng)語(yǔ)音識(shí)別系統(tǒng)有英語(yǔ)、西班牙語(yǔ)、德語(yǔ)和俄語(yǔ)版本。

非英語(yǔ)自動(dòng)語(yǔ)音識(shí)別模型是在各種開源數(shù)據(jù)集(如 Mozilla Common Voice )以及私有數(shù)據(jù)集上訓(xùn)練的。 Riva 開發(fā)自動(dòng)語(yǔ)音識(shí)別模型是為了提供開箱即用的準(zhǔn)確度,并作為適應(yīng)行業(yè)、行話、方言甚至嘈雜環(huán)境的良好起點(diǎn)。在流行的評(píng)估數(shù)據(jù)集上,這些模型在多個(gè)行業(yè)應(yīng)用中提供了世界級(jí)的準(zhǔn)確性。

可定制的文本到語(yǔ)音管道

為了讓客戶享受逼真的對(duì)話,語(yǔ)音應(yīng)用程序必須提供類似人類的表情。使用 FASTROPE ,NVIDIA 語(yǔ)音 AI 研究小組創(chuàng)建的新模型 Riva 幫助開發(fā)者定制文本到語(yǔ)音管道并創(chuàng)建表達(dá)性語(yǔ)音接口。例如,在推理過(guò)程中,開發(fā)人員可以使用 SSML 標(biāo)簽改變語(yǔ)音音調(diào)和速度。

圖 2:NVIDIA Riva 提供了可定制的文本到語(yǔ)音管道,用于更具表現(xiàn)力的交互。

最新的最先進(jìn)的模型,比如里瓦的 Fastpitch ,幫助文本到語(yǔ)音管道的運(yùn)行速度比市場(chǎng)上其他競(jìng)爭(zhēng)對(duì)手快幾倍。

關(guān)于作者

About Gordana Neskovic

Gordana Neskovic 是AI/DL產(chǎn)品營(yíng)銷團(tuán)隊(duì)的成員,負(fù)責(zé) NVIDIA Maxine。在加入 NVIDIA 之前,Gordana曾在VMware、Wells Fargo、Pinterest、SFO-ITT和KLA Tencor擔(dān)任過(guò)各種產(chǎn)品營(yíng)銷、數(shù)據(jù)科學(xué)家、AI架構(gòu)師和工程職位。她擁有博士學(xué)位。圣塔 Clara 大學(xué),塞爾維亞貝爾格萊德大學(xué)電氣工程碩士和學(xué)士學(xué)位。

About Sirisha Rella

Sirisha Rella 是 NVIDIA 的技術(shù)產(chǎn)品營(yíng)銷經(jīng)理,專注于計(jì)算機(jī)視覺(jué)、語(yǔ)音和基于語(yǔ)言的深度學(xué)習(xí)應(yīng)用。 Sirisha 獲得了密蘇里大學(xué)堪薩斯城分校的計(jì)算機(jī)科學(xué)碩士學(xué)位,是國(guó)家科學(xué)基金會(huì)大學(xué)習(xí)中心的研究生助理。

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5309

    瀏覽量

    106454
  • AI
    AI
    +關(guān)注

    關(guān)注

    88

    文章

    35168

    瀏覽量

    280172
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    大彩講堂:VisualTFT軟件如何自定義圓形進(jìn)度條

    VisualTFT軟件如何自定義圓形進(jìn)度條
    的頭像 發(fā)表于 07-07 17:10 ?515次閱讀
    大彩講堂:VisualTFT軟件如何<b class='flag-5'>自定義</b>圓形進(jìn)度條

    KiCad 中的自定義規(guī)則(KiCon 演講)

    設(shè)計(jì)規(guī)則 展開,重點(diǎn)探討了 那些復(fù)雜卻強(qiáng)大的特性。 由于這些規(guī)則本質(zhì)上是基于文本表達(dá)的,需要用戶細(xì)致入微的理解。演講的 核心目標(biāo) 是引導(dǎo)用戶有效實(shí)施這些規(guī)則,從而 規(guī)避布線問(wèn)題、提升制造良率,并優(yōu)化設(shè)計(jì)流程 。 討論 始于對(duì)自定義設(shè)計(jì)規(guī)則的
    的頭像 發(fā)表于 06-16 11:17 ?622次閱讀
    KiCad 中的<b class='flag-5'>自定義</b>規(guī)則(KiCon 演講)

    HarmonyOS應(yīng)用自定義鍵盤解決方案

    自定義鍵盤是一種替換系統(tǒng)默認(rèn)鍵盤的解決方案,可實(shí)現(xiàn)鍵盤個(gè)性化交互。允許用戶結(jié)合業(yè)務(wù)需求與操作習(xí)慣,對(duì)按鍵布局進(jìn)行可視化重構(gòu)、設(shè)置多功能組合鍵位,使輸入更加便捷和舒適。在安全防護(hù)層面,自定義鍵盤可以
    的頭像 發(fā)表于 06-05 14:19 ?693次閱讀

    LabVIEW運(yùn)動(dòng)控制(三):EtherCAT運(yùn)動(dòng)控制器的高效加工指令自定義封裝

    LabVIEW高效加工指令自定義封裝
    的頭像 發(fā)表于 04-08 13:49 ?2702次閱讀
    LabVIEW運(yùn)動(dòng)控制(三):EtherCAT運(yùn)動(dòng)控制器的高效加工指令<b class='flag-5'>自定義</b>封裝

    如何添加自定義單板

    在開發(fā)過(guò)程中,用戶有時(shí)需要創(chuàng)建自定義板配置。本節(jié)將通過(guò)一個(gè)實(shí)例講解用戶如何創(chuàng)建屬于自己的machine,下面以g2l-test.conf為例進(jìn)行說(shuō)明。
    的頭像 發(fā)表于 03-12 14:43 ?593次閱讀

    如何快速創(chuàng)建用戶自定義Board和App工程

    概述自HPM_SDKv1.7.0發(fā)布開始,在HPM_ENV中新增了user_template文件夾,以方便用戶快速創(chuàng)建自定義的Board和App工程。user_template是用戶模板工程,用戶
    的頭像 發(fā)表于 02-08 13:38 ?524次閱讀
    如何快速<b class='flag-5'>創(chuàng)建</b>用戶<b class='flag-5'>自定義</b>Board和App工程

    Altium Designer 15.0自定義元件設(shè)計(jì)

    電子發(fā)燒友網(wǎng)站提供《Altium Designer 15.0自定義元件設(shè)計(jì).pdf》資料免費(fèi)下載
    發(fā)表于 01-21 15:04 ?0次下載
    Altium Designer 15.0<b class='flag-5'>自定義</b>元件設(shè)計(jì)

    think-cell:自定義think-cell(四)

    定義這些設(shè)置。 在 PowerPoint 幻燈片母版視圖中,創(chuàng)建新的自定義版式。您將復(fù)制與 think-cell 議程幻燈片的所需外觀最匹配的現(xiàn)有自定義布局之一。 將新的
    的頭像 發(fā)表于 01-13 10:37 ?514次閱讀
    think-cell:<b class='flag-5'>自定義</b>think-cell(四)

    智能語(yǔ)音識(shí)別照明解決方案,平臺(tái)自定義,中英切換

    智能語(yǔ)音識(shí)別照明方案引入NRK3502芯片,支持平臺(tái)自定義,離線控制,中英雙語(yǔ)切換。NRK3502具備高性能和靈活自定義能力,可推動(dòng)智能照明革新,控制其他智能設(shè)備,為國(guó)際用戶提供全方位智能生活體驗(yàn)。
    的頭像 發(fā)表于 01-10 13:23 ?439次閱讀
    智能<b class='flag-5'>語(yǔ)音</b>識(shí)別照明解決方案,平臺(tái)<b class='flag-5'>自定義</b>,中英切換

    think-cell;自定義think-cell(一)

    布局介紹了如何創(chuàng)建自定義議程幻燈片布局,第六部分 C.6 功能區(qū)自定義 介紹了如何使用 PowerPoint 的功能區(qū)自定義選項(xiàng)自定義 th
    的頭像 發(fā)表于 01-08 11:31 ?744次閱讀
    think-cell;<b class='flag-5'>自定義</b>think-cell(一)

    NV512H語(yǔ)音芯片賦能加濕器方案,集語(yǔ)音播報(bào)+平臺(tái)自定義語(yǔ)音功能

    。NV512H語(yǔ)音芯片是一款適合大中小型批量生產(chǎn)的Flash語(yǔ)音芯片。它具有生產(chǎn)周期短,成本低,性能穩(wěn)定,音質(zhì)高,控制方便,平臺(tái)自定義等諸多顯著優(yōu)點(diǎn),適合低成本快速投產(chǎn)的品牌
    的頭像 發(fā)表于 12-26 13:35 ?531次閱讀
    NV512H<b class='flag-5'>語(yǔ)音</b>芯片賦能加濕器方案,集<b class='flag-5'>語(yǔ)音</b>播報(bào)+平臺(tái)<b class='flag-5'>自定義</b><b class='flag-5'>語(yǔ)音</b>功能

    驅(qū)鳥器自定義播放音樂(lè),低成本語(yǔ)音方案選型-N9305九芯電子

    農(nóng)業(yè)現(xiàn)代化需高效環(huán)保驅(qū)鳥器,N9305語(yǔ)音芯片提供低成本方案,支持自定義音樂(lè),低功耗高可靠,易集成自主更新,助力農(nóng)業(yè)可持續(xù)發(fā)展。
    的頭像 發(fā)表于 12-10 13:39 ?542次閱讀

    創(chuàng)建自定義的基于閃存的引導(dǎo)加載程序(BSL)

    電子發(fā)燒友網(wǎng)站提供《創(chuàng)建自定義的基于閃存的引導(dǎo)加載程序(BSL).pdf》資料免費(fèi)下載
    發(fā)表于 09-19 10:50 ?0次下載
    <b class='flag-5'>創(chuàng)建</b><b class='flag-5'>自定義</b>的基于閃存的引導(dǎo)加載程序(BSL)

    如何創(chuàng)建TestStand自定義步驟

    在之前的課程中簡(jiǎn)單地介紹過(guò)TestStand自帶的一些步驟類型,如測(cè)試、消息彈窗、賦值、標(biāo)簽等等,這些簡(jiǎn)單的步驟從TestStand的插入選版中就可以添加到序列中。那么在使用中如果碰到需要實(shí)現(xiàn)更加靈活、復(fù)雜的功能,使用自帶的一些步驟類型可能難以滿足,這時(shí)就需要使用到自定義步驟。
    的頭像 發(fā)表于 09-11 14:46 ?2542次閱讀
    如何<b class='flag-5'>創(chuàng)建</b>TestStand<b class='flag-5'>自定義</b>步驟

    NVIDIA NeMo加速并簡(jiǎn)化自定義模型開發(fā)

    如果企業(yè)希望充分發(fā)揮出 AI 的力量,就需要根據(jù)其行業(yè)需求量身定制的自定義模型。
    的頭像 發(fā)表于 07-26 11:17 ?1266次閱讀
    NVIDIA NeMo加速并簡(jiǎn)化<b class='flag-5'>自定義</b>模型開發(fā)