一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

谷歌發(fā)布VLOGGER AI模型,實(shí)現(xiàn)肖像朗讀音頻內(nèi)容

微云疏影 ? 來源:綜合整理 ? 作者:綜合整理 ? 2024-03-19 14:27 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

3 月 19 日,Google 在其官方博客上發(fā)布了關(guān)于 VLOGGER AI 模型的相關(guān)信息。這是一款利用用戶提供的肖像照片和音頻內(nèi)容,使人物生動(dòng)地呈現(xiàn)音頻內(nèi)容并具備豐富面部表情的人工智能程序。

具體來說,VLOGGER AI 采用一種適應(yīng)虛擬肖像的多模態(tài) Diffusion 模型,通過 MENTOR 數(shù)據(jù)庫進(jìn)行訓(xùn)練,涵蓋了超80萬個(gè)人物肖像及超過2200小時(shí)的視頻數(shù)據(jù)。得益于此,VLOGGER 可以生成各種族、各年齡段、穿著多樣、姿態(tài)各異的肖像視頻。

研發(fā)團(tuán)隊(duì)指出,相較于之前的同類產(chǎn)品,VLOGGER 的獨(dú)特之處在于無需針對每個(gè)使用者進(jìn)行單獨(dú)培訓(xùn),且不受限于人臉檢測和裁剪,能產(chǎn)出完整的圖像,且能夠處理更多元化的情境如可見的身軀或者其他身份特征,這對于真實(shí)再現(xiàn)人物交流過程至關(guān)重要。

谷歌將 VLOGGER 視為通往“通用聊天機(jī)器人”未來的關(guān)鍵一步,使人工智能能以自然的語音、手勢和眼神等方式與人類交互。除此之外,VLOGGER 還可用作報(bào)告、教育領(lǐng)域以及旁白等方面的輔助工具,并能對已有的電影進(jìn)行剪輯和表情調(diào)整。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • Google
    +關(guān)注

    關(guān)注

    5

    文章

    1789

    瀏覽量

    59047
  • 模型
    +關(guān)注

    關(guān)注

    1

    文章

    3521

    瀏覽量

    50427
  • VLogger
    +關(guān)注

    關(guān)注

    0

    文章

    5

    瀏覽量

    8422
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    英語單詞學(xué)習(xí)頁面+單詞朗讀實(shí)現(xiàn) -- 【2】單詞朗讀實(shí)現(xiàn) ##HarmonyOS SDK AI##

    的原理是通過文字轉(zhuǎn)語音的形式實(shí)現(xiàn)的,之前也寫過文章分享過在API9下如何進(jìn)行文字轉(zhuǎn)語音,那是通過第三方的API實(shí)現(xiàn)的,需要申請token,請求接口,然后再通過media去播放,整體流程較為復(fù)雜,還必須
    發(fā)表于 06-29 23:26

    英語單詞學(xué)習(xí)頁面+單詞朗讀實(shí)現(xiàn) -- 【1】頁面實(shí)現(xiàn) ##HarmonyOS SDK AI##

    ?先看一下頁面效果 ? 整體頁面是一個(gè)比較簡潔的頁面,其中有兩個(gè)特色功能 對于例句中,能夠實(shí)現(xiàn)將當(dāng)前的單詞從句子中進(jìn)行識別并突出顯示 對于單詞和句子,可以進(jìn)行朗讀,這個(gè)朗讀使用的是Core
    發(fā)表于 06-29 23:24

    首創(chuàng)開源架構(gòu),天璣AI開發(fā)套件讓端側(cè)AI模型接入得心應(yīng)手

    的自有模型移植,使首字詞生態(tài)速度比云端方案提升70%,賦能絕影多模態(tài)智能座艙強(qiáng)大的端側(cè)運(yùn)行能力,讓汽車擁有“有趣的靈魂”。 不僅如此,天璣AI開發(fā)套件已經(jīng)接入NVIDIA TAO生態(tài)圈,實(shí)現(xiàn)TAO
    發(fā)表于 04-13 19:52

    谷歌新一代 TPU 芯片 Ironwood:助力大規(guī)模思考與推理的 AI 模型新引擎?

    與推理 AI 模型。谷歌方面表示,它代表著 AI 發(fā)展從 “響應(yīng)式” 向 “主動(dòng)式” 的范式轉(zhuǎn)變,未來 AI 代理將能夠主動(dòng)檢索并
    的頭像 發(fā)表于 04-12 00:57 ?2439次閱讀

    谷歌“減法”新動(dòng)作:砍掉耳機(jī)按鍵喚醒朗讀功能

    電子發(fā)燒友網(wǎng)報(bào)道(文/莫婷婷)近期,谷歌宣布將對耳機(jī)上的 Google Assistant語音助手功能進(jìn)行調(diào)整,取消通過觸控喚醒助理“自動(dòng)朗讀未讀通知”的功能。谷歌表示,要想完成該功能可以通過語音
    的頭像 發(fā)表于 02-22 22:56 ?2467次閱讀
    <b class='flag-5'>谷歌</b>“減法”新動(dòng)作:砍掉耳機(jī)按鍵喚醒<b class='flag-5'>朗讀</b>功能

    NVIDIA推出面向RTX AI PC的AI基礎(chǔ)模型

    NVIDIA 今日發(fā)布能在 NVIDIA RTX AI PC 本地運(yùn)行的基礎(chǔ)模型,為數(shù)字人、內(nèi)容創(chuàng)作、生產(chǎn)力和開發(fā)提供強(qiáng)大助力。
    的頭像 發(fā)表于 01-08 11:01 ?551次閱讀

    谷歌發(fā)布“深度研究”AI工具,利用Gemini模型進(jìn)行網(wǎng)絡(luò)信息檢索

    據(jù)外媒最新報(bào)道,谷歌近期發(fā)布了一款名為“深度研究”的先進(jìn)AI工具。這款工具借助其內(nèi)部的Gemini大型語言模型,實(shí)現(xiàn)了對網(wǎng)絡(luò)信息的高效檢索與
    的頭像 發(fā)表于 12-16 09:35 ?724次閱讀

    谷歌正式發(fā)布Gemini 2.0 性能提升近兩倍

    在智能體時(shí)代,谷歌再次引領(lǐng)技術(shù)潮流,正式發(fā)布了其最新力作——Gemini 2.0。這款AI模型不僅在性能上實(shí)現(xiàn)了顯著提升,更是在多模態(tài)表現(xiàn)和
    的頭像 發(fā)表于 12-12 14:22 ?825次閱讀

    谷歌發(fā)布Gemini 2.0 AI模型

    谷歌近日正式推出了新一代AI模型——Gemini 2.0。此次更新引入了名為“深度研究”的新特性,旨在為用戶提供更加全面和深入的復(fù)雜主題探索與報(bào)告撰寫輔助。 Gemini 2.0通過高級推理和長上
    的頭像 發(fā)表于 12-12 10:13 ?645次閱讀

    谷歌計(jì)劃12月發(fā)布Gemini 2.0模型

    近日,有消息稱谷歌計(jì)劃在12月發(fā)布其下一代人工智能模型——Gemini 2.0。這一消息引發(fā)了業(yè)界的廣泛關(guān)注,因?yàn)?b class='flag-5'>谷歌在人工智能領(lǐng)域一直保持著領(lǐng)先地位,而Gemini系列
    的頭像 發(fā)表于 10-29 11:02 ?1138次閱讀

    HarmonyOS NEXT應(yīng)用元服務(wù)開發(fā)標(biāo)注屏幕朗讀內(nèi)容的場景

    控件包含顯示文本(text)、無障礙文本(accessibilityText)2個(gè)屬性,其中,顯示文本為用戶界面上呈現(xiàn)的信息,無障礙文本為無障礙專有的朗讀信息,不在界面上顯示。屏幕朗讀提取信息進(jìn)行
    發(fā)表于 10-12 15:52

    谷歌Pixel 9系列發(fā)布會:AI技術(shù)領(lǐng)先,Gemini AI成焦點(diǎn)

    8月14日,谷歌在景山城總部舉行了一場備受矚目的新品發(fā)布會,提前于蘋果iPhone 16系列發(fā)布,展示了Pixel 9系列手機(jī)及其搭載的全新AI功能,這一舉措迅速吸引了業(yè)界的廣泛關(guān)注。
    的頭像 發(fā)表于 08-15 15:22 ?1606次閱讀

    谷歌獲Character.AI模型技術(shù)授權(quán),創(chuàng)始人重歸谷歌懷抱

    8月5日最新資訊,創(chuàng)新企業(yè)Character.AI在上周五正式宣布,他們已經(jīng)與科技巨頭谷歌的母公司Alphabet達(dá)成了一項(xiàng)重要合作,非獨(dú)家授權(quán)谷歌使用其先進(jìn)的大型語言模型技術(shù)。此次合
    的頭像 發(fā)表于 08-05 14:35 ?761次閱讀

    蘋果AI模型訓(xùn)練新動(dòng)向:攜手谷歌,未選英偉達(dá)

    近日,蘋果公司發(fā)布的最新研究報(bào)告揭示了其在人工智能領(lǐng)域的又一重要戰(zhàn)略選擇——采用谷歌設(shè)計(jì)的芯片來訓(xùn)練其AI模型,而非行業(yè)巨頭英偉達(dá)的產(chǎn)品。這一決定在業(yè)界引起了廣泛關(guān)注,尤其是在當(dāng)前英偉
    的頭像 發(fā)表于 08-01 18:11 ?1144次閱讀

    谷歌發(fā)布革命性AI天氣預(yù)測模型NeuralGCM

    在科技與自然科學(xué)的交匯點(diǎn)上,谷歌公司于7月23日宣布了一項(xiàng)重大突破——全新的人工智能天氣預(yù)測模型NeuralGCM。這一創(chuàng)新成果不僅融合了機(jī)器學(xué)習(xí)的前沿技術(shù),還巧妙結(jié)合了傳統(tǒng)氣象學(xué)的精髓,其研究成果已在國際權(quán)威科學(xué)期刊《Nature》上
    的頭像 發(fā)表于 07-23 14:24 ?819次閱讀