一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

TikTok引入前谷歌VideoPoet負(fù)責(zé)人蔣路,發(fā)力AI視頻生成

甲子光年 ? 來源:甲子發(fā)現(xiàn) ? 2024-02-22 13:36 ? 次閱讀

獨(dú)家獲悉,谷歌高級(jí)科學(xué)家、卡內(nèi)基梅隆大學(xué)(CMU)計(jì)算機(jī)學(xué)院兼職教授蔣路,已經(jīng)加入TikTok。

蔣路是谷歌 VideoPoet 項(xiàng)目負(fù)責(zé)人,VideoPoet 是谷歌在 2023 年 12 月推出的視頻生成大模型,類似 OpenAI 剛剛發(fā)布的 Sora。

近期,昆侖萬維創(chuàng)始人周亞輝在朋友圈表示,有個(gè)論文的作者加入字節(jié)北美做Tech Leader,正是指《VideoPoet: A large language model for zero-shot video generation》論文的作者蔣路。

資料顯示,蔣路先后在西安交通大學(xué)、布魯塞爾自由大學(xué)、卡內(nèi)基梅隆大學(xué)學(xué)習(xí)計(jì)算機(jī),并先后進(jìn)入微軟亞洲研究院、谷歌研究院、雅虎研究院實(shí)習(xí)。

2017 年,蔣路畢業(yè)后加入谷歌。他是谷歌云 AI 的創(chuàng)始成員,也是李佳博士和李飛飛博士首次聘請(qǐng)的研究員。此后,蔣路進(jìn)入谷歌研究院工作。

蔣路的研究曾被應(yīng)用到谷歌多個(gè)產(chǎn)品,如 YouTube、云服務(wù)、云 AutoML、廣告、Waymo 和翻譯服務(wù),影響了全球數(shù)十億用戶的日常生活。

蔣路的工作在自然語言處理(ACL)和計(jì)算機(jī)視覺(CVPR)的頂級(jí)會(huì)議上被提名為最佳論文。他是研究社區(qū)的活躍成員,擔(dān)任美國國家種子基金(NSF SBIR)的 AI 評(píng)審專家,并定期擔(dān)任 CVPR、ICCV、NeurlPS、ACM Multimedia 和 AAAI 等著名會(huì)議的領(lǐng)域主席。

蔣路的研究興趣主要在多媒體交叉領(lǐng)域,他專注于生成式 AI 和視頻創(chuàng)作。2019 年起,他就開始嘗試將 Transformer 用在圖像、視頻生成研究上。

與 Sora 采用的 Diffusion + Transformer 架構(gòu)不同,蔣路負(fù)責(zé)的 VideoPoet 視頻生成模型采用了單 Transformer 架構(gòu),可以將任何自回歸語言模型或大型語言模型轉(zhuǎn)換為高質(zhì)量的視頻生成器,支持生成方形或縱向視頻,以針對(duì)短格式內(nèi)容定制生成視頻,并支持視頻輸入生成音頻

VideoPoet 采用了名為 Tokenizer 的數(shù)據(jù)處理技術(shù),可以將視頻和音頻片段編碼為離散標(biāo)記序列(discrete tokens),這些標(biāo)記也可以被轉(zhuǎn)換回原始表示。其中,視頻和圖像數(shù)據(jù)使用名為 MAGVIT V2 的技術(shù),音頻數(shù)據(jù)使用 SoundStream 的技術(shù)。

VideoPoet 通過使用多個(gè) Tokenizer 訓(xùn)練一個(gè)自回歸語言模型,以學(xué)習(xí)跨視頻、圖像、音頻和文本模態(tài)。一旦模型根據(jù)某些上下文生成了標(biāo)記,這些標(biāo)記就可以通過分詞器解碼器轉(zhuǎn)換回可查看的表示。

fe1ad37c-d143-11ee-a297-92fbcf53809c.png

3 周前,蔣路本人在職場(chǎng)社交平臺(tái)宣布了自己在谷歌的 Last Day,并特別表示對(duì)在谷歌所做的視頻生成項(xiàng)目(VideoPoet,MAGVIT,WALT等)感到自豪。

蔣路表示自己將繼續(xù)留在灣區(qū),開始視頻生成領(lǐng)域的新旅程?,F(xiàn)在來看,新的旅程就是 TikTok。

值得一提的是,字節(jié)跳動(dòng)已經(jīng)在大模型領(lǐng)域全面布局,模型層推出了自研的「云雀大模型」以及類 ChatGPT 對(duì)話機(jī)器人產(chǎn)品豆包。2023 年底,字節(jié)跳動(dòng)成立新的 AI 應(yīng)用部門 Flow,并在海外推出了 Coze 等多款產(chǎn)品。抖音集團(tuán) CEO 張楠也于近期卸任,專注于 AI 工具剪映的發(fā)展。

字節(jié)跳動(dòng)近期辟謠了推出中文版 Sora,并表示:“還無法完善產(chǎn)品落地,距離國外模型有很大差距?!钡硪环矫?,字節(jié)跳動(dòng)正在大力招攬人才。

大模型戰(zhàn)場(chǎng),字節(jié)跳動(dòng)將會(huì)如何攪局?




審核編輯:劉清

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 機(jī)器人
    +關(guān)注

    關(guān)注

    212

    文章

    29299

    瀏覽量

    210995
  • 計(jì)算機(jī)視覺
    +關(guān)注

    關(guān)注

    9

    文章

    1705

    瀏覽量

    46489
  • OpenAI
    +關(guān)注

    關(guān)注

    9

    文章

    1199

    瀏覽量

    8522
  • TikTok
    +關(guān)注

    關(guān)注

    2

    文章

    226

    瀏覽量

    7649

原文標(biāo)題:獨(dú)家:TikTok引入前谷歌VideoPoet負(fù)責(zé)人蔣路,發(fā)力AI視頻生成|甲子光年

文章出處:【微信號(hào):jazzyear,微信公眾號(hào):甲子光年】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    AI Agent 應(yīng)用與項(xiàng)目實(shí)戰(zhàn)》----- 學(xué)習(xí)如何開發(fā)視頻應(yīng)用

    開發(fā)一個(gè)視頻內(nèi)容生成Agent。 訪問語聚AI平臺(tái)官網(wǎng) ,進(jìn)行注冊(cè)或登錄。 在平臺(tái)首頁,了解語聚AI的功能和應(yīng)用場(chǎng)景,特別是其支持的視頻生成
    發(fā)表于 03-05 19:52

    谷歌印度公共政策負(fù)責(zé)人Sreenivasa Reddy辭職

    印度公司擔(dān)任高管職務(wù),擁有豐富的行業(yè)經(jīng)驗(yàn)和卓越的領(lǐng)導(dǎo)能力。他于2023年9月加入谷歌,擔(dān)任印度公共政策負(fù)責(zé)人,致力于推動(dòng)谷歌在印度市場(chǎng)的業(yè)務(wù)發(fā)展。 印度作為谷歌的關(guān)鍵增長(zhǎng)市場(chǎng)之一,一直
    的頭像 發(fā)表于 02-14 09:46 ?250次閱讀

    字節(jié)跳動(dòng)即將推出多模態(tài)視頻生成模型OmniHuman

    一條完整的AI視頻。 據(jù)即夢(mèng)AI相關(guān)負(fù)責(zé)人透露,OmniHuman模型在研發(fā)過程中融入了前沿的人工智能技術(shù),通過復(fù)雜的算法和深度學(xué)習(xí)機(jī)制,實(shí)現(xiàn)了圖片與音頻的精準(zhǔn)匹配和
    的頭像 發(fā)表于 02-08 10:53 ?586次閱讀

    字節(jié)TikTok算法負(fù)責(zé)人陳志杰或離職創(chuàng)業(yè)

    近日,從多位知情人士處獲得的消息顯示,字節(jié)跳動(dòng)旗下TikTok的算法負(fù)責(zé)人陳志杰可能在近期離職。這一消息引發(fā)了業(yè)界的廣泛關(guān)注。 據(jù)了解,陳志杰在字節(jié)跳動(dòng)期間,以其卓越的算法能力和對(duì)技術(shù)的深刻理解,為
    的頭像 發(fā)表于 12-25 10:39 ?787次閱讀

    OpenAI推出AI視頻生成模型Sora

    近日,備受期待的OpenAI再次推出了其創(chuàng)新之作——AI視頻生成模型Sora。這一新品的發(fā)布,無疑為AI技術(shù)注入了新的活力。 據(jù)悉,Sora與OpenAI旗下的AI工具DALL-E有著
    的頭像 發(fā)表于 12-12 09:40 ?547次閱讀

    三星芯片部門任命新負(fù)責(zé)人

    三星電子近期進(jìn)行了一些管理層調(diào)整,三星芯片業(yè)務(wù)的負(fù)責(zé)人進(jìn)行了調(diào)整: 以前負(fù)責(zé)半導(dǎo)體及設(shè)備解決方案(DS)部門的負(fù)責(zé)人、公司副董事長(zhǎng)Jun Young-hyun將調(diào)任三星聯(lián)合首席執(zhí)行官,同時(shí)負(fù)責(zé)
    的頭像 發(fā)表于 11-28 14:14 ?405次閱讀

    字節(jié)跳動(dòng)自研視頻生成模型Seaweed開放

    近日,字節(jié)跳動(dòng)旗下的AI內(nèi)容平臺(tái)即夢(mèng)AI傳來新消息,宣布自研的視頻生成模型Seaweed即日起正式面向平臺(tái)用戶開放使用。這一舉措標(biāo)志著字節(jié)跳動(dòng)在AI
    的頭像 發(fā)表于 11-11 14:31 ?511次閱讀

    火山引擎推出豆包·視頻生成模型

    在近期舉辦的2024火山引擎AI創(chuàng)新巡展上,火山引擎總裁譚待隆重推出了豆包·視頻生成模型,這一舉措標(biāo)志著火山引擎在視頻內(nèi)容生成領(lǐng)域邁出了重要一步。豆包模型憑借其獨(dú)特的技術(shù)優(yōu)勢(shì),吸引了業(yè)
    的頭像 發(fā)表于 09-25 14:11 ?500次閱讀

    OpenAI硬件負(fù)責(zé)人熱議AI基礎(chǔ)設(shè)施擴(kuò)展與節(jié)能方案

    在近日于斯坦福大學(xué)舉辦的Hot Chips 2024大會(huì)上,OpenAI的硬件設(shè)施負(fù)責(zé)人Trevor Cai發(fā)表了一場(chǎng)深入人心的演講,其核心聚焦于“構(gòu)建可擴(kuò)展的AI基礎(chǔ)設(shè)施”。Trevor Cai
    的頭像 發(fā)表于 09-02 16:20 ?740次閱讀

    谷歌任命原Character.AI首席執(zhí)行官為Gemini聯(lián)合技術(shù)負(fù)責(zé)人

    近日,谷歌宣布了一項(xiàng)重要人事任命,原Character.AI的聯(lián)合創(chuàng)始人兼首席執(zhí)行官諾姆·沙澤爾(Noam Shazeer)已重返谷歌,并將擔(dān)任其人工智能新項(xiàng)目“Gemini”的聯(lián)合技術(shù)負(fù)責(zé)人
    的頭像 發(fā)表于 08-26 11:06 ?700次閱讀

    MediaTek與快手?jǐn)y手創(chuàng)新,端側(cè)視頻生成技術(shù)引領(lǐng)AI新紀(jì)元

    在科技日新月異的今天,MediaTek與快手再次攜手,于近日宣布了一項(xiàng)重大技術(shù)突破——高效端側(cè)視頻生成技術(shù)的誕生。這項(xiàng)技術(shù)不僅是對(duì)即將于2024年世界移動(dòng)通信大會(huì)(MWC 2024)上亮相的先進(jìn)視頻生成技術(shù)的有力延續(xù),更是雙方在生成
    的頭像 發(fā)表于 07-05 11:52 ?1445次閱讀

    MediaTek聯(lián)合快手推出高效端側(cè)視頻生成技術(shù)

    MediaTek 與快手共同宣布,推出高效端側(cè)視頻生成技術(shù),共同探索并推進(jìn)生成AI 技術(shù)的革新。作為對(duì) 2024 世界移動(dòng)通信大會(huì)(MWC 2024)上亮相的視頻生成技術(shù)的延續(xù),該
    的頭像 發(fā)表于 07-05 11:23 ?8331次閱讀

    三星電子任命半導(dǎo)體業(yè)務(wù)新負(fù)責(zé)人,加碼AI芯片市場(chǎng)

    三星電子近日宣布,任命Young Hyun Jun為半導(dǎo)體部門的新負(fù)責(zé)人,此舉旨在進(jìn)一步加碼AI芯片市場(chǎng),以追趕包括SK海力士在內(nèi)的競(jìng)爭(zhēng)對(duì)手。
    的頭像 發(fā)表于 05-27 14:06 ?669次閱讀

    谷歌發(fā)布全新視頻生成模型Veo與Imagen文生圖模型

    谷歌近日宣布了兩項(xiàng)重大技術(shù)進(jìn)展,首先是視頻生成模型Veo的正式推出。這款先進(jìn)的模型能夠支持生成質(zhì)量更高的視頻內(nèi)容,讓用戶能夠根據(jù)自己的需求設(shè)定光照、鏡頭語言、
    的頭像 發(fā)表于 05-16 10:46 ?538次閱讀

    阿里云視頻生成技術(shù)創(chuàng)新!視頻生成使用了哪些AI技術(shù)和算法

    照片就能讓 EMO 合成演戲唱歌視頻。 ? 阿里云在視頻生成領(lǐng)域的創(chuàng)新 ? EMO(Emote Portrait Alive)是一個(gè)由阿里巴巴集團(tuán)智能計(jì)算研究院開發(fā)的框架,一個(gè)音頻驅(qū)動(dòng)的 AI 肖像
    的頭像 發(fā)表于 05-08 00:07 ?3771次閱讀