一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

新火種AI|圍攻光明頂:Sora效應下的AI視頻生成競賽

新火種 ? 來源:新火種 ? 2024-03-16 11:12 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

作者:一號

編輯:美美

Sora的出現(xiàn),讓AI視頻生成領(lǐng)域真正“活”了起來。

2024年2月,OpenAI發(fā)布Sora,在生成式AI領(lǐng)域扔下了重磅炸彈。

盡管在去年,Runway、Pika以及Stable Video等就已經(jīng)涉足AI視頻生成領(lǐng)域,并且也曾經(jīng)帶給人們很多驚艷的時刻,甚至讓馬斯克都直呼,2024會是AI視頻生成的元年。就在大家還在期待著這些公司會在2024年帶給大家更多驚喜的時候,Sora放出的Demo,60秒、動作流暢,涂抹感不強,憑借一己之力抬高了視頻生成領(lǐng)域的標準,對于之前只能生成幾秒鐘的AI視頻來說,簡直就是降維打擊。

因此,不僅在社交媒體上人們對Sora贊不絕口,在官方媒體以及一眾企業(yè)家眼中,Sora也成了AI界中明星般的存在。盡管已經(jīng)過去了一個月,光是靠著在TikTok上更新Sora生成的視頻,OpenAI剛開通不久的賬號就已經(jīng)漲了數(shù)十萬粉。這樣的熱度,讓不少的公司都開始想著如何與Sora競爭,如何復現(xiàn)Sora。

AI視頻生成的戰(zhàn)場,因為Sora,開始真正熱了起來。

Sora橫空出世,同行們怎么樣了?

在Sora橫空出世后,因為AI繪畫開源模型Stable Diffusion而被人們所熟知的Stability AI率先帶頭沖鋒,將在去年展現(xiàn)過的Stable Video拿出來進行了公測。在SV官網(wǎng)上,提供了圖像和文字生成兩個選擇,在輸入提示詞之后,可以生成四張圖像供人選擇,并且還能選擇鏡頭運動的方式,但目前還只能生成4秒鐘的視頻,不少人實際體驗下來,覺得差強人意。

而要說去年炙手可熱的兩大AI視頻生成工具,那一定是Runway的Gen 2以及初創(chuàng)公司Pika。在Sora發(fā)布之前,Runway和Pika都被認為是視頻生成領(lǐng)域上的佼佼者,而在Sora展示了Demo之后,很多人認為,效果已經(jīng)能夠輕松吊打這兩家新興獨角獸公司了,不少人開始擔憂這些創(chuàng)業(yè)者的命運。

不過,Pika創(chuàng)始人,華人女學霸郭文景卻并不心灰意冷,她在采訪中回應稱,“我們覺得這是一個很振奮人心的消息,我們已經(jīng)在籌備直接沖,將直接對標Sora?!倍聦嵣?,Pika也開始在最近幾周開始了頻繁的更新,但并不是和Sora硬剛。Pika先是更新了讓視頻中的人物能夠根據(jù)輸入的音頻實現(xiàn)對口型的Lip Syne功能,主打一個電影臺詞還是電影最重要的部分。隨后又更新了視頻音效生成的功能,畢竟有聲電影比無聲電影還是要精彩得多的。

而Runway則是自去年P(guān)ika刷屏之后,就說下一步的研究方向是世界模型,因此到現(xiàn)在為止,除了更新了一下用于控制視頻生成效果的運動筆刷,就沒有什么大的消息了。

此外,還有一家來自以色列的公司LTX Studio另辟蹊徑,上線了一個電影制作平臺,直接把視頻生成、編輯、剪輯還有旁白一條龍全都搞定了。

國內(nèi)企業(yè)也在暗暗追趕Sora

除了國外AI視頻生成領(lǐng)域原本的佼佼者開始對Sora奮起直追外,飽受吐槽的國產(chǎn)AI實際上也并沒有讓人失望。

首先是國內(nèi)大廠,與Pika一樣,阿里巴巴同樣選擇了音頻和視頻結(jié)合的賽道來進行“彎道超車”,推出了一個基于音頻生成視頻的模型EMO,只要上傳一張照片和一段音頻,就能讓照片里的人開口說話、唱歌,并且不限時長。像什么小李子版說唱,蒙娜麗莎開口說話以及奧黛麗赫本演講等等都不在話下。

Sora Demo視頻中的這個東京女郎,也成為了能說會道的女士。而且效果也比PIka強不少,也因此在社交媒體上刷了一波屏,該說不說,大廠不愧是大廠。

而字節(jié)跳動,則是早在Sora發(fā)布之前,就已經(jīng)展現(xiàn)了一款名為Boximator的視頻生成模型。它能夠精準空時視頻中的物體,用戶無需編寫復雜的文本提示詞,直接在參考圖像中框選對象,然后添加一些方框和線條來定義目標的結(jié)束位置或跨幀的整個運動路徑,盡管目前產(chǎn)品還未落地,但也體現(xiàn)了在視頻生成上的一大創(chuàng)意。

除了大廠,在今年3月5日的超訊通信X七火山大會上,一家名為七火山的公司推出了一個融合了Diffusion和Transformer的AI視頻生成模型Etna,實現(xiàn)了15秒4K 60幀的超逼真視頻生成效果,并且同樣具備一定的時空理解能力,可以說是當前國內(nèi)最接近Sora的模型之一了。

Sora成功激活了AI視頻市場

除了國內(nèi)外不同企業(yè)的追趕,Sora的出現(xiàn)不僅給同是AI視頻生成領(lǐng)域的創(chuàng)業(yè)公司帶來了壓力,也同樣給他們帶來了希望。

早在Sora展現(xiàn)Demo之前,國內(nèi)就有一家名為智子引擎的公司在快1年以前提出了基于Transformer的Video統(tǒng)一生成框架,他們拿著這篇論文十分費勁地為投資人、求知者講了大半年,卻屢屢碰壁。而如今因為Sora的火爆,他們也收到了不同投資人的電話,想要學習Sora、學習他們的論文成果。

同樣因為Sora而收到關(guān)注的,還有一家名為愛詩科技的公司。它們的目標是3-6個月趕超Sora。它由字節(jié)跳動前視覺技術(shù)負責人王長虎于2023年4月創(chuàng)辦,他們致力于打造全球頂尖的AI視頻生成模型及應用。如今它已經(jīng)完成了億級A1輪融資,資金將主要用于底層視頻大模型的技術(shù)研發(fā)和團隊搭建等方面。

企業(yè)之外,高校也并未落隊。北大團隊發(fā)起了一項Sora復現(xiàn)計劃——Open Sora,希望集結(jié)開源社區(qū)的力量,盡可能完成對Sora的復現(xiàn)。這個初始團隊一共有13人:帶隊的是北大信息工程學院助理教授、博導袁粒和北大計算機學院教授、博導田永鴻等人。消息一經(jīng)公布,就有北大校友兼AnimateDiff貢獻者等人進行了回應,究竟這個“國產(chǎn)版Sora”的新挑戰(zhàn)者能否成功實現(xiàn)復現(xiàn),我們拭目以待。

顯然Sora的誕生已經(jīng)成功激活了AI視頻生成領(lǐng)域,相信一部完全由AI生成的院線電影可能會比我們想象中更快到來。

審核編輯:湯梓紅
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 視頻
    +關(guān)注

    關(guān)注

    6

    文章

    1972

    瀏覽量

    73891
  • AI
    AI
    +關(guān)注

    關(guān)注

    88

    文章

    35041

    瀏覽量

    279099
  • Sora
    +關(guān)注

    關(guān)注

    0

    文章

    83

    瀏覽量

    477
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    4K、多模態(tài)、長視頻AI視頻生成的下一個戰(zhàn)場,誰在領(lǐng)跑?

    電子發(fā)燒友網(wǎng)報道(文/李彎彎) 6月11日,豆包App上線視頻生成模型豆包Seedance 1.0 pro。這是字節(jié)跳動最新視頻模型,支持文字與圖片輸入,可生成多鏡頭無縫切換的1080P高品質(zhì)
    的頭像 發(fā)表于 06-16 00:13 ?6177次閱讀

    AI Agent 應用與項目實戰(zhàn)》----- 學習如何開發(fā)視頻應用

    開發(fā)一個視頻內(nèi)容生成Agent。 訪問語聚AI平臺官網(wǎng) ,進行注冊或登錄。 在平臺首頁,了解語聚AI的功能和應用場景,特別是其支持的視頻生成
    發(fā)表于 03-05 19:52

    字節(jié)跳動即將推出多模態(tài)視頻生成模型OmniHuman

    字節(jié)跳動旗下一站式AI創(chuàng)作平臺即夢AI即將迎來重大更新,全新多模態(tài)視頻生成模型OmniHuman即將上線。這款模型是字節(jié)跳動自研的閉源模型,其強大的功能令人矚目:僅需一張圖片與一段音頻,便能自動
    的頭像 發(fā)表于 02-08 10:53 ?742次閱讀

    阿里云通義萬相2.1視頻生成模型震撼發(fā)布

    近日,阿里云旗下的通義萬相迎來了重要升級,正式推出了全新的萬相2.1視頻生成模型。這一創(chuàng)新成果標志著阿里云在視頻生成技術(shù)領(lǐng)域的又一次重大突破。 據(jù)悉,萬相2.1視頻生成模型在多個方面實現(xiàn)了顯著提升
    的頭像 發(fā)表于 01-13 10:00 ?823次閱讀

    Google兩款先進生成AI模型登陸Vertex AI平臺

    新的 AI 模型,包括最先進的視頻生成模型Veo以及最高品質(zhì)的圖像生成模型Imagen 3。近日,我們在 Google Cloud 上進一步推動這一勢頭,客戶可以在Vertex AI
    的頭像 發(fā)表于 12-30 09:56 ?609次閱讀

    華為云 Flexus 云服務器 X 實例 Windows 系統(tǒng)部署一鍵短視頻生成 AI 工具 moneyprinter

    在追求創(chuàng)新與效率并重的今天,我們公司迎難而上,決定自主搭建一款短視頻生成 AI 工具——MoneyPrinter,旨在為市場帶來前所未有的創(chuàng)意風暴。面對服務器選擇的難題,我們經(jīng)過深思熟慮與多方比較
    的頭像 發(fā)表于 12-30 09:10 ?631次閱讀
    華為云 Flexus 云服務器 X 實例 Windows 系統(tǒng)部署一鍵短<b class='flag-5'>視頻生成</b> <b class='flag-5'>AI</b> 工具 moneyprinter

    OpenAI暫不推出Sora視頻生成模型API

    OpenAI近日宣布,目前暫無推出其視頻生成模型Sora的應用程序接口(API)的計劃。Sora模型能夠基于文本和圖像生成視頻,引發(fā)了廣泛關(guān)
    的頭像 發(fā)表于 12-20 14:23 ?522次閱讀

    OpenAI推出AI視頻生成模型Sora

    近日,備受期待的OpenAI再次推出了其創(chuàng)新之作——AI視頻生成模型Sora。這一新品的發(fā)布,無疑為AI技術(shù)注入了新的活力。 據(jù)悉,Sora
    的頭像 發(fā)表于 12-12 09:40 ?702次閱讀

    OpenAI開放Sora視頻生成模型

    OpenAI近日宣布,其傾力打造的人工智能視頻生成系統(tǒng)Sora已正式向美國及其他市場的ChatGPT Plus訂閱用戶開放。自去年首次公開預覽以來,Sora歷經(jīng)約10個月的精心研發(fā)與優(yōu)化,現(xiàn)已全面
    的頭像 發(fā)表于 12-10 11:16 ?726次閱讀

    可靈AI全球首發(fā)視頻模型定制功能,助力AI視頻創(chuàng)作

    近日,快手旗下的可靈AI在全球范圍內(nèi)率先推出了視頻模型定制功能,這一創(chuàng)新之舉成功解決了AI視頻生成過程中人物IP穩(wěn)定性不足的難題。 據(jù)了解,用戶現(xiàn)在可以在可靈
    的頭像 發(fā)表于 11-26 14:02 ?1236次閱讀

    字節(jié)跳動自研視頻生成模型Seaweed開放

    近日,字節(jié)跳動旗下的AI內(nèi)容平臺即夢AI傳來新消息,宣布自研的視頻生成模型Seaweed即日起正式面向平臺用戶開放使用。這一舉措標志著字節(jié)跳動在AI
    的頭像 發(fā)表于 11-11 14:31 ?685次閱讀

    生成AI工具作用

    生成AI工具是指那些能夠自動生成文本、圖像、音頻、視頻等多種類型數(shù)據(jù)的人工智能技術(shù)。在此,petacloud.ai小編為您整理
    的頭像 發(fā)表于 10-28 11:19 ?740次閱讀

    火山引擎推出豆包·視頻生成模型

    在近期舉辦的2024火山引擎AI創(chuàng)新巡展上,火山引擎總裁譚待隆重推出了豆包·視頻生成模型,這一舉措標志著火山引擎在視頻內(nèi)容生成領(lǐng)域邁出了重要一步。豆包模型憑借其獨特的技術(shù)優(yōu)勢,吸引了業(yè)
    的頭像 發(fā)表于 09-25 14:11 ?627次閱讀

    STAR AI進軍美股科技星智能領(lǐng)跑生成AI賽道

    自ChatGPT問世以來,從文字chatbot到視頻生成和機器人,生成式人工智能(Generative AI)的商業(yè)應用已經(jīng)成為全球最具爆炸性效應的賽道,
    的頭像 發(fā)表于 08-22 08:56 ?620次閱讀
    STAR <b class='flag-5'>AI</b>進軍美股科技星智能領(lǐng)跑<b class='flag-5'>生成</b>式<b class='flag-5'>AI</b>賽道

    阿里首推AI視頻生成利器Tora:指尖畫圈,自由操控物體運動軌跡

    近日,阿里巴巴團隊震撼發(fā)布了一項革命性的創(chuàng)新成果——Tora,一個前所未有的AI視頻生成框架。Tora深度融合了文本、視覺與軌跡條件,依托其獨創(chuàng)的軌跡導向擴散變換器(DiT)技術(shù),徹底顛覆了視頻內(nèi)容的創(chuàng)造與控制方式,為電影特效、
    的頭像 發(fā)表于 08-06 16:41 ?1408次閱讀