一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Sora還在PPT階段,“中國(guó)版Sora”已經(jīng)開(kāi)放使用了!

Hobby觀察 ? 來(lái)源:電子發(fā)燒友 ? 作者:梁浩斌 ? 2024-06-17 09:07 ? 次閱讀

電子發(fā)燒友網(wǎng)報(bào)道(文/梁浩斌)今年春節(jié)期間,OpenAI的AI文字生成視頻模型Sora驚艷全世界,極高的視頻生成效果、長(zhǎng)達(dá)60秒的視頻生成長(zhǎng)度,讓過(guò)去Pika Labs推出的Pika 1.0、去年Runway推出的Gen-1、谷歌團(tuán)隊(duì)發(fā)布的VideoPoet等各種文生視頻模型都黯然失色。

然而,Sora在發(fā)布近4個(gè)月的時(shí)間里,依然沒(méi)有開(kāi)放普通用戶使用,同時(shí)也沒(méi)有更多的視頻案例流出,目前只有官方發(fā)布的演示視頻。

最近,快手旗下的名為“可靈”的文生視頻大模型上線,與Sora不同的是,可靈發(fā)布即開(kāi)放申請(qǐng)使用,目前已經(jīng)有大量用戶獲得使用名額,社交平臺(tái)上已經(jīng)有不少用戶上傳了可靈生成的視頻,甚至在海外AI圈迅速爆火。

對(duì)比Sora,可靈的效果如何?

快手在推出可靈時(shí),很明確地表示可靈是“首個(gè)效果對(duì)標(biāo)Sora且面向用戶開(kāi)放的文生視頻大模型”。既然對(duì)標(biāo)Sora,那么就要看下雙方的實(shí)際表現(xiàn)如何了。

首先從生成視頻的指標(biāo)上看,Sora宣稱能夠輸出1080p分辨率,最長(zhǎng)60秒的視頻,從OpenAI展示出的Demo來(lái)看,Sora的強(qiáng)大之處更在于物體模型的穩(wěn)定,不僅是在單鏡頭運(yùn)動(dòng)中物體建模能夠保持一致性,即使是多鏡頭的畫(huà)面切換中,依然能夠保持色彩、畫(huà)面風(fēng)格的一致。

可靈官方宣稱的指標(biāo)是,支持長(zhǎng)達(dá)2分鐘的電影級(jí)畫(huà)面輸出,支持720p和1080p視頻輸出,幀率30fps,同時(shí)支持多種寬高比??伸`采用3D時(shí)空聯(lián)合注意力機(jī)制,能夠更好地建模復(fù)雜時(shí)空運(yùn)動(dòng),生成較大幅度運(yùn)動(dòng)的視頻內(nèi)容,同時(shí)能夠符合運(yùn)動(dòng)規(guī)律。

f2995ac7b0584a00af00995fcbc7dab8~tplv-tt-shrink:640:0.image?lk3s=06827d14&traceid=20240617091711EBF48DEC4FE63F87A0A1&x-expires=2147483647&x-signature=E8pc3thbmfHkHatUiux2GjkkaRU%3D

提示詞:小男孩在花園里騎自行車(chē)經(jīng)歷秋冬春夏四季變換

在一些演示視頻中,也可以看到可靈的物理建模比較穩(wěn)定,在一分多鐘的長(zhǎng)鏡頭畫(huà)面中,整體畫(huà)面一致性表現(xiàn)較為理想。

7a9605de5a65453b8af6284b93f6204e~tplv-tt-shrink:640:0.image?lk3s=06827d14&traceid=20240617091711EBF48DEC4FE63F87A0A1&x-expires=2147483647&x-signature=MjQ1FFHJra1ZBGSZcPOngB70Ejg%3D

提示詞:微距鏡頭,火山在一個(gè)咖啡杯中噴發(fā)

文生視頻的一個(gè)重要應(yīng)用就是生成現(xiàn)實(shí)中不存在的畫(huà)面,能夠充分將人的想象力轉(zhuǎn)化成視頻。Sora發(fā)布之初在咖啡杯中的海盜船令人印象深刻,可靈官方演示視頻中也有類似的案例。

af5f4fcea2374eecba97160d26e6ecd3~tplv-tt-shrink:640:0.image?lk3s=06827d14&traceid=20240617091711EBF48DEC4FE63F87A0A1&x-expires=2147483647&x-signature=PfB671WcgzCU92GiwDBZHY%2BrM3E%3D

提示詞:一個(gè)戴眼鏡的中國(guó)男孩在快餐店內(nèi)閉眼享受美味的芝士漢堡

在“吃漢堡”的場(chǎng)景中,Sora此前的演示視頻已經(jīng)較為真實(shí)地展示了漢堡的咬痕,但可靈添加了更多細(xì)節(jié),不僅是漢堡在被咬后的缺口,同時(shí)小男孩咬下漢堡后嘴邊殘留的碎屑也展現(xiàn)出來(lái)了,更加符合物理規(guī)律。

不過(guò),目前可靈內(nèi)測(cè)的版本只支持5秒、720p分辨率的視頻,有博主測(cè)試同樣提示詞,可靈有時(shí)候理解相對(duì)Sora會(huì)較弱。

比如提示詞:動(dòng)畫(huà)場(chǎng)景特寫(xiě)了一個(gè)跪在融化的紅燭旁的毛茸茸的小怪物。藝術(shù)風(fēng)格是3D和現(xiàn)實(shí)主義的,重點(diǎn)是照明和紋理。這幅畫(huà)的基調(diào)是驚奇和好奇,因?yàn)楣治锉牬笱劬堉炷曋鹧?。它的姿?shì)和表情傳達(dá)出一種天真和頑皮的感覺(jué),就好像它是第一次探索周?chē)氖澜?。暖色和戲劇性燈光的使用進(jìn)一步增強(qiáng)了圖像的舒適氛圍。

這串細(xì)節(jié)描寫(xiě)豐富的提示詞,Sora官網(wǎng)展示的效果是這樣的:

399ac79eaeae48f79a0ef5aa7cd4f8dc~tplv-tt-shrink:640:0.image?lk3s=06827d14&traceid=20240617091711EBF48DEC4FE63F87A0A1&x-expires=2147483647&x-signature=4W2ULy%2BlAa0Hi0CeUAA0uaBKq%2BY%3D

而可靈是這樣的:

a5444151ab6b48e0af8bc57d193c5451~tplv-tt-shrink:640:0.image?lk3s=06827d14&traceid=20240617091711EBF48DEC4FE63F87A0A1&x-expires=2147483647&x-signature=n3jPrQTCNDxnuhwgUMNZBlv%2FxlY%3D

當(dāng)然,由于模型的不同,可能可靈的提示詞優(yōu)化方向會(huì)與Sora有所區(qū)別。

但從效果來(lái)看,可靈與Sora已經(jīng)十分接近,更重要的是,可靈已經(jīng)開(kāi)放公眾測(cè)試,Sora目前依然處于PPT階段。

文生視頻模型即將迎來(lái)大爆發(fā)?

盡管Sora表現(xiàn)依然有所領(lǐng)先,但此前Sora火爆出圈的短片《氣球人》被爆經(jīng)過(guò)大量后期調(diào)整,三個(gè)人的團(tuán)隊(duì)花了1.5至2周的時(shí)間才做出來(lái),團(tuán)隊(duì)自曝Sora生成的視頻素材最終用到影片里的只有1/300。

所以,Sora一直未開(kāi)放使用或許也有實(shí)際效果不如預(yù)期的考慮。因此,可靈的強(qiáng)大之處在于,實(shí)打?qū)嵉亻_(kāi)放給創(chuàng)作者使用,目前在快手旗下的快影APP中就能申請(qǐng)使用資格,截至6月14日,已經(jīng)有8萬(wàn)人在排隊(duì)審核中。

同時(shí),快手上已經(jīng)出現(xiàn)大量采用可靈制作的短片,通過(guò)多個(gè)5秒的短鏡頭拼接而成,實(shí)際效果可見(jiàn)即可得。

而近期除了可靈之外,Luma AI也對(duì)外開(kāi)放了其文生視頻模型Dream Machine,更是宣稱可以輸出120秒120幀的高質(zhì)量視頻。

目前文生視頻模型,包括可靈、Sora等都采用了Diffusion Transformer作為整體架構(gòu),有觀點(diǎn)認(rèn)為,Sora并不是技術(shù)性的突破,而是產(chǎn)品性的突破。即文生視頻實(shí)際上也是大模型應(yīng)用的一個(gè)方向,而Sora就是其中一個(gè)突破性產(chǎn)品。

可靈領(lǐng)銜的文生視頻模型大規(guī)模應(yīng)用,更是代表著這類產(chǎn)品的新高度。從產(chǎn)品上看,可以預(yù)見(jiàn),未來(lái)半年里,國(guó)內(nèi)外可能將會(huì)陸續(xù)涌現(xiàn)更多高質(zhì)量的文生視頻大模型產(chǎn)品,并大大加快迭代的進(jìn)度。

文生視頻大模型的爆發(fā),將會(huì)有很大可能,徹底改變未來(lái)短視頻創(chuàng)作的生態(tài)。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • Sora
    +關(guān)注

    關(guān)注

    0

    文章

    83

    瀏覽量

    396
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    Ironwood開(kāi)放式頂部BGA插座凸輪驅(qū)動(dòng)桿

    Ironwood開(kāi)放式頂部BGA插座凸輪驅(qū)動(dòng)桿 Ironwood的BGA芯片壽命通??赏ㄟ^(guò)浴槽曲線來(lái)典型地展示。鑒于BGA制造工藝的固有屬性,極少數(shù)BGA在初期使用階段就可能失效,而在其正常使用期
    發(fā)表于 02-17 09:36

    OpenAI攻克Sora視頻創(chuàng)建錯(cuò)誤率高難題

    在人工智能與多媒體技術(shù)的交叉領(lǐng)域,OpenAI近期宣布了一項(xiàng)重要進(jìn)展:成功解決了Sora視頻創(chuàng)建過(guò)程中錯(cuò)誤率高的問(wèn)題。這一突破不僅標(biāo)志著OpenAI在視頻處理技術(shù)上取得了顯著進(jìn)步,也為廣大用戶帶來(lái)
    的頭像 發(fā)表于 12-31 10:37 ?382次閱讀

    OpenAI暫不推出Sora視頻生成模型API

    OpenAI近日宣布,目前暫無(wú)推出其視頻生成模型Sora的應(yīng)用程序接口(API)的計(jì)劃。Sora模型能夠基于文本和圖像生成視頻,引發(fā)了廣泛關(guān)注。然而,由于訪問(wèn)量遠(yuǎn)超預(yù)期,OpenAI此前不得不緊急
    的頭像 發(fā)表于 12-20 14:23 ?410次閱讀

    成都匯陽(yáng)投資關(guān)于Sora 正式上線,多模態(tài)模型的里程碑

    ? 事?件 ?12月10日,OpenAl正式上線?Sora,并向包括美國(guó)在內(nèi)的多數(shù)國(guó)家用戶開(kāi)放,用戶可在OpenAI官網(wǎng)上體驗(yàn)Sora。同時(shí),Sora?被包含在ChatGPT?Plus
    的頭像 發(fā)表于 12-16 14:39 ?527次閱讀

    OpenAI推出AI視頻生成模型Sora

    近日,備受期待的OpenAI再次推出了其創(chuàng)新之作——AI視頻生成模型Sora。這一新品的發(fā)布,無(wú)疑為AI技術(shù)注入了新的活力。 據(jù)悉,Sora與OpenAI旗下的AI工具DALL-E有著異曲同工之妙
    的頭像 發(fā)表于 12-12 09:40 ?538次閱讀

    Sora之后,視頻生成模型的中國(guó)牌局

    大模型的牌局,國(guó)內(nèi)企業(yè)正在找到自己的節(jié)奏感
    的頭像 發(fā)表于 12-12 09:23 ?2665次閱讀
    <b class='flag-5'>Sora</b>之后,視頻生成模型的<b class='flag-5'>中國(guó)</b>牌局

    OpenAI開(kāi)放Sora視頻生成模型

    OpenAI近日宣布,其傾力打造的人工智能視頻生成系統(tǒng)Sora已正式向美國(guó)及其他市場(chǎng)的ChatGPT Plus訂閱用戶開(kāi)放。自去年首次公開(kāi)預(yù)覽以來(lái),Sora歷經(jīng)約10個(gè)月的精心研發(fā)與優(yōu)化,現(xiàn)已全面
    的頭像 發(fā)表于 12-10 11:16 ?556次閱讀

    Sora的功能優(yōu)勢(shì)及用戶評(píng)價(jià)

    在數(shù)字化時(shí)代,個(gè)人助理軟件已經(jīng)成為我們?nèi)粘I钪胁豢苫蛉钡囊徊糠帧?b class='flag-5'>Sora,作為一款新興的智能個(gè)人助理,以其獨(dú)特的功能優(yōu)勢(shì)和卓越的用戶體驗(yàn),迅速在市場(chǎng)上占據(jù)了一席之地。 一、Sora的功能優(yōu)勢(shì)
    的頭像 發(fā)表于 10-31 14:38 ?816次閱讀

    玩具反斗城使用OpenAI的Sora文本轉(zhuǎn)視頻工具制作&quot;品牌電影&quot;

    你對(duì)玩具反斗城(Toys“R”Us)有美好的回憶嗎?據(jù)悉,該玩具零售巨頭正借助人工智能技術(shù)謀求品牌復(fù)興,近日發(fā)布了一則聲稱使用OpenAI的Sora文本轉(zhuǎn)視頻工具制作的"品牌電影",引發(fā)業(yè)界關(guān)注
    的頭像 發(fā)表于 07-03 16:40 ?983次閱讀

    SynSense時(shí)識(shí)科技與中科院自動(dòng)化所聯(lián)合研究成果榮登國(guó)際權(quán)威期刊

    人工智能,作為引領(lǐng)科技革命和產(chǎn)業(yè)變革的核心力量,正推動(dòng)生成式AI技術(shù)如ChatGPT、Sora等不斷取得新的突破,大模型的應(yīng)用范圍也日漸拓寬。
    的頭像 發(fā)表于 05-29 09:56 ?734次閱讀
    SynSense時(shí)識(shí)科技與中科院自動(dòng)化所聯(lián)合研究成果榮登國(guó)際權(quán)威期刊

    谷歌首席執(zhí)行官皮查伊:關(guān)注臉書(shū)和微軟利用YouTube內(nèi)容訓(xùn)練AI,將采取措施

    早前曾報(bào)道,OpenAI 首席技術(shù)官在采訪中含糊其辭,未透露 Sora 訓(xùn)練數(shù)據(jù)來(lái)源,且當(dāng)記者詢問(wèn)是否包括 YouTube 視頻時(shí),其回應(yīng)“我不確定”。
    的頭像 發(fā)表于 05-17 11:37 ?383次閱讀

    Sora的最強(qiáng)競(jìng)爭(zhēng)對(duì)手,來(lái)自中國(guó)

    今年2月發(fā)布的Sora,先是引得業(yè)界“哇聲一片”,馬斯克直接表態(tài)「人類愿賭服輸」;周鴻祎說(shuō)借助Sora人類實(shí)現(xiàn)AGI將縮減至一兩年。大佬的彩虹屁不是白吹的。利用
    的頭像 發(fā)表于 05-13 17:11 ?171次閱讀
    <b class='flag-5'>Sora</b>的最強(qiáng)競(jìng)爭(zhēng)對(duì)手,來(lái)自<b class='flag-5'>中國(guó)</b>

    智譜AI正在研發(fā)國(guó)產(chǎn)文生視頻模型,對(duì)標(biāo)OpenAI Sora

    國(guó)內(nèi)AI領(lǐng)域的獨(dú)角獸企業(yè)智譜AI正全力研發(fā)一款與OpenAI的Sora相媲美的國(guó)產(chǎn)文生視頻模型。據(jù)悉,該模型的技術(shù)研發(fā)已取得顯著進(jìn)展,預(yù)計(jì)最快將于今年內(nèi)正式對(duì)外發(fā)布。
    的頭像 發(fā)表于 05-13 11:14 ?818次閱讀

    愛(ài)芯元智推出邊端側(cè)智能SoCAX650N,讓視覺(jué)更智能

    當(dāng)前大模型蓬勃發(fā)展,OpenAI的Sora、ChatGPT、CLIP、DALL-E,Google的Gemini、ViT-22B,Meta的LLaMA3、DINO v2,
    的頭像 發(fā)表于 05-09 14:39 ?2400次閱讀
    愛(ài)芯元智推出邊端側(cè)智能SoCAX650N,讓視覺(jué)更智能

    智譜AI正研發(fā)對(duì)標(biāo)Sora的國(guó)產(chǎn)文生視頻模型

    智譜AI,這家國(guó)內(nèi)估值超過(guò)200億的AI大模型獨(dú)角獸企業(yè),正全力投入研發(fā)一款與OpenAI的Sora相媲美的國(guó)產(chǎn)文生視頻模型。據(jù)公司內(nèi)部人士透露,該模型預(yù)計(jì)最快將在今年內(nèi)發(fā)布,將成為AI視頻生成領(lǐng)域的一大亮點(diǎn)。
    的頭像 發(fā)表于 05-07 09:22 ?660次閱讀