紧缚调教一区二区三区在线播放,欧美黄色一区,久操视频免费看五月婷婷丁香

電子發(fā)燒友網(wǎng)報道（文/梁浩斌）今年春節(jié)期間，OpenAI的AI文字生成視頻模型Sora驚艷全世界，極高的視頻生成效果、長達60秒的視頻生成長度，讓過去Pika Labs推出的Pika 1.0、去年Runway推出的Gen-1、谷歌團隊發(fā)布的VideoPoet等各種文生視頻模型都黯然失色。

然而，Sora在發(fā)布近4個月的時間里，依然沒有開放普通用戶使用，同時也沒有更多的視頻案例流出，目前只有官方發(fā)布的演示視頻。

最近，快手旗下的名為“可靈”的文生視頻大模型上線，與Sora不同的是，可靈發(fā)布即開放申請使用，目前已經(jīng)有大量用戶獲得使用名額，社交平臺上已經(jīng)有不少用戶上傳了可靈生成的視頻，甚至在海外AI圈迅速爆火。

對比Sora，可靈的效果如何？

快手在推出可靈時，很明確地表示可靈是“首個效果對標Sora且面向用戶開放的文生視頻大模型”。既然對標Sora，那么就要看下雙方的實際表現(xiàn)如何了。

首先從生成視頻的指標上看，Sora宣稱能夠輸出1080p分辨率，最長60秒的視頻，從OpenAI展示出的Demo來看，Sora的強大之處更在于物體模型的穩(wěn)定，不僅是在單鏡頭運動中物體建模能夠保持一致性，即使是多鏡頭的畫面切換中，依然能夠保持色彩、畫面風格的一致。

可靈官方宣稱的指標是，支持長達2分鐘的電影級畫面輸出，支持720p和1080p視頻輸出，幀率30fps，同時支持多種寬高比?？伸`采用3D時空聯(lián)合注意力機制，能夠更好地建模復(fù)雜時空運動，生成較大幅度運動的視頻內(nèi)容，同時能夠符合運動規(guī)律。

f2995ac7b0584a00af00995fcbc7dab8~tplv-tt-shrink:640:0.image?lk3s=06827d14&traceid=20240617091711EBF48DEC4FE63F87A0A1&x-expires=2147483647&x-signature=E8pc3thbmfHkHatUiux2GjkkaRU%3D

提示詞：小男孩在花園里騎自行車經(jīng)歷秋冬春夏四季變換

在一些演示視頻中，也可以看到可靈的物理建模比較穩(wěn)定，在一分多鐘的長鏡頭畫面中，整體畫面一致性表現(xiàn)較為理想。

7a9605de5a65453b8af6284b93f6204e~tplv-tt-shrink:640:0.image?lk3s=06827d14&traceid=20240617091711EBF48DEC4FE63F87A0A1&x-expires=2147483647&x-signature=MjQ1FFHJra1ZBGSZcPOngB70Ejg%3D

提示詞：微距鏡頭，火山在一個咖啡杯中噴發(fā)

文生視頻的一個重要應(yīng)用就是生成現(xiàn)實中不存在的畫面，能夠充分將人的想象力轉(zhuǎn)化成視頻。Sora發(fā)布之初在咖啡杯中的海盜船令人印象深刻，可靈官方演示視頻中也有類似的案例。

af5f4fcea2374eecba97160d26e6ecd3~tplv-tt-shrink:640:0.image?lk3s=06827d14&traceid=20240617091711EBF48DEC4FE63F87A0A1&x-expires=2147483647&x-signature=PfB671WcgzCU92GiwDBZHY%2BrM3E%3D

提示詞：一個戴眼鏡的中國男孩在快餐店內(nèi)閉眼享受美味的芝士漢堡

在“吃漢堡”的場景中，Sora此前的演示視頻已經(jīng)較為真實地展示了漢堡的咬痕，但可靈添加了更多細節(jié)，不僅是漢堡在被咬后的缺口，同時小男孩咬下漢堡后嘴邊殘留的碎屑也展現(xiàn)出來了，更加符合物理規(guī)律。

不過，目前可靈內(nèi)測的版本只支持5秒、720p分辨率的視頻，有博主測試同樣提示詞，可靈有時候理解相對Sora會較弱。

比如提示詞：動畫場景特寫了一個跪在融化的紅燭旁的毛茸茸的小怪物。藝術(shù)風格是3D和現(xiàn)實主義的，重點是照明和紋理。這幅畫的基調(diào)是驚奇和好奇，因為怪物睜大眼睛張著嘴凝視著火焰。它的姿勢和表情傳達出一種天真和頑皮的感覺，就好像它是第一次探索周圍的世界。暖色和戲劇性燈光的使用進一步增強了圖像的舒適氛圍。

這串細節(jié)描寫豐富的提示詞，Sora官網(wǎng)展示的效果是這樣的：

399ac79eaeae48f79a0ef5aa7cd4f8dc~tplv-tt-shrink:640:0.image?lk3s=06827d14&traceid=20240617091711EBF48DEC4FE63F87A0A1&x-expires=2147483647&x-signature=4W2ULy%2BlAa0Hi0CeUAA0uaBKq%2BY%3D

而可靈是這樣的：

a5444151ab6b48e0af8bc57d193c5451~tplv-tt-shrink:640:0.image?lk3s=06827d14&traceid=20240617091711EBF48DEC4FE63F87A0A1&x-expires=2147483647&x-signature=n3jPrQTCNDxnuhwgUMNZBlv%2FxlY%3D

當然，由于模型的不同，可能可靈的提示詞優(yōu)化方向會與Sora有所區(qū)別。

但從效果來看，可靈與Sora已經(jīng)十分接近，更重要的是，可靈已經(jīng)開放公眾測試，Sora目前依然處于PPT階段。

文生視頻模型即將迎來大爆發(fā)？

盡管Sora表現(xiàn)依然有所領(lǐng)先，但此前Sora火爆出圈的短片《氣球人》被爆經(jīng)過大量后期調(diào)整，三個人的團隊花了1.5至2周的時間才做出來，團隊自曝Sora生成的視頻素材最終用到影片里的只有1/300。

所以，Sora一直未開放使用或許也有實際效果不如預(yù)期的考慮。因此，可靈的強大之處在于，實打?qū)嵉亻_放給創(chuàng)作者使用，目前在快手旗下的快影APP中就能申請使用資格，截至6月14日，已經(jīng)有8萬人在排隊審核中。

同時，快手上已經(jīng)出現(xiàn)大量采用可靈制作的短片，通過多個5秒的短鏡頭拼接而成，實際效果可見即可得。

而近期除了可靈之外，Luma AI也對外開放了其文生視頻模型Dream Machine，更是宣稱可以輸出120秒120幀的高質(zhì)量視頻。

目前文生視頻模型，包括可靈、Sora等都采用了Diffusion Transformer作為整體架構(gòu)，有觀點認為，Sora并不是技術(shù)性的突破，而是產(chǎn)品性的突破。即文生視頻實際上也是大模型應(yīng)用的一個方向，而Sora就是其中一個突破性產(chǎn)品。

可靈領(lǐng)銜的文生視頻模型大規(guī)模應(yīng)用，更是代表著這類產(chǎn)品的新高度。從產(chǎn)品上看，可以預(yù)見，未來半年里，國內(nèi)外可能將會陸續(xù)涌現(xiàn)更多高質(zhì)量的文生視頻大模型產(chǎn)品，并大大加快迭代的進度。

文生視頻大模型的爆發(fā)，將會有很大可能，徹底改變未來短視頻創(chuàng)作的生態(tài)。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴