一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Sora還在PPT階段,“中國版Sora”已經(jīng)開放使用了!

Hobby觀察 ? 來源:電子發(fā)燒友 ? 作者:梁浩斌 ? 2024-06-17 09:07 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

電子發(fā)燒友網(wǎng)報道(文/梁浩斌)今年春節(jié)期間,OpenAI的AI文字生成視頻模型Sora驚艷全世界,極高的視頻生成效果、長達60秒的視頻生成長度,讓過去Pika Labs推出的Pika 1.0、去年Runway推出的Gen-1、谷歌團隊發(fā)布的VideoPoet等各種文生視頻模型都黯然失色。

然而,Sora在發(fā)布近4個月的時間里,依然沒有開放普通用戶使用,同時也沒有更多的視頻案例流出,目前只有官方發(fā)布的演示視頻。

最近,快手旗下的名為“可靈”的文生視頻大模型上線,與Sora不同的是,可靈發(fā)布即開放申請使用,目前已經(jīng)有大量用戶獲得使用名額,社交平臺上已經(jīng)有不少用戶上傳了可靈生成的視頻,甚至在海外AI圈迅速爆火。

對比Sora,可靈的效果如何?

快手在推出可靈時,很明確地表示可靈是“首個效果對標Sora且面向用戶開放的文生視頻大模型”。既然對標Sora,那么就要看下雙方的實際表現(xiàn)如何了。

首先從生成視頻的指標上看,Sora宣稱能夠輸出1080p分辨率,最長60秒的視頻,從OpenAI展示出的Demo來看,Sora的強大之處更在于物體模型的穩(wěn)定,不僅是在單鏡頭運動中物體建模能夠保持一致性,即使是多鏡頭的畫面切換中,依然能夠保持色彩、畫面風格的一致。

可靈官方宣稱的指標是,支持長達2分鐘的電影級畫面輸出,支持720p和1080p視頻輸出,幀率30fps,同時支持多種寬高比??伸`采用3D時空聯(lián)合注意力機制,能夠更好地建模復(fù)雜時空運動,生成較大幅度運動的視頻內(nèi)容,同時能夠符合運動規(guī)律。

f2995ac7b0584a00af00995fcbc7dab8~tplv-tt-shrink:640:0.image?lk3s=06827d14&traceid=20240617091711EBF48DEC4FE63F87A0A1&x-expires=2147483647&x-signature=E8pc3thbmfHkHatUiux2GjkkaRU%3D

提示詞:小男孩在花園里騎自行車經(jīng)歷秋冬春夏四季變換

在一些演示視頻中,也可以看到可靈的物理建模比較穩(wěn)定,在一分多鐘的長鏡頭畫面中,整體畫面一致性表現(xiàn)較為理想。

7a9605de5a65453b8af6284b93f6204e~tplv-tt-shrink:640:0.image?lk3s=06827d14&traceid=20240617091711EBF48DEC4FE63F87A0A1&x-expires=2147483647&x-signature=MjQ1FFHJra1ZBGSZcPOngB70Ejg%3D

提示詞:微距鏡頭,火山在一個咖啡杯中噴發(fā)

文生視頻的一個重要應(yīng)用就是生成現(xiàn)實中不存在的畫面,能夠充分將人的想象力轉(zhuǎn)化成視頻。Sora發(fā)布之初在咖啡杯中的海盜船令人印象深刻,可靈官方演示視頻中也有類似的案例。

af5f4fcea2374eecba97160d26e6ecd3~tplv-tt-shrink:640:0.image?lk3s=06827d14&traceid=20240617091711EBF48DEC4FE63F87A0A1&x-expires=2147483647&x-signature=PfB671WcgzCU92GiwDBZHY%2BrM3E%3D

提示詞:一個戴眼鏡的中國男孩在快餐店內(nèi)閉眼享受美味的芝士漢堡

在“吃漢堡”的場景中,Sora此前的演示視頻已經(jīng)較為真實地展示了漢堡的咬痕,但可靈添加了更多細節(jié),不僅是漢堡在被咬后的缺口,同時小男孩咬下漢堡后嘴邊殘留的碎屑也展現(xiàn)出來了,更加符合物理規(guī)律。

不過,目前可靈內(nèi)測的版本只支持5秒、720p分辨率的視頻,有博主測試同樣提示詞,可靈有時候理解相對Sora會較弱。

比如提示詞:動畫場景特寫了一個跪在融化的紅燭旁的毛茸茸的小怪物。藝術(shù)風格是3D和現(xiàn)實主義的,重點是照明和紋理。這幅畫的基調(diào)是驚奇和好奇,因為怪物睜大眼睛張著嘴凝視著火焰。它的姿勢和表情傳達出一種天真和頑皮的感覺,就好像它是第一次探索周圍的世界。暖色和戲劇性燈光的使用進一步增強了圖像的舒適氛圍。

這串細節(jié)描寫豐富的提示詞,Sora官網(wǎng)展示的效果是這樣的:

399ac79eaeae48f79a0ef5aa7cd4f8dc~tplv-tt-shrink:640:0.image?lk3s=06827d14&traceid=20240617091711EBF48DEC4FE63F87A0A1&x-expires=2147483647&x-signature=4W2ULy%2BlAa0Hi0CeUAA0uaBKq%2BY%3D

而可靈是這樣的:

a5444151ab6b48e0af8bc57d193c5451~tplv-tt-shrink:640:0.image?lk3s=06827d14&traceid=20240617091711EBF48DEC4FE63F87A0A1&x-expires=2147483647&x-signature=n3jPrQTCNDxnuhwgUMNZBlv%2FxlY%3D

當然,由于模型的不同,可能可靈的提示詞優(yōu)化方向會與Sora有所區(qū)別。

但從效果來看,可靈與Sora已經(jīng)十分接近,更重要的是,可靈已經(jīng)開放公眾測試,Sora目前依然處于PPT階段。

文生視頻模型即將迎來大爆發(fā)?

盡管Sora表現(xiàn)依然有所領(lǐng)先,但此前Sora火爆出圈的短片《氣球人》被爆經(jīng)過大量后期調(diào)整,三個人的團隊花了1.5至2周的時間才做出來,團隊自曝Sora生成的視頻素材最終用到影片里的只有1/300。

所以,Sora一直未開放使用或許也有實際效果不如預(yù)期的考慮。因此,可靈的強大之處在于,實打?qū)嵉亻_放給創(chuàng)作者使用,目前在快手旗下的快影APP中就能申請使用資格,截至6月14日,已經(jīng)有8萬人在排隊審核中。

同時,快手上已經(jīng)出現(xiàn)大量采用可靈制作的短片,通過多個5秒的短鏡頭拼接而成,實際效果可見即可得。

而近期除了可靈之外,Luma AI也對外開放了其文生視頻模型Dream Machine,更是宣稱可以輸出120秒120幀的高質(zhì)量視頻。

目前文生視頻模型,包括可靈、Sora等都采用了Diffusion Transformer作為整體架構(gòu),有觀點認為,Sora并不是技術(shù)性的突破,而是產(chǎn)品性的突破。即文生視頻實際上也是大模型應(yīng)用的一個方向,而Sora就是其中一個突破性產(chǎn)品。

可靈領(lǐng)銜的文生視頻模型大規(guī)模應(yīng)用,更是代表著這類產(chǎn)品的新高度。從產(chǎn)品上看,可以預(yù)見,未來半年里,國內(nèi)外可能將會陸續(xù)涌現(xiàn)更多高質(zhì)量的文生視頻大模型產(chǎn)品,并大大加快迭代的進度。

文生視頻大模型的爆發(fā),將會有很大可能,徹底改變未來短視頻創(chuàng)作的生態(tài)。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • Sora
    +關(guān)注

    關(guān)注

    0

    文章

    83

    瀏覽量

    477
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    泰克科技解析AI服務(wù)器電源架構(gòu)的技術(shù)演進

    2025年,AI熱潮持續(xù)升溫。大模型的參數(shù)規(guī)模越發(fā)驚人,訓練周期從月級壓縮至周級,ChatGPT、DeepSeek、Sora、Grok等一眾生成式AI應(yīng)用輪番登場,讓“AI服務(wù)器”的算力競技演化為全球科技廠商的焦點戰(zhàn)場。
    的頭像 發(fā)表于 06-07 09:06 ?847次閱讀
    泰克科技解析AI服務(wù)器電源架構(gòu)的技術(shù)演進

    PCIe 6.0時代的測試挑戰(zhàn)和解決方案

    近年來,人工智能(AI)計算、云計算、邊緣計算等高性能應(yīng)用正在迎來井噴式增長。大模型訓練(如 DeepSeek、GPT-4、Sora)對計算能力提出了前所未有的挑戰(zhàn),數(shù)據(jù)中心正在加速向 PCIe 6.0邁進,以滿足AI計算、存儲和高速互連的需求。
    的頭像 發(fā)表于 02-19 17:25 ?967次閱讀
    PCIe 6.0時代的測試挑戰(zhàn)和解決方案

    Ironwood開放式頂部BGA插座凸輪驅(qū)動桿

    Ironwood開放式頂部BGA插座凸輪驅(qū)動桿 Ironwood的BGA芯片壽命通??赏ㄟ^浴槽曲線來典型地展示。鑒于BGA制造工藝的固有屬性,極少數(shù)BGA在初期使用階段就可能失效,而在其正常使用期
    發(fā)表于 02-17 09:36

    憶阻器存算一體技術(shù)深度解析

    AI領(lǐng)域正在經(jīng)歷一場顛覆性的變革!DeepSeek,一款近期火爆全球的開源AI大模型,正與GPT-4、Sora等模型一起,掀起一場前所未有的算力競賽。隨著AI訓練規(guī)模的指數(shù)級增長,計算資源的短缺已經(jīng)成為無法忽視的問題——算力不足,功耗爆表,傳統(tǒng)芯片難以支撐未來AI需求!
    的頭像 發(fā)表于 02-13 17:32 ?782次閱讀
    憶阻器存算一體技術(shù)深度解析

    美洽榮登2024中國生成式AI 創(chuàng)新企業(yè)系列榜單-智能客服創(chuàng)新企業(yè)榜

    創(chuàng)新企業(yè)系列榜單” 從ChatGPT的火爆到Sora的發(fā)布,大模型正以驚人的速度迭代升級,這股浪潮不僅刷新了技術(shù)邊界,更顛覆了各行各業(yè)的傳統(tǒng)認知。 在中國,越來越多的企業(yè)正在融合AI優(yōu)化業(yè)務(wù)流程、提升決策效率、創(chuàng)新服務(wù)模式,積極探索如何融合最新
    的頭像 發(fā)表于 12-31 15:12 ?553次閱讀
    美洽榮登2024<b class='flag-5'>中國</b>生成式AI 創(chuàng)新企業(yè)系列榜單-智能客服創(chuàng)新企業(yè)榜

    OpenAI攻克Sora視頻創(chuàng)建錯誤率高難題

    在人工智能與多媒體技術(shù)的交叉領(lǐng)域,OpenAI近期宣布了一項重要進展:成功解決了Sora視頻創(chuàng)建過程中錯誤率高的問題。這一突破不僅標志著OpenAI在視頻處理技術(shù)上取得了顯著進步,也為廣大用戶帶來
    的頭像 發(fā)表于 12-31 10:37 ?523次閱讀

    OpenAI暫不推出Sora視頻生成模型API

    OpenAI近日宣布,目前暫無推出其視頻生成模型Sora的應(yīng)用程序接口(API)的計劃。Sora模型能夠基于文本和圖像生成視頻,引發(fā)了廣泛關(guān)注。然而,由于訪問量遠超預(yù)期,OpenAI此前不得不緊急
    的頭像 發(fā)表于 12-20 14:23 ?522次閱讀

    成都匯陽投資關(guān)于Sora 正式上線,多模態(tài)模型的里程碑

    ? 事?件 ?12月10日,OpenAl正式上線?Sora,并向包括美國在內(nèi)的多數(shù)國家用戶開放,用戶可在OpenAI官網(wǎng)上體驗Sora。同時,Sora?被包含在ChatGPT?Plus
    的頭像 發(fā)表于 12-16 14:39 ?703次閱讀

    OpenAI推出AI視頻生成模型Sora

    近日,備受期待的OpenAI再次推出了其創(chuàng)新之作——AI視頻生成模型Sora。這一新品的發(fā)布,無疑為AI技術(shù)注入了新的活力。 據(jù)悉,Sora與OpenAI旗下的AI工具DALL-E有著異曲同工之妙
    的頭像 發(fā)表于 12-12 09:40 ?702次閱讀

    Sora之后,視頻生成模型的中國牌局

    大模型的牌局,國內(nèi)企業(yè)正在找到自己的節(jié)奏感
    的頭像 發(fā)表于 12-12 09:23 ?2845次閱讀
    <b class='flag-5'>Sora</b>之后,視頻生成模型的<b class='flag-5'>中國</b>牌局

    OpenAI開放Sora視頻生成模型

    OpenAI近日宣布,其傾力打造的人工智能視頻生成系統(tǒng)Sora已正式向美國及其他市場的ChatGPT Plus訂閱用戶開放。自去年首次公開預(yù)覽以來,Sora歷經(jīng)約10個月的精心研發(fā)與優(yōu)化,現(xiàn)已全面
    的頭像 發(fā)表于 12-10 11:16 ?726次閱讀

    Sora的功能優(yōu)勢及用戶評價

    在數(shù)字化時代,個人助理軟件已經(jīng)成為我們?nèi)粘I钪胁豢苫蛉钡囊徊糠帧?b class='flag-5'>Sora,作為一款新興的智能個人助理,以其獨特的功能優(yōu)勢和卓越的用戶體驗,迅速在市場上占據(jù)了一席之地。 一、Sora的功能優(yōu)勢
    的頭像 發(fā)表于 10-31 14:38 ?1232次閱讀

    偉創(chuàng)力受邀參加2024開放計算中國峰會

    日前,偉創(chuàng)力電源模塊受邀參加在北京香格里拉飯店舉行的開放計算中國峰會,本次大會以“開放協(xié)同:協(xié)作? 智慧 ? 創(chuàng)新”為主題,由全球兩大開放組織 OCP與OCTC 聯(lián)合主辦。
    的頭像 發(fā)表于 09-03 17:10 ?1119次閱讀

    對第四屆 RISC-V 中國峰會有何期待?

    2024 RISC-V 中國峰會將于 8 月 19 至 25 日舉辦,其中峰會主會場和展區(qū)將于 21-23 日在中國杭州黃龍飯店舉行,觀眾報名通道現(xiàn)已開放。大家有什么期待嗎?
    發(fā)表于 07-28 16:15

    2024 第四屆 RISC-V 中國峰會將于 8 月 19 日至 25 日在杭州舉辦

    21-23 日在中國杭州黃龍飯店舉行,觀眾報名通道現(xiàn)已開放。 RISC-V 中國峰會迄今已經(jīng)舉辦至第四屆,目前已經(jīng)成為全球三大 RISC-
    發(fā)表于 07-28 16:14