一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

OpenAI又打出王炸!一句話生成60秒視頻,馬斯克:人類認(rèn)輸吧

Hobby觀察 ? 來源:電子發(fā)燒友網(wǎng) ? 作者:梁浩斌 ? 2024-02-19 09:02 ? 次閱讀

電子發(fā)燒友網(wǎng)報道(文/梁浩斌)在大年初七,春節(jié)假期的尾聲,OpenAI突然發(fā)布的AI文字生成視頻模型Sora被全網(wǎng)刷屏,馬斯克甚至感嘆“gg Humans”(gg是good game的縮寫,在競技游戲中原意為稱贊對方打得不錯,但目前主流的含義是代表認(rèn)輸退出)。

文字生成視頻的AI模型其實之前也有不少,比如去年11月美國AI初創(chuàng)公司Pika Labs發(fā)布的Pika 1.0;去年Runway推出了文生視頻模型Gen-1,并完成了兩次迭代;還有谷歌團(tuán)隊發(fā)布的視頻生成模型VideoPoet。但問題在于,此前市面上的文生視頻模型只能生成數(shù)秒,最高十多秒的視頻。而Sora一上來就是60秒的視頻長度,且生成視頻的細(xì)節(jié)、質(zhì)量幾乎“秒殺”其他文生視頻模型,這足以顛覆目前的視頻生成模型初創(chuàng)公司的格局。

視頻生成質(zhì)量炸裂,好萊塢時代要結(jié)束了?

Sora生成的視頻效果有多強?下面是OpenAI在官網(wǎng)展示的第一個視頻,也是最能夠表現(xiàn)Sora實力的視頻。


這個視頻的提示詞為“一位時尚女士走在東京的街道上,街道上充滿了溫暖的霓虹燈和動畫城市標(biāo)志。她穿著黑色皮夾克、紅色長裙和黑色靴子,拿著一個黑色錢包。她戴著太陽鏡,涂著紅色口紅。她走路自信而隨意。街道潮濕且反光,形成了五顏六色燈光的鏡面效果。許多行人四處走動?!?br />
從視頻中,無論是運鏡還是人物、地面、背景的細(xì)節(jié),還有拉進(jìn)鏡頭后人物面部上的皺紋、毛發(fā)、墨鏡上的反光,都幾乎可以以假亂真,畫面穩(wěn)定不錯位。在長達(dá)60秒的視頻里,畫面隨鏡頭的大幅度運動并沒有出現(xiàn)錯位的情況,整體風(fēng)格保持了驚人的一致性。

在復(fù)雜場景方面,另一個演示視頻同樣展現(xiàn)了Sora的炸裂效果。下面這個視頻使用的提示詞為:“一段美麗的自制視頻展示了2056年尼日利亞拉各斯的人們。用手機(jī)相機(jī)拍攝。”

同樣是運鏡幅度巨大的場景,同時背景有大量的人物。在以往的文生圖模型中,類似這種背景有人群的圖片都會產(chǎn)生很多錯位,很容易看出AI的痕跡,而在Sora生成的這個視頻里,背景人群不仔細(xì)看很難發(fā)現(xiàn)有錯誤,特別是在動態(tài)的視頻當(dāng)中。另一方面在視頻后半段的人物近景里,大幅度運動的鏡頭同樣沒有對人物造成影響,畫面細(xì)節(jié)極為穩(wěn)定。

Sora生成視頻的穩(wěn)定,不止于單鏡頭的運動,即使是多鏡頭的畫面切換中,依然能夠保持色彩、畫面風(fēng)格的一致

除了真實場景之外,Sora還能以動畫風(fēng)格生成視頻。比如使用提示詞:“動畫場景特寫了一個跪在融化的紅燭旁的毛茸茸的小怪物。藝術(shù)風(fēng)格是3D和現(xiàn)實主義的,重點是照明和紋理。這幅畫的基調(diào)是驚奇和好奇,因為怪物睜大眼睛張著嘴凝視著火焰。它的姿勢和表情傳達(dá)出一種天真和頑皮的感覺,就好像它是第一次探索周圍的世界。暖色和戲劇性燈光的使用進(jìn)一步增強了圖像的舒適氛圍?!?br />

生成出的動畫形象與皮克斯電影幾乎不相上下,此前在動畫電影中大費周章渲染出的毛發(fā),如今AI直接一鍵生成!難怪會有網(wǎng)友表示“好萊塢的時代要結(jié)束了”。

有博主將Sora跟Pika、Runway、Stable Video等幾個模型進(jìn)行對比,對其輸入同樣的提示詞:“美麗、多雪的東京城熙熙攘攘。鏡頭穿過熙熙攘攘的城市街道,跟隨幾個享受美麗的下雪天氣和在附近攤位購物的人。絢麗的櫻花花瓣隨著雪花隨風(fēng)飛舞。”

結(jié)果Sora生成的視頻無論是時間長度、還是運鏡、畫面細(xì)節(jié),都完勝其他幾個模型生成出的視頻。比如Pika和Runway生成的視頻在短短幾秒時間里都只有固定鏡頭畫面,Stable Video有鏡頭移動的變化,但時長太短。

Sora還未完美,OpenAI揭秘背后技術(shù)

目前Sora還未對大眾開放,OpenAI表示Sora正在面向部分用戶開放,以評估關(guān)鍵領(lǐng)域的潛在危害或風(fēng)險。同時,OpenAI也邀請了一批視覺藝術(shù)家、設(shè)計師和電影制作人加入以推動模型的發(fā)展。

當(dāng)然,在驚艷的演示視頻外,Sora的視頻生成也并非完美。OpenAI也表示,目前的模型可能難以準(zhǔn)確模擬復(fù)雜場景的物理特性,也可能不理解因果關(guān)系的具體實例,比如一個人咬了一口餅干,餅干上可能沒有咬痕。Sora生成的視頻還可能混淆提示詞中關(guān)于空間的細(xì)節(jié)(比如左右),并且難以準(zhǔn)確描述隨時間發(fā)生的事件,比如跟隨特定的鏡頭軌跡等。


比如上面動圖中所使用的提示詞為“五只灰狼崽在一條偏僻的碎石路上嬉戲追逐,周圍都是草地。小狗們奔跑跳躍,相互追逐,相互撕咬,嬉戲玩?!?,但實際畫面中灰狼數(shù)量出錯,并且部分是憑空出現(xiàn)又憑空消失,出現(xiàn)身體互相重疊等現(xiàn)象。

對于Sora背后使用的技術(shù),OpenAI在官網(wǎng)上發(fā)布了一篇報告進(jìn)行了介紹,但只提到了方便大模型進(jìn)行訓(xùn)練的數(shù)據(jù)處理方式和對Sora局限性的評價,沒有太多技術(shù)細(xì)節(jié)。

根據(jù)介紹,Sora是一種diffusion模型,它從一個看起來像靜態(tài)噪聲的視頻開始生成視頻,并通過多個步驟去除噪聲來逐漸轉(zhuǎn)換視頻。與GPT相似,Sora算法層面也采用了transformer,以釋放出強大的擴(kuò)展性能。

OpenAI表示,Sora是以過于公司對DALL·E和GPT模型的研究作為基礎(chǔ),使用了DALL·E 3中的重新標(biāo)注技術(shù)。通過用一個能夠生成詳細(xì)描述的標(biāo)注模型,為訓(xùn)練集中的所有視頻生成詳細(xì)的文字說明,這能夠提高文字準(zhǔn)確性的同時,還能提升視頻的整體質(zhì)量。

與DALL·E 3類似,OpenAI也使用了GPT將簡短的用戶提示詞轉(zhuǎn)換為更詳細(xì)的文本,所以Sora能夠準(zhǔn)確理解用戶提示,并生成對應(yīng)視頻。

另外,OpenAI還透露了Sora的其他能力,包括接受圖像和文本說明輸出視頻、能夠以時間線向前或向后擴(kuò)展視頻、生成圖像、改變視頻風(fēng)格和環(huán)境、無縫連接兩個不同視頻等等。

業(yè)界大佬評價:“真的非常?!薄爸忻繟I差距進(jìn)一步拉大”

Sora的“刷屏”,引起了多位業(yè)內(nèi)大佬的關(guān)注。前阿里技術(shù)副總裁賈揚清也感嘆“Sora真的非常?!保⒄J(rèn)為對標(biāo)OpenAI的公司有一波被其他大廠因為害怕錯過AI而收購相關(guān)公司的機(jī)會。對于其他算法小廠,賈揚清建議“要不就算法上媲美OpenAI,要不就垂直領(lǐng)域深耕應(yīng)用,要不就開源”,最后他預(yù)言AI infra(AI基礎(chǔ)設(shè)施)的需求會繼續(xù)猛增。

360董事長周鴻祎則回應(yīng)了如何看待Sora的問題,他認(rèn)為科技競爭最終比拼的是讓人才密度和深厚積累,“很多人說 Sora的效果吊打Pika和Runway。這很正常,和創(chuàng)業(yè)者團(tuán)隊比,OpenAl 這種有核心技術(shù)的公司實力還是非常強勁的。有人認(rèn)為有了AI以后創(chuàng)業(yè)公司只需要做個體戶就行,實際今天再次證明這種想法是非??尚Φ摹!?br />
周鴻祎還表示,AI不一定那么快顛覆所有行業(yè),但它能激發(fā)更多人的創(chuàng)作力。關(guān)于國內(nèi)外的AI大模型差距,周鴻祎認(rèn)為國內(nèi)大模型發(fā)展距離GPT-4.0還有一年半的差距,并且相信OpenAl手里應(yīng)該還藏著一些秘密武器。“奧特曼是個營銷大師,知道怎樣掌握節(jié)奏,他們手里的武器并沒有全拿出來。這樣看來中國跟美國的AI差距可能還在加大?!?br />
關(guān)于大模型本身,周鴻祎對Sora理解為OpenAl利用它的大語言模型優(yōu)勢,把LLM和 Diffusion結(jié)合起來訓(xùn)練,讓Sora實現(xiàn)了對現(xiàn)實世界的理解和對世界的模擬兩層能力,這樣產(chǎn)生的視頻才是真實的,才能跳出2D的范圍模擬真實的物理世界。而得益于大量視頻的訓(xùn)練,周鴻祎認(rèn)為AI對世界的理解將遠(yuǎn)超文字學(xué)習(xí),可能未來一到兩年就能實現(xiàn)AGI(通用人工智能)。

而作為去年年底爆火的AI視頻生成初創(chuàng)公司Pika創(chuàng)始人,郭文景將Sora的發(fā)布視為動力,表示“我們覺得這是一個很振奮人心的消息,我們已經(jīng)在籌備直接沖,將直接對標(biāo) Sora?!?br />

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    33554

    瀏覽量

    274195
  • 算力
    +關(guān)注

    關(guān)注

    1

    文章

    1103

    瀏覽量

    15354
  • OpenAI
    +關(guān)注

    關(guān)注

    9

    文章

    1196

    瀏覽量

    8293
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    2941

    瀏覽量

    3683
收藏 人收藏

    評論

    相關(guān)推薦

    OpenAI董事會拒絕馬斯克974億美元收購要約

    據(jù)報道,ChatGPT的開發(fā)商——美國開放人工智能研究中心(OpenAI)的董事會已致決定,拒絕埃隆·馬斯克提出的以974億美元收購該公司資產(chǎn)的提議。 這決定是在
    的頭像 發(fā)表于 02-17 09:32 ?312次閱讀

    OpenAI拒絕馬斯克974億美元收購要約

    近日,據(jù)外媒報道,OpenAI首席執(zhí)行官山姆?阿爾特曼在則內(nèi)部消息中明確告知員工,公司董事會已對埃隆?馬斯克提出的收購要約表示了無興趣。 據(jù)悉,馬斯克曾提出以高達(dá)974億美元(當(dāng)前約
    的頭像 發(fā)表于 02-12 10:33 ?310次閱讀

    馬斯克欲974億收購OpenAI,奧爾特曼質(zhì)疑其動機(jī)

    據(jù)《華爾街日報》報道,埃隆·馬斯克(Elon Musk)正計劃以高達(dá)974億美元的價格收購人工智能巨頭OpenAI。此次收購由馬斯克領(lǐng)銜的投資者財團(tuán)發(fā)起,旨在將這家前沿科技公司納入其商業(yè)版
    的頭像 發(fā)表于 02-12 09:46 ?297次閱讀

    奧爾特曼:馬斯克競購OpenAI意在拖延發(fā)展

    在巴黎AI峰會上,OpenAI公司的首席執(zhí)行官奧爾特曼(Sam Altman)透露了個令人意外的觀點。他指出,特斯拉和SpaceX的創(chuàng)始人馬斯克正試圖通過主動競購OpenAI來拖延該
    的頭像 發(fā)表于 02-12 09:30 ?365次閱讀

    馬斯克牽頭974億美元收購OpenAI遭拒

    近日,據(jù)《華爾街日報》報道,特斯拉公司的首席執(zhí)行官埃隆·馬斯克攜手組投資者,向ChatGPT的研發(fā)企業(yè)OpenAI提出了高達(dá)974億美元的收購報價。這巨額報價的背后,是
    的頭像 發(fā)表于 02-11 13:50 ?308次閱讀

    馬斯克呼吁強制拍賣OpenAI股份,加劇與CEO斗爭

    近日,據(jù)媒體報道,埃隆·馬斯克名律師馬克·托伯洛夫(Marc Toberoff)正積極呼吁加利福尼亞州和特拉華州的總檢察長采取行動,迫使OpenAI拍賣其在該公司持有的大量股份。這
    的頭像 發(fā)表于 01-13 10:28 ?454次閱讀

    馬斯克預(yù)言:AI將全面超越人類智力

    近日,科技巨頭馬斯克作出了個關(guān)于人工智能(AI)的大膽預(yù)測。他斷言,AI的發(fā)展速度將超乎人類的想象,并將在不久的將來全面超越人類的智力。 馬斯克
    的頭像 發(fā)表于 12-28 14:23 ?566次閱讀

    馬斯克加碼起訴OpenAI 已向美國聯(lián)邦法院申請了初步禁令

    據(jù)外媒報道,馬斯克OpenAI的法律糾紛還在繼續(xù)升級;馬斯克加碼起訴OpenAI;目前xAI公司已經(jīng)向美國聯(lián)邦法院申請了初步禁令,要求法院阻止Op
    的頭像 發(fā)表于 12-02 14:40 ?655次閱讀

    馬斯克xAI將推獨立應(yīng)用,正面迎戰(zhàn)OpenAI

    近日,馬斯克的xAI公司即將推出款全新的聊天機(jī)器人應(yīng)用程序,其功能與OpenAI的ChatGPT頗為相似,最快有望在下個月正式面市。這舉措被視為xAI與
    的頭像 發(fā)表于 12-02 10:30 ?555次閱讀

    馬斯克欲阻OpenAI商業(yè)化轉(zhuǎn)型

    近日,據(jù)彭博社最新報道,特斯拉的首席執(zhí)行官埃隆·馬斯克正積極采取行動,試圖通過法律途徑來阻止OpenAI家非營利組織轉(zhuǎn)變?yōu)闋I利性公司。馬斯克聲稱,在
    的頭像 發(fā)表于 12-02 10:07 ?366次閱讀

    開關(guān)電源布線 一句話:要運行最穩(wěn)定、波形最漂亮、電磁兼容性最好

    開關(guān)電源在布線上最大的特點是拓?fù)湟鸬母哳l(高壓)強電流與控制級的弱電信號交織在起,首先要保證強電流的存在不干擾電源內(nèi)部的控制信號,其次要盡量減少對外部的干擾(EMC)。一句話:要運行最穩(wěn)定、波形
    的頭像 發(fā)表于 10-28 14:06 ?1699次閱讀
    開關(guān)電源布線 <b class='flag-5'>一句話</b>:要運行最穩(wěn)定、波形最漂亮、電磁兼容性最好

    馬斯克撤銷對OpenAI及奧特曼訴訟

    近日,特斯拉CEO埃隆·馬斯克在美國加州法院做出了項引人注目的決定——他撤回了對人工智能研究公司OpenAI及其兩位聯(lián)合創(chuàng)始人的訴訟。這撤訴舉動發(fā)生在原定于當(dāng)?shù)貢r間6月12日舉行的
    的頭像 發(fā)表于 06-12 15:58 ?601次閱讀

    今日看點:蘋果與OpenAI合作惹怒馬斯克 蘋果市值夜蒸發(fā)4213億元

    小編給大家分享下科技金融的今日看點: 蘋果與OpenAI合作惹怒馬斯克 蘋果公司的WWDC全球開發(fā)者大會上大家都在關(guān)注蘋果的AI,?蘋果宣布與OpenAI構(gòu)建合作伙伴關(guān)系,整合
    的頭像 發(fā)表于 06-11 11:15 ?872次閱讀

    一句話讓你理解線程和進(jìn)程

    今天給大家分享下線程與進(jìn)程,主要包含以下幾部分內(nèi)容:一句話說明線程和進(jìn)程操作系統(tǒng)為什么需要進(jìn)程為什么要引入線程圖說明線程和進(jìn)程的關(guān)系一句話讓你理解進(jìn)程和線程進(jìn)程:是指?個內(nèi)存中運?
    的頭像 發(fā)表于 06-04 08:04 ?1447次閱讀
    <b class='flag-5'>一句話</b>讓你理解線程和進(jìn)程

    馬斯克也給英偉達(dá)打工了

    馬斯克融來的60億美元巨資,讓xAI彎道超車,估值躍成為全球第二大AI獨角獸。但馬斯克在AI行業(yè)內(nèi)積累的人望,以及此刻大模型創(chuàng)業(yè)之激烈,他的入局遠(yuǎn)遠(yuǎn)談不上眾望所歸。而xAI由此被拉起
    的頭像 發(fā)表于 06-03 08:04 ?196次閱讀
    <b class='flag-5'>馬斯克</b>也給英偉達(dá)打工了