ABSTRACT摘要
2 月 16 日凌晨,也就是中國大年初七,OpenAI 在 AI 生成視頻領域扔出一枚“王炸”,宣布推出全新的生成式人工智能模型“Sora”。
這家舊金山公司周四推出的該工具使用生成人工智能,根據(jù)書面命令立即創(chuàng)建短視頻。
JAEALOT
2024年2月16日
2 月 16 日凌晨,也就是中國大年初七,OpenAI 在 AI 生成視頻領域扔出一枚“王炸”,宣布推出全新的生成式人工智能模型“Sora”。
這家舊金山公司周四推出的該工具使用生成人工智能,根據(jù)書面命令立即創(chuàng)建短視頻。
Sora 并不是第一個展示這種技術的產(chǎn)品。但行業(yè)分析師指出,該工具迄今為止展示的視頻質(zhì)量很高,并指出它的推出標志著 OpenAI 和文本到視頻生成的未來的整體重大飛躍。
盡管如此,與當今快速發(fā)展的人工智能領域的所有事物一樣,此類技術也引發(fā)了人們對潛在道德和社會影響的擔憂。
Sora 是一款文本到視頻生成器 - 使用生成式 AI 根據(jù)書面提示創(chuàng)建長達 60 秒的視頻。該模型還可以從現(xiàn)有的靜態(tài)圖像生成視頻。
生成式人工智能是人工智能的一個分支,可以創(chuàng)造新的東西。示例包括聊天機器人(如 OpenAI 的 ChatGPT)以及圖像生成器(如 DALL-E 和 Midjourney)。讓人工智能系統(tǒng)生成視頻是更新且更具挑戰(zhàn)性的,但依賴于一些相同的技術。
OpenAI 在周四(2 月 15 日)的博客文章中表示, Sora可以根據(jù)用戶的文本提示創(chuàng)建長達一分鐘的視頻。
OpenAI 在帖子中表示:“我們正在教人工智能理解和模擬運動中的物理世界,目的是訓練模型來幫助人們解決需要現(xiàn)實世界交互的問題?!?/p>
OpenAI 在帖子中補充道:“Sora 能夠生成具有多個角色、特定類型的運動以及主題和背景的準確細節(jié)的復雜場景?!?“該模型不僅了解用戶在提示中提出的要求,還了解這些東西在物理世界中的存在方式。”
此外,根據(jù)該帖子,生成式人工智能模型可以基于單個圖像創(chuàng)建視頻,以及擴展現(xiàn)有視頻或填充缺失的幀。
Sora 尚未可供公眾使用(OpenAI 表示,在正式發(fā)布該工具之前,它正在與政策制定者和藝術家進行接觸),而且還有很多我們不知道的事情。但自周四宣布以來,該公司已經(jīng)分享了一些 Sora 生成的視頻示例,以展示其功能。
OpenAI 首席執(zhí)行官 Sam Altman 還利用 X(以前稱為Twitter 的平臺)要求社交媒體用戶及時發(fā)送想法。后來,他分享了逼真詳細的視頻,這些視頻響應了“兩只金毛獵犬在山頂上播客”和“在海洋上與不同動物進行自行車比賽,運動員在無人機攝像機視圖下騎自行車”等提示。
雖然 Sora 生成的視頻可以描繪復雜、極其詳細的場景,但 OpenAI 指出仍然存在一些弱點,包括一些空間和因果元素。例如,OpenAI 在其網(wǎng)站上補充道,“一個人可能會咬一口餅干,但之后,餅干可能沒有咬痕?!?/p>
OpenAI 的 Sora 并不是同類產(chǎn)品中的第一個。谷歌、Meta 和初創(chuàng)公司 Runway ML 等公司都展示了類似的技術。
-
機器人
+關注
關注
213文章
29735瀏覽量
212854 -
AI
+關注
關注
88文章
35136瀏覽量
279728 -
人工智能
+關注
關注
1806文章
49014瀏覽量
249411
發(fā)布評論請先 登錄
4K、多模態(tài)、長視頻:AI視頻生成的下一個戰(zhàn)場,誰在領跑?
《AI Agent 應用與項目實戰(zhàn)》----- 學習如何開發(fā)視頻應用
DeepSeek扔的第二枚開源王炸是什么

評論