一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Sora陰影之下,焦慮的中國AI

科技云報(bào)到 ? 來源:jf_60444065 ? 作者:jf_60444065 ? 2024-02-28 13:43 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

科技云報(bào)道原創(chuàng)。

“跟不上的可能就要被淘汰了?!笨吹絊ora演示視頻后,從業(yè)10多年的動(dòng)畫制作師黃斌得出了這樣的判斷。

隨著影視業(yè)***呼聲漸起,Sora的誕生也給中國AI行業(yè)帶來了巨大的焦慮。

360集團(tuán)創(chuàng)始人周鴻祎認(rèn)為,Sora模型展現(xiàn)出了超越當(dāng)前中國同類產(chǎn)品的性能和技術(shù)水平,這不僅體現(xiàn)在Sora可能實(shí)現(xiàn)通用人工智能(AGI)的時(shí)間表上,還體現(xiàn)在其實(shí)際應(yīng)用效果和創(chuàng)新能力上。

更有甚者,網(wǎng)上流傳著“Sora的誕生是牛頓時(shí)刻”的說法,認(rèn)為Sora代表了新一輪產(chǎn)業(yè)革命的興起。

事實(shí)上,國內(nèi)在經(jīng)過“百模大戰(zhàn)”之后,才剛剛在文本模型上取得顯著成果,達(dá)到或超過GPT-3.5的水平,并正朝著GPT-4的方向努力追趕。

但Sora的誕生,展示了OpenAI在多模態(tài)模型而非單一文本領(lǐng)域的突破性進(jìn)展,讓國內(nèi)AI廠商追上甚至超越OpenAI,幾乎成了不可能完成的任務(wù)。

由此不少網(wǎng)友對中國AI發(fā)出質(zhì)問:

為什么Sora沒有誕生在中國?中國跟美國的AI差距越來越大,Sora這波國內(nèi)慢了十年吧?永遠(yuǎn)都是在追趕路上,為啥沒有原創(chuàng)?

在一句句靈魂版的拷問中,中國AI廠商集體陷入了沉默。

那么,在Sora這樣的多模態(tài)大模型上,中美到底有多大差距?追趕的難點(diǎn)在哪兒?在種種限制之下,中國是否有自己的優(yōu)勢?

中美AI差距幾何?

盡管OpenAI承認(rèn)Sora仍處于開發(fā)的早期階段,需要進(jìn)一步完善,但業(yè)界已形成一個(gè)共識——Sora的推出標(biāo)志著生成人工智能領(lǐng)域的一個(gè)重要里程碑。

這是因?yàn)镾ora不僅僅是一個(gè)文生視頻的工具,更是AGI的一個(gè)關(guān)鍵節(jié)點(diǎn),它驗(yàn)證了一條通向AGI的可行技術(shù)路線。

和之前的GPT-3一樣,Sora再次驗(yàn)證了Scaling Law可以在這個(gè)技術(shù)方向上繼續(xù)發(fā)揮作用實(shí)現(xiàn)涌現(xiàn)。

而這背后,不僅是驚人的資本和算力支持的結(jié)果,更是通過無數(shù)工程實(shí)驗(yàn)試錯(cuò)和強(qiáng)大技術(shù)力量支持的結(jié)果。

不少人推斷,OpenAI手里應(yīng)該已經(jīng)有一個(gè)基本完整的多模態(tài)GPT-5,可以根據(jù)需要隨時(shí)釋放其中的某一部分打擊對手,或者引導(dǎo)輿論。

360集團(tuán)創(chuàng)始人周鴻祎更是直接斷言,Sora的出現(xiàn),意味著AGI(人工通用智能)的實(shí)現(xiàn)將從10年縮短到1年。

事實(shí)上,在Sora面前,無論是現(xiàn)有的頂級AI模型如Pika、Runway等,還是在多模態(tài)AI上有投入的國內(nèi)廠商,基本上都被“吊打”了。

這也側(cè)面反映出中美在AI技術(shù)研發(fā)深度和資源投入上的差距。

首先,門檻來自算力。

雖然有學(xué)者認(rèn)為Sora只是一個(gè)大約30億參數(shù)的模型,訓(xùn)練成本并沒有想象的高,但視頻數(shù)據(jù)本身的處理、標(biāo)注等成本,加上長視頻在推理階段注定的巨大token數(shù)量和算力消耗,顯然對任何公司都是難以承受的挑戰(zhàn)。

即便Sora真的只有30億參數(shù),視頻分析對算力的消耗應(yīng)該也是遠(yuǎn)遠(yuǎn)超過一個(gè)千億模型的。在國內(nèi)GPU被卡脖子之后,算力是一個(gè)巨大的挑戰(zhàn)。

其次,是高質(zhì)量的數(shù)據(jù)。

根據(jù)OpenAI發(fā)布的技術(shù)報(bào)告,Sora強(qiáng)大能力歸功于兩點(diǎn):其一是使用了基于Transformer的擴(kuò)散模型(Diffusion Model);其二是將不同類型視覺數(shù)據(jù)轉(zhuǎn)化為統(tǒng)一格式——像素塊(patch),從而能利用數(shù)量龐大、質(zhì)量過硬且算力性價(jià)比高的數(shù)據(jù)。

業(yè)內(nèi)人士認(rèn)為,數(shù)據(jù)質(zhì)量和數(shù)量上的顯著優(yōu)勢,很可能是Sora成功的最關(guān)鍵因素之一。

在算力方面,雖然OpenAI訓(xùn)練Sora模型使用的GPU卡數(shù)量并非無法企及,但其他公司在具備足夠硬件資源的情況下,仍然難以復(fù)制OpenAI的成功,主要瓶頸還是在于如何獲取和處理大規(guī)模高質(zhì)量的視頻數(shù)據(jù)。

2022年,OpenAI曾宣布以創(chuàng)新方法來訓(xùn)練AI模型,省去標(biāo)注大量資料的訓(xùn)練過程。

據(jù)報(bào)道,OpenAI所公布的視頻預(yù)訓(xùn)練模型(VPT),讓AI學(xué)會(huì)了在《我的世界》里從頭開始造石鎬。

研究人員首先收集一波數(shù)據(jù)標(biāo)注外包們玩游戲的數(shù)據(jù),其中包含視頻和鍵鼠操作的記錄。

然后,利用這些數(shù)據(jù)制作逆動(dòng)力學(xué)模型(IDM),從而推測出視頻里每一步在進(jìn)行的時(shí)候,鍵鼠都是怎么動(dòng)的。這樣只需比原來少很多的數(shù)據(jù)就可以實(shí)現(xiàn)目的。

這項(xiàng)研究發(fā)表于2022年6月,同時(shí)文中還注明這個(gè)工作已經(jīng)進(jìn)行了一年之久,也就是說,OpenAI至少從2021年起就開始進(jìn)行這項(xiàng)研究。

Logenic AI聯(lián)合創(chuàng)始人李博杰認(rèn)為,OpenAI的先發(fā)優(yōu)勢決定了早期的數(shù)據(jù)壁壘,對于后進(jìn)入市場的公司來說,增加了追趕的難度。

“即使是谷歌這樣全球數(shù)據(jù)量最大的公司,在訓(xùn)練大模型時(shí),訓(xùn)練數(shù)據(jù)也未必能比OpenAI更好”,李博杰表示。

相比之下,國內(nèi)公司在數(shù)據(jù)上的積累和利用上也存在一定差距:一方面,由于政策變化和其他限制,后來者可能無法獲取之前可用的一些關(guān)鍵數(shù)據(jù);另一方面,隨著AI生成內(nèi)容越來越多地充斥互聯(lián)網(wǎng),原始的真實(shí)世界數(shù)據(jù)被“污染”,使得獲取高質(zhì)量、無偏見的訓(xùn)練數(shù)據(jù)更加困難。

最后,是創(chuàng)新的訓(xùn)練方法。

Sora實(shí)現(xiàn)了將Transformer和擴(kuò)散模型結(jié)合的創(chuàng)新,首先將不同類型的視覺數(shù)據(jù)轉(zhuǎn)換成統(tǒng)一的視覺數(shù)據(jù)表示(視覺patch),然后將原始視頻壓縮到一個(gè)低維潛在空間,并將視覺表示分解成時(shí)空patch(相當(dāng)于Transformer token),讓Sora在這個(gè)潛在空間里進(jìn)行訓(xùn)練并生成視頻。

接著做加噪去噪,輸入噪聲patch后,Sora通過預(yù)測原始“干凈”patch來生成視頻。

OpenAI發(fā)現(xiàn),訓(xùn)練計(jì)算量越大,樣本質(zhì)量就會(huì)越高,特別是經(jīng)過大規(guī)模訓(xùn)練后,Sora展現(xiàn)出模擬現(xiàn)實(shí)世界某些屬性的“涌現(xiàn)”能力。

總的來說,Sora是好的架構(gòu)+好的數(shù)據(jù),然后把模型做大,達(dá)到量變到質(zhì)變。

盡管Sora在方案設(shè)計(jì)上大部分是已有的技術(shù),但能夠做出驚艷效果的也只有Sora,這也說明在訓(xùn)練過程中有很多訓(xùn)練技巧的問題要解決。

中國AI廠商能否 追趕OpenAI?

Sora的技術(shù)突破讓AI焦慮在國內(nèi)蔓延開來,但中國AI并非完全無招架之力。在Sora出現(xiàn)并占據(jù)大眾視野之前,國內(nèi)也曾有多家上市公司在多模態(tài)AI方面展開過布局。

2023年12月18日,東方證券在一份研報(bào)中提及,國內(nèi)的??低?/u>、大華股份、螢石網(wǎng)絡(luò)等視頻分析行業(yè)領(lǐng)先廠商,紛紛投入到多模態(tài)大模型研究和行業(yè)應(yīng)用落地進(jìn)程。

與此同時(shí),百度、阿里、騰訊、華為、字節(jié)跳動(dòng)等大廠也都布局了多模態(tài)基礎(chǔ)大模型。

據(jù)不完全統(tǒng)計(jì),2023年12月至今三個(gè)月內(nèi),已有包括萬興科技、博匯科技、易點(diǎn)天下、數(shù)碼視訊、漢王科技、當(dāng)虹科技、東方國信等在內(nèi)的十余家A股公司,在投資者互動(dòng)平臺披露過視頻生成模型領(lǐng)域的業(yè)務(wù)情況。

盡管目前國內(nèi)廠商呈現(xiàn)的“文生視頻”效果遠(yuǎn)不如Sora,但Sora所用到的基礎(chǔ)模型LLM、文生圖模型DALL·E 3、大規(guī)模視頻數(shù)據(jù)集、AI算力體系、大模型開發(fā)工具棧等核心基礎(chǔ)設(shè)施,中國都已經(jīng)具備。

比如原創(chuàng)的基礎(chǔ)大語言模型文心一言、訊飛星火、BAICHUAN等,以及文生圖模型文心一格、騰訊混元等,加上過去一年大模型基礎(chǔ)設(shè)施的突飛猛進(jìn),有能力和條件支持中國AI修成正果,在視頻生成賽道再現(xiàn)類似ChatGPT式的成功。

騰訊研究院資深專家王鵬認(rèn)為,Sora的發(fā)布進(jìn)一步明確了DiT(=VAE編碼器+ViT+DDPM+VAE解碼器)是多模態(tài)AI的可行方向,中國AI大廠仍然有可能以現(xiàn)有資源在一年左右接近Sora目前的水平。

中國AI的機(jī)會(huì)

事實(shí)上,不僅是技術(shù)代際差異并沒有想象中的那么大,視頻生成模型走向行業(yè)的長跑才剛剛開始。大模型的價(jià)值需要商業(yè)化來證明,Sora也不例外。

首先,相比“人人皆可上手”的大語言模型,視頻生成模型的應(yīng)用門檻更高,受眾群體更小。目前OpenAI僅開放給創(chuàng)作者使用,而非像ChatGPT那樣開放給大眾。

不難看到,視頻生成模型從研發(fā)到落地,整個(gè)過程會(huì)更加緩慢,應(yīng)用潛力與商業(yè)出口還有待探索。

其次,Sora雖然強(qiáng)大,但成本確實(shí)是一個(gè)現(xiàn)實(shí)問題。

有人估算,Sora生成一條視頻的成本在幾美元到幾十美元不等,如果普及到大眾使用,成本需要降到目前的1%才能接受。

降低成本的同時(shí)提高生成質(zhì)量和邏輯連貫性,是亟待解決的關(guān)鍵挑戰(zhàn)。

同時(shí),考慮到無法解決“幻覺”的問題,要想生成真正可控可用的視頻,短期內(nèi)成本高昂。

這些局限性,都為中國AI產(chǎn)學(xué)各界留下了較長的追趕窗口期。

目前,Sora能夠激活多大的商業(yè)價(jià)值尚不明確,但是利用大模型找應(yīng)用場景卻是中國市場的優(yōu)勢所在。

中國擁有豐富的行業(yè)和場景,如果中國AI廠商能為垂直的行業(yè)用戶解決具體的場景問題,打磨好工具,做好視頻生成模型的提示詞工程,以便非專業(yè)背景的廣大行業(yè)用戶們上手使用,那么在特定領(lǐng)域超過GPT-4甚至是GPT-5的可能性是非常大的。

不僅如此,中國AI廠商也可以在Sora等大模型的基礎(chǔ)上,做進(jìn)一步的應(yīng)用創(chuàng)新,例如在Sora之上能夠提供更復(fù)雜的視頻剪輯能力、革新醫(yī)療教學(xué)與模擬訓(xùn)練等,從而率先探索出商業(yè)化之路。

結(jié)語

Sora作為人工智能視頻生成技術(shù)的重大突破,顯示了中美之間存在顯著的技術(shù)差距。這對于中國科技界而言,既是警醒也是鞭策。在承認(rèn)現(xiàn)實(shí)差距的同時(shí),中國AI也不必妄自菲薄,審視自我、調(diào)整戰(zhàn)略、奮起直追,抓住機(jī)會(huì)窗口,才是彎道超車的必由之路。

【關(guān)于科技云報(bào)道】

專注于原創(chuàng)的企業(yè)級內(nèi)容行家——科技云報(bào)道。成立于2015年,是前沿企業(yè)級IT領(lǐng)域Top10媒體。獲工信部權(quán)威認(rèn)可,可信云、全球云計(jì)算大會(huì)官方指定傳播媒體之一。深入原創(chuàng)報(bào)道云計(jì)算、大數(shù)據(jù)、人工智能、區(qū)塊鏈等領(lǐng)域。

審核編輯 黃宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    88

    文章

    35109

    瀏覽量

    279608
  • 人工智能
    +關(guān)注

    關(guān)注

    1806

    文章

    49011

    瀏覽量

    249364
  • Sora
    +關(guān)注

    關(guān)注

    0

    文章

    83

    瀏覽量

    483
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    生成式人工智能認(rèn)證:重塑AI職業(yè)生態(tài)的底層邏輯

    在人工智能技術(shù)滲透至社會(huì)毛細(xì)血管的今天,生成式人工智能(Generative AI)的崛起正在改寫人類與技術(shù)的協(xié)作范式。從ChatGPT引爆的全球熱潮,到Sora模型推動(dòng)的文生視頻革命,這項(xiàng)技術(shù)不僅
    的頭像 發(fā)表于 05-23 09:17 ?191次閱讀

    在官網(wǎng)上下載的在linux之下使用的canmvide如何安裝?

    在官網(wǎng)上下載的在linux之下使用的canmvide如何安裝,有沒有安裝手冊呢? 期待結(jié)果和實(shí)際結(jié)果
    發(fā)表于 04-29 06:24

    美洽榮登2024中國生成式AI 創(chuàng)新企業(yè)系列榜單-智能客服創(chuàng)新企業(yè)榜

    創(chuàng)新企業(yè)系列榜單” 從ChatGPT的火爆到Sora的發(fā)布,大模型正以驚人的速度迭代升級,這股浪潮不僅刷新了技術(shù)邊界,更顛覆了各行各業(yè)的傳統(tǒng)認(rèn)知。 在中國,越來越多的企業(yè)正在融合AI優(yōu)化業(yè)務(wù)流程、提升決策效率、創(chuàng)新服務(wù)模式,積
    的頭像 發(fā)表于 12-31 15:12 ?561次閱讀
    美洽榮登2024<b class='flag-5'>中國</b>生成式<b class='flag-5'>AI</b> 創(chuàng)新企業(yè)系列榜單-智能客服創(chuàng)新企業(yè)榜

    OpenAI攻克Sora視頻創(chuàng)建錯(cuò)誤率高難題

    在人工智能與多媒體技術(shù)的交叉領(lǐng)域,OpenAI近期宣布了一項(xiàng)重要進(jìn)展:成功解決了Sora視頻創(chuàng)建過程中錯(cuò)誤率高的問題。這一突破不僅標(biāo)志著OpenAI在視頻處理技術(shù)上取得了顯著進(jìn)步,也為廣大用戶帶來
    的頭像 發(fā)表于 12-31 10:37 ?535次閱讀

    OpenAI暫不推出Sora視頻生成模型API

    OpenAI近日宣布,目前暫無推出其視頻生成模型Sora的應(yīng)用程序接口(API)的計(jì)劃。Sora模型能夠基于文本和圖像生成視頻,引發(fā)了廣泛關(guān)注。然而,由于訪問量遠(yuǎn)超預(yù)期,OpenAI此前不得不緊急
    的頭像 發(fā)表于 12-20 14:23 ?526次閱讀

    成都匯陽投資關(guān)于Sora 正式上線,多模態(tài)模型的里程碑

    ? 事?件 ?12月10日,OpenAl正式上線?Sora,并向包括美國在內(nèi)的多數(shù)國家用戶開放,用戶可在OpenAI官網(wǎng)上體驗(yàn)Sora。同時(shí),Sora?被包含在ChatGPT?Plus
    的頭像 發(fā)表于 12-16 14:39 ?711次閱讀

    OpenAI推出AI視頻生成模型Sora

    近日,備受期待的OpenAI再次推出了其創(chuàng)新之作——AI視頻生成模型Sora。這一新品的發(fā)布,無疑為AI技術(shù)注入了新的活力。 據(jù)悉,Sora與OpenAI旗下的
    的頭像 發(fā)表于 12-12 09:40 ?708次閱讀

    OpenAI開放Sora視頻生成模型

    OpenAI近日宣布,其傾力打造的人工智能視頻生成系統(tǒng)Sora已正式向美國及其他市場的ChatGPT Plus訂閱用戶開放。自去年首次公開預(yù)覽以來,Sora歷經(jīng)約10個(gè)月的精心研發(fā)與優(yōu)化,現(xiàn)已全面
    的頭像 發(fā)表于 12-10 11:16 ?737次閱讀

    激光可以投下陰影?

    研究人員發(fā)現(xiàn),激光束可以像不透明物體一樣投射出影子。這一發(fā)現(xiàn)挑戰(zhàn)了人們對陰影的傳統(tǒng)理解,為利用一束激光控制另一束激光的技術(shù)提供了新的可能性。
    的頭像 發(fā)表于 12-02 09:34 ?453次閱讀
    激光可以投下<b class='flag-5'>陰影</b>?

    激光束能投射陰影,科學(xué)家顛覆傳統(tǒng)認(rèn)知

    ??? 光及其與物質(zhì)的各種相互作用的研究,幾個(gè)世紀(jì)以來一直是科學(xué)探究的基石。從早期對反射和折射現(xiàn)象的觀察,到更復(fù)雜的衍射和偏振現(xiàn)象,我們對光的理解不斷演變。?? 理解光與陰影???? 陰影傳統(tǒng)上被
    的頭像 發(fā)表于 11-28 09:09 ?630次閱讀

    Sora的功能優(yōu)勢及用戶評價(jià)

    在數(shù)字化時(shí)代,個(gè)人助理軟件已經(jīng)成為我們?nèi)粘I钪胁豢苫蛉钡囊徊糠帧?b class='flag-5'>Sora,作為一款新興的智能個(gè)人助理,以其獨(dú)特的功能優(yōu)勢和卓越的用戶體驗(yàn),迅速在市場上占據(jù)了一席之地。 一、Sora的功能優(yōu)勢
    的頭像 發(fā)表于 10-31 14:38 ?1246次閱讀

    即夢AI上線,字節(jié)跳動(dòng)挑戰(zhàn)SoraAI創(chuàng)作平臺

    字節(jié)跳動(dòng)近期動(dòng)作頻頻,其剪映團(tuán)隊(duì)精心研發(fā)的“即夢AI”移動(dòng)版已正式登陸蘋果App Store,標(biāo)志著字節(jié)在AI創(chuàng)作領(lǐng)域的又一重要布局。即夢AI專為追求創(chuàng)意的愛好者量身打造,集AI圖片創(chuàng)
    的頭像 發(fā)表于 08-07 16:47 ?974次閱讀

    RISC-V在中國的發(fā)展機(jī)遇有哪些場景?

    聯(lián)網(wǎng)市場的重要參與者,擁有龐大的用戶基數(shù)和豐富的應(yīng)用場景。RISC-V在中國的發(fā)展將受益于這一市場需求的增長。 2. 人工智能(AIAI算力需求:隨著人工智能技術(shù)的廣泛應(yīng)用,對算力的需求不斷增加
    發(fā)表于 07-29 17:14

    中國AI長卷(二):框架立基

    AI框架可以看到,更強(qiáng)的產(chǎn)業(yè)化能力,就是中國AI的底色
    的頭像 發(fā)表于 07-24 12:27 ?3006次閱讀
    <b class='flag-5'>中國</b><b class='flag-5'>AI</b>長卷(二):框架立基

    基于COOT算法的局部陰影下光伏陣列MPPT控制研究

    針對光伏陣列在局部陰影下會(huì)產(chǎn)生多個(gè)功率峰值,可能出現(xiàn)跟蹤到錯(cuò)誤的功率峰值的情況,將白冠雞優(yōu)化算法(COOT)應(yīng)用于局部陰影MPPT控制,通過動(dòng)態(tài)調(diào)整太陽能電池板輸出電壓和電流,使得太陽能電池
    的頭像 發(fā)表于 07-23 11:28 ?258次閱讀
    基于COOT算法的局部<b class='flag-5'>陰影</b>下光伏陣列MPPT控制研究