一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

谷歌發(fā)布基礎(chǔ)世界模型Genie,世界模型領(lǐng)域競爭升溫

CHANBAEK ? 來源:網(wǎng)絡(luò)整理 ? 2024-02-28 18:20 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

繼OpenAI和Meta之后,谷歌也在世界模型領(lǐng)域公布了其最新進展。 近日,谷歌發(fā)布了一種新的AI模型Genie,據(jù)谷歌官網(wǎng)介紹,Genie是一個基于互聯(lián)網(wǎng)視頻訓(xùn)練的基礎(chǔ)世界模型,能夠從合成圖像、照片、草圖等多種來源生成多種動作可控的環(huán)境。

隨著谷歌的加入,世界模型領(lǐng)域的競爭愈發(fā)激烈,但目前尚難以確定誰能引領(lǐng)這一領(lǐng)域的發(fā)展風向。此前,Sora作為一款世界模型已引發(fā)爭議。反對者認為其視頻生成方式與世界模型的因果預(yù)測存在很大不同。從Sora發(fā)布的視頻來看,雖然保真度較高,但模擬物理規(guī)律似乎是其弱點,且目前難以看出其交互能力。

相比之下,谷歌的Genie在交互性方面下了不少功夫。它能夠推斷出生成環(huán)境中的潛在動作,為用戶提供一個可玩的、交互式的虛擬環(huán)境。然而,在視頻真實性和清晰度的層面,Genie尚未展現(xiàn)出與Sora相當?shù)乃健?/p>

總的來說,谷歌的Genie和Sora各自具有不同的優(yōu)勢和挑戰(zhàn)。世界模型領(lǐng)域正迎來一場激烈的競爭,未來的發(fā)展方向?qū)⑷Q于各大公司在技術(shù)創(chuàng)新和市場應(yīng)用上的表現(xiàn)。我們期待看到這一領(lǐng)域能夠涌現(xiàn)出更多創(chuàng)新成果,推動人工智能技術(shù)的不斷發(fā)展和進步。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 谷歌
    +關(guān)注

    關(guān)注

    27

    文章

    6231

    瀏覽量

    108153
  • 模型
    +關(guān)注

    關(guān)注

    1

    文章

    3521

    瀏覽量

    50430
  • OpenAI
    +關(guān)注

    關(guān)注

    9

    文章

    1210

    瀏覽量

    8924
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    聲學(xué)世界模型將如何改變我們的生活

    近日,聲智科技發(fā)表標題為“A Survey on World Models Grounded in Acoustic Physical Information”的聲學(xué)世界模型綜述文章,調(diào)研了全球研究
    的頭像 發(fā)表于 06-27 11:36 ?347次閱讀

    自動駕駛中常提的世界模型是個啥?

    [首發(fā)于智駕最前沿微信公眾號]隨著自動駕駛技術(shù)的不斷成熟,車輛需要在復(fù)雜多變的道路環(huán)境中安全地行駛,這就要求系統(tǒng)不僅能“看見”周圍的世界,還要能“理解”和“推測”未來的變化。世界模型可以被看作一種
    的頭像 發(fā)表于 06-24 08:53 ?170次閱讀
    自動駕駛中常提的<b class='flag-5'>世界</b><b class='flag-5'>模型</b>是個啥?

    世界模型:多模態(tài)融合+因果推理,解鎖AI認知邊界

    電子發(fā)燒友網(wǎng)綜合報道 在人工智能的蓬勃發(fā)展進程中,世界模型正嶄露頭角,成為推動其邁向更高智能水平的關(guān)鍵力量。世界模型作為 AI 系統(tǒng)對外部世界
    的頭像 發(fā)表于 06-23 04:49 ?2427次閱讀

    模型領(lǐng)域常用名詞解釋(近100個)

    本文總結(jié)了大模型領(lǐng)域常用的近100個名詞解釋,并按照模型架構(gòu)與基礎(chǔ)概念,訓(xùn)練方法與技術(shù),模型優(yōu)化與壓縮,推理與應(yīng)用,計算與性能優(yōu)化,數(shù)據(jù)與標簽,模型評估與調(diào)試,特征與數(shù)據(jù)處理,倫理與公
    的頭像 發(fā)表于 02-19 11:49 ?790次閱讀
    大<b class='flag-5'>模型領(lǐng)域</b>常用名詞解釋(近100個)

    NVIDIA Cosmos世界基礎(chǔ)模型平臺的主要功能

    隨著機器人技術(shù)和自動駕駛汽車的發(fā)展,加快物理 AI 的開發(fā)工作變得至關(guān)重要。物理 AI 使自主機器能夠感知、理解并執(zhí)行物理世界中的復(fù)雜操作,而這些系統(tǒng)的核心是世界基礎(chǔ)模型(WFM)。這種 AI
    的頭像 發(fā)表于 01-15 11:03 ?979次閱讀
    NVIDIA Cosmos<b class='flag-5'>世界</b>基礎(chǔ)<b class='flag-5'>模型</b>平臺的主要功能

    英偉達推出基石世界模型Cosmos,解決智駕與機器人具身智能訓(xùn)練數(shù)據(jù)問題

    CES 2025展會上,英偉達推出了基石世界模型Cosmos,World Foundation Model基石世界模型,簡稱WFM。 物理 AI
    的頭像 發(fā)表于 01-14 11:04 ?1285次閱讀
    英偉達推出基石<b class='flag-5'>世界</b><b class='flag-5'>模型</b>Cosmos,解決智駕與機器人具身智能訓(xùn)練數(shù)據(jù)問題

    華為、理想、特斯拉、商湯的世界模型是做什么用的

    最近世界模型(World Model)很火,甚至有人說世界模型是終極自動駕駛解決方案,實際上它只是端到端大模型的一種,和VLM沒有本質(zhì)區(qū)別。
    的頭像 發(fā)表于 01-14 09:27 ?1008次閱讀
    華為、理想、特斯拉、商湯的<b class='flag-5'>世界</b><b class='flag-5'>模型</b>是做什么用的

    英偉達發(fā)布Cosmos世界基礎(chǔ)模型

    近日,在2025年1月6日于拉斯維加斯拉開帷幕的國際消費類電子產(chǎn)品展覽會(CES)上,英偉達宣布了一項重大創(chuàng)新——Cosmos世界基礎(chǔ)模型平臺。該平臺集成了先進的生成世界基礎(chǔ)模型,旨在
    的頭像 發(fā)表于 01-09 10:23 ?713次閱讀

    NVIDIA Cosmos世界基礎(chǔ)模型平臺發(fā)布

    NVIDIA 宣布推出NVIDIA Cosmos,該平臺由先進的生成式世界基礎(chǔ)模型、高級 tokenizer、護欄和加速視頻處理管線組成,將推動自動駕駛汽車(AV)和機器人等物理 AI 系統(tǒng)的發(fā)展。
    的頭像 發(fā)表于 01-08 10:39 ?569次閱讀

    【「大模型啟示錄」閱讀體驗】營銷領(lǐng)域模型的應(yīng)用

    今天跟隨「大模型啟示錄」這本書,學(xué)習(xí)在營銷領(lǐng)域應(yīng)用大模型。 大模型通過分析大量的消費者數(shù)據(jù),包括購買歷史、瀏覽記錄、社交媒體互動等,能夠識別消費者的偏好和行為模式。這種分析能力有助于企
    發(fā)表于 12-24 12:48

    【「大模型啟示錄」閱讀體驗】對大模型更深入的認知

    ,大模型世界遠比我想象的要復(fù)雜和深刻。 書中不僅詳細介紹了大模型的構(gòu)建過程,還探討了它們的核心能力和所需的基礎(chǔ)設(shè)施。我特別喜歡的是,書中用通俗易懂的語言,把大模型的“不可能三角”,即
    發(fā)表于 12-20 15:46

    【「大模型啟示錄」閱讀體驗】如何在客服領(lǐng)域應(yīng)用大模型

    在客服領(lǐng)域是大模型落地場景中最多的,也是最容易實現(xiàn)的。本身客服領(lǐng)域的特點就是問答形式,大模型接入難度低。今天跟隨《大模型啟示錄 》這本書,學(xué)
    發(fā)表于 12-17 16:53

    OpenAI世界最貴大模型:昂貴背后的技術(shù)突破

    2023年“雙十二”的第一天,OpenAI推出了其最強推理模型o1的滿血版及其Pro版本。同時,ChatGPT也推出了每月200美元的Pro訂閱計劃,這一價格使其一躍成為“世界最貴的大模型”。下面,AI部落小編帶您深入了解Ope
    的頭像 發(fā)表于 12-06 14:46 ?1073次閱讀

    Google DeepMind發(fā)布Genie 2:打造交互式3D虛擬世界

    在OpenAI宣布即將發(fā)布模型和新功能后,Google DeepMind也不甘落后,于近日推出了大型基礎(chǔ)世界模型——Genie 2。這款
    的頭像 發(fā)表于 12-05 14:16 ?1040次閱讀

    谷歌計劃12月發(fā)布Gemini 2.0模型

    近日,有消息稱谷歌計劃在12月發(fā)布其下一代人工智能模型——Gemini 2.0。這一消息引發(fā)了業(yè)界的廣泛關(guān)注,因為谷歌在人工智能領(lǐng)域一直保持
    的頭像 發(fā)表于 10-29 11:02 ?1139次閱讀