一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

NVIDIA推出加速物理AI開發(fā)的Cosmos世界基礎(chǔ)模型

NVIDIA英偉達(dá) ? 來源:NVIDIA英偉達(dá) ? 2025-01-09 11:05 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

經(jīng)數(shù)百萬小時(shí)的駕駛和機(jī)器人視頻數(shù)據(jù)訓(xùn)練的先進(jìn)模型,可用于普及物理 AI 開發(fā),并以開放模型許可形式提供。

NVIDIA Cosmos是一個(gè)用于加速物理 AI 開發(fā)的平臺,推出了一系列世界基礎(chǔ)模型——可以預(yù)測和生成虛擬環(huán)境未來狀態(tài)的物理感知視頻的神經(jīng)網(wǎng)絡(luò),以幫助開發(fā)者構(gòu)建新一代機(jī)器人和自動(dòng)駕駛汽車(AV)。

如同大語言模型一樣,世界基礎(chǔ)模型(WFM)屬于基礎(chǔ)類模型。這類模型使用包括文本、圖像、視頻和運(yùn)動(dòng)在內(nèi)的輸入數(shù)據(jù)來生成和仿真虛擬世界,以準(zhǔn)確模擬場景中物體的空間關(guān)系及其物理交互。

在 CES 大會上,NVIDIA 推出第一批 Cosmos 世界基礎(chǔ)模型,用于基于物理的仿真和合成數(shù)據(jù)生成,配備先進(jìn)的 tokenizer、護(hù)欄、加速數(shù)據(jù)處理和管理工作流,以及模型定制和優(yōu)化框架。

無論公司規(guī)模大小,研究人員和開發(fā)者都可以根據(jù) NVIDIA 允許商業(yè)使用的開放模型許可下,自由使用 Cosmos 模型。構(gòu)建 AI 智能體的企業(yè)還可以使用在 CES 上推出的新開源 NVIDIA Llama Nemotron 和 Cosmos Nemotron 模型。

Cosmos 先進(jìn)的開放模型能夠幫助物理 AI 開發(fā)者解決障礙,無拘無束構(gòu)建機(jī)器人和自動(dòng)駕駛汽車技術(shù),并使各種規(guī)模的企業(yè)能夠更快地將其物理 AI 應(yīng)用推向市場。開發(fā)者可以直接使用 Cosmos 模型生成基于物理學(xué)的合成數(shù)據(jù),或利用 NVIDIA NeMo 框架,根據(jù)自己的視頻對模型進(jìn)行微調(diào),以實(shí)現(xiàn)特定物理 AI 設(shè)置。

物理 AI 領(lǐng)先者——包括機(jī)器人公司 1X、Agility Robotics 和小鵬汽車,以及自動(dòng)駕駛汽車開發(fā)商 Uber 和 Waabi ——已經(jīng)在與 Cosmos 協(xié)作,加速并增強(qiáng)模型開發(fā)。

開發(fā)者可以在 NVIDIA API 目錄中預(yù)覽首個(gè) Cosmos 自回歸和擴(kuò)散模型,并從 NGC 目錄和 Hugging Face 下載模型系列和微調(diào)框架。

用于物理 AI 的世界基礎(chǔ)模型

Cosmos 世界基礎(chǔ)模型是一套用于物理感知視頻生成的開放式擴(kuò)散和自回歸 Transformer 模型。這些模型已基于 2000 萬小時(shí)的真實(shí)世界人類互動(dòng)、環(huán)境、工業(yè)、機(jī)器人和駕駛數(shù)據(jù),訓(xùn)練了 9,000 萬億個(gè) token。

該類模型分為三類:Nano,用于針對實(shí)時(shí)、低延遲推理和邊緣部署進(jìn)行優(yōu)化的模型;Super,用于高性能基線模型;Ultra,具有高質(zhì)量和保真度,適合用于蒸餾自定義模型。

配合NVIDIA Omniverse3D 輸出時(shí),擴(kuò)散模型生成可控的高質(zhì)量合成視頻數(shù)據(jù),用于啟動(dòng)機(jī)器人和自動(dòng)駕駛汽車感知模型的訓(xùn)練。自回歸模型基于輸入幀和文本,預(yù)測視頻幀序列中的下一步動(dòng)態(tài)??蓪?shí)現(xiàn)實(shí)時(shí)下一個(gè) token 預(yù)測,讓物理 AI 模型預(yù)測他們的下一個(gè)最佳行動(dòng)。

開發(fā)者可以使用 Cosmos 開放模型進(jìn)行文本到世界和視頻到世界的生成。擴(kuò)散或自回歸模型版本的參數(shù)量在 40 億到 140 億之間,現(xiàn)可以在 NGC 目錄和 Hugging Face 上查詢。

還提供用于總結(jié)文本提示的參數(shù)量級達(dá) 120 億的上采樣模型、針對增強(qiáng)現(xiàn)實(shí)優(yōu)化 70 億參數(shù)級視頻解碼器、以及確保負(fù)責(zé)任和安全使用的護(hù)欄模型。

為了展示定制的機(jī)會,NVIDIA 還發(fā)布了針對垂直應(yīng)用的微調(diào)模型樣本,例如為自動(dòng)駕駛汽車生成多傳感器視圖。

推動(dòng)機(jī)器人、自動(dòng)駕駛汽車應(yīng)用

Cosmos 世界基礎(chǔ)模型可以實(shí)現(xiàn)合成數(shù)據(jù)生成,以增強(qiáng)訓(xùn)練數(shù)據(jù)集,在物理 AI 模型部署到現(xiàn)實(shí)世界之前進(jìn)行仿真測試和調(diào)試,以及在虛擬環(huán)境中進(jìn)行強(qiáng)化學(xué)習(xí)以加速 AI 智能體學(xué)習(xí)。

開發(fā)者可以通過使用NVIDIA Omniverse組合的 3D 場景來調(diào)節(jié) Cosmos ,從而生成大量可控的基于物理學(xué)的合成數(shù)據(jù)。

Waabi 是一家從自動(dòng)駕駛汽車開始致力于開發(fā)物理世界生成式 AI 的先驅(qū)。該公司正在評估 Cosmos 在自動(dòng)駕駛汽車軟件開發(fā)和仿真中視頻數(shù)據(jù)搜索與整理的應(yīng)用。這將進(jìn)一步加速該公司安全方面行業(yè)領(lǐng)先的方法,該方法以 Waabi World 為基礎(chǔ)。Waabi World 是一種生成式 AI 仿真器,能夠以與現(xiàn)實(shí)世界中發(fā)生的情況相同的水平,創(chuàng)建出車輛可能遇到的情況。

在機(jī)器人開發(fā)中,世界基礎(chǔ)模型可以生成合成虛擬環(huán)境或世界,為機(jī)器人學(xué)習(xí)提供更具性價(jià)比、更高效和更受控的空間。AI 機(jī)器人初創(chuàng)公司 Hillbot 正在利用 Cosmos 生成萬億字節(jié)級的高保真 3D 環(huán)境,以提升數(shù)據(jù)工作流。這種 AI 生成數(shù)據(jù)將幫助公司完善其機(jī)器人培訓(xùn)和操作,實(shí)現(xiàn)更快、更高效的機(jī)器人技能和提高工業(yè)和家庭任務(wù)表現(xiàn)。

無論工業(yè)或家庭應(yīng)用,開發(fā)者都可以使用 NVIDIA Omniverse 和 Cosmos 作為多元宇宙仿真引擎,允許物理 AI 策略模型模擬執(zhí)行特定任務(wù)的每一個(gè)可能的未來路徑,從而有助于模型選擇最佳路徑。

數(shù)據(jù)管理和 Cosmos 模型的訓(xùn)練依賴于數(shù)千個(gè) NVIDIA GPU,通過高性能、完全托管的 AI 平臺 NVIDIA DGX Cloud,在每個(gè)領(lǐng)先的云端提供加速計(jì)算集群。

采用 Cosmos 的開發(fā)者可以使用 DGX Cloud 進(jìn)行 Cosmos 模型的簡單部署,并通過 NVIDIA AI Enterprise 軟件平臺提供進(jìn)一步的支持。

通過 NVIDIA Cosmos 進(jìn)行自定義和部署

除基礎(chǔ)模型外,Cosmos 平臺還包括由 NVIDIA NeMo Curator 提供支持的數(shù)據(jù)處理和管理工作流,并針對 NVIDIA 數(shù)據(jù)中心 GPU 進(jìn)行了優(yōu)化。

機(jī)器人和自動(dòng)駕駛汽車開發(fā)者收集數(shù)百萬或數(shù)十億小時(shí)的真實(shí)世界錄制視頻,從而產(chǎn)生數(shù)千萬億字節(jié)級的數(shù)據(jù)。Cosmos 使開發(fā)者能夠在 NVIDIA Hopper GPU 上僅用 40 天處理 2000 萬小時(shí)的數(shù)據(jù),在 NVIDIA Blackwell GPU 上只需 14 天就能處理 2000 萬小時(shí)的數(shù)據(jù)。使用在具有等效功耗的 CPU 系統(tǒng)上運(yùn)行的未優(yōu)化的工作流,處理相同數(shù)量的數(shù)據(jù)將需要三年以上的時(shí)間。

該平臺還擁有一套強(qiáng)大的視頻和圖像 tokenizer,可以將視頻轉(zhuǎn)換為不同視頻壓縮比的標(biāo)記,用于訓(xùn)練各種 Transformer 模型。

與當(dāng)今先進(jìn)的 tokenizer 相比,Cosmos tokenizer 的總壓縮率高出 8 倍,處理速度快 12 倍,在訓(xùn)練和推理方面提供卓越的質(zhì)量并降低計(jì)算成本。開發(fā)者可以通過 Hugging Face 和 GitHub 訪問這些根據(jù) NVIDIA 開放模式許可提供的tokenizer。

使用 Cosmos 的開發(fā)者還可以使用 NeMo 框架提供的模型訓(xùn)練和微調(diào)功能,NeMo 框架是一種 GPU 加速框架,可實(shí)現(xiàn)高吞吐量 AI 訓(xùn)練。

開發(fā)安全、負(fù)責(zé)任的 AI 模型

現(xiàn)在,Cosmos 已根據(jù) NVIDIA 開放模式許可協(xié)議向開發(fā)者開放,其開發(fā)符合 NVIDIA 的可信 AI 原則,包括非歧視、隱私、安全、保障和透明度。

Cosmos 平臺包括 Cosmos Guardrails,這是一套專用的模型,其功能包括在預(yù)處理期間減少有害文本和圖像輸入,以及在后處理期間屏幕生成安全視頻。開發(fā)者可以進(jìn)一步增強(qiáng)這些護(hù)欄,以適應(yīng)自定義應(yīng)用程序。

NVIDIA API Catalog 上的 Cosmos 模型還具有內(nèi)置的水印系統(tǒng),可識別 AI 生成序列。

NVIDIA Cosmos 由 NVIDIA Research 開發(fā)。請閱讀研究論文《Cosmos World Foundation Model Platform for Physical AI》,了解有關(guān)模型開發(fā)和基準(zhǔn)的更多詳細(xì)信息。可訪問 Hugging Face,查找模型卡以了解詳細(xì)信息。

開始使用 NVIDIA Cosmos 并與 NVIDIA 一起,參加 CES 大會。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5309

    瀏覽量

    106408
  • AI
    AI
    +關(guān)注

    關(guān)注

    88

    文章

    35164

    瀏覽量

    279890
  • 模型
    +關(guān)注

    關(guān)注

    1

    文章

    3521

    瀏覽量

    50423

原文標(biāo)題:CES 2025 | NVIDIA 面向物理 AI 開發(fā)者社區(qū)開放 Cosmos 世界基礎(chǔ)模型

文章出處:【微信號:NVIDIA_China,微信公眾號:NVIDIA英偉達(dá)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    如何本地部署NVIDIA Cosmos Reason-1-7B模型

    近日,NVIDIA 開源其物理 AI 平臺 NVIDIA Cosmos 中的關(guān)鍵模型——
    的頭像 發(fā)表于 07-09 10:17 ?164次閱讀

    NVIDIA GTC巴黎亮點(diǎn):全新Cosmos Predict-2世界基礎(chǔ)模型與CARLA集成加速智能汽車訓(xùn)練

    。這種向使用大模型的過渡大大增加了對用于訓(xùn)練、測試和驗(yàn)證的高質(zhì)量、基于物理學(xué)傳感器數(shù)據(jù)的需求。 為加速下一代輔助駕駛架構(gòu)的開發(fā)NVIDIA
    的頭像 發(fā)表于 06-12 10:00 ?580次閱讀

    在阿里云PAI上快速部署NVIDIA Cosmos Reason-1模型

    NVIDIA 近期發(fā)布了 Cosmos Reason-1 的 7B 和 56B 兩款多模態(tài)大語言模型 (MLLM),它們經(jīng)過了“物理 AI
    的頭像 發(fā)表于 06-04 13:43 ?304次閱讀

    NVIDIA Cosmos加速機(jī)器人和自動(dòng)駕駛汽車物理AI發(fā)展

    NVIDIA Cosmos 通過可預(yù)測未來世界狀態(tài)的世界基礎(chǔ)模型加速
    的頭像 發(fā)表于 04-24 11:01 ?549次閱讀
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>Cosmos</b><b class='flag-5'>加速</b>機(jī)器人和自動(dòng)駕駛汽車<b class='flag-5'>物理</b><b class='flag-5'>AI</b>發(fā)展

    英偉達(dá)Cosmos-Reason1 模型深度解讀

    英偉達(dá)近期發(fā)布的 Cosmos-Reason1 模型物理常識推理領(lǐng)域引發(fā)廣泛關(guān)注。作為專為物理世界交互設(shè)計(jì)的多模態(tài)大語言
    的頭像 發(fā)表于 03-29 23:29 ?1975次閱讀

    英偉達(dá)GTC2025亮點(diǎn) NVIDIA推出Cosmos世界基礎(chǔ)模型物理AI數(shù)據(jù)工具的重大更新

    、Figure AI、Skild AI 是最早采用該技術(shù)的公司。 NVIDIA 宣布推出全新 NVIDIA
    的頭像 發(fā)表于 03-20 19:01 ?885次閱讀

    NVIDIA Cosmos世界基礎(chǔ)模型平臺的主要功能

    隨著機(jī)器人技術(shù)和自動(dòng)駕駛汽車的發(fā)展,加快物理 AI開發(fā)工作變得至關(guān)重要。物理 AI 使自主機(jī)器能夠感知、理解并執(zhí)行
    的頭像 發(fā)表于 01-15 11:03 ?977次閱讀
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>Cosmos</b><b class='flag-5'>世界</b>基礎(chǔ)<b class='flag-5'>模型</b>平臺的主要功能

    英偉達(dá)推出基石世界模型Cosmos,解決智駕與機(jī)器人具身智能訓(xùn)練數(shù)據(jù)問題

    CES 2025展會上,英偉達(dá)推出了基石世界模型Cosmos,World Foundation Model基石世界
    的頭像 發(fā)表于 01-14 11:04 ?1283次閱讀
    英偉達(dá)<b class='flag-5'>推出</b>基石<b class='flag-5'>世界</b><b class='flag-5'>模型</b><b class='flag-5'>Cosmos</b>,解決智駕與機(jī)器人具身智能訓(xùn)練數(shù)據(jù)問題

    NVIDIA發(fā)布Cosmos平臺,加速物理AI開發(fā)

    NVIDIA近日宣布了一項(xiàng)重大創(chuàng)新——推出NVIDIA Cosmos?平臺。該平臺集成了先進(jìn)的生成式世界基礎(chǔ)
    的頭像 發(fā)表于 01-13 11:06 ?797次閱讀

    NVIDIA Omniverse擴(kuò)展至生成式物理AI領(lǐng)域

    NVIDIA近日宣布,其Omniverse?平臺再次實(shí)現(xiàn)重大突破,成功推出多個(gè)生成式AI模型和藍(lán)圖,將Omniverse的應(yīng)用范圍進(jìn)一步擴(kuò)展至物理
    的頭像 發(fā)表于 01-13 10:56 ?766次閱讀

    NVIDIA推出開放式Llama Nemotron系列模型

    作為 NVIDIA NIM 微服務(wù),開放式 Llama Nemotron 大語言模型Cosmos Nemotron 視覺語言模型可在任何加速
    的頭像 發(fā)表于 01-09 11:11 ?749次閱讀

    英偉達(dá)發(fā)布Cosmos世界基礎(chǔ)模型

    自動(dòng)駕駛汽車、機(jī)器人等物理AI系統(tǒng)的開發(fā)進(jìn)程。 Cosmos平臺的核心在于其強(qiáng)大的生成世界基礎(chǔ)模型
    的頭像 發(fā)表于 01-09 10:23 ?711次閱讀

    NVIDIA發(fā)布Cosmos?平臺,助力物理AI系統(tǒng)發(fā)展

    基礎(chǔ)模型、高級tokenizer、護(hù)欄以及加速視頻處理管線等多項(xiàng)先進(jìn)技術(shù)。其中,Cosmos世界基礎(chǔ)模型(WFM)是平臺的核心,它使
    的頭像 發(fā)表于 01-08 15:36 ?616次閱讀

    NVIDIA推出多個(gè)生成式AI模型和藍(lán)圖

    NVIDIA 宣布推出多個(gè)生成式 AI 模型和藍(lán)圖,將 NVIDIA Omniverse 一體化進(jìn)一步擴(kuò)展至
    的頭像 發(fā)表于 01-08 10:48 ?632次閱讀

    NVIDIA Cosmos世界基礎(chǔ)模型平臺發(fā)布

    NVIDIA 宣布推出NVIDIA Cosmos,該平臺由先進(jìn)的生成式世界基礎(chǔ)模型、高級 tok
    的頭像 發(fā)表于 01-08 10:39 ?563次閱讀