一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

在阿里云PAI上快速部署NVIDIA Cosmos Reason-1模型

NVIDIA英偉達(dá)企業(yè)解決方案 ? 來(lái)源:NVIDIA英偉達(dá)企業(yè)解決方案 ? 2025-06-04 13:43 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

NVIDIA 近期發(fā)布了Cosmos Reason-1的 7B 和 56B 兩款多模態(tài)大語(yǔ)言模型 (MLLM),它們經(jīng)過(guò)了“物理 AI 監(jiān)督微調(diào)”和“物理 AI 強(qiáng)化學(xué)習(xí)”兩個(gè)階段的訓(xùn)練。其中,Cosmos Reason-1-7B 已經(jīng)開(kāi)源,其基于 Qwen2.5-VL 使用物理常識(shí)和具身推理數(shù)據(jù)進(jìn)行了后訓(xùn)練。

阿里云 PAI-Model Gallery 現(xiàn)已集成 Cosmos Reason-1-7B 模型并提供企業(yè)級(jí)部署方案,本文介紹如何在阿里云人工智能平臺(tái) PAI (Platform of AI) 上快速部署和使用該模型。

NVIDIA Cosmos 平臺(tái)

NVIDIA Cosmos是一個(gè)世界基礎(chǔ)模型 (WFM) 的開(kāi)發(fā)平臺(tái),整合了先進(jìn)的分詞器、護(hù)欄以及用于加速數(shù)據(jù)處理和管理的工作流,它為世界模型的訓(xùn)練提供支持,并加速智能駕駛汽車(chē) (AV) 和機(jī)器人的物理 AI 開(kāi)發(fā)。

Cosmos 提供了一系列預(yù)訓(xùn)練多模態(tài)模型,開(kāi)發(fā)者可以開(kāi)箱即用,包括用于世界生成和后訓(xùn)練的 Cosmos Predict、生成大規(guī)??煽厍腋弑U婧铣蓴?shù)據(jù)的 Cosmos Transfer、物理 AI 推理的 Cosmos Reason 以及過(guò)濾不安全輸入并確保輸出一致性和安全性的 Cosmos Guardrail 等。

其中,NVIDIA Cosmos Reason-1 是一款可完全定制的多模態(tài) AI 推理模型,它專(zhuān)門(mén)為理解運(yùn)動(dòng)、物體交互以及時(shí)空關(guān)系而構(gòu)建?;谒季S鏈 (Chain-of-thought, CoT) 推理,Cosmos Reason-1 模型可以解讀視覺(jué)輸入、根據(jù)給定的提示詞預(yù)測(cè)結(jié)果、并基于推理給出優(yōu)化分析和決策。

該模型基于真實(shí)世界的物理規(guī)律實(shí)現(xiàn)推理,從而生成清晰且能夠感知上下文環(huán)境的自然語(yǔ)言回復(fù)。Cosmos Reason-1 既可以作為其他物理 AI 模型的數(shù)據(jù)清洗和質(zhì)量過(guò)濾工具,也可以作為規(guī)劃模型用于推理具身智能體下一步的行為。

阿里云 PAI-Model Gallery 集成的Cosmos Reason-1-7B

PAI-Model Gallery 是阿里云人工智能平臺(tái) PAI 產(chǎn)品組件,集成了眾多 AI 開(kāi)源社區(qū)中優(yōu)質(zhì)的預(yù)訓(xùn)練模型,并且基于開(kāi)源模型支持零代碼實(shí)現(xiàn)模型訓(xùn)練(微調(diào))、壓縮、評(píng)測(cè)、部署和推理的全部過(guò)程,提供更快、更高效、更便捷的 AI 應(yīng)用體驗(yàn)。此外,它還提供開(kāi)箱即用的 API,并且支持企業(yè)級(jí)數(shù)據(jù)安全。

Cosmos Reason-1-7B 集成到阿里云 PAI-Model Gallery,標(biāo)志著用戶(hù)能夠在“AI + 云”的范式下,通過(guò)預(yù)訓(xùn)練模型的即用性與模塊化設(shè)計(jì),顯著降低多模態(tài)技術(shù)棧選型的復(fù)雜度及模型適配成本。

企業(yè)和開(kāi)發(fā)者現(xiàn)在可以基于領(lǐng)先的云原生平臺(tái),實(shí)現(xiàn)從原始視覺(jué)數(shù)據(jù)輸入到物理約束驅(qū)動(dòng)的高級(jí)推理輸出的端到端開(kāi)發(fā),從而加速物理 AI 從原型到生產(chǎn)級(jí)部署的全生命周期。

在阿里云 PAI 上一鍵部署Cosmos Reason-1-7B

本節(jié)介紹 Cosmos Reason-1-7B 模型在阿里云人工智能平臺(tái) PAI 上進(jìn)行一鍵部署,以及模型驗(yàn)證的實(shí)踐。

1. 在 PAI-Model Gallery 模型廣場(chǎng)找到 Cosmos Reason-1-7B 模型。以阿里云新加坡和中國(guó)大陸的節(jié)點(diǎn)為例。

2. 在模型詳情頁(yè)右上角點(diǎn)擊「部署」,在選擇計(jì)算資源后,即可一鍵完成模型的云上部署。

3. 部署成功后,在服務(wù)頁(yè)面可以點(diǎn)擊“查看調(diào)用信息”獲取調(diào)用的 Endpoint 和 Token,想了解服務(wù)調(diào)用方式可以點(diǎn)擊“預(yù)訓(xùn)練模型”鏈接,返回模型介紹頁(yè)查看調(diào)用方式說(shuō)明。

4. 使用推理服務(wù):您可以使用 API 調(diào)用模型服務(wù),也可以使用 PAI 提供的 WebUI 界面與模型交互。

模型實(shí)測(cè)

實(shí)測(cè)使用NVIDIA Research官網(wǎng)上的視頻案例作為模型輸入。視頻中一個(gè)人正在往杯子中倒牛奶,我們給模型的問(wèn)題是:“視頻中的人將牛奶倒入杯子以后,下一步最合理的動(dòng)作是什么?”模型的回答展示出模型考慮到了人物下一步動(dòng)作的各種可能性,甚至考慮到了倒完牛奶放好奶瓶后,用勺子攪拌牛奶和咖啡,最后模型在進(jìn)行了一番深入思考后得出了結(jié)論,下一步是“將奶瓶放回到臺(tái)面上”。

從這個(gè)例子可以看出,模型準(zhǔn)確地“理解”了視頻中人的動(dòng)作并給出了正確的預(yù)測(cè),這種對(duì)運(yùn)動(dòng)、物體交互以及時(shí)空關(guān)系的理解及預(yù)測(cè)能力一般難以做到,而且模型輸出了完整的思維鏈,讓我們能清楚地知道模型的整個(gè)思考過(guò)程。

下面附上完整的視頻、輸入問(wèn)題、模型輸出結(jié)果,供大家參考。

Question:The overall goal is "The agent pours milk into the cup". The agent in the video is currently performing one subtask out of many to complete this instruction. For the agent in the video, what is the most plausible next immediate subtask?

Model outputs:The agent is currently pouring milk into the cup. The next immediate subtask after pouring would logically be to stop pouring once the desired amount is achieved. Then, the agent would need to place the milk bottle back on the countertop. After that, they might close the bottle's cap to prevent spills. Finally, they could stir the mixture with the spoon to mix the milk and coffee thoroughly. However, since the current action is pouring, the very next step after pouring would be to stop pouring and set the bottle down. But the question asks for the most plausible next immediate subtask. Since the pouring is ongoing, the next step after completing the pour would be to place the milk bottle back on the countertop. Alternatively, if the pouring is still in progress, maybe adjusting the angle to ensure all milk is poured. But given the context, the agent is actively pouring, so once that's done, placing the bottle down makes sense. However, the answer might be to stop pouring and set the bottle aside. But the exact next step after pouring would be to place the bottle back. Alternatively, maybe the agent needs to check if the cup is full enough. But the most logical next step after pouring is to stop and place the bottle down. So the answer is likely "Place the milk bottle back on the countertop."

即將到來(lái):基于 NVIDIA Cosmos Reason-1 tools的模型后訓(xùn)練最佳實(shí)踐

NVIDIA 也開(kāi)源了 Cosmos Reason-1 tools,它是用于在 Cosmos Reason-1 基準(zhǔn)測(cè)試上訓(xùn)練和評(píng)估模型的腳本。它提供的模型后訓(xùn)練腳本 (SFT + RL) 將加速企業(yè)和開(kāi)發(fā)者基于自有數(shù)據(jù)定制 Cosmos Reason-1 模型,從而創(chuàng)建專(zhuān)屬的 physical AI 模型。

阿里云 PAI 團(tuán)隊(duì)測(cè)試的 Cosmos Reason-1 tools 的性能表現(xiàn)如下:在 Qwen2.5-32B-Instruct 模型和 gsm8k 數(shù)據(jù)集 (Batch size = 2,048) 組合上進(jìn)行后訓(xùn)練測(cè)試,相比其他開(kāi)源框架,Cosmos Reason-1 tools 在小規(guī)模集群上實(shí)測(cè)有 1-2 倍的性能加速。PAI 將在近期集成 Cosmos Reason-1 tools 的模型后訓(xùn)練能力。

通過(guò)阿里云 PAI 上手實(shí)踐NVIDIA Cosmos Reason-1-7B 模型

您可以根據(jù)所在區(qū)域,在阿里云國(guó)際站的新加坡或中國(guó)大陸節(jié)點(diǎn),通過(guò)阿里云 PAI 使用 Cosmos Reason-1-7B 模型。

作者

黃博遠(yuǎn)

黃博遠(yuǎn)是阿里云大數(shù)據(jù)及人工智能平臺(tái)的產(chǎn)品總監(jiān)。他于 2014 年加入阿里巴巴集團(tuán),負(fù)責(zé)阿里媽媽?zhuān)ㄔ诰€廣告)和商業(yè)搜索團(tuán)隊(duì)的工程工作。自 2018 年起,他擔(dān)任阿里云人工智能平臺(tái) PAI、DataWorks 和搜索平臺(tái)的產(chǎn)品負(fù)責(zé)人。加入阿里巴巴之前,自 2007 年起,他曾在微軟搜索技術(shù)中心擔(dān)任搜索廣告與展示廣告團(tuán)隊(duì)的資深開(kāi)發(fā)負(fù)責(zé)人。

高慧怡

高慧怡是 NVIDIA 深度學(xué)習(xí)解決方案架構(gòu)師,2020 年加入 NVIDIA 解決方案架構(gòu)團(tuán)隊(duì),從事深度學(xué)習(xí)應(yīng)用在異構(gòu)系統(tǒng)的加速工作,目前主要支持國(guó)內(nèi) CSP 客戶(hù)在大語(yǔ)言模型的訓(xùn)練加速工作。

金國(guó)強(qiáng)

金國(guó)強(qiáng)是 NVIDIA 資深解決方案架構(gòu)師,主要負(fù)責(zé)深度學(xué)習(xí)生成式 AI 領(lǐng)域模型訓(xùn)練、推理優(yōu)化以及大模型開(kāi)發(fā)與應(yīng)用云端落地等技術(shù)方向合作。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5309

    瀏覽量

    106455
  • 模型
    +關(guān)注

    關(guān)注

    1

    文章

    3521

    瀏覽量

    50445
  • 阿里云
    +關(guān)注

    關(guān)注

    3

    文章

    1014

    瀏覽量

    44212

原文標(biāo)題:在阿里云 PAI 上一鍵部署和使用 NVIDIA Cosmos Reason-1 模型

文章出處:【微信號(hào):NVIDIA-Enterprise,微信公眾號(hào):NVIDIA英偉達(dá)企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    英偉達(dá)Cosmos-Reason1 模型深度解讀

    英偉達(dá)近期發(fā)布的 Cosmos-Reason1 模型物理常識(shí)推理領(lǐng)域引發(fā)廣泛關(guān)注。作為專(zhuān)為物理世界交互設(shè)計(jì)的多模態(tài)大語(yǔ)言模型,它通過(guò)融合視覺(jué)感知與復(fù)雜邏輯推理,重新定義了AI對(duì)物理世
    的頭像 發(fā)表于 03-29 23:29 ?1987次閱讀

    阿里設(shè)備的物模型數(shù)據(jù)里面始終沒(méi)有值是為什么?

    如上圖,不知道講清楚沒(méi)有。 IG502自定義TOPIC 發(fā)到阿里沒(méi)問(wèn)題。采用阿里模型
    發(fā)表于 07-24 07:49

    AI開(kāi)發(fā)者福音!阿里推出國(guó)內(nèi)首個(gè)基于英偉達(dá)NGC的GPU優(yōu)化容器

    摘要: 3月28日,2018云棲大會(huì)·深圳峰會(huì)上,阿里宣布與英偉達(dá)GPU 合作 (NGC),開(kāi)發(fā)者可以
    發(fā)表于 04-04 14:39

    阿里Kubernetes容器服務(wù)打造TensorFlow實(shí)驗(yàn)室

    的定義和訓(xùn)練的收斂趨勢(shì)。總結(jié)我們可以利用阿里Kubernetes容器服務(wù),輕松的搭建在云端搭建TensorFlow的環(huán)境,運(yùn)行深度學(xué)習(xí)的實(shí)驗(yàn)室,并且利用TensorBoard追蹤訓(xùn)練效果。歡迎大家使用阿里
    發(fā)表于 05-10 10:24

    阿里免費(fèi)使用及手冊(cè)

    .................................................... 6三、阿里優(yōu)惠及免費(fèi)(建立實(shí)名認(rèn)證的基礎(chǔ)) .............
    發(fā)表于 05-10 21:17

    阿里企業(yè)IPv6部署方案

    方便的阿里部署IPv6公網(wǎng)入口,同時(shí)將實(shí)例后端關(guān)聯(lián)到線下IDC或其他平臺(tái)的服務(wù)器。
    發(fā)表于 07-09 16:18

    阿里巴巴大數(shù)據(jù)產(chǎn)品最新特性介紹--機(jī)器學(xué)習(xí)PAI

    ,用戶(hù)可以方便的進(jìn)行構(gòu)建實(shí)驗(yàn),并將模型進(jìn)行在線部署,最后應(yīng)用到實(shí)際業(yè)務(wù)當(dāng)中。3. PAI-DSWPAI之后的發(fā)展過(guò)程中,出現(xiàn)了新的需求,即
    發(fā)表于 09-18 14:57

    阿里展示“到端”整體方案

    MDM9206 中預(yù)集成阿里 Link 物聯(lián)網(wǎng)套件,模組廠商和物聯(lián)網(wǎng)開(kāi)發(fā)者可以利用 LTE IoT 連接以及運(yùn)行在 LTE 系統(tǒng)級(jí)芯片的客戶(hù)端軟件,實(shí)現(xiàn)解決方案的快速開(kāi)發(fā)和
    發(fā)表于 07-27 06:30

    Ubuntu使用Nvidia GPU訓(xùn)練模型

    問(wèn)題最近在Ubuntu使用Nvidia GPU訓(xùn)練模型的時(shí)候,沒(méi)有問(wèn)題,過(guò)一會(huì)再訓(xùn)練出現(xiàn)非??D,使用nvidia-smi查看發(fā)現(xiàn),顯示GPU的風(fēng)扇和電源報(bào)錯(cuò):解決方案自動(dòng)風(fēng)扇控制
    發(fā)表于 01-03 08:24

    云端機(jī)器學(xué)習(xí)平臺(tái)PAI最新的創(chuàng)新實(shí)踐

    今年 3 月的 GTC 2022 大會(huì)上,阿里帶來(lái)了推理優(yōu)化/部署、深度學(xué)習(xí)編譯器、大模型部署
    的頭像 發(fā)表于 06-09 09:52 ?1295次閱讀

    GTC23 | 阿里機(jī)器學(xué)習(xí)平臺(tái) PAI 精選演講推薦

    本次 GTC 大會(huì),來(lái)自阿里機(jī)器學(xué)習(xí)平臺(tái) PAI 的技術(shù)專(zhuān)家,將分享 開(kāi)源產(chǎn)品 DeepRec 的高性能 GPU 訓(xùn)練推理優(yōu)化 ,以及 機(jī)器學(xué)習(xí)模型中訪存密集型計(jì)算 STITCH 融
    的頭像 發(fā)表于 03-19 22:45 ?2312次閱讀

    NVIDIA Cosmos世界基礎(chǔ)模型平臺(tái)發(fā)布

    NVIDIA 宣布推出NVIDIA Cosmos,該平臺(tái)由先進(jìn)的生成式世界基礎(chǔ)模型、高級(jí) tokenizer、護(hù)欄和加速視頻處理管線組成,將推動(dòng)自動(dòng)駕駛汽車(chē)(AV)和機(jī)器人等物理 AI
    的頭像 發(fā)表于 01-08 10:39 ?571次閱讀

    NVIDIA發(fā)布Cosmos?平臺(tái),助力物理AI系統(tǒng)發(fā)展

    NVIDIA近日宣布推出全新的NVIDIA Cosmos?平臺(tái),該平臺(tái)專(zhuān)為自動(dòng)駕駛汽車(chē)(AV)和機(jī)器人等物理AI系統(tǒng)而設(shè)計(jì),旨在推動(dòng)這些領(lǐng)域的快速發(fā)展。
    的頭像 發(fā)表于 01-08 15:36 ?619次閱讀

    百度阿里上線DeepSeek模型部署服務(wù)

    近日,百度智能云和阿里相繼宣布上線DeepSeek-R1和DeepSeek-V3模型部署服務(wù),為開(kāi)發(fā)者和企業(yè)用戶(hù)提供了更加高效便捷的AI
    的頭像 發(fā)表于 02-05 15:40 ?873次閱讀

    如何本地部署NVIDIA Cosmos Reason-1-7B模型

    近日,NVIDIA 開(kāi)源其物理 AI 平臺(tái) NVIDIA Cosmos 中的關(guān)鍵模型——NVIDIA C
    的頭像 發(fā)表于 07-09 10:17 ?173次閱讀