一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

英偉達GTC25亮點:NVIDIA Dynamo開源庫加速并擴展AI推理模型

NVIDIA英偉達 ? 來源: NVIDIA英偉達 ? 2025-03-20 15:03 ? 次閱讀

NVIDIA Dynamo 提高了推理性能,同時降低了擴展測試時計算 (Scaling Test-Time Compute) 的成本;在 NVIDIA Blackwell 上的推理優(yōu)化將 DeepSeek-R1 上的吞吐量提高了 30 倍

NVIDIA 發(fā)布了開源推理軟件 NVIDIA Dynamo,旨在以高效率、低成本加速并擴展 AI 工廠中的 AI 推理模型。

作為 NVIDIA Triton 推理服務(wù)器的后續(xù)產(chǎn)品,NVIDIA Dynamo 是一款全新的 AI 推理服務(wù)軟件,旨在為部署推理 AI 模型的 AI 工廠最大化其 token 收益。它協(xié)調(diào)并加速數(shù)千個 GPU 之間的推理通信,并使用分離服務(wù)將大語言模型 (LLM) 的處理階段和生成階段在不同 GPU 上分離開來。這使得每個階段的特定需求可以進行單獨優(yōu)化,并確保更大程度地利用 GPU 資源。

NVIDIA Dynamo 完全開源并支持 PyTorch、SGLang、NVIDIA TensorRT-LLM 和 vLLM,使企業(yè)、初創(chuàng)公司和研究人員能夠開發(fā)和優(yōu)化在分離推理時部署 AI 模型的方法。

“全世界各行業(yè)都在訓(xùn)練 AI 模型以不同的方式進行思考和學(xué)習,從而使模型復(fù)雜度持續(xù)升級?!?NVIDIA 創(chuàng)始人兼首席執(zhí)行官黃仁勛表示,“為了實現(xiàn)自定義推理 AI 的未來,NVIDIA Dynamo 可以在這些模型上進行規(guī)模化部署,從而為 AI 工廠實現(xiàn)降本增效”。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5188

    瀏覽量

    105427
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    33554

    瀏覽量

    274198

原文標題:GTC25 | NVIDIA Dynamo 開源庫加速并擴展 AI 推理模型

文章出處:【微信號:NVIDIA_China,微信公眾號:NVIDIA英偉達】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    揭曉英偉最強芯片!Blackwell Ultra、Rubin芯片亮相,新機器人壓軸

    電子發(fā)燒友網(wǎng)報道(文/莫婷婷)北京時間3月19日晚間,NVIDIA 創(chuàng)始人兼首席執(zhí)行官黃仁勛在2025年GTC開發(fā)者大會上發(fā)表了主題演講,介紹了英偉
    的頭像 發(fā)表于 03-19 09:05 ?1309次閱讀
    揭曉<b class='flag-5'>英偉</b><b class='flag-5'>達</b>最強芯片!Blackwell Ultra、Rubin芯片亮相,新機器人壓軸

    詳解 LLM 推理模型的現(xiàn)狀

    領(lǐng)域的最新研究進展,特別是自DeepSeekR1發(fā)布后興起的推理時間計算擴展相關(guān)內(nèi)容。在LLM中實施和改進推理簡單來說,基于LLM的推理模型是一種旨在通過生成中間
    的頭像 發(fā)表于 04-03 12:09 ?176次閱讀
    詳解 LLM <b class='flag-5'>推理模型</b>的現(xiàn)狀

    英偉GTC2025亮點NVIDIA認證計劃擴展至企業(yè)存儲領(lǐng)域,加速AI工廠部署

    ,現(xiàn)在已將企業(yè)存儲納入其中,旨在通過加速計算、網(wǎng)絡(luò)、軟件和存儲,助力企業(yè)更高效地部署 AI 工廠。 在企業(yè)構(gòu)建 AI 工廠的過程中,獲取高質(zhì)量數(shù)據(jù)對于確保 AI
    的頭像 發(fā)表于 03-21 19:38 ?795次閱讀

    英偉GTC2025亮點NVIDIA、Alphabet 和谷歌攜手開啟代理式與物理AI的未來

    聯(lián)合計劃涵蓋基礎(chǔ)設(shè)施和開源模型優(yōu)化,在機器人、藥物研發(fā)等領(lǐng)域取得巨大進展 具有長期合作伙伴關(guān)系的 NVIDIA、Alphabet 和谷歌宣布了多項新計劃,旨在推動 AI 發(fā)展、普及
    的頭像 發(fā)表于 03-21 15:10 ?918次閱讀
    <b class='flag-5'>英偉</b><b class='flag-5'>達</b><b class='flag-5'>GTC</b>2025<b class='flag-5'>亮點</b>:<b class='flag-5'>NVIDIA</b>、Alphabet 和谷歌攜手開啟代理式與物理<b class='flag-5'>AI</b>的未來

    英偉GTC2025亮點:Oracle與NVIDIA合作助力企業(yè)加速代理式AI推理

    Oracle 數(shù)據(jù)NVIDIA AI 相集成,使企業(yè)能夠更輕松、快捷地采用代理式 AI Oracle 和 NVIDIA 宣布,
    的頭像 發(fā)表于 03-21 12:01 ?465次閱讀
    <b class='flag-5'>英偉</b><b class='flag-5'>達</b><b class='flag-5'>GTC</b>2025<b class='flag-5'>亮點</b>:Oracle與<b class='flag-5'>NVIDIA</b>合作助力企業(yè)<b class='flag-5'>加速</b>代理式<b class='flag-5'>AI</b><b class='flag-5'>推理</b>

    英偉GTC2025亮點 NVIDIA推出Cosmos世界基礎(chǔ)模型和物理AI數(shù)據(jù)工具的重大更新

    推理模型,讓開發(fā)者以前所未有的方式控制世界生成。 NVIDIA 還推出了兩款由 NVIDIA Omniverse 和 Cosmos 平臺提供支持的新藍圖,為開發(fā)者提供用于機
    的頭像 發(fā)表于 03-20 19:01 ?733次閱讀

    英偉GTC25亮點NVIDIA Blackwell Ultra 開啟 AI 推理新時代

    英偉GTC25亮點NVIDIA Blackwell Ultra 開啟 AI
    的頭像 發(fā)表于 03-20 15:35 ?522次閱讀

    Oracle 與 NVIDIA 合作助力企業(yè)加速代理式 AI 推理

    Oracle 數(shù)據(jù)NVIDIA AI 相集成,使企業(yè)能夠更輕松、快捷地采用代理式 AI ? ? ? 美國加利福尼亞州圣何塞 —— GTC
    發(fā)表于 03-19 15:24 ?282次閱讀
    Oracle 與 <b class='flag-5'>NVIDIA</b> 合作助力企業(yè)<b class='flag-5'>加速</b>代理式 <b class='flag-5'>AI</b> <b class='flag-5'>推理</b>

    NVIDIA 推出開放推理 AI 模型系列,助力開發(fā)者和企業(yè)構(gòu)建代理式 AI 平臺

    NVIDIA 后訓(xùn)練的全新 Llama Nemotron 推理模型,為代理式 AI 提供業(yè)務(wù)就緒型基礎(chǔ) 埃森哲、Amdocs、Atlassian、Box、Cadence、CrowdStrike
    發(fā)表于 03-19 09:31 ?169次閱讀
    <b class='flag-5'>NVIDIA</b> 推出開放<b class='flag-5'>推理</b> <b class='flag-5'>AI</b> <b class='flag-5'>模型</b>系列,助力開發(fā)者和企業(yè)構(gòu)建代理式 <b class='flag-5'>AI</b> 平臺

    智譜推出深度推理模型GLM-Zero預(yù)覽版

    近日,智譜公司正式發(fā)布了其深度推理模型GLM-Zero的預(yù)覽版——GLM-Zero-Preview。這款模型標志著智譜在擴展強化學(xué)習技術(shù)訓(xùn)練推理模型方面的重大突破,成為其首個專注于增強
    的頭像 發(fā)表于 01-03 10:42 ?375次閱讀

    智譜GLM-Zero深度推理模型預(yù)覽版正式上線

    近日,智譜公司宣布其深度推理模型GLM-Zero的初代版本——GLM-Zero-Preview已正式上線。這款模型是智譜首個基于擴展強化學(xué)習技術(shù)訓(xùn)練的推理模型,標志著智譜在
    的頭像 發(fā)表于 01-02 10:55 ?392次閱讀

    阿里云開源推理模型QwQ

    近日,阿里云通義團隊宣布推出全新AI推理模型QwQ-32B-Preview,并同步實現(xiàn)了開源。這一舉措標志著阿里云在AI推理領(lǐng)域邁出了重要一
    的頭像 發(fā)表于 11-29 11:30 ?932次閱讀

    英偉推出全新NVIDIA AI Foundry服務(wù)和NVIDIA NIM推理微服務(wù)

    NVIDIA 宣布推出全新 NVIDIA AI Foundry 服務(wù)和 NVIDIA NIM 推理微服務(wù),與同樣剛推出的 Llama 3.1
    的頭像 發(fā)表于 07-25 09:48 ?930次閱讀

    英偉推出AI模型推理服務(wù)NVIDIA NIM

    英偉近日宣布推出一項革命性的AI模型推理服務(wù)——NVIDIA NIM。這項服務(wù)將極大地簡化
    的頭像 發(fā)表于 06-04 09:15 ?870次閱讀

    進一步解讀英偉 Blackwell 架構(gòu)、NVlink及GB200 超級芯片

    計算工作負載、釋放百億億次計算能力和萬億參數(shù)人工智能模型的全部潛力提供關(guān)鍵基礎(chǔ)。 NVLink釋放數(shù)萬億參數(shù)AI模型加速性能,顯著提升大型多GPU系統(tǒng)的可
    發(fā)表于 05-13 17:16