英偉達GTC25亮點：NVIDIA Dynamo開源庫加速并擴展AI推理模型

NVIDIA Dynamo 提高了推理性能，同時降低了擴展測試時計算 (Scaling Test-Time Compute) 的成本；在 NVIDIA Blackwell 上的推理優(yōu)化將 DeepSeek-R1 上的吞吐量提高了 30 倍

NVIDIA 發(fā)布了開源推理軟件 NVIDIA Dynamo，旨在以高效率、低成本加速并擴展 AI 工廠中的 AI 推理模型。

作為 NVIDIA Triton 推理服務(wù)器的后續(xù)產(chǎn)品，NVIDIA Dynamo 是一款全新的 AI 推理服務(wù)軟件，旨在為部署推理 AI 模型的 AI 工廠最大化其 token 收益。它協(xié)調(diào)并加速數(shù)千個 GPU 之間的推理通信，并使用分離服務(wù)將大語言模型 (LLM) 的處理階段和生成階段在不同 GPU 上分離開來。這使得每個階段的特定需求可以進行單獨優(yōu)化，并確保更大程度地利用 GPU 資源。

NVIDIA Dynamo 完全開源并支持 PyTorch、SGLang、NVIDIA TensorRT-LLM 和 vLLM，使企業(yè)、初創(chuàng)公司和研究人員能夠開發(fā)和優(yōu)化在分離推理時部署 AI 模型的方法。

“全世界各行業(yè)都在訓(xùn)練 AI 模型以不同的方式進行思考和學(xué)習(xí)，從而使模型復(fù)雜度持續(xù)升級。” NVIDIA 創(chuàng)始人兼首席執(zhí)行官黃仁勛表示，“為了實現(xiàn)自定義推理 AI 的未來，NVIDIA Dynamo 可以在這些模型上進行規(guī)?；渴穑瑥亩鵀?AI 工廠實現(xiàn)降本增效”。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

NVIDIA

NVIDIA

+關(guān)注

關(guān)注
14

文章
5309

瀏覽量
106431
AI

AI

+關(guān)注

關(guān)注
88

文章
35164

瀏覽量
280041

原文標(biāo)題：GTC25 | NVIDIA Dynamo 開源庫加速并擴展 AI 推理模型

文章出處：【微信號：NVIDIA_China，微信公眾號：NVIDIA英偉達】歡迎添加關(guān)注！文章轉(zhuǎn)載請注明出處。

NVIDIA英偉達
專欄

0 文章 0 閱讀 0 粉絲 0 點贊

關(guān)注個人主頁

Hot VR、AR與MR的發(fā)展歷史以及商業(yè)應(yīng)用實例
Hot NVIDIA RTX與GTX的區(qū)別是什么？

New 2025 NVIDIA創(chuàng)業(yè)企業(yè)展示杭州站圓滿收官
New NVIDIA 將恢復(fù)H20芯片在中國的銷售 NVIDIA CEO 黃仁勛在美國和中國加大推廣AI

精選推薦
更多

文章

資料

帖子

AI通話的N種新玩法，讓科幻照進現(xiàn)實

腦極體
1天前

595 閱讀

三菱電機SiC DIPIPM在變頻家電中的應(yīng)用（2）

三菱電機半導(dǎo)體
18小時前

534 閱讀

三菱電機SiC DIPIPM在變頻家電中的應(yīng)用（1）

三菱電機半導(dǎo)體
19小時前

496 閱讀

英飛凌TLD7002-16 OTP PRG的常見問題解析

駿龍電子
19小時前

435 閱讀

DC/DC轉(zhuǎn)換器電路板安裝過程中的焊接技巧與導(dǎo)通檢查要點

駿龍電子
19小時前

532 閱讀

光學(xué)儀器分辨本領(lǐng)

wzp17317
736

免費

0下載

印制電路板入門必讀

陳大文
390 KB

免費

0下載

TaoLer輕社區(qū)BBS論壇CMS系統(tǒng)

劉潤生
13.21 MB

2積分

1下載

COLA Architecture整潔面向?qū)ο蠓謱蛹軜?gòu)

大彭
0.50 MB

免費

0下載

caozha-order競價頁訂單管理系統(tǒng)

chumowei
20.22 MB

2積分

1下載

【VisionFive 2單板計算機試用體驗】3、開源大語言模型部署

左岸cpx
1天前

130 閱讀

【M-K1HSE開發(fā)板免費體驗】DevEco Studio應(yīng)用開發(fā)體驗(物理機器運行失敗)

jf_1137202360
1天前

92 閱讀

【RA-Eco-RA6M4開發(fā)板評測】開箱、Hello World（串口+OLED）

jf_57061047
1天前

143 閱讀

省錢+環(huán)保+個性：打造一臺永不“過時”的自定義電腦！

早知
2天前

584 閱讀

【BPI-CanMV-K230D-Zero開發(fā)板體驗】+溫度大氣壓檢測及顯示

jinglixixi
2天前

737 閱讀

推薦專欄
更多

企業(yè)產(chǎn)品

資料

方案
更多

一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

搜索歷史

英偉達GTC25亮點：NVIDIA Dynamo開源庫加速并擴展AI推理模型

評論