NVIDIA推出生成式AI微服務(wù)，供開發(fā)者在CUDA GPU系統(tǒng)中創(chuàng)建部署生成式AI助手

NVIDIA 于今日推出數(shù)十項企業(yè)級生成式 AI 微服務(wù)，企業(yè)可以利用這些微服務(wù)在自己的平臺上創(chuàng)建和部署定制應(yīng)用，同時保留對知識產(chǎn)權(quán)的完整所有權(quán)和控制權(quán)。

這些云原生微服務(wù)目錄在NVIDIA CUDA平臺上開發(fā)，其中包括NVIDIA NIM微服務(wù)，可適用于 NVIDIA 及合作伙伴生態(tài)系統(tǒng)中 20 多個熱門的 AI 模型進(jìn)行推理優(yōu)化。此外，用戶現(xiàn)能夠以NVIDIA CUDA-X微服務(wù)的形式使用 NVIDIA 加速軟件開發(fā)套件、庫和工具，用于檢索增強(qiáng)生成（RAG）、護(hù)欄、數(shù)據(jù)處理、HPC 等。NVIDIA 還發(fā)布了 20 多項醫(yī)療 NIM 和 CUDA-X 微服務(wù)。

這些精心挑選的微服務(wù)為 NVIDIA 全棧計算平臺增添了新的一層，連接起了由模型開發(fā)人員、平臺提供商和企業(yè)組成的 AI 生態(tài)系統(tǒng)，使其能夠通過標(biāo)準(zhǔn)化的路徑來運(yùn)行針對 NVIDIA CUDA 安裝基礎(chǔ)（在云、數(shù)據(jù)中心、工作站和 PC 中的數(shù)以億計的 GPU）優(yōu)化的定制 AI 模型。

NVIDIA 創(chuàng)始人兼首席執(zhí)行官黃仁勛表示：“成熟的企業(yè)平臺坐擁數(shù)據(jù)金礦，這些數(shù)據(jù)可以轉(zhuǎn)化為生成式 AI 助手。我們與合作伙伴生態(tài)系統(tǒng)一起創(chuàng)建的這些容器化 AI 微服務(wù)，是各行業(yè)企業(yè)成為 AI 公司的基石?！?/strong>

NIM 推理微服務(wù)將部署時間從幾周縮短至幾分鐘

NIM 微服務(wù)提供基于 NVIDIA 推理軟件的預(yù)構(gòu)建容器，包括 Triton 推理服務(wù)器 和 TensorRT-LLM，使開發(fā)者能夠?qū)⒉渴饡r間從幾周縮短至幾分鐘。

它們?yōu)檎Z言、語音和藥物發(fā)現(xiàn)等領(lǐng)域提供行業(yè)標(biāo)準(zhǔn) API，使開發(fā)者能夠使用安全托管在自己的基礎(chǔ)設(shè)施中的專有數(shù)據(jù)，來快速構(gòu)建 AI 應(yīng)用。這些應(yīng)用可按需擴(kuò)展，從而為在 NVIDIA 加速計算平臺上運(yùn)行生產(chǎn)級生成式 AI 提供靈活性和性能。

面向 RAG、數(shù)據(jù)處理、護(hù)欄、HPC 的 CUDA-X 微服務(wù)

CUDA-X 微服務(wù)為數(shù)據(jù)準(zhǔn)備、定制和訓(xùn)練提供端到端的構(gòu)建模塊，助力各行各業(yè)加快開發(fā)生產(chǎn)級 AI。

為了加快 AI 采用，企業(yè)可以使用 CUDA-X 微服務(wù)，包括用于定制語音和翻譯 AI 的 NVIDIA Riva、用于路由優(yōu)化的 NVIDIA cuOpt，以及用于高分辨率氣候和天氣模擬的 NVIDIA Earth-2。

生態(tài)系統(tǒng)通過生成式 AI 微服務(wù)賦能企業(yè)平臺

除了領(lǐng)先的應(yīng)用提供商外，NVIDIA 生態(tài)系統(tǒng)中的數(shù)據(jù)、基礎(chǔ)設(shè)施和計算平臺提供商也在使用 NVIDIA 微服務(wù)，為企業(yè)帶來生成式 AI。

包括 Box、Cloudera、Cohesity、Datastax、Dropbox 和 NetApp 在內(nèi)的頂級數(shù)據(jù)平臺提供商正在使用 NVIDIA 微服務(wù)，幫助客戶優(yōu)化 RAG 管道，并將專有數(shù)據(jù)集成到生成式 AI 應(yīng)用中。Snowflake 正在使用 NeMo Retriever，充分利用企業(yè)數(shù)據(jù)來構(gòu)建 AI 應(yīng)用。

可用性

開發(fā)者可以在 ai.nvidia.com 免費試用 NVIDIA 微服務(wù)。企業(yè)則可以在 NVIDIA 認(rèn)證系統(tǒng)和領(lǐng)先的云平臺上使用 NVIDIA AI Enterprise 5.0 部署生產(chǎn)級 NIM 微服務(wù)。

審核編輯：劉清

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

NVIDIA

NVIDIA

+關(guān)注

關(guān)注
14

文章
5309

瀏覽量
106347

GPU芯片

GPU芯片

+關(guān)注

關(guān)注
1

文章
305

瀏覽量
6197

生成式AI

生成式AI

+關(guān)注

關(guān)注
0

文章
531

瀏覽量
811

原文標(biāo)題：GTC24 | NVIDIA 推出生成式 AI 微服務(wù)，供開發(fā)者在 CUDA GPU 系統(tǒng)中創(chuàng)建部署生成式 AI 助手

文章出處：【微信號：NVIDIA_China，微信公眾號：NVIDIA英偉達(dá)】歡迎添加關(guān)注！文章轉(zhuǎn)載請注明出處。

收藏人收藏

掃一掃，分享給好友

復(fù)制鏈接分享

加入交流群

掃碼添加小助手

加入工程師交流群

評論

發(fā)布評論請先登錄

相關(guān)推薦

熱點推薦

NVIDIA發(fā)布全新NIM AI Guardrail微服務(wù)

，致力于提升生成式AI應(yīng)用的安全性、精準(zhǔn)度和可擴(kuò)展性。這些微服務(wù)以NeMo Guardrails為核心進(jìn)行編排，充分利用了NVIDIA N

發(fā)表于 01-18 11:48 ?795次閱讀

NVIDIA 發(fā)布保障代理式 AI 應(yīng)用安全的 NIM 微服務(wù)

是 NVIDIA NeMo Guardrails 軟件工具系列的一部分。這些可移植且經(jīng)過優(yōu)化的推理微服務(wù)可幫助企業(yè)提高生成式 AI 應(yīng)用的安

發(fā)表于 01-17 16:29 ?160次閱讀

Cirium發(fā)布業(yè)界首款生成式AI準(zhǔn)點率助手

全球航空分析數(shù)據(jù)領(lǐng)域的佼佼者Cirium，近日宣布推出業(yè)界首款專為航空公司和機(jī)場準(zhǔn)點率(OTP)設(shè)計的生成式AI

發(fā)表于 01-16 14:27 ?504次閱讀

NVIDIA Omniverse擴(kuò)展至生成式物理AI領(lǐng)域

NVIDIA近日宣布，其Omniverse?平臺再次實現(xiàn)重大突破，成功推出多個生成式AI模型和藍(lán)圖，將Omniverse的應(yīng)用范圍進(jìn)一步擴(kuò)展

發(fā)表于 01-13 10:56 ?760次閱讀

NVIDIA推出多個生成式AI模型和藍(lán)圖

NVIDIA 宣布推出多個生成式 AI 模型和藍(lán)圖，將 NVIDIA Omniverse 一體化

發(fā)表于 01-08 10:48 ?623次閱讀

NVIDIA 推出高性價比的生成式 AI 超級計算機(jī)

Jetson Orin Nano Super 可將生成式 AI 性能提升至1.7 倍，支持科技愛好者、開發(fā)者和學(xué)生使用的主流模型。 ? ?

發(fā)表于 12-18 17:01 ?721次閱讀

NVIDIA推出全新生成式AI模型Fugatto

NVIDIA 開發(fā)了一個全新的生成式 AI 模型。利用輸入的文本和音頻，該模型可以創(chuàng)作出包含任意的音樂、人聲和聲音組合的作品。

發(fā)表于 11-27 11:29 ?812次閱讀

NVIDIA助力Amdocs打造生成式AI智能體

正在使用NVIDIA DGX Cloud 與 NVIDIA AI Enterprise軟件開發(fā)和交付基于商用大語言模型（LLM）和領(lǐng)域適配模型的解決方案。該公司還在使用

發(fā)表于 11-19 14:48 ?905次閱讀

在設(shè)備上利用AI Edge Torch生成式API部署自定義大語言模型

我們很高興地發(fā)布 AI Edge Torch 生成式 API，它能將開發(fā)者用 PyTorch 編寫的高性能大語言模型 (LLM) 部署至 T

發(fā)表于 11-14 10:23 ?1127次閱讀

NVIDIA AI助力SAP生成式AI助手Joule加速發(fā)展

在美國佛羅里達(dá)州奧蘭多舉行的 SAP Sapphire 大會上，NVIDIA 與這家企業(yè)軟件公司公布了搭載NVIDIA AI Enterprise軟件的

發(fā)表于 09-09 09:37 ?813次閱讀

全新NVIDIA NIM微服務(wù)將生成式AI引入數(shù)字環(huán)境

生成式物理 AI NIM 微服務(wù)以及 NVIDIA Metropolis 參考工作流旨在協(xié)助創(chuàng)建

發(fā)表于 08-02 15:20 ?910次閱讀

NVIDIA攜手Meta推出AI服務(wù)，為企業(yè)提供生成式AI服務(wù)

NVIDIA近日宣布了一項重大舉措，正式推出NVIDIA AI Foundry服務(wù)與NVIDIA

發(fā)表于 07-25 16:57 ?841次閱讀

英偉達(dá)推出全新NVIDIA AI Foundry服務(wù)和NVIDIA NIM推理微服務(wù)

NVIDIA 宣布推出全新 NVIDIA AI Foundry 服務(wù)和 NVIDIA NIM 推

發(fā)表于 07-25 09:48 ?1060次閱讀

使用OpenVINO GenAI API的輕量級生成式AI

機(jī)器人的進(jìn)步很快、變化不斷，很難預(yù)測接下來會有什么突破，開發(fā)者應(yīng)該關(guān)注什么。我們知道生成式AI將繼續(xù)存在，開發(fā)人員希望看到

發(fā)表于 07-24 15:08 ?1938次閱讀

NVIDIA AI Foundry 為全球企業(yè)打造自定義 Llama 3.1 生成式 AI 模型

Foundry 提供從數(shù)據(jù)策管、合成數(shù)據(jù)生成、微調(diào)、檢索、防護(hù)到評估的全方位生成式 AI 模型服務(wù)，以便

發(fā)表于 07-24 09:39 ?914次閱讀

NVIDIA英偉達(dá)
專欄

0 文章 0 閱讀 0 粉絲 0 點贊

關(guān)注個人主頁

Hot VR、AR與MR的發(fā)展歷史以及商業(yè)應(yīng)用實例
Hot NVIDIA RTX與GTX的區(qū)別是什么？

New 2025 NVIDIA創(chuàng)業(yè)企業(yè)展示杭州站圓滿收官
New NVIDIA 將恢復(fù)H20芯片在中國的銷售 NVIDIA CEO 黃仁勛在美國和中國加大推廣AI

精選推薦
更多

文章

資料

帖子

基于FPGA YOLO算法的掃描式SMT焊點缺陷檢測系統(tǒng)設(shè)計

FPGA技術(shù)江湖
15分鐘前

46 閱讀

電源開關(guān)瞬態(tài)保護(hù)設(shè)計方案

德州儀器
22分鐘前

64 閱讀

一文詳解封裝缺陷分類

中科院半導(dǎo)體所
1小時前

106 閱讀

基于TI GaN FET的10kW單相串式逆變器設(shè)計

德州儀器
1小時前

119 閱讀

鐵路客車輔助電源逆變器設(shè)計方案

電源聯(lián)盟
1小時前

124 閱讀

多目標(biāo)優(yōu)化問題的連續(xù)域蟻群算法仿真研究

吳湛
223

5積分

37下載

昆侖通態(tài)MCGS TPC教程

1號娃娃baby
1.34 MB

免費

0下載

WhatRoute macOS網(wǎng)絡(luò)診斷實用程序

qjqb
0.34 MB

免費

0下載

ImageViewer安卓圖片瀏覽器

時見棲鴉
1.19 MB

2積分

3下載

UsualToolCMS內(nèi)容管理系統(tǒng)及快速建站框架

王娟
0.01 MB

免費

0下載

PWM相移問題：下面是我的代碼，請問各位大佬是什么原因?qū)е碌模?/span>

jf_08053489
11小時前

21 閱讀

【RA-Eco-RA6M4開發(fā)板評測】開箱+Keil環(huán)境搭建+點燈

gtbestom
11小時前

107 閱讀

【HZ-RK3568開發(fā)板免費體驗】合眾HZ-RK3568開發(fā)環(huán)境搭建

ouxiaolong
1天前

82 閱讀

【運(yùn)算放大器參數(shù)解析與LTspice應(yīng)用仿真閱讀體驗】+ 第二章學(xué)習(xí)心得

meiyaolei
1天前

95 閱讀

匠芯創(chuàng)D133CBS RISC-V KunLun Pi V1.0開發(fā)板開發(fā)資料

ElecFans小喇叭
1天前

346 閱讀

推薦專欄
更多

企業(yè)產(chǎn)品

資料

方案
更多

搜索歷史

NVIDIA推出生成式AI微服務(wù)，供開發(fā)者在CUDA GPU系統(tǒng)中創(chuàng)建部署生成式AI助手

評論

NVIDIA推出生成式AI微服務(wù)，供開發(fā)者在CUDA GPU系統(tǒng)中創(chuàng)建部署生成式AI助手