NVIDIA 于今日推出數(shù)十項企業(yè)級生成式 AI 微服務(wù),企業(yè)可以利用這些微服務(wù)在自己的平臺上創(chuàng)建和部署定制應(yīng)用,同時保留對知識產(chǎn)權(quán)的完整所有權(quán)和控制權(quán)。
這些云原生微服務(wù)目錄在NVIDIA CUDA平臺上開發(fā),其中包括NVIDIA NIM微服務(wù),可適用于 NVIDIA 及合作伙伴生態(tài)系統(tǒng)中 20 多個熱門的 AI 模型進(jìn)行推理優(yōu)化。此外,用戶現(xiàn)能夠以NVIDIA CUDA-X微服務(wù)的形式使用 NVIDIA 加速軟件開發(fā)套件、庫和工具,用于檢索增強(qiáng)生成(RAG)、護(hù)欄、數(shù)據(jù)處理、HPC 等。NVIDIA 還發(fā)布了 20 多項醫(yī)療 NIM 和 CUDA-X 微服務(wù)。
這些精心挑選的微服務(wù)為 NVIDIA 全棧計算平臺增添了新的一層,連接起了由模型開發(fā)人員、平臺提供商和企業(yè)組成的 AI 生態(tài)系統(tǒng),使其能夠通過標(biāo)準(zhǔn)化的路徑來運(yùn)行針對 NVIDIA CUDA 安裝基礎(chǔ)(在云、數(shù)據(jù)中心、工作站和 PC 中的數(shù)以億計的 GPU)優(yōu)化的定制 AI 模型。
NVIDIA 創(chuàng)始人兼首席執(zhí)行官黃仁勛表示:“成熟的企業(yè)平臺坐擁數(shù)據(jù)金礦,這些數(shù)據(jù)可以轉(zhuǎn)化為生成式 AI 助手。我們與合作伙伴生態(tài)系統(tǒng)一起創(chuàng)建的這些容器化 AI 微服務(wù),是各行業(yè)企業(yè)成為 AI 公司的基石?!?/strong>
NIM 推理微服務(wù)將部署時間從幾周縮短至幾分鐘
NIM 微服務(wù)提供基于 NVIDIA 推理軟件的預(yù)構(gòu)建容器,包括 Triton 推理服務(wù)器 和 TensorRT-LLM,使開發(fā)者能夠?qū)⒉渴饡r間從幾周縮短至幾分鐘。
它們?yōu)檎Z言、語音和藥物發(fā)現(xiàn)等領(lǐng)域提供行業(yè)標(biāo)準(zhǔn) API,使開發(fā)者能夠使用安全托管在自己的基礎(chǔ)設(shè)施中的專有數(shù)據(jù),來快速構(gòu)建 AI 應(yīng)用。這些應(yīng)用可按需擴(kuò)展,從而為在 NVIDIA 加速計算平臺上運(yùn)行生產(chǎn)級生成式 AI 提供靈活性和性能。
面向 RAG、數(shù)據(jù)處理、護(hù)欄、HPC 的 CUDA-X 微服務(wù)
CUDA-X 微服務(wù)為數(shù)據(jù)準(zhǔn)備、定制和訓(xùn)練提供端到端的構(gòu)建模塊,助力各行各業(yè)加快開發(fā)生產(chǎn)級 AI。
為了加快 AI 采用,企業(yè)可以使用 CUDA-X 微服務(wù),包括用于定制語音和翻譯 AI 的 NVIDIA Riva、用于路由優(yōu)化的 NVIDIA cuOpt,以及用于高分辨率氣候和天氣模擬的 NVIDIA Earth-2。
生態(tài)系統(tǒng)通過生成式 AI 微服務(wù)賦能企業(yè)平臺
除了領(lǐng)先的應(yīng)用提供商外,NVIDIA 生態(tài)系統(tǒng)中的數(shù)據(jù)、基礎(chǔ)設(shè)施和計算平臺提供商也在使用 NVIDIA 微服務(wù),為企業(yè)帶來生成式 AI。
包括 Box、Cloudera、Cohesity、Datastax、Dropbox 和 NetApp 在內(nèi)的頂級數(shù)據(jù)平臺提供商正在使用 NVIDIA 微服務(wù),幫助客戶優(yōu)化 RAG 管道,并將專有數(shù)據(jù)集成到生成式 AI 應(yīng)用中。Snowflake 正在使用 NeMo Retriever,充分利用企業(yè)數(shù)據(jù)來構(gòu)建 AI 應(yīng)用。
可用性
開發(fā)者可以在 ai.nvidia.com 免費試用 NVIDIA 微服務(wù)。企業(yè)則可以在 NVIDIA 認(rèn)證系統(tǒng)和領(lǐng)先的云平臺上使用 NVIDIA AI Enterprise 5.0 部署生產(chǎn)級 NIM 微服務(wù)。
審核編輯:劉清
-
NVIDIA
+關(guān)注
關(guān)注
14文章
5309瀏覽量
106347 -
GPU芯片
+關(guān)注
關(guān)注
1文章
305瀏覽量
6197 -
生成式AI
+關(guān)注
關(guān)注
0文章
531瀏覽量
811
原文標(biāo)題:GTC24 | NVIDIA 推出生成式 AI 微服務(wù),供開發(fā)者在 CUDA GPU 系統(tǒng)中創(chuàng)建部署生成式 AI 助手
文章出處:【微信號:NVIDIA_China,微信公眾號:NVIDIA英偉達(dá)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
NVIDIA發(fā)布全新NIM AI Guardrail微服務(wù)
NVIDIA 發(fā)布保障代理式 AI 應(yīng)用安全的 NIM 微服務(wù)
Cirium發(fā)布業(yè)界首款生成式AI準(zhǔn)點率助手
NVIDIA Omniverse擴(kuò)展至生成式物理AI領(lǐng)域
NVIDIA推出多個生成式AI模型和藍(lán)圖
NVIDIA 推出高性價比的生成式 AI 超級計算機(jī)

NVIDIA推出全新生成式AI模型Fugatto
NVIDIA助力Amdocs打造生成式AI智能體
在設(shè)備上利用AI Edge Torch生成式API部署自定義大語言模型

NVIDIA AI助力SAP生成式AI助手Joule加速發(fā)展
全新NVIDIA NIM微服務(wù)將生成式AI引入數(shù)字環(huán)境
NVIDIA攜手Meta推出AI服務(wù),為企業(yè)提供生成式AI服務(wù)
英偉達(dá)推出全新NVIDIA AI Foundry服務(wù)和NVIDIA NIM推理微服務(wù)
使用OpenVINO GenAI API的輕量級生成式AI
NVIDIA AI Foundry 為全球企業(yè)打造自定義 Llama 3.1 生成式 AI 模型

評論