一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

使用NVIDIA Triton推理服務(wù)器來加速AI預(yù)測(cè)

NVIDIA英偉達(dá)企業(yè)解決方案 ? 來源:NVIDIA英偉達(dá)企業(yè)解決方案 ? 2024-02-29 14:04 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

這家云計(jì)算巨頭的計(jì)算機(jī)視覺和數(shù)據(jù)科學(xué)服務(wù)使用 NVIDIA Triton 推理服務(wù)器來加速 AI 預(yù)測(cè)。

作為一名狂熱的自行車愛好者,Thomas Park 深知擁有多個(gè)變速檔位對(duì)于平穩(wěn)、快速騎行的重要性。

因此,當(dāng)這位軟件架構(gòu)師為 Oracle Cloud Infrastructure(OCI)的視覺 AI 服務(wù)設(shè)計(jì) AI 推理平臺(tái)時(shí),他選擇了 NVIDIA Triton 推理服務(wù)器,因?yàn)樗梢酝ㄟ^變換“檔位”,來快速高效地處理幾乎任何 AI 模型、框架、硬件和運(yùn)行模式。

Park 表示:“NVIDIA AI推理平臺(tái)為我們的全球云服務(wù)客戶帶來了巨大的靈活性,讓他們可以構(gòu)建和運(yùn)行 AI 應(yīng)用。”Park 是一位在蘇黎世工作的計(jì)算機(jī)工程師,同時(shí)也是一名富有競(jìng)爭(zhēng)力的自行車手,他曾先后就職于四家全球超大型云服務(wù)提供商。

具體而言,Triton 將 OCI 的總擁有成本降低了 10%、將遷移到 Triton 的 OCI 視覺和文檔理解服務(wù)模型的預(yù)測(cè)吞吐量提高了 76%,并將推理延遲降低了 51%。Park 和一位同事在今年早些時(shí)候發(fā)布的一篇 Oracle 博客中指出,全球有超過 45 個(gè)區(qū)域數(shù)據(jù)中心在運(yùn)行這些服務(wù)。

計(jì)算機(jī)視覺加速深入洞察

依靠 OCI 視覺 AI,客戶可以進(jìn)行各種物體檢測(cè)和圖像分類工作。例如,美國(guó)的一家運(yùn)輸公司利用它來自動(dòng)檢測(cè)經(jīng)過的車軸數(shù),以計(jì)算和結(jié)算過橋費(fèi),從而節(jié)省了忙碌的卡車司機(jī)在收費(fèi)站的等待時(shí)間。

OCI AI 還通過 Oracle NetSuite 提供,Oracle NetSuite 是全球 37,000 多個(gè)企業(yè)組織使用的一套商業(yè)應(yīng)用程序,它可以用于自動(dòng)識(shí)別發(fā)票等工作。

在 Park 的努力下,Triton 如今也被其他 OCI 服務(wù)所采用。

能夠識(shí)別 Triton 的數(shù)據(jù)服務(wù)

負(fù)責(zé)處理 Oracle 內(nèi)外部用戶機(jī)器學(xué)習(xí)事務(wù)的 OCI 數(shù)據(jù)科學(xué)服務(wù)產(chǎn)品管理總監(jiān) Tzvi Keisar 表示:“我們的 AI 平臺(tái)能夠識(shí)別 Triton,以造福于我們的客戶?!?/p>

Keisar 提到:“想要使用 Triton 的客戶不必?fù)?dān)心配置問題,因?yàn)槠脚_(tái)會(huì)自動(dòng)完成配置,為他們啟動(dòng)一個(gè) Triton 驅(qū)動(dòng)的推理終端節(jié)點(diǎn)。”

Triton 包含在 NVIDIA AI Enterprise 中,該平臺(tái)可提供企業(yè)所需的全方位的安全和支持,并且可以在 OCI Marketplace 上獲得

一個(gè)龐大的 SaaS 平臺(tái)

OCI 的數(shù)據(jù)科學(xué)服務(wù)是一個(gè)適用于 Oracle NetSuite 和 Oracle Fusion 應(yīng)用程序的機(jī)器學(xué)習(xí)平臺(tái)。

“這些商業(yè)應(yīng)用套件規(guī)模龐大,有數(shù)以萬計(jì)的客戶也在我們的服務(wù)上構(gòu)建他們的框架?!盞eisar 說。

這些客戶主要是來自于制造業(yè)、零售業(yè)、交通運(yùn)輸業(yè)等行業(yè)的企業(yè)用戶。他們正在構(gòu)建和使用幾乎所有形態(tài)與規(guī)模的 AI 模型。

推理是該團(tuán)隊(duì)推出的首批服務(wù)之一,而 Triton 在推出后不久就進(jìn)入了該團(tuán)隊(duì)的視線。

最佳的推理框架

“我們看到 Triton 作為一流的服務(wù)框架越來越受歡迎,于是開始試用?!盞eisar 說,“我們發(fā)現(xiàn)它的性能非常出色,彌補(bǔ)了現(xiàn)有產(chǎn)品的不足,尤其是在多模型推理方面。它是目前功能最全面、最先進(jìn)的推理框架?!?/p>

Triton 于 3 月在 OCI 上發(fā)布,已經(jīng)吸引了 Oracle 許多內(nèi)部團(tuán)隊(duì)的關(guān)注。他們希望將其用于需要同時(shí)運(yùn)行多個(gè) AI 模型以作出預(yù)測(cè)的推理工作。

他表示:“當(dāng)用于部署在單個(gè)端點(diǎn)上的多個(gè)模型時(shí),Triton 的表現(xiàn)和性能都非常好?!?/p>

加快未來發(fā)展

展望未來,復(fù)雜的大語言模型(LLM)激發(fā)了眾多用戶的想象力。為了能夠在未來為這些模型上的推理提供更強(qiáng)大的助力,Keisar 的團(tuán)隊(duì)正在對(duì) NVIDIA TensorRT-LLM 軟件進(jìn)行評(píng)估。

身為一名活躍的博主,Keisar 在其最新文章中詳細(xì)介紹了在 NVIDIA A10 Tensor Core GPU 上運(yùn)行具有高達(dá) 700 億參數(shù)的 Llama 2 LLM 的量化技術(shù)。

他表示:“即使減低到四位參數(shù),模型輸出的質(zhì)量仍然相當(dāng)不錯(cuò)。在 NVIDIA GPU 上的部署使我們能夠靈活地在延遲、吞吐量和成本之間找到良好的平衡點(diǎn)。”




審核編輯:劉清

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5309

    瀏覽量

    106412
  • 計(jì)算機(jī)視覺
    +關(guān)注

    關(guān)注

    9

    文章

    1709

    瀏覽量

    46779
  • LLM
    LLM
    +關(guān)注

    關(guān)注

    1

    文章

    325

    瀏覽量

    841

原文標(biāo)題:名不虛傳:NVIDIA Triton 加速 Oracle Cloud 上的推理

文章出處:【微信號(hào):NVIDIA-Enterprise,微信公眾號(hào):NVIDIA英偉達(dá)企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    基于RAKsmart云服務(wù)器AI大模型實(shí)時(shí)推理方案設(shè)計(jì)

    面對(duì)高并發(fā)請(qǐng)求、嚴(yán)格的響應(yīng)延遲要求及波動(dòng)的業(yè)務(wù)負(fù)載,傳統(tǒng)本地化部署的算力瓶頸愈發(fā)顯著。RAKsmart云服務(wù)器憑借其彈性計(jì)算資源池、分布式網(wǎng)絡(luò)架構(gòu)與全棧AI加速能力,為AI大模型實(shí)時(shí)
    的頭像 發(fā)表于 05-13 10:33 ?234次閱讀

    AI 推理服務(wù)器都有什么?2025年服務(wù)器品牌排行TOP10與選購(gòu)技巧

    根據(jù)行業(yè)數(shù)據(jù),AI推理服務(wù)器的性能差異可以達(dá)到10倍以上。比如,用普通服務(wù)器跑一個(gè)700億參數(shù)的大模型,可能需要30秒才能出結(jié)果,而用頂級(jí)服務(wù)器
    的頭像 發(fā)表于 04-09 11:06 ?1068次閱讀
    <b class='flag-5'>AI</b> <b class='flag-5'>推理</b><b class='flag-5'>服務(wù)器</b>都有什么?2025年<b class='flag-5'>服務(wù)器</b>品牌排行TOP10與選購(gòu)技巧

    國(guó)產(chǎn)推理服務(wù)器如何選擇?深度解析選型指南與華頡科技實(shí)戰(zhàn)案例

    人工智能技術(shù)的爆發(fā)催生了對(duì)推理算力的迫切需求,而進(jìn)口服務(wù)器的高成本與技術(shù)依賴性,推動(dòng)了國(guó)產(chǎn)推理服務(wù)器的快速發(fā)展。據(jù)IDC預(yù)測(cè),到2025年,
    的頭像 發(fā)表于 03-24 17:11 ?486次閱讀
    國(guó)產(chǎn)<b class='flag-5'>推理</b><b class='flag-5'>服務(wù)器</b>如何選擇?深度解析選型指南與華頡科技實(shí)戰(zhàn)案例

    英偉達(dá)GTC2025亮點(diǎn):Oracle與NVIDIA合作助力企業(yè)加速代理式AI推理

    Oracle 數(shù)據(jù)庫(kù)與 NVIDIA AI 相集成,使企業(yè)能夠更輕松、快捷地采用代理式 AI Oracle 和 NVIDIA 宣布,NVIDIA
    的頭像 發(fā)表于 03-21 12:01 ?703次閱讀
    英偉達(dá)GTC2025亮點(diǎn):Oracle與<b class='flag-5'>NVIDIA</b>合作助力企業(yè)<b class='flag-5'>加速</b>代理式<b class='flag-5'>AI</b><b class='flag-5'>推理</b>

    英偉達(dá)GTC25亮點(diǎn):NVIDIA Dynamo開源庫(kù)加速并擴(kuò)展AI推理模型

    Triton 推理服務(wù)器的后續(xù)產(chǎn)品,NVIDIA Dynamo 是一款全新的 AI 推理
    的頭像 發(fā)表于 03-20 15:03 ?649次閱讀

    Oracle 與 NVIDIA 合作助力企業(yè)加速代理式 AI 推理

    ——Oracle 和 NVIDIA 今日宣布,NVIDIA 加速計(jì)算和推理軟件與 Oracle 的 AI 基礎(chǔ)設(shè)施以及生成式
    發(fā)表于 03-19 15:24 ?358次閱讀
    Oracle 與 <b class='flag-5'>NVIDIA</b> 合作助力企業(yè)<b class='flag-5'>加速</b>代理式 <b class='flag-5'>AI</b> <b class='flag-5'>推理</b>

    使用NVIDIA推理平臺(tái)提高AI推理性能

    NVIDIA推理平臺(tái)提高了 AI 推理性能,為零售、電信等行業(yè)節(jié)省了數(shù)百萬美元。
    的頭像 發(fā)表于 02-08 09:59 ?721次閱讀
    使用<b class='flag-5'>NVIDIA</b><b class='flag-5'>推理</b>平臺(tái)提高<b class='flag-5'>AI</b><b class='flag-5'>推理</b>性能

    GPU加速服務(wù)器怎么用的

    GPU加速服務(wù)器是將GPU硬件與云計(jì)算服務(wù)相結(jié)合,通過云服務(wù)提供商的平臺(tái),用戶可以根據(jù)需求靈活租用帶有GPU資源的虛擬機(jī)實(shí)例。那么,GPU加速
    的頭像 發(fā)表于 12-26 11:58 ?456次閱讀

    Triton編譯在機(jī)器學(xué)習(xí)中的應(yīng)用

    1. Triton編譯概述 Triton編譯NVIDIA Triton
    的頭像 發(fā)表于 12-24 18:13 ?990次閱讀

    NVIDIA助力麗蟾科技打造AI訓(xùn)練與推理加速解決方案

    麗蟾科技通過 Leaper 資源管理平臺(tái)集成 NVIDIA AI Enterprise,為企業(yè)和科研機(jī)構(gòu)提供了一套高效、靈活的 AI 訓(xùn)練與推理加速
    的頭像 發(fā)表于 10-27 10:03 ?831次閱讀
    <b class='flag-5'>NVIDIA</b>助力麗蟾科技打造<b class='flag-5'>AI</b>訓(xùn)練與<b class='flag-5'>推理</b><b class='flag-5'>加速</b>解決方案

    NVIDIA與思科合作打造企業(yè)級(jí)生成式AI基礎(chǔ)設(shè)施

    NVIDIA 加速計(jì)算平臺(tái)、NVIDIA AI Enterprise 軟件和 NVIDIA NIM
    的頭像 發(fā)表于 10-10 09:35 ?842次閱讀

    什么是AI服務(wù)器?AI服務(wù)器的優(yōu)勢(shì)是什么?

    AI服務(wù)器是一種專門為人工智能應(yīng)用設(shè)計(jì)的服務(wù)器,它采用異構(gòu)形式的硬件架構(gòu),通常搭載GPU、FPGA、ASIC等加速芯片,利用CPU與加速芯片
    的頭像 發(fā)表于 09-21 11:43 ?2040次閱讀

    AMD助力HyperAccel開發(fā)全新AI推理服務(wù)器

    HyperAccel 是一家成立于 2023 年 1 月的韓國(guó)初創(chuàng)企業(yè),致力于開發(fā) AI 推理專用型半導(dǎo)體器件和硬件,最大限度提升推理工作負(fù)載的存儲(chǔ)帶寬使用,并通過將此解決方案應(yīng)用于
    的頭像 發(fā)表于 09-18 09:37 ?883次閱讀
    AMD助力HyperAccel開發(fā)全新<b class='flag-5'>AI</b><b class='flag-5'>推理</b><b class='flag-5'>服務(wù)器</b>

    NVIDIA助力提供多樣、靈活的模型選擇

    在本案例中,Dify 以模型中立以及開源生態(tài)的優(yōu)勢(shì),為廣大 AI 創(chuàng)新者提供豐富的模型選擇。其集成的 NVIDIAAPI Catalog、NVIDIA NIM和Triton 推理
    的頭像 發(fā)表于 09-09 09:19 ?935次閱讀

    英偉達(dá)推出全新NVIDIA AI Foundry服務(wù)NVIDIA NIM推理服務(wù)

    NVIDIA 宣布推出全新 NVIDIA AI Foundry 服務(wù)NVIDIA NIM 推理
    的頭像 發(fā)表于 07-25 09:48 ?1061次閱讀