一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

NVIDIA GPU Operator的新功能介紹

星星科技指導(dǎo)員 ? 來(lái)源:NVIDIA ? 作者:NVIDIA ? 2022-04-11 16:44 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

在 Kubernetes 中使用 GPU 可靠地配置服務(wù)器可能很快變得復(fù)雜,因?yàn)楸仨毎惭b和管理多個(gè)組件才能使用 GPU。 GPU 運(yùn)營(yíng)商基于運(yùn)營(yíng)商框架,簡(jiǎn)化了 GPU 服務(wù)器的初始部署和管理。 NVIDIA , Red Hat 和社區(qū)中的其他人合作創(chuàng)建了 GPU 運(yùn)營(yíng)商。

要在 Kubernetes 群集中配置 GPU 工作節(jié)點(diǎn),需要以下 NVIDIA 軟件組件:

NVIDIA driver

NVIDIA 容器工具包

Kubernetes 設(shè)備插件

Monitoring

這些組件應(yīng)該在 GPU 資源可用于集群之前進(jìn)行配置,并在集群操作期間進(jìn)行管理。

GPU 操作員通過(guò)將所有組件封裝起來(lái),簡(jiǎn)化了組件的初始部署和管理。它使用標(biāo)準(zhǔn)的 kubernetes api 來(lái)自動(dòng)化和管理這些組件,包括版本控制和升級(jí)。 GPU 操作符是完全開源的。它在 NGC 上提供,并且是 NVIDIA EGX Stack和 Red Hat OpenShift 的一部分。

最新的 GPU 操作員版本 1 . 6 和 1 . 7 包括幾個(gè)新功能:

支持使用 NVIDIA 安培體系結(jié)構(gòu)產(chǎn)品自動(dòng)配置 MIG 幾何圖形

支持預(yù)安裝的 NVIDIA 驅(qū)動(dòng)程序和 NVIDIA 容器工具包

更新了對(duì) Red Hat OpenShift 4 . 7 的支持

更新了 GPU 驅(qū)動(dòng)程序版本,包括對(duì) NVIDIA A40 、 A30 和 A10 的支持

使用 Containerd 支持 RuntimeClass

多實(shí)例 GPU 支持

多實(shí)例 GPU ( MIG )擴(kuò)展了每個(gè) NVIDIA A100 TensorCoreGPU 的性能和價(jià)值。 MIG 可以將 A100 或 A30 GPU 劃分為多達(dá)七個(gè)實(shí)例( A100 )或四個(gè)實(shí)例( A30 ),每個(gè)實(shí)例都用自己的高帶寬內(nèi)存、緩存和計(jì)算核心完全隔離。

如果沒有 MIG ,在同一 GPU 上運(yùn)行的不同作業(yè)(如不同的 AI 推斷請(qǐng)求)將爭(zhēng)奪相同的資源(如內(nèi)存帶寬)。使用 MIG ,作業(yè)在不同的實(shí)例上同時(shí)運(yùn)行,每個(gè)實(shí)例都有專用的計(jì)算、內(nèi)存和內(nèi)存帶寬資源。這將產(chǎn)生可預(yù)測(cè)的性能、服務(wù)質(zhì)量和最大 GPU 利用率。因?yàn)橥瑫r(shí)作業(yè)可以操作, MIG 是邊緣計(jì)算用例的理想選擇。

GPU Operator 1 . 7 添加了一個(gè)名為 NVIDIA MIG Kubernetes Manager, 的新組件,它作為守護(hù)程序運(yùn)行,管理每個(gè)節(jié)點(diǎn)上的 MIG 模式和 MIG 配置更改。您可以在節(jié)點(diǎn)上應(yīng)用 MIG 配置,方法是添加一個(gè)指示要應(yīng)用的預(yù)定義配置名稱的標(biāo)簽。應(yīng)用 MIG 配置后, GPU 運(yùn)算符自動(dòng)驗(yàn)證是否按預(yù)期應(yīng)用了 MIG 更改。

預(yù)裝驅(qū)動(dòng)程序和容器工具包

GPU Operator 1 . 7 現(xiàn)在支持有選擇地安裝 NVIDIA 驅(qū)動(dòng)程序和容器工具包(容器配置)組件。這個(gè)新特性為預(yù)安裝驅(qū)動(dòng)程序或 nvidia-docker2 包的環(huán)境提供了極大的靈活性。這些環(huán)境現(xiàn)在可以使用 GPU 操作符簡(jiǎn)化對(duì)其他軟件組件的管理,如設(shè)備插件、 GPU 功能發(fā)現(xiàn)插件、用于監(jiān)視的 DCGM 導(dǎo)出器或用于 Kubernetes 的 MIG 管理器。

只預(yù)裝驅(qū)動(dòng)程序的 Install 命令:

 helm install --wait --generate-name \
  nvidia/gpu-operator \
  --set driver.enabled=false 

預(yù)裝驅(qū)動(dòng)程序和nvidia-docker2的 Install 命令:

 helm install --wait --generate-name \
  nvidia/gpu-operator \
  --set driver.enabled=false
  --set toolkit.enabled=false 

增加了對(duì) Red Hat OpenShift 的支持

我們繼續(xù)支持 Red Hat OpenShift ,

GPU Operator 1 . 6 和 1 . 7 支持最新的 Red Hat OpenShift 4 . 7 版本。

GPU 運(yùn)算符 1 . 5 支持 Red Hat OpenShift 4 . 6 。

GPU 操作符 1 . 4 和 1 . 3 分別支持 Red Hat OpenShift 4 . 5 和 4 . 4 。

GPU 操作員是經(jīng)過(guò) OpenShift 認(rèn)證的操作員。通過(guò) OpenShift web 控制臺(tái),只需單擊幾下鼠標(biāo)即可安裝并開始使用 GPU 操作符。作為一名經(jīng)過(guò)認(rèn)證的操作員,使用 NVIDIA GPU s 和 Red Hat OpenShift 非常容易。

GPU 對(duì) NVIDIA A40 、 A30 和 A10 的驅(qū)動(dòng)程序支持

我們更新了 GPU 驅(qū)動(dòng)程序版本,包括對(duì) NVIDIA A40 、 A30 和 A10 的支持。

NVIDIA A40

NVIDIA A40 提供了設(shè)計(jì)師、工程師、藝術(shù)家和科學(xué)家所需的基于數(shù)據(jù)中心的解決方案,以應(yīng)對(duì)當(dāng)今的挑戰(zhàn)。 A40 基于 NVIDIA 安培架構(gòu),結(jié)合了最新一代 RT 核、張量核和 CUDA 核。它有 48 GB 的圖形內(nèi)存,用于前所未有的圖形、渲染、計(jì)算和人工智能性能。從功能強(qiáng)大的虛擬工作站到專用的渲染和計(jì)算節(jié)點(diǎn), A40 旨在處理來(lái)自數(shù)據(jù)中心的最苛刻的可視化計(jì)算工作負(fù)載。

NVIDIA A30

NVIDIA A30 張量核 GPU 是用于人工智能推理和企業(yè)工作負(fù)載的最通用的主流計(jì)算機(jī) GPU 。具有 MIG 的 Tensor 內(nèi)核與 165W 低功耗外殼中的快速內(nèi)存帶寬結(jié)合在一起,所有這些都采用 PCIe 外形,是主流服務(wù)器的理想選擇。

A30 是為大規(guī)模人工智能推理而構(gòu)建的,它還可以使用 TF32 快速重新訓(xùn)練人工智能模型,并使用 FP64 張量核加速高性能計(jì)算的應(yīng)用。 NVIDIA 安培體系結(jié)構(gòu)張量?jī)?nèi)核和 MIG 的結(jié)合在不同的工作負(fù)載上提供了安全的加速,所有這些都由一個(gè)多功能的 GPU 提供動(dòng)力,實(shí)現(xiàn)了彈性數(shù)據(jù)中心。多功能 A30 計(jì)算能力為主流企業(yè)提供最大價(jià)值。

NVIDIA A10

NVIDIA A10 張量核 GPU 是具有人工智能的主流媒體和圖形的理想 GPU 。第二代 RT 核和第三代 Tensor 核通過(guò)強(qiáng)大的 AI 豐富了圖形和視頻應(yīng)用程序。 NVIDIA A10 為密集服務(wù)器提供了一個(gè)寬、全高、全長(zhǎng) PCIe 外形尺寸和 150W 電源外殼。

NVIDIA A10 Tensor Core GPU 專為具有強(qiáng)大 AI 功能的圖形、媒體和云游戲應(yīng)用程序而設(shè)計(jì),可提供豐富的媒體體驗(yàn)。與 NVIDIA T4 張量?jī)?nèi)核 GPU 相比,它提供了高達(dá) 4k 的云游戲,圖形性能是 NVIDIA T4 張量?jī)?nèi)核的 2 . 5 倍,推理性能是 GPU 的 3 倍以上。

對(duì) Containerd 的 RuntimeClass 支持

RuntimeClass 為您提供了選擇每個(gè) Pod 的容器運(yùn)行時(shí)配置,然后為每個(gè)節(jié)點(diǎn)上的所有 Pod 應(yīng)用默認(rèn)運(yùn)行時(shí)配置的靈活性。通過(guò)這種支持,您可以為運(yùn)行 GPU – 加速工作負(fù)載的 pod 指定特定的運(yùn)行時(shí)配置,并為通用工作負(fù)載選擇其他運(yùn)行時(shí)。

GPU Operator v1 . 7 . 0 現(xiàn)在支持在安裝過(guò)程中將默認(rèn)運(yùn)行時(shí)選擇為 containerd 時(shí)自動(dòng)創(chuàng)建 nvidia RuntimeClass 。 運(yùn)行使用 GPU 的應(yīng)用程序時(shí),可以顯式指定此 RuntimeClass 名稱。

 apiVersion: node.k8s.io/v1beta1
 handler: nvidia
 kind: RuntimeClass
 metadata:
 labels:
  app.kubernetes.io/component: gpu-operator

name: nvidia 關(guān)于作者

Troy Estes 是 NVIDIA Edge 和企業(yè)計(jì)算解決方案的產(chǎn)品營(yíng)銷經(jīng)理。在加入 Edge & Enterprise 業(yè)務(wù)部門之前,特洛伊曾在自主汽車業(yè)務(wù)部門和 NVIDIA 電網(wǎng)產(chǎn)品集團(tuán)從事營(yíng)銷活動(dòng)和支持產(chǎn)品 GTM 。

Erik Bohnhorst 是 NVIDIA 的高級(jí)產(chǎn)品經(jīng)理,專注于云本地技術(shù),為 edge 和數(shù)據(jù)中心構(gòu)建一流的解決方案。 Erik 于 2014 年加入 NVIDIA ,以解決方案架構(gòu)師的身份幫助客戶構(gòu)建世界一流的虛擬化遠(yuǎn)程工作站。埃里克領(lǐng)導(dǎo)技術(shù)營(yíng)銷團(tuán)隊(duì),直到他加入了 EGX 團(tuán)隊(duì)。

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5308

    瀏覽量

    106342
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    4943

    瀏覽量

    131203
  • 人工智能
    +關(guān)注

    關(guān)注

    1806

    文章

    49008

    瀏覽量

    249289
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    NVIDIA實(shí)現(xiàn)神經(jīng)網(wǎng)絡(luò)渲染技術(shù)的突破性增強(qiáng)功能

    近日,NVIDIA 宣布了 NVIDIA RTX 神經(jīng)網(wǎng)絡(luò)渲染技術(shù)的突破性增強(qiáng)功能NVIDIA 與微軟合作,將在 4 月的 Microsoft DirectX 預(yù)覽版中增加神經(jīng)網(wǎng)絡(luò)著
    的頭像 發(fā)表于 04-07 11:33 ?439次閱讀

    NVIDIA虛擬GPU 18.0版本的亮點(diǎn)

    NVIDIA 虛擬 GPU(vGPU)技術(shù)可在虛擬桌面基礎(chǔ)設(shè)施(VDI)中解鎖 AI 功能,使其比以往更加強(qiáng)大、用途更加廣泛。vGPU 通過(guò)為各種虛擬化環(huán)境中的 AI 驅(qū)動(dòng)工作負(fù)載提供動(dòng)力,提高了
    的頭像 發(fā)表于 04-07 11:28 ?677次閱讀

    使用NVIDIA RTX PRO Blackwell系列GPU加速AI開發(fā)

    NVIDIA GTC 推出新一代專業(yè)級(jí) GPU 和 AI 賦能的開發(fā)者工具—同時(shí),ChatRTX 更新現(xiàn)已支持 NVIDIA NIM,RTX Remix 正式結(jié)束測(cè)試階段,本月的 NVIDIA
    的頭像 發(fā)表于 03-28 09:59 ?618次閱讀

    NVIDIA GPU助力科研人員探索外星世界

    NVIDIA GPU 驅(qū)動(dòng)的深度學(xué)習(xí)在短短幾秒內(nèi)解讀出了卡西尼號(hào)土星探測(cè)器多年來(lái)收集的海量數(shù)據(jù),為科研人員探索外星世界提供了更加智能的方式。
    的頭像 發(fā)表于 02-27 10:37 ?560次閱讀

    NVIDIA和GeForce RTX GPU專為AI時(shí)代打造

    NVIDIA 和 GeForce RTX GPU 專為 AI 時(shí)代打造。
    的頭像 發(fā)表于 01-06 10:45 ?656次閱讀

    借助NVIDIA GPU提升魯班系統(tǒng)CAE軟件計(jì)算效率

    本案例中魯班系統(tǒng)高性能 CAE 軟件利用 NVIDIA 高性能 GPU,實(shí)現(xiàn)復(fù)雜產(chǎn)品的快速仿真,加速產(chǎn)品開發(fā)和設(shè)計(jì)迭代,縮短開發(fā)周期,提升產(chǎn)品競(jìng)爭(zhēng)力。
    的頭像 發(fā)表于 12-27 16:24 ?671次閱讀

    《CST Studio Suite 2024 GPU加速計(jì)算指南》

    指定GPU設(shè)備數(shù)量。 - 批處理模式:使用命令行開關(guān)(-withgpu),并給出了Windows和Linux下的使用示例。 5. NVIDIA使用指南 - ECC功能:可檢測(cè)和糾正GPU
    發(fā)表于 12-16 14:25

    解析NVIDIA JetPack 6.1的新功能

    NVIDIA JetPack一直在不斷發(fā)展,通過(guò)提供量身定制的先進(jìn)軟件滿足邊緣 AI 和機(jī)器人開發(fā)者日益增長(zhǎng)的需求。每次發(fā)布的 JetPack 新版本都會(huì)升級(jí)性能、加入新功能與優(yōu)化現(xiàn)有工具,以便為
    的頭像 發(fā)表于 11-28 10:41 ?1044次閱讀
    解析<b class='flag-5'>NVIDIA</b> JetPack 6.1的<b class='flag-5'>新功能</b>

    OpenAI計(jì)劃明年1月發(fā)布首款A(yù)I助理產(chǎn)品“Operator

    ,“Operator”將具備強(qiáng)大的功能,包括但不限于編寫代碼、預(yù)訂旅行以及自動(dòng)電商購(gòu)物等。這些功能的實(shí)現(xiàn),將依賴于OpenAI在人工智能技術(shù)領(lǐng)域的深厚積累和不斷創(chuàng)新。 根據(jù)內(nèi)部員工的爆料,OpenAI預(yù)計(jì)將在2025年1月正式推
    的頭像 發(fā)表于 11-14 14:03 ?1136次閱讀

    AMD與NVIDIA GPU優(yōu)缺點(diǎn)

    在圖形處理單元(GPU)市場(chǎng),AMD和NVIDIA是兩大主要的競(jìng)爭(zhēng)者,它們各自推出的產(chǎn)品在性能、功耗、價(jià)格等方面都有著不同的特點(diǎn)和優(yōu)勢(shì)。 一、性能 GPU的性能是用戶最關(guān)心的指標(biāo)之一。在高端市場(chǎng)
    的頭像 發(fā)表于 10-27 11:15 ?2473次閱讀

    Zigbee 3.0的新功能

    電子發(fā)燒友網(wǎng)站提供《Zigbee 3.0的新功能.pdf》資料免費(fèi)下載
    發(fā)表于 09-26 10:45 ?3次下載
    Zigbee 3.0的<b class='flag-5'>新功能</b>

    NVIDIA Parabricks v4.3.1版本的新功能

    會(huì)(ESHG)上發(fā)布,其加入了新的體細(xì)胞數(shù)據(jù)變異檢測(cè)功能,并將業(yè)內(nèi)領(lǐng)先的工具升級(jí)到最新版本。這個(gè)版本是繼在 NVIDIA GTC 2024 大會(huì)上發(fā)布 Parabricks v4.3 之后推出的新版本。
    的頭像 發(fā)表于 09-10 10:22 ?809次閱讀
    <b class='flag-5'>NVIDIA</b> Parabricks v4.3.1版本的<b class='flag-5'>新功能</b>

    NVIDIA JetPack 6.0版本的關(guān)鍵功能

    NVIDIA JetPack SDK 支持 NVIDIA Jetson 模塊,為構(gòu)建端到端加速 AI 應(yīng)用提供全面的解決方案。JetPack 6 通過(guò)微服務(wù)和一系列新功能,擴(kuò)展了 Jetson 平臺(tái)的靈活性和可擴(kuò)展性,是 202
    的頭像 發(fā)表于 09-09 10:18 ?1075次閱讀
    <b class='flag-5'>NVIDIA</b> JetPack 6.0版本的關(guān)鍵<b class='flag-5'>功能</b>

    暴漲預(yù)警!NVIDIA GPU供應(yīng)大跳水

    gpu
    jf_02331860
    發(fā)布于 :2024年07月26日 09:41:42

    NVIDIA全面轉(zhuǎn)向開源GPU內(nèi)核模塊

    借助 R515 驅(qū)動(dòng)程序,NVIDIA 于 2022 年 5 月發(fā)布了一套開源的 Linux GPU 內(nèi)核模塊,該模塊采用雙許可證,即 GPL 和 MIT 許可。初始版本主要面向數(shù)據(jù)中心計(jì)算 GPU,而 GeForce 和工作站
    的頭像 發(fā)表于 07-25 09:56 ?1067次閱讀
    <b class='flag-5'>NVIDIA</b>全面轉(zhuǎn)向開源<b class='flag-5'>GPU</b>內(nèi)核模塊