一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Docker運(yùn)行GPUStack的詳細(xì)教程

馬哥Linux運(yùn)維 ? 來源:CSDN技術(shù)社區(qū) ? 2025-06-06 11:45 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

Docker 運(yùn)行 GPUStack 的詳細(xì)教程

GPUStack

GPUStack 是一個(gè)用于運(yùn)行 AI 模型的開源 GPU集群管理器。它具有廣泛的硬件兼容性,支持多種品牌的 GPU,并能在 Apple MacBook、Windows PC 和 Linux 服務(wù)器上運(yùn)行。GPUStack 支持各種 AI 模型,包括大型語言模型(LLMs)、擴(kuò)散模型、音頻模型、嵌入模型和重新排序模型。GPUStack 可以輕松擴(kuò)展,只需添加更多 GPU 或節(jié)點(diǎn)即可擴(kuò)展操作。它支持單節(jié)點(diǎn)多 GPU 和多節(jié)點(diǎn)推理和服務(wù),并提供多種推理后端,如llama-box、vox-box和vLLM。GPUStack 是一個(gè)輕量級(jí)的 Python 包,具有最小的依賴項(xiàng)和操作開銷,并且提供與 OpenAI 標(biāo)準(zhǔn)兼容的 API。此外,它還簡化了用戶和 API 密鑰的管理,提供了 GPU 性能和利用率的實(shí)時(shí)監(jiān)控,以及令牌使用和速率限制的有效跟蹤。

關(guān)鍵特性

?廣泛的硬件兼容性:支持管理 Apple Mac、Windows PC 和 Linux 服務(wù)器上不同品牌的 GPU。

?廣泛的模型支持:支持從大語言模型(LLMs)、多模態(tài)模型(VLMs)、擴(kuò)散模型、語音模型到嵌入和重新排序模型的廣泛模型。

?異構(gòu) GPU 支持與擴(kuò)展:能夠輕松添加異構(gòu) GPU 資源,并按需擴(kuò)展算力規(guī)模。

?分布式推理:支持單機(jī)多卡并行和多機(jī)多卡并行推理。

?多推理后端支持:支持llama-box(基于 llama.cpp 和 stable-diffusion.cpp)、vox-box和vLLM作為推理后端。

?輕量級(jí) Python 包:最小的依賴和操作開銷。

?OpenAI 兼容 API:提供兼容 OpenAI 標(biāo)準(zhǔn)的 API 服務(wù)。

?用戶和 API 密鑰管理:簡化用戶和 API 密鑰的管理流程。

?GPU 指標(biāo)監(jiān)控:實(shí)時(shí)監(jiān)控 GPU 性能和利用率。

?Token 使用和速率統(tǒng)計(jì):有效跟蹤 token 使用情況,并管理速率限制。

支持的硬件平臺(tái)

?Apple Metal(M 系列芯片)

?NVIDIA CUDA(計(jì)算能力 6.0 及以上)

?AMD ROCm

?華為昇騰CANN)

?摩爾線程(MUSA)

?海光 DTK

支持的模型類型

?大語言模型(LLMs):如 Qwen、LLaMA、Mistral、Deepseek、Phi、Yi 等。

?多模態(tài)模型(VLMs):如 Llama3.2-Vision、Pixtral、Qwen2-VL、LLaVA、InternVL2.5 等。

?擴(kuò)散模型:如 Stable Diffusion、FLUX 等。

?嵌入模型:如 BGE、BCE、Jina 等。

?重新排序模型:如 BGE、BCE、Jina 等。

?語音模型:如 Whisper(語音轉(zhuǎn)文本)、CosyVoice(文本轉(zhuǎn)語音)等。

使用場景

GPUStack 適用于需要高效管理和調(diào)度 GPU 資源的場景,特別是在運(yùn)行 AI 模型時(shí)。它支持單節(jié)點(diǎn)多 GPU 和多節(jié)點(diǎn)推理及服務(wù),并提供多種推理后端,如llama-box、vox-box和vLLM。GPUStack 是一個(gè)輕量級(jí)的 Python 包,具有最小的依賴項(xiàng)和操作開銷,并且提供與 OpenAI 標(biāo)準(zhǔn)兼容的 API。此外,它還簡化了用戶和 API 密鑰的管理,提供了 GPU 性能和利用率的實(shí)時(shí)監(jiān)控,以及令牌使用和速率限制的有效跟蹤。

Docker 運(yùn)行 GPUStack 的詳細(xì)教程

https://docs.gpustack.ai/latest/installation/docker-installation/

以下是使用 Docker 運(yùn)行 GPUStack 的詳細(xì)教程,結(jié)合官方文檔與社區(qū)實(shí)踐整理而成。通過本指南,您可以在支持 NVIDIA GPU 的 Linux 環(huán)境中快速部署 GPUStack,并實(shí)現(xiàn)異構(gòu) GPU 集群的管理與大模型服務(wù)。

d0f627c8-4061-11f0-b715-92fbcf53809c.png

在這里插入圖片描述

d11c2b44-4061-11f0-b715-92fbcf53809c.png

在這里插入圖片描述

一、環(huán)境準(zhǔn)備

1.硬件與系統(tǒng)要求

? 確保系統(tǒng)已安裝 NVIDIA GPU,并驗(yàn)證驅(qū)動(dòng)兼容性(支持 CUDA 11.0 及以上版本)。

? 推薦使用 Ubuntu 22.04 LTS 或 CentOS 7+ 系統(tǒng)。

2.驗(yàn)證 GPU 與依賴項(xiàng)

# 檢查 NVIDIA GPU 是否識(shí)別
lspci | grep -i nvidia

root@i-28e6iose:/home/ubuntu# lspci | grep -i nvidia
00:0c.0 VGA compatible controller: NVIDIA Corporation TU102 [GeForce RTX 2080 Ti] (rev a1)
00:0d.0 Audio device: NVIDIA Corporation TU102 High Definition Audio Controller (rev a1)

# 確認(rèn) GCC 已安裝
gcc --version

root@i-28e6iose:/home/ubuntu# gcc --version
gcc (Ubuntu 9.5.0-6ubuntu2) 9.5.0
Copyright (C) 2019 Free Software Foundation, Inc.
This is free software; see thesourceforcopying conditions. There is NO
warranty; not evenforMERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.

二、安裝 NVIDIA 驅(qū)動(dòng)與 Docker

1.安裝 NVIDIA 驅(qū)動(dòng)

# 安裝內(nèi)核頭文件
sudoapt-get install linux-headers-$(uname-r)
# 添加 CUDA 倉庫并安裝驅(qū)動(dòng)
wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2204/x86_64/cuda-keyring_1.1-1_all.deb
sudodpkg -i cuda-keyring_1.1-1_all.deb
sudoapt-get update
sudoapt-get install nvidia-driver-535 -y
sudoreboot
# 驗(yàn)證驅(qū)動(dòng)
nvidia-smi


root@i-28e6iose:/home/ubuntu# nvidia-smi
Sun Mar 9 2043 2025
+-----------------------------------------------------------------------------------------+
| NVIDIA-SMI 570.124.06       Driver Version: 570.124.06   CUDA Version: 12.8   |
|-----------------------------------------+------------------------+----------------------+
| GPU Name         Persistence-M | Bus-Id     Disp.A | Volatile Uncorr. ECC |
| Fan Temp  Perf     Pwr:Usage/Cap |      Memory-Usage | GPU-Util Compute M. |
|                     |            |        MIG M. |
|=========================================+========================+======================|
|  0 NVIDIA GeForce RTX 2080 Ti   Off |  000000000C.0 Off |         N/A |
| 22%  29C  P8       20W / 250W |    4MiB / 11264MiB |   0%   Default |
|                     |            |         N/A |
+-----------------------------------------+------------------------+----------------------+

+-----------------------------------------------------------------------------------------+
| Processes:                                       |
| GPU  GI  CI       PID  Type  Process name            GPU Memory |
|    ID  ID                                Usage   |
|=========================================================================================|
| No running processes found                               |
+-----------------------------------------------------------------------------------------+

2.安裝 Docker Engine

# 卸載舊版本 Docker(如有)
sudoapt-get remove docker.io docker-doc containerd
# 添加 Docker 官方源
curl -fsSL https://download.docker.com/linux/ubuntu/gpg |sudogpg --dearmor -o /etc/apt/keyrings/docker.gpg
echo"deb [arch=$(dpkg --print-architecture)signed-by=/etc/apt/keyrings/docker.gpg] https://download.docker.com/linux/ubuntu$(lsb_release -cs)stable"|sudotee/etc/apt/sources.list.d/docker.list > /dev/null
sudoapt-get update
sudoapt-get install docker-ce docker-ce-cli containerd.io -y
# 驗(yàn)證 Docker
docker info

root@i-28e6iose:/home/ubuntu# docker info
Client: Docker Engine - Community
Version:  28.0.1
Context:  default
Debug Mode:false
Plugins:
 buildx: Docker Buildx (Docker Inc.)
  Version: v0.21.1
  Path:   /usr/libexec/docker/cli-plugins/docker-buildx
 compose: Docker Compose (Docker Inc.)
  Version: v2.33.1
  Path:   /usr/libexec/docker/cli-plugins/docker-compose

Server:
Containers: 10
 Running: 10
 Paused: 0
 Stopped: 0
Images: 10
Server Version: 28.0.1

3.配置 NVIDIA Container Toolkit

d1391290-4061-11f0-b715-92fbcf53809c.png

在這里插入圖片描述 nvidia/cuda:12.2.0-base-ubuntu22.04是一個(gè)基于 Ubuntu 22.04 操作系統(tǒng)的 NVIDIA CUDA 基礎(chǔ)鏡像,用于運(yùn)行需要GPU 加速的計(jì)算環(huán)境。CUDA(Compute Unified Device Architecture)是 NVIDIA 提供的一個(gè)并行計(jì)算平臺(tái)和編程模型,它使開發(fā)者可以使用 NVIDIA GPU 進(jìn)行高性能計(jì)算。這個(gè)鏡像提供了 CUDA 12.2.0 版本,適用于需要利用 NVIDIA GPU 進(jìn)行深度學(xué)習(xí)、科學(xué)計(jì)算和其他計(jì)算密集型任務(wù)的場景。CUDA 12.2.0 版本帶來了許多改進(jìn)和新特性,包括對(duì)新架構(gòu)的支持、性能優(yōu)化和新 APIhttps://docs.nvidia.com/datacenter/cloud-native/container-toolkit/latest/install-guide.html

# 添加倉庫并安裝工具包
curl -fsSL https://nvidia.github.io/libnvidia-container/gpgkey |sudogpg --dearmor -o /usr/share/keyrings/nvidia-container-toolkit-keyring.gpg
curl -s -L https://nvidia.github.io/libnvidia-container/stable/deb/nvidia-container-toolkit.list |sudotee/etc/apt/sources.list.d/nvidia-container-toolkit.list
sudoapt-get update
sudoapt-get install nvidia-container-toolkit -y
# 配置 Docker 運(yùn)行時(shí)
sudonvidia-ctk runtime configure --runtime=docker
sudosystemctl restart docker

root@i-28e6iose:/home/ubuntu#sudonvidia-ctk runtime configure --runtime=docker
INFO[0000] Loading config from /etc/docker/daemon.json
INFO[0000] Wrote updated config to /etc/docker/daemon.json
INFO[0000] It is recommended that docker daemon be restarted.

# 驗(yàn)證 CUDA 容器
docker run --rm--gpus all nvidia/cuda:12.2.0-base-ubuntu22.04 nvidia-smi

root@i-28e6iose:/home/ubuntu# docker run --rm--gpus all nvidia/cuda:12.2.0-base-ubuntu22.04 nvidia-smi
Sun Mar 9 1355 2025
+-----------------------------------------------------------------------------------------+
| NVIDIA-SMI 570.124.06       Driver Version: 570.124.06   CUDA Version: 12.8   |
|-----------------------------------------+------------------------+----------------------+
| GPU Name         Persistence-M | Bus-Id     Disp.A | Volatile Uncorr. ECC |
| Fan Temp  Perf     Pwr:Usage/Cap |      Memory-Usage | GPU-Util Compute M. |
|                     |            |        MIG M. |
|=========================================+========================+======================|
|  0 NVIDIA GeForce RTX 2080 Ti   Off |  000000000C.0 Off |         N/A |
| 22%  26C  P8       21W / 250W |    4MiB / 11264MiB |   0%   Default |
|                     |            |         N/A |
+-----------------------------------------+------------------------+----------------------+

+-----------------------------------------------------------------------------------------+
| Processes:                                       |
| GPU  GI  CI       PID  Type  Process name            GPU Memory |
|    ID  ID                                Usage   |
|=========================================================================================|
| No running processes found                               |
+-----------------------------------------------------------------------------------------+

三、部署 GPUStack 容器

1.運(yùn)行 GPUStack 主節(jié)點(diǎn)

docker run -d 
 --gpus all 
 -p 890:80 
 --ipc=host 
 --name gpustack 
 -v gpustack-data:/var/lib/gpustack 
 gpustack/gpustack:latest

?參數(shù)說明

?--gpus all:啟用所有 GPU 資源。

?--ipc=host:共享主機(jī) IPC 命名空間,提升性能。

?-v gpustack-data:持久化存儲(chǔ)配置與模型數(shù)據(jù)。

2.獲取初始密碼

dockerexec-it gpustackcat/var/lib/gpustack/initial_admin_password

root@i-28e6iose:/home/ubuntu# dockerexec-it gpustackcat/var/lib/gpustack/initial_admin_password
rjl@Ainm3dtQ

#賬戶信息:
admin/rjl@Ainm3dtQ
#修改密碼:P@88w0rd
訪問http://<服務(wù)器IP>,使用用戶名admin和上述密碼登錄,首次需重置密碼。

d17ab7d6-4061-11f0-b715-92fbcf53809c.png

在這里插入圖片描述

四、擴(kuò)展 GPU 集群

1.添加 Worker 節(jié)點(diǎn)

? 在主節(jié)點(diǎn)獲取 Token:

dockerexec-it gpustackcat/var/lib/gpustack/token

? 在 Worker 節(jié)點(diǎn)運(yùn)行:

docker run -d 
 --gpus all 
 --network=host 
 --ipc=host 
 gpustack/gpustack 
 --server-url http://<主節(jié)點(diǎn)IP> 
 --token <獲取的Token>

五、功能使用示例

1.部署大模型
在 GPUStack 控制臺(tái)的Models頁面,支持從 Hugging Face 或本地導(dǎo)入模型。例如部署 Llama3.2 模型時(shí),系統(tǒng)會(huì)自動(dòng)分配 GPU 資源并生成 API 端點(diǎn)。

2.Playground 調(diào)測
在 Playground 中可測試多模態(tài)模型(如 Stable Diffusion)、文本嵌入模型(BERT)等,支持多模型對(duì)比與參數(shù)優(yōu)化。

六、常見問題

?GPU 未識(shí)別:檢查nvidia-smi是否正常,并確認(rèn) Docker 運(yùn)行時(shí)配置正確。

?容器啟動(dòng)失敗:確保已啟用--ipc=host并掛載持久化卷。

?網(wǎng)絡(luò)問題:跨節(jié)點(diǎn)通信需開放防火墻的 80 端口及內(nèi)部 RPC 端口(默認(rèn)為 6789)。

七、參考資源

?GPUStack 官方 Docker 部署文檔

?NVIDIA Container Toolkit 配置指南

通過以上步驟,您可快速搭建一個(gè)支持異構(gòu) GPU 資源調(diào)度的企業(yè)級(jí)大模型服務(wù)平臺(tái),實(shí)現(xiàn)從單機(jī)到集群的高效擴(kuò)展。

鏈接:https://blog.csdn.net/shenhonglei1234/article/details/146139022

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    4925

    瀏覽量

    130899
  • 開源
    +關(guān)注

    關(guān)注

    3

    文章

    3642

    瀏覽量

    43659
  • 模型
    +關(guān)注

    關(guān)注

    1

    文章

    3504

    瀏覽量

    50191
  • Docker
    +關(guān)注

    關(guān)注

    0

    文章

    514

    瀏覽量

    12843

原文標(biāo)題:告別環(huán)境折磨!Docker+GPUStack一鍵部署教程,NVIDIA顯卡秒變AI工作站

文章出處:【微信號(hào):magedu-Linux,微信公眾號(hào):馬哥Linux運(yùn)維】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    docker運(yùn)行datax實(shí)現(xiàn)數(shù)據(jù)同步方案

    docker運(yùn)行datax實(shí)現(xiàn)數(shù)據(jù)同步方案 --docker commit方式測試
    發(fā)表于 04-21 15:07

    docker運(yùn)行之jar包

    docker運(yùn)行jar包
    發(fā)表于 07-18 13:20

    在Ubuntu 18.04 for Arm上運(yùn)行的TensorFlow和PyTorch的Docker映像

    入門要構(gòu)建和運(yùn)行 Docker 映像,請(qǐng)確保使用的機(jī)器是 Arm AArch64。$ uname -maarch64任何由Graviton提供支持的 AWS EC2 實(shí)例 均可
    發(fā)表于 10-14 14:25

    Docker鏡像的詳細(xì)講解

    本文是對(duì) Docker 鏡像的詳細(xì)講解,講解了如何安裝 Docker、配置 Docker 鏡像加速以及操作 Docker 鏡像。希望對(duì)大家有
    的頭像 發(fā)表于 08-02 10:00 ?2484次閱讀

    開源的Docker運(yùn)行Mac OS是什么體驗(yàn)?

    使用沙箱機(jī)制,相互之間不會(huì)有任何接口。 相信大家對(duì) Docker 并不陌生,有時(shí)候想把玩一些開源項(xiàng)目,如果對(duì)應(yīng)的項(xiàng)目提供 Docker 的啟動(dòng)方式的話,你可以非常容易的將對(duì)應(yīng)項(xiàng)目跑起來。所以,你有沒有想過使用 Docker
    的頭像 發(fā)表于 11-14 17:51 ?1210次閱讀

    如何在Docker容器中運(yùn)行Nginx

    在本教程中,您將學(xué)習(xí)如何將 Nginx 作為 Docker 容器運(yùn)行,并將其公開給您的本地網(wǎng)絡(luò)。此外,您將學(xué)習(xí)如何創(chuàng)建 Docker 數(shù)據(jù)卷以在容器和主機(jī)文件系統(tǒng)之間共享信息。
    的頭像 發(fā)表于 02-17 09:30 ?2308次閱讀

    Docker 教程:如何將Helix QAC作為容器創(chuàng)建并運(yùn)行

    在此 Docker 教程中,你將學(xué)習(xí)如何創(chuàng)建 Helix QAC 并將其作為容器化鏡像運(yùn)行。 Docker 的基本定義是一種開源和流行的操作系統(tǒng)級(jí)虛擬化(通常稱為“容器化”)技術(shù),它是輕量級(jí)的,可
    的頭像 發(fā)表于 10-31 09:36 ?1260次閱讀
    <b class='flag-5'>Docker</b> 教程:如何將Helix QAC作為容器創(chuàng)建并<b class='flag-5'>運(yùn)行</b>

    如何在macOS系統(tǒng)中用Docker運(yùn)行macOS鏡像呢?

    macOS Containers 是一群開發(fā)者基于 chroot 打造的工具,能讓你在 macOS 用 Docker 運(yùn)行 macOS 鏡像。
    的頭像 發(fā)表于 09-28 09:24 ?1608次閱讀
    如何在macOS系統(tǒng)中用<b class='flag-5'>Docker</b><b class='flag-5'>運(yùn)行</b>macOS鏡像呢?

    docker exec命令的使用方法

    有用的命令,用于在正在運(yùn)行的容器中執(zhí)行命令。 在本文中,我將詳細(xì)介紹Docker exec命令的使用方法,包括命令格式、參數(shù)選項(xiàng)、使用示例等。 Docker exec命令格式
    的頭像 發(fā)表于 11-23 09:33 ?2258次閱讀

    linux關(guān)閉docker的命令

    在 Linux 系統(tǒng)中,關(guān)閉 Docker 的操作可以通過以下多種方式進(jìn)行。本文將詳細(xì)講解每一種方式,并提供示例代碼和命令,以幫助讀者更好地理解和實(shí)踐。 使用 docker 命令 最常用的方法
    的頭像 發(fā)表于 11-23 09:39 ?3536次閱讀

    如何啟動(dòng)本機(jī)docker服務(wù)

    Docker是一個(gè)開源項(xiàng)目,可以幫助開發(fā)者打包應(yīng)用程序及其依賴,并且能夠?qū)⑵渥鳛楠?dú)立的容器來運(yùn)行。本文將詳細(xì)介紹如何在本機(jī)上啟動(dòng)Docker服務(wù)。 第一步:安裝
    的頭像 發(fā)表于 11-23 09:43 ?2717次閱讀

    docker進(jìn)入容器的方法有哪些

    Docker是一種流行的容器化平臺(tái),它能夠快速構(gòu)建、交付和運(yùn)行應(yīng)用程序。在使用Docker時(shí),我們經(jīng)常需要進(jìn)入容器進(jìn)行調(diào)試、管理和運(yùn)行命令等操作。本文將
    的頭像 發(fā)表于 11-23 09:45 ?1.2w次閱讀

    docker核心組件有哪些

    Docker Image、Docker Container、Docker Registry 和 Docker Compose。以下將詳細(xì)
    的頭像 發(fā)表于 11-23 09:47 ?2378次閱讀

    【鴻蒙】OpenHarmony運(yùn)行docker詳細(xì)步驟

    1.環(huán)境和設(shè)備 系統(tǒng)版本: 3.2release(64 位) OpenHarmony 內(nèi)核版本:5.10 標(biāo)準(zhǔn)系統(tǒng)設(shè)備: DAYU200 Docker:18.03.1 (64 位) sd 卡一張
    的頭像 發(fā)表于 03-02 15:10 ?3651次閱讀
    【鴻蒙】OpenHarmony<b class='flag-5'>運(yùn)行</b><b class='flag-5'>docker</b><b class='flag-5'>詳細(xì)</b>步驟

    Docker運(yùn)行環(huán)境安裝

    作者:京東科技 林中 Docker是一個(gè)開放的平臺(tái),用于開發(fā)、發(fā)布和運(yùn)行應(yīng)用程序。Docker分離了應(yīng)用程序和運(yùn)行應(yīng)用的基礎(chǔ)設(shè)施,從而實(shí)現(xiàn)了軟件的快速交付。利用
    的頭像 發(fā)表于 10-29 11:28 ?612次閱讀