一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

如何在英特爾平臺(tái)上高效部署DeepSeek模型

英特爾物聯(lián)網(wǎng) ? 來(lái)源:英特爾物聯(lián)網(wǎng) ? 2025-02-21 10:16 ? 次閱讀

隨著人工智能技術(shù)的迅猛發(fā)展,大規(guī)模語(yǔ)言模型(LLMs)在自然語(yǔ)言處理、內(nèi)容生成和智能對(duì)話等領(lǐng)域的應(yīng)用日益廣泛。國(guó)產(chǎn) AI 大模型 DeepSeek 憑借其強(qiáng)大的生成能力和廣泛的應(yīng)用場(chǎng)景,迅速成為業(yè)界焦點(diǎn)。

目前,我們已經(jīng)在英特爾 酷睿 處理器與英特爾銳炫 顯卡組成的硬件配置上,完成對(duì)大模型推理的驗(yàn)證,為 AI 模型的部署和推理提供了強(qiáng)有力的支持。

本文將帶您深入了解如何在英特爾平臺(tái)上高效部署 DeepSeek 模型,充分發(fā)揮其潛力,助力 AI 應(yīng)用的快速落地。

1硬件配置

GPU: 英特爾銳炫 B580 12G

2BIOS 配置

安裝英特爾銳炫顯卡后,必須在 BIOS 中啟用 PCIe 可重設(shè) BAR(Base Address Register)。

3操作系統(tǒng)和驅(qū)動(dòng)程序安裝

3.1Ubuntu* 24.10 操作系統(tǒng)安裝

以下是下載和安裝 Ubuntu 24.10 的步驟:

1)下載并安裝Ubuntu 24.10

wget https://releases.ubuntu.com/24.10/ubuntu-24.10-desktop-amd64.iso

2)關(guān)閉 Ubuntu 無(wú)人值守升級(jí),以避免未經(jīng)驗(yàn)證的內(nèi)核更新。

登錄 Ubuntu 后,設(shè)置屏幕永不鎖定并啟用自動(dòng)登錄。

Setting->Power->Power Saving->Screen Blank->Never

設(shè)置 -> 電源 -> 節(jié)能 -> 屏幕空白 -> 從不

System->Users->Automatic Login

系統(tǒng) -> 用戶 -> 自動(dòng)登錄

sudo systemctl disable --now unattended-upgrades

然后編輯/etc/apt/apt.conf.d/20auto-upgrades,將Unattended-Upgrade設(shè)置為 “0”。

3)檢查內(nèi)核版本是否為6.11.

$ uname -a
Linux benchmark-Z590-VISION-D 6.11.0-8-generic #8-Ubuntu SMP PREEMPT_DYNAMIC Mon Sep 16 1320 UTC 2024 x86_64 x86_64 x86_64 GNU/Linux

4)重新啟動(dòng)設(shè)備,查看顯示是否正常工作。

3.2 英特爾客戶端 GPU

驅(qū)動(dòng)程序安裝(ARC B 系列)

參考:

https://dgpu-docs.intel.com/driver/client/overview.html#installing-client-gpus-on-ubuntu-desktop-24-10

3.2.1在 Ubuntu Desktop 24.10 上

安裝客戶端 GPU

使用以下命令安裝 intel-graphics PPA 和必要的計(jì)算與媒體包:

sudo apt-get update
sudo apt-get install -y software-properties-common


# Add the intel-graphics PPA for 24.10
sudo add-apt-repository -y ppa:kobuk-team/intel-graphics


# Install the compute-related packages
sudo apt-get install -y libze-intel-gpu1 libze1 intel-ocloc intel-opencl-icd clinfo intel-gsc hwinfo


# Install the media-related packages
sudo apt-get install -y intel-media-va-driver-non-free libmfx1 libmfx-gen1 libvpl2 libvpl-tools libva-glx2 va-driver-all vainfo

上述命令安裝了大多數(shù)用戶所需的所有基本包,旨在盡量減少不必要的包安裝。

請(qǐng)注意,不同版本的 intel-opencl-icd 可能會(huì)有不同的性能表現(xiàn)。

3.2.2 配置渲染組成員資格

要訪問(wèn) GPU 功能,當(dāng)前用戶必須能夠訪問(wèn)/dev/dri 中的 DRM 渲染節(jié)點(diǎn)。

如果當(dāng)前用戶不是 DRM 渲染節(jié)點(diǎn)(通常為 'render')組的成員,請(qǐng)將用戶添加到渲染節(jié)點(diǎn)組。

sudo gpasswd -a ${USER} render

這對(duì)更新后創(chuàng)建的 shell 就足夠了。要更改當(dāng)前 shell 的組 ID:

newgrp render

3.3 驗(yàn)證英特爾銳炫 B580 PCIe 配置空間

確保英特爾銳炫 B580 PCIe 配置空間具有 12GB 的 BAR2。以下是檢查 GPU PCIe 配置空間的指南:

步驟 1:列出 VGA 設(shè)備的 PCIe 總線地址。

lspci | grep -i vga

您將在屏幕上看到這些消息:

a8ff2a88-ef73-11ef-9310-92fbcf53809c.png

步驟 2:檢查英特爾銳炫 B580 的 PCIe 功能。

sudo lspci -s 03:00 -vvv | grep BAR

您將看到英特爾銳炫 B580 的 PCIe 功能,并檢查 PCIe 配置空間。

4OpenVINO 和基準(zhǔn)測(cè)試工具安裝

OpenVINO 是一個(gè)開(kāi)源工具包,用于優(yōu)化和部署從云到邊緣的深度學(xué)習(xí)模型。它加速了各種用例的深度學(xué)習(xí)推理,如生成式 AI、視頻、音頻和語(yǔ)言,支持來(lái)自流行框架(如 PyTorch、TensorFlow、ONNX 等)的模型。轉(zhuǎn)換和優(yōu)化模型,并部署在混合的英特爾 硬件和環(huán)境中,無(wú)論是在本地、設(shè)備上、瀏覽器中還是云端。

OpenVINO GenAI 是 OpenVINO 的一個(gè)變體,旨在簡(jiǎn)化生成式 AI 模型的推理運(yùn)行。它隱藏了生成過(guò)程的復(fù)雜性,并最大限度地減少了所需的代碼量。

使用以下命令快速安裝 OpenVINO 和工具。

git clone https://github.com/openvinotoolkit/openvino.genai.git


cd ./tools/llm_bench


python3 -m venv python-env


source python-env/bin/activate


pip install --upgrade pip


pip install -r requirements.txt

更多詳情請(qǐng)參考o(jì)penvino.genai/tools/llm_bench at master · openvinotoolkit/openvino.genai · GitHub

https://github.com/openvinotoolkit/openvino.genai/tree/master/tools/llm_bench

5運(yùn)行 DeepSeek蒸餾模型的基準(zhǔn)測(cè)試

5.1 下載預(yù)訓(xùn)練的 LLM 模型

訪問(wèn):

https://huggingface.co或https://www.modelscope.cn

下載 deepseek 蒸餾模型,并將下載的模型保存在~/models 文件夾中。

5.2將模型轉(zhuǎn)換為 OpenVINO IR

運(yùn)行以下命令將 DeepSeek-R1-Distill-Qwen-7B 轉(zhuǎn)換為 IR 格式并將權(quán)重壓縮為 INT4。您的系統(tǒng)必須至少具有 64GB 內(nèi)存才能進(jìn)行轉(zhuǎn)換。

optimum-cli export openvino --framework pt 
-m ./DeepSeek-R1-Distill-Qwen-7B --weight-format int4 –sym 
--trust-remote-code --task 
text-generation-with-past ./DeepSeek-R1-Distill-Qwen-7B-IR

5.3 使用 OpenVINO 啟動(dòng) LLM 基準(zhǔn)測(cè)試

要在 B580 上啟動(dòng) LLM 模型 DeepSeek-R1-Distill-Qwen-7B 的基準(zhǔn)測(cè)試,請(qǐng)運(yùn)行以下命令:

python3 benchmark.py -m DeepSeek-R1-Distill-Qwen-7B-IR -n 1 -d GPU
python benchmark.py -m DeepSeek-R1-Distill-Qwen-7B-IR -p "What is openvino?" -n 1 -d GPU

測(cè)試結(jié)果將顯示在屏幕上。請(qǐng)注意,結(jié)果可能因平臺(tái)和軟件版本而異。

通過(guò)本文的詳細(xì)步驟和配置指南,我們成功在英特爾平臺(tái)上驗(yàn)證了 DeepSeek 蒸餾模型的推理性能。從硬件配置、BIOS 設(shè)置、操作系統(tǒng)安裝到驅(qū)動(dòng)程序和 OpenVINO 工具的部署,每一步都確保了系統(tǒng)發(fā)揮更卓越的性能。

通過(guò)基準(zhǔn)測(cè)試,我們展示了 DeepSeek-R1-Distill-Qwen 系列模型在 INT4 精度下的高效推理能力,尤其是在首個(gè) token 和后續(xù) token 的延遲表現(xiàn)上,展現(xiàn)了英特爾銳炫 顯卡在處理大模型推理任務(wù)時(shí)的強(qiáng)大潛力。英特爾銳炫 B580能夠?yàn)锳I工作負(fù)載提供加速,其配備的英特爾Xe矩陣計(jì)算引擎(XMX),為新推出的XeSS 2提供強(qiáng)大支持。OpenVINO 工具套件可以縮短延遲,提高吞吐量,加速 AI 推理過(guò)程,同時(shí)保持精度,縮小模型占用空間,優(yōu)化硬件使用。

未來(lái),隨著硬件和軟件的進(jìn)一步優(yōu)化,我們期待在更多復(fù)雜場(chǎng)景中,特別是在生成式 AI 和大規(guī)模語(yǔ)言模型的應(yīng)用中,驗(yàn)證和英特爾銳炫 顯卡的性能,通過(guò)英特爾豐富的軟硬件產(chǎn)品協(xié)同,為 DeepSeek 及各種 AI 大模型的應(yīng)用提供更強(qiáng)大的算力,讓邊緣側(cè)部署 AI 的使用場(chǎng)景有更多可能。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 英特爾
    +關(guān)注

    關(guān)注

    61

    文章

    10141

    瀏覽量

    173573
  • 顯卡
    +關(guān)注

    關(guān)注

    16

    文章

    2497

    瀏覽量

    69017
  • 人工智能
    +關(guān)注

    關(guān)注

    1804

    文章

    48449

    瀏覽量

    244974
  • DeepSeek
    +關(guān)注

    關(guān)注

    1

    文章

    755

    瀏覽量

    1053

原文標(biāo)題:DeepSeek 模型在英特爾銳炫? 顯卡上的高效推理實(shí)踐

文章出處:【微信號(hào):英特爾物聯(lián)網(wǎng),微信公眾號(hào):英特爾物聯(lián)網(wǎng)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    MWC上海2018:英特爾助力合作伙伴加速5G部署

    在MWC上海2018上,英特爾攜手行業(yè)合作伙伴,展示了一系列基于英特爾5G端到端技術(shù)的精彩案例。從英特爾?FPGA、英特爾至強(qiáng)?處理器、英特爾
    的頭像 發(fā)表于 06-28 15:30 ?5800次閱讀

    英特爾CPU部署Qwen 1.8B模型的過(guò)程

    本文介紹了在英特爾 13 代酷睿 CPU i5 - 13490F 設(shè)備上部署 Qwen 1.8B 模型的過(guò)程,你需要至少 16GB 內(nèi)存的機(jī)器來(lái)完成這項(xiàng)任務(wù),我們將使用英特爾的大
    的頭像 發(fā)表于 01-12 10:28 ?3185次閱讀

    添越智創(chuàng)基于 RK3588 開(kāi)發(fā)板部署測(cè)試 DeepSeek 模型全攻略

    DeepSeek 模型部署與測(cè)試,開(kāi)啟這場(chǎng)充滿挑戰(zhàn)與驚喜的技術(shù)探索之旅。 RK3588 開(kāi)發(fā)板:AI 性能擔(dān)當(dāng) RK3588 開(kāi)發(fā)板基于先進(jìn)的 8nm LP 制程工藝精心打造,其硬件配置堪稱豪華,在 AI
    發(fā)表于 02-14 17:42

    #高通 #英特爾 #Elite 高通X Elite芯片或終結(jié)蘋(píng)果、英特爾的芯片王朝

    高通英特爾蘋(píng)果
    深圳市浮思特科技有限公司
    發(fā)布于 :2023年10月27日 16:46:07

    英特爾多款平板電腦CPU將于明年推出

    的價(jià)格均在199美元至249美元之間。此外,對(duì)于那些售價(jià)在249美元以上的Android平板,英特爾還會(huì)提供Bay Trail和Cherry Trail平臺(tái)供選擇?! ?014年9月份,英特爾將會(huì)
    發(fā)表于 12-19 16:48

    OpenCL平臺(tái)英特爾Stratix 10 FPGA的結(jié)合使用

    在這個(gè)高度依賴圖像的時(shí)代,英特爾? FPGA 可利用 OpenCL? 平臺(tái)滿足巨大的圖像處 理和分類需求簡(jiǎn)介從 2015 年到 2020 年,互聯(lián)網(wǎng)視頻流量將增長(zhǎng)四倍。[1] 鑒于可視數(shù)據(jù)的爆炸性
    發(fā)表于 07-17 06:34

    為什么選擇加入英特爾?

    近日,加入英特爾已有3個(gè)月的明星芯片架構(gòu)師Jim Keller接受了外媒VentureBeat的采訪,在采訪中談及了自己加入英特爾的始末和讓其為之興奮的新角色——英特爾公司技術(shù)、系統(tǒng)架構(gòu)和客戶端事業(yè)部高級(jí)副總裁兼芯片工程事業(yè)部總
    發(fā)表于 07-25 07:31

    適用于英特爾性能設(shè)備平臺(tái)的RMC

    適用于英特爾性能設(shè)備平臺(tái)的RMC
    發(fā)表于 08-20 07:53

    介紹英特爾?分布式OpenVINO?工具包

    介紹英特爾?分布式OpenVINO?工具包可快速部署模擬人類視覺(jué)的應(yīng)用程序和解決方案。 該工具包基于卷積神經(jīng)網(wǎng)絡(luò)(CNN),可擴(kuò)展英特爾?硬件的計(jì)算機(jī)視覺(jué)(CV)工作負(fù)載,從而最大限度地提高
    發(fā)表于 07-26 06:45

    英特爾Context Sensing SDK跨平臺(tái)上下文感知體驗(yàn)

    英特爾?ContextSensing SDK使應(yīng)用程序開(kāi)發(fā)人員能夠創(chuàng)建引人注目的跨平臺(tái)上下文感知體驗(yàn)。
    的頭像 發(fā)表于 11-07 06:09 ?3691次閱讀

    由Gayathri Murali設(shè)計(jì)英特爾平臺(tái)上的Android

    Android在英特爾平臺(tái)上由Gayathri Murali設(shè)計(jì) - 灣區(qū)Android巨星
    的頭像 發(fā)表于 05-31 09:29 ?2443次閱讀

    何在英特爾? 平臺(tái)上實(shí)現(xiàn)高效的大語(yǔ)言模型訓(xùn)練后量化

    本文介紹了可提升大語(yǔ)言模型的訓(xùn)練后量化表現(xiàn)的增強(qiáng)型 SmoothQuant 技術(shù),說(shuō)明了這項(xiàng)技術(shù)的用法,并證明了其在準(zhǔn)確率方面的優(yōu)勢(shì)。此方法已整合至 英特爾 ?Neural Compressor
    的頭像 發(fā)表于 07-14 20:10 ?1083次閱讀
    如<b class='flag-5'>何在</b><b class='flag-5'>英特爾</b>? <b class='flag-5'>平臺(tái)上</b>實(shí)現(xiàn)<b class='flag-5'>高效</b>的大語(yǔ)言<b class='flag-5'>模型</b>訓(xùn)練后量化

    英特爾酷睿Ultra處理器支持DeepSeek運(yùn)行

    Janus-Pro更是將其多模態(tài)的本領(lǐng)發(fā)揮至極。DeepSeek模型因其高效、易部署等特性,非常適合在英特爾AI PC進(jìn)行本地化應(yīng)用。
    的頭像 發(fā)表于 02-08 10:13 ?718次閱讀

    探索座艙“未至之境”:英特爾支持DeepSeek車內(nèi)本地運(yùn)行

    超火的DeepSeek進(jìn)入駕艙是什么樣子?英特爾告訴你答案。在英特爾的軟件定義汽車車載平臺(tái)上DeepSeek-R1,從1.5B直到14B,
    的頭像 發(fā)表于 02-14 16:19 ?270次閱讀
    探索座艙“未至之境”:<b class='flag-5'>英特爾</b>支持<b class='flag-5'>DeepSeek</b>車內(nèi)本地運(yùn)行

    英特爾賦能DeepSeek本地運(yùn)行,助力汽車升級(jí)“最強(qiáng)大腦”

    英特爾近期宣布支持DeepSeek在本地實(shí)現(xiàn)高效運(yùn)行。據(jù)悉,借助英特爾的軟件定義汽車車載平臺(tái),DeepS
    的頭像 發(fā)表于 02-17 09:37 ?576次閱讀