一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線(xiàn)課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

產(chǎn)品應(yīng)用 | 小盒子跑大模型!英碼科技基于算能BM1684X平臺(tái)實(shí)現(xiàn)大模型私有化部署

英碼科技 ? 來(lái)源:英碼科技 ? 作者:英碼科技 ? 2024-06-14 16:29 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

當(dāng)前,在人工智能領(lǐng)域,大模型在豐富人工智能應(yīng)用場(chǎng)景中扮演著重要的角色,經(jīng)過(guò)不斷的探索,大模型進(jìn)入到落地的階段。而大模型在落地過(guò)程中面臨兩大關(guān)鍵難題:對(duì)龐大計(jì)算資源的需求和對(duì)數(shù)據(jù)隱私與安全的考量。為應(yīng)對(duì)這些挑戰(zhàn),在邊緣側(cè)私有化部署大模型成為了一個(gè)有效的解決方案。

將大模型部署到邊緣側(cè),不僅能夠減少延遲和帶寬消耗,使得大模型能夠在邊緣節(jié)點(diǎn)快速進(jìn)行推理和應(yīng)用;還能增強(qiáng)數(shù)據(jù)隱私保護(hù),這對(duì)于維護(hù)企業(yè)的數(shù)據(jù)安全至關(guān)重要。

為響應(yīng)市場(chǎng)需求,英碼科技推出了基于算能BM1684X平臺(tái)的大模型私有化部署產(chǎn)品方案,包括:邊緣計(jì)算盒子IVP03X-V2、云邊加速卡AIV02X和AIV03X,助力企業(yè)實(shí)現(xiàn)垂直大模型應(yīng)用落地!

wKgaomZr_fqAdrBeAAbmBEryjaQ258.png

▎邊緣計(jì)算盒子IVP03X-V2

IVP03X-V2是英碼科技基于BM1684X推出的高性能邊緣計(jì)算盒子,INT8算力高達(dá)32Tops,配置了16GB大內(nèi)存,支持適配Llama2-7B/ChatGLM3-6B/Qwen-7B和SAM/StableDiffusion等大模型,是業(yè)內(nèi)少數(shù)能同時(shí)兼容國(guó)內(nèi)外深度學(xué)習(xí)框架,并且能夠流暢運(yùn)行大語(yǔ)言模型推理的邊緣計(jì)算設(shè)備之一。

▎大模型推理加速卡AIV02X & AIV03X

AIV02X和AIV03X算力可達(dá)64 TOPS@INT8和72 TOPS@INT8,顯存配置32GB和48GB,支持多芯分布式推理及支持大語(yǔ)言/提示型/圖像生成模型等大模型推理;這兩款云邊大模型推理加速卡均可應(yīng)用于邊緣大語(yǔ)言、文生圖等通用大模型、垂直行業(yè)私有模型的推理應(yīng)用。

接下來(lái),以英碼科技IVP03X邊緣計(jì)算盒子為例,為大家介紹實(shí)測(cè)大語(yǔ)言模型、文生圖大模型的部署流程和效果演示:

英碼科技IVP03X-V2實(shí)測(cè)大語(yǔ)言模型

一、前期準(zhǔn)備工作

demo下載地址:

https://github.com/sophgo/sophon-demo

二、大模型內(nèi)存配置

1、建一個(gè)存放工具的文件夾:

mkdir memedit && cd memedit


2、下載內(nèi)存配置工具:

wget -nd https://sophon-file.sophon.cn/sophon-prod-s3/drive/23/09/11/13/DeviceMemoryModificationKit.tgz tar xvf DeviceMemoryModificationKit.tgz cd DeviceMemoryModificationKit tar xvf memory_edit_{vx.x}.tar.xz #vx.x是版本號(hào) cd memory_edit

3、重配內(nèi)存:

./memory_edit.sh -p #這個(gè)命令會(huì)打印當(dāng)前的內(nèi)存布局信息 ./memory_edit.sh -c -npu 7615 -vpu 3072 -vpp 3072 #npu也可以訪(fǎng)問(wèn)vpu和vpp的內(nèi)存 替換emmbboot.itb: sudo cp /data/memedit/DeviceMemoryModificationKit/memory_edit/emmcboot.itb /boot/emmcboot.itb && sync

4、重啟生效:

reboot 重啟后,檢查配置: free -h cat /sys/kernel/debug/ion/bm_npu_heap_dump/summary | head -2 cat /sys/kernel/debug/ion/bm_vpu_heap_dump/summary | head -2 cat /sys/kernel/debug/ion/bm_vpp_heap_dump/summary | head -2

三、實(shí)測(cè)Chat-GLM3大模型(英文模式)

1、demo下載(Chat-GLM3)

進(jìn)到Chat-GLM2案例目錄下:sophon-demo-release/sample/Chat-GLM2/

安裝pip3,安裝dfss

sudo apt install python3-pip pip3 install dfss -i https://pypi.tuna.tsinghua.edu.cn/simple/ pip3 install dfss --upgrade

下載模型:

sudo apt install unzip chmod -R +x scripts/ ./scripts/download.sh

2、安裝依賴(lài)

安裝python依賴(lài):

pip3 install -r python/requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple/ Sail安裝包,下載安裝: python3 -m dfss --url=open@sophgo.com:sophon-demo/ChatGLM3/sail/soc/sophon_arm-3.7.0-py3-none-any.whl pip3 install sophon_arm-3.7.0-py3-none-any.whl

3、大模型運(yùn)行測(cè)試:

python3 python/chatglm3.py --bmodel models/BM1684X/chatglm3-6b_int4.bmodel --token python/token_config --dev_id 0 python3 python/chatglm3.py --bmodel models/BM1684X/chatglm3-6b_int8.bmodel --token python/token_config --dev_id 0 python3 python/chatglm3.py --bmodel models/BM1684X/chatglm3-6b_fp16.bmodel --token python/token_config --dev_id 0

9

四、實(shí)測(cè)Qwen大模型(中文模式)

1、demo下載(Qwen)

進(jìn)到Chat-GLM2案例目錄下:sophon-demo-release/sample/Qwen/

安裝pip3,安裝dfss

sudo apt install python3-pip pip3 install dfss -i https://pypi.tuna.tsinghua.edu.cn/simple/ pip3 install dfss --upgrade

下載模型:

sudo apt install unzip chmod -R +x scripts/ ./scripts/download.sh

2、安裝依賴(lài)

安裝python依賴(lài):

pip3 install -r python/requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple/ Sail安裝包,下載安裝: python3 -m dfss --url=open@sophgo.com:sophon-demo/ChatGLM3/sail/soc/sophon_arm-3.7.0-py3-none-any.whl pip3 install sophon_arm-3.7.0-py3-none-any.whl

3、大運(yùn)行測(cè)試:

python3 python/qwen.py --bmodel models/BM1684X/qwen-7b_int4_1dev.bmodel --token python/token_config --dev_id 0 python3 python/qwen.py --bmodel models/BM1684X/qwen-7b_int8_1dev.bmodel --token python/token_config --dev_id 0

英碼科技IVP03X-V2實(shí)測(cè)文生圖大模型

1、demo下載(StableDiffusionV1_5)

進(jìn)到Chat-GLM2案例目錄下:sophon-demo-release/sample/Qwen/

安裝pip3,安裝dfss

sudo apt install python3-pip pip3 install dfss -i https://pypi.tuna.tsinghua.edu.cn/simple/ pip3 install dfss --upgrade

下載模型:

sudo apt install unzip chmod -R +x scripts/ ./scripts/download_controlnets_bmodel.sh ./scripts/download_multilize_bmodel.sh ./scripts/download_singlize_bmodel.sh

2、安裝依賴(lài)

安裝python依賴(lài):

pip3 install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple/ 安裝sail包 python3 -m dfss --url=open@sophgo.com:sophon-demo/ChatGLM3/sail/soc/sophon_arm-3.7.0-py3-none-any.whl

3、大模型運(yùn)行測(cè)試:

①文本生成圖像

迭代20次

python3run.py--model_path../models/BM1684X--stagesinglize--prompt"Aparrotrestingonabranch"--neg_prompt"worstquality"--num_inference_steps20--dev_id0

迭代500次

python3 run.py --model_path ../models/BM1684X --stage singlize --pr ompt "A parrot resting on a branch" --neg_prompt "worst quality" --num_inference_steps 500 --dev_id 0

wKgZomZr_zWAOsD4AA-bPEXwDNo060.png

② Controlnet插件輔助控制 生成圖像

一只小兔子晚上在酒吧喝酒 :迭代次數(shù),20次

python3 run.py --model_path ../models/BM1684X --stage multilize --controlnet_name scribble_controlnet_fp16.bmodel --processor_name scribble_processor_fp16.bmodel --controlnet_img ../pics/generated_img.jpg --prompt "a rabbit drinking at the bar at night" --neg_prompt "worst quality" --num_inference_steps 100 --dev_id 0

一只小兔子晚上在酒吧喝酒 :迭代次數(shù),200次

python3 run.py --model_path ../models/BM1684X --stage multilize --controlnet_name scribble_controlnet_fp16.bmodel --processor_name scribble_processor_fp16.bmodel --controlnet_img ../pics/generated_img.jpg --prompt "a rabbit drinking at the bar at night" --neg_prompt "worst quality" --num_inference_steps 200 --dev_id 0

wKgaomZr_0iAARqMABC_rCt6XA0763.png

結(jié)語(yǔ)

隨著大模型技術(shù)的不斷落地和應(yīng)用,大模型涌現(xiàn)的強(qiáng)大能力不再局限于云端,模型的算法正逐漸向邊緣端延伸;未來(lái),英碼科技將結(jié)合自身在軟硬件方面的技術(shù)優(yōu)勢(shì)和豐富的經(jīng)驗(yàn),以AI賦能更多企業(yè)低門(mén)檻、高效落地邊緣側(cè)大模型應(yīng)用,從而推動(dòng)各行業(yè)智能化轉(zhuǎn)型的進(jìn)程。

審核編輯 黃宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    88

    文章

    35164

    瀏覽量

    280014
  • 人工智能
    +關(guān)注

    關(guān)注

    1807

    文章

    49029

    瀏覽量

    249577
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    3146

    瀏覽量

    4074
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    潤(rùn)和軟件AIRUNS 3.0助力企業(yè)打造私有化AI模型

    ”)打造企業(yè)級(jí)全流程AI模型工藝平臺(tái)——AIRUNS 3.0,深度適配國(guó)產(chǎn)軟硬件,實(shí)現(xiàn)從數(shù)據(jù)接入到模型落地的高效閉環(huán),助力企業(yè)加速AI工程
    的頭像 發(fā)表于 06-28 17:03 ?841次閱讀

    AIBOX 產(chǎn)品矩陣:支持主流大模型私有化部署,滿(mǎn)足個(gè)性 AI 應(yīng)用需求

    AIBOX系列產(chǎn)品具備高性能、低功耗、環(huán)境適應(yīng)性強(qiáng)等特點(diǎn),力覆蓋6-157TOPS,通過(guò)搭配多樣深度學(xué)習(xí)算法,體積小巧,能夠支持主流大模型私有
    的頭像 發(fā)表于 06-25 16:32 ?470次閱讀
    AIBOX <b class='flag-5'>產(chǎn)品</b>矩陣:支持主流大<b class='flag-5'>模型</b>的<b class='flag-5'>私有化</b><b class='flag-5'>部署</b>,滿(mǎn)足個(gè)性<b class='flag-5'>化</b> AI 應(yīng)用需求

    企業(yè)部署AI大模型怎么做

    當(dāng)下,AI大模型已成為驅(qū)動(dòng)決策自動(dòng)、服務(wù)智能產(chǎn)品創(chuàng)新的核心引擎。然而,企業(yè)面對(duì)動(dòng)輒數(shù)百億參數(shù)的大模型
    的頭像 發(fā)表于 06-04 09:26 ?208次閱讀

    登臨科技與元石智達(dá)成戰(zhàn)略合作

    近日,登臨科技與元石智達(dá)成重要戰(zhàn)略合作,成功實(shí)現(xiàn)元石智平臺(tái)在登臨Goldwasser推理集群的部署,并完成多款主流大
    的頭像 發(fā)表于 04-01 17:40 ?875次閱讀

    阿普奇工控機(jī)私有化部署Deepseek:平衡性能、成本、應(yīng)用三者的優(yōu)選硬件方案

    的競(jìng)爭(zhēng)格局,它不僅加速了生產(chǎn)模式的智能升級(jí),其開(kāi)源模式與低成本特性,使中小企業(yè)能以更低門(mén)檻接入AI能力, 推動(dòng)行業(yè)從“經(jīng)驗(yàn)驅(qū)動(dòng)”向“數(shù)據(jù)智能驅(qū)動(dòng)”轉(zhuǎn)型 。 但對(duì)企業(yè)而言,私有化部署Deepseek更具備戰(zhàn)略必要性: 其一 ,
    的頭像 發(fā)表于 03-06 13:22 ?480次閱讀
    阿普奇工控機(jī)<b class='flag-5'>私有化</b><b class='flag-5'>部署</b>Deepseek:平衡性能、成本、應(yīng)用三者的優(yōu)選硬件方案

    昇騰推理服務(wù)器+DeepSeek大模型 技術(shù)培訓(xùn)在圖為科技成功舉辦

    與DeepSeek大模型的全面融合應(yīng)用即將邁入實(shí)質(zhì)性落地的新階段。 昇騰加持DeepSeek大模型私有化部署 華為講師李文童提到,DeepSeek大
    的頭像 發(fā)表于 02-26 17:38 ?604次閱讀
    昇騰推理服務(wù)器+DeepSeek大<b class='flag-5'>模型</b> 技術(shù)培訓(xùn)在圖為科技成功舉辦

    云軸科技ZStack智塔攜手昇騰AI實(shí)現(xiàn)DeepSeek模型部署

    DeepSeek為人工智能AI產(chǎn)業(yè)帶來(lái)一場(chǎng)革命,為企業(yè)級(jí)AI應(yīng)用私有化部署場(chǎng)景(Private AI)注入強(qiáng)勁動(dòng)力。作為企業(yè)級(jí)私有化AI Infra平臺(tái),云軸科技ZStack智塔攜手昇
    的頭像 發(fā)表于 02-18 09:59 ?739次閱讀
    云軸科技ZStack智塔攜手昇騰AI<b class='flag-5'>實(shí)現(xiàn)</b>DeepSeek<b class='flag-5'>模型</b><b class='flag-5'>部署</b>

    添越智創(chuàng)基于 RK3588 開(kāi)發(fā)板部署測(cè)試 DeepSeek 模型全攻略

    常見(jiàn)的 Hugging Face 格式模型,轉(zhuǎn)換為 RKLLM 模型。轉(zhuǎn)換后的模型完美適配 Rockchip NPU 平臺(tái),充分釋放 NP
    發(fā)表于 02-14 17:42

    京東云正式上線(xiàn)DeepSeek系列模型

    實(shí)際需求,在京東云官網(wǎng)上輕松實(shí)現(xiàn)一鍵部署。通過(guò)進(jìn)入言犀AI開(kāi)發(fā)計(jì)算平臺(tái)的“AI資產(chǎn)市場(chǎng)”,開(kāi)發(fā)者和企業(yè)可以便捷地選用DeepSeek系列模型,進(jìn)行快速調(diào)用和應(yīng)用。 為了滿(mǎn)足不同場(chǎng)景下的
    的頭像 發(fā)表于 02-06 14:25 ?529次閱讀

    基于 Flexus 云服務(wù)器 X 實(shí)例的應(yīng)用場(chǎng)景 - 私有化部署自己的筆記平臺(tái)

    ,為其他人提供一些便利幫助。 一般記錄自己筆記的方式有好多種,比如在開(kāi)源的博客平臺(tái)上發(fā)布,比如 CSDN,博客園,51CTO 博客、公眾號(hào)等。另一種方式就是:自己部署一款私有化的筆記平臺(tái)
    的頭像 發(fā)表于 01-02 09:55 ?355次閱讀
    基于 Flexus 云服務(wù)器 <b class='flag-5'>X</b> 實(shí)例的應(yīng)用場(chǎng)景 - <b class='flag-5'>私有化</b><b class='flag-5'>部署</b>自己的筆記<b class='flag-5'>平臺(tái)</b>

    AI模型部署邊緣設(shè)備的奇妙之旅:目標(biāo)檢測(cè)模型

    并非易事,它涉及到從選擇合適的算法架構(gòu)到針對(duì)特定硬件平臺(tái)進(jìn)行優(yōu)化等一系列復(fù)雜的工作。 接下來(lái),我們將詳細(xì)介紹如何在資源受限的邊緣設(shè)備上成功部署目標(biāo)檢測(cè)模型,探索其背后的原理和技術(shù),并討論解決該領(lǐng)域內(nèi)常見(jiàn)
    發(fā)表于 12-19 14:33

    模型時(shí)代的力需求

    現(xiàn)在AI已進(jìn)入大模型時(shí)代,各企業(yè)都爭(zhēng)相部署模型,但如何保證大模型力,以及相關(guān)的穩(wěn)定性和性能,是一個(gè)極為重要的問(wèn)題,帶著這個(gè)極為重要的問(wèn)
    發(fā)表于 08-20 09:04

    智能水電表管理系統(tǒng)支持本地私有化部署嗎?

    智能水電表管理系統(tǒng),作為智慧城市建設(shè)中的關(guān)鍵組件,正逐步改變著能源計(jì)量與管理的傳統(tǒng)模式。面對(duì)日益增長(zhǎng)的數(shù)據(jù)安全需求及特定行業(yè)的合規(guī)性考量,越來(lái)越多的企業(yè)和機(jī)構(gòu)開(kāi)始關(guān)注系統(tǒng)的本地私有化部署方案。本文將
    的頭像 發(fā)表于 08-12 20:32 ?579次閱讀
    智能水電表管理系統(tǒng)支持本地<b class='flag-5'>私有化</b><b class='flag-5'>部署</b>嗎?

    開(kāi)啟智能效管理:4G 智能計(jì)量控制插座的協(xié)議對(duì)接與私有化部署

    4G智能插座以其先進(jìn)的通信能力和精準(zhǔn)的計(jì)量功能,為用戶(hù)提供便捷、高效的能源管理方案。支持協(xié)議對(duì)接和私有化部署的特性,讓數(shù)據(jù)安全得到保障。實(shí)時(shí)智能監(jiān)控、斷電告警、數(shù)據(jù)保護(hù)等全面解析,滿(mǎn)足用戶(hù)個(gè)性、智能
    的頭像 發(fā)表于 08-12 12:01 ?667次閱讀
    開(kāi)啟智能<b class='flag-5'>能</b>效管理:4G 智能計(jì)量控制插座的協(xié)議對(duì)接與<b class='flag-5'>私有化</b><b class='flag-5'>部署</b>

    AIBOX青春版上線(xiàn)!1399把AI帶回家

    BM1688,力高達(dá)16TOPS,支持主流大模型私有化部署,把AI的能力私有化,滿(mǎn)足個(gè)性
    的頭像 發(fā)表于 08-08 08:02 ?1377次閱讀
    AIBOX青春版上線(xiàn)!1399把AI帶回家