五月丁香婷婷第一页亚洲,国产裸体免费网站

作者：

楊亦誠(chéng) 英特爾 AI 軟件工程師

介紹

近期阿里通義實(shí)驗(yàn)室在 Hugging Face 和 ModelScope 上開(kāi)源了 Qwen2.5-VL 的 Base 和 Instruct 模型，包含 3B、7B 和 72B 在內(nèi)的 3 個(gè)模型尺寸。其中，Qwen2.5-VL-7B-Instruct 在多個(gè)任務(wù)中超越了 GPT-4o-mini，而 Qwen2.5-VL-3B 作為端側(cè) AI 的潛力股，甚至超越了之前版本的Qwen2-VL 7B 模型。Qwen2.5-VL 增強(qiáng)了模型對(duì)時(shí)間和空間尺度的感知能力，在空間維度上，Qwen2.5-VL 不僅能夠動(dòng)態(tài)地將不同尺寸的圖像轉(zhuǎn)換為不同長(zhǎng)度的 token，使用圖像的實(shí)際尺寸來(lái)表示檢測(cè)框和點(diǎn)等坐標(biāo)，這也使得Qwen2.5-VL模型可以直接作為一個(gè)視覺(jué) Agent，推理并動(dòng)態(tài)地使用工具，具備了使用電腦和使用手機(jī)的能力。

本文將分享如何利用英特爾 OpenVINO 工具套件在本地加速Q(mào)wen2.5-VL系列模型的推理任務(wù)。

內(nèi)容列表

環(huán)境準(zhǔn)備

模型下載和轉(zhuǎn)換

加載模型

準(zhǔn)備模型輸入

運(yùn)行圖像理解任務(wù)

1環(huán)境準(zhǔn)備

該示例基于Jupyter Notebook編寫(xiě)，因此我們需要準(zhǔn)備好相對(duì)應(yīng)的Python環(huán)境?；A(chǔ)環(huán)境可以參考以下鏈接安裝，并根據(jù)自己的操作系統(tǒng)進(jìn)行選擇具體步驟。

https://github.com/openvinotoolkit/openvino_notebooks?tab=readme-ov-file#-getting-started

圖：基礎(chǔ)環(huán)境安裝導(dǎo)航頁(yè)面

此外本示例將依賴qwen-vl-utils以及optimum-intel組件，其中安裝optimum-intel過(guò)程中將自動(dòng)安裝OpenVINOruntime, NNCF及Transformers等相關(guān)依賴庫(kù)。

2模型下載和轉(zhuǎn)換

這一步中，我們需要完成將Qwen2.5-VL .safetensor格式模型轉(zhuǎn)化為OpenVINO IR格式，并對(duì)其進(jìn)行INT4權(quán)重量化，實(shí)現(xiàn)對(duì)模型體積的壓縮。為了達(dá)到這一目的，optimum-intel提供了命令行工具：optimum-cli，基于該工具，我們只需一行命令便可實(shí)現(xiàn)上述步驟：

 optimum-cli export openvino --model Qwen/Qwen2.5-VL-3B-Instruct Qwen2.5-VL-3B-Instruct/INT4 --weight-format int4

其中“—model”參數(shù)后的“Qwen/Qwen2.5-VL-3B-Instruct”為模型在HuggingFace上的model id，這里我們也提前下載原始模型，并將model id替換為原始模型的本地路徑，針對(duì)國(guó)內(nèi)開(kāi)發(fā)者，推薦使用ModelScope魔搭社區(qū)作為原始模型的下載渠道，具體加載方式可以參考ModelScope官方指南：https://www.modelscope.cn/docs/models/download

3加載模型

接下來(lái)需要完成對(duì)模型推理任務(wù)的初始化，并將模型載入到指定硬件的內(nèi)存中，同樣的，我們可以利用optimum-intel封裝好的OpenVINO視覺(jué)多模態(tài)任務(wù)對(duì)象 OVModelForVisualCausalLM 對(duì)象完成該操作。

from optimum.intel.openvino import OVModelForVisualCausalLM
model = OVModelForVisualCausalLM.from_pretrained(model_dir, device.value)

如示例代碼所示，通過(guò)OVModelForVisualCausalLM的from_pretrained函數(shù)接口，可以很方便地根據(jù)用戶提供的模型路徑，將模型載入到指定的硬件平臺(tái)，完成視覺(jué)多模態(tài)任務(wù)的初始化。

4準(zhǔn)備模型輸入

第四步需要根據(jù)Qwen2.5-VL模型要求的prompt template準(zhǔn)備模型的輸入數(shù)據(jù)。數(shù)據(jù)格式如下：

messages = [
  {
    "role": "user",
    "content": [
      {
        "type": "image",
        "image": f"file://{example_image_path}",
      },
      {"type": "text", "text": question},
    ],
  }
]

其中:

“role“字段用于指定對(duì)話角色，包括system, user以及assistant三種類型；

"content"字段表示對(duì)話角色輸出的內(nèi)容，其中”type”為內(nèi)容類別，包含image，video，text三種類型，支持多張image輸入。

接下來(lái)可以通過(guò)Qwen官方提供的方法將用戶輸入的text和image編碼為模型的輸入tensor。

text = processor.apply_chat_template(messages, tokenize=False, add_generation_prompt=True)
image_inputs, video_inputs = process_vision_info(messages)
inputs = processor(
  text=[text],
  images=image_inputs,
  videos=video_inputs,
  padding=True,
  return_tensors="pt",
)

5運(yùn)行圖像理解任務(wù)

最后一步需要調(diào)用模型對(duì)象的generation函數(shù)，進(jìn)行答案生成，這里可以通過(guò)添加TextStreamer迭代器的方式，在命令行中流式輸出文本內(nèi)容。

from transformers import TextStreamer
generated_ids = model.generate(**inputs, max_new_tokens=100, streamer=TextStreamer(processor.tokenizer, skip_prompt=True, skip_special_tokens=True))

6總結(jié)

Qwen2.5-VL 系列模型的發(fā)布帶來(lái)了更精準(zhǔn)的視覺(jué)定位，文字理解以及Agent智能體能力。OpenVINO 則可以以更低的資源占用，高效地在本地運(yùn)行Qwen2.5-VL視覺(jué)多模態(tài)模型，激發(fā)AIPC異構(gòu)處理器的潛能。相信構(gòu)建面向桌面操作系統(tǒng)的本地智能體應(yīng)用已不再遙遠(yuǎn)。

聲明：本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴

英特爾

英特爾

+關(guān)注

關(guān)注
61

文章
10188

瀏覽量
174274
模型

模型

+關(guān)注

關(guān)注
1

文章
3504

瀏覽量
50193
OpenVINO

OpenVINO

+關(guān)注

關(guān)注
0

文章
114

瀏覽量
445

原文標(biāo)題：開(kāi)發(fā)者實(shí)戰(zhàn)｜如何利用OpenVINO? 在本地運(yùn)行Qwen2.5-VL系列模型

文章出處：【微信號(hào)：英特爾物聯(lián)網(wǎng)，微信公眾號(hào)：英特爾物聯(lián)網(wǎng)】歡迎添加關(guān)注！文章轉(zhuǎn)載請(qǐng)注明出處。

一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

搜索歷史

利用英特爾OpenVINO在本地運(yùn)行Qwen2.5-VL系列模型

評(píng)論