一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

基于AX650N芯片部署MiniCPM-V 2.0高效端側(cè)多模態(tài)大模型

愛芯元智AXERA ? 來源:愛芯元智AXERA ? 2024-07-15 09:34 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

MiniCPM-V 2.0: 具備領(lǐng)先OCR和理解能力的高效端側(cè)多模態(tài)大模型

背景

今年4月份,面壁智能&清華大學(xué)自然語言處理實(shí)驗(yàn)室推出MiniCPM系列的最新多模態(tài)版本MiniCPM-V 2.0。該模型基于MiniCPM 2.4B和SigLip-400M構(gòu)建,共擁有2.8B參數(shù)。MiniCPM-V 2.0具有領(lǐng)先的光學(xué)字符識別(OCR)和多模態(tài)理解能力。該模型在綜合性O(shè)CR能力評測基準(zhǔn)OCRBench上達(dá)到開源社區(qū)的最佳水平,甚至在場景文字理解方面實(shí)現(xiàn)接近Gemini Pro的性能。簡單來說,就是能夠?qū)崿F(xiàn)更好地理解圖片中內(nèi)容,實(shí)現(xiàn)精準(zhǔn)的“以圖生文”的能力,所見即所得。

本文將通過走馬觀花的方式,初探MiniCPM-V 2.0的新特性。同時(shí)也將分享基于愛芯元智的AX650N芯片適配MiniCPM-V 2.0的最新進(jìn)展,向業(yè)界對端側(cè)多模態(tài)大模型部署的開發(fā)者提供一種新的思路,促進(jìn)社區(qū)對端側(cè)多模態(tài)大模型的探索。

MiniCPM-V介紹

2.1 MiniCPM-V 2.0特性

領(lǐng)先的OCR和多模態(tài)理解能力。MiniCPM-V 2.0顯著提升了OCR和多模態(tài)理解能力,場景文字理解能力接近Gemini Pro,在多個(gè)主流評測基準(zhǔn)上性能超過了更大參數(shù)規(guī)模(例如17-34B)的主流模型。

可信行為。MiniCPM-V 2.0是第一個(gè)通過多模態(tài)RLHF對齊的端側(cè)多模態(tài)大模型。該模型在Object HalBench達(dá)到和GPT-4V相仿的性能。

任意長寬比高清圖像高效編碼。MiniCPM-V 2.0可以接受180萬像素的任意長寬比圖像輸入(基于最新的LLaVA-UHD技術(shù)),這使得模型可以感知到小物體、密集文字等更加細(xì)粒度的視覺信息。

高效部署。MiniCPM-V 2.0可以高效部署在大多數(shù)消費(fèi)級顯卡、個(gè)人電腦以及移動(dòng)手機(jī)等終端設(shè)備。

雙語支持。MiniCPM-V 2.0提供領(lǐng)先的中英雙語多模態(tài)能力支持。該能力通過VisCPM[ICLR'24]論文中提出的多模態(tài)能力的跨語言泛化技術(shù)實(shí)現(xiàn)。

2.2 多模態(tài)“小鋼炮”

MiniCPM-V 2.0與參數(shù)規(guī)模更大的多模態(tài)大模型相比,也表現(xiàn)出優(yōu)秀的成績,不愧是業(yè)界“小鋼炮”。

3c34e4f6-3dc6-11ef-a4c8-92fbcf53809c.png

芯片介紹

3.1 AX650N

愛芯元智第三代高能效比智能視覺芯片AX650N。集成了八核Cortex-A55 CPU,高能效比NPU,支持8K@30fps的ISP,以及H.264、H.265編解碼的 VPU。接口方面,AX650N支持64bit LPDDR4x,多路MIPI輸入,千兆Ethernet、USB、以及HDMI 2.0b輸出,并支持32路1080p@30fps解碼內(nèi)置高算力和超強(qiáng)編解碼能力,滿足行業(yè)對高性能邊緣智能計(jì)算的需求。通過內(nèi)置多種深度學(xué)習(xí)算法,實(shí)現(xiàn)視覺結(jié)構(gòu)化、行為分析、狀態(tài)檢測等應(yīng)用,高效率支持基于Transformer結(jié)構(gòu)的視覺大模型和語言類大模型。提供豐富的開發(fā)文檔,方便用戶進(jìn)行二次開發(fā)。

3c814daa-3dc6-11ef-a4c8-92fbcf53809c.jpg

上版部署

我們已實(shí)現(xiàn)“命令行”和“UI”兩種示例,其中“命令行”版本已上傳到網(wǎng)盤中,歡迎試用。

4.1 命令行版本

測試圖片:

測試結(jié)果:

3d08edfa-3dc6-11ef-a4c8-92fbcf53809c.jpg

4.2 GUI版本

4.3 性能統(tǒng)計(jì)

項(xiàng)目 描述
輸入圖片大小 280 x 280
Image Encoder 0.8s
Input Prompt 96 tokens
Prefill Time 0.4s
Decoder 5 tokens/s

結(jié)束語

隨著大語言模型小型化的快速發(fā)展,越來越多有趣的多模態(tài)AI應(yīng)用將逐漸從云端服務(wù)遷移到邊緣側(cè)設(shè)備和端側(cè)設(shè)備。我們會(huì)緊跟行業(yè)最新動(dòng)態(tài),適配更多的端側(cè)大模型,歡迎大家持續(xù)關(guān)注。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 自然語言處理
    +關(guān)注

    關(guān)注

    1

    文章

    628

    瀏覽量

    14083
  • 愛芯元智
    +關(guān)注

    關(guān)注

    1

    文章

    100

    瀏覽量

    5094
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    3085

    瀏覽量

    3963

原文標(biāo)題:愛芯分享 | 基于AX650N部署MiniCPM-V 2.0

文章出處:【微信號:愛芯元智AXERA,微信公眾號:愛芯元智AXERA】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    基于AX650N/AX630C部署側(cè)大語言模型Qwen2

    本文將分享如何將最新的側(cè)大語言模型部署到超高性價(jià)比SoC上,向業(yè)界對側(cè)
    的頭像 發(fā)表于 07-06 17:43 ?4518次閱讀
    基于<b class='flag-5'>AX650N</b>/<b class='flag-5'>AX</b>630C<b class='flag-5'>部署</b><b class='flag-5'>端</b><b class='flag-5'>側(cè)</b>大語言<b class='flag-5'>模型</b>Qwen2

    基于AX650N/AX630C部署模態(tài)模型InternVL2-1B

    InternVL2是由上海人工智能實(shí)驗(yàn)室OpenGVLab發(fā)布的一款模態(tài)模型,中文名稱為“書生·萬象”。該模型在多學(xué)科問答(MMMU)等任務(wù)上表現(xiàn)出色,并且具備處理多種
    的頭像 發(fā)表于 11-18 17:32 ?1697次閱讀
    基于<b class='flag-5'>AX650N</b>/<b class='flag-5'>AX</b>630C<b class='flag-5'>部署</b><b class='flag-5'>多</b><b class='flag-5'>模態(tài)</b>大<b class='flag-5'>模型</b>InternVL2-1B

    部署DeepSeek R1于AX650NAX630C平臺

    背景 春節(jié)前,國產(chǎn)大模型 DeepSeek 橫空出世,迅速成為AI領(lǐng)域的焦點(diǎn)。作為側(cè)AI能效比優(yōu)異的 AX650NAX630C
    的頭像 發(fā)表于 02-09 09:32 ?1005次閱讀
    <b class='flag-5'>部署</b>DeepSeek R1于<b class='flag-5'>AX650N</b>與<b class='flag-5'>AX</b>630C平臺

    AI SoC # 愛芯元智AX650N詳細(xì)介紹:原生支持Transformer架構(gòu)模型 適用部署DeepSeek R1

    AX650N是愛芯元智(AXERA)推出的一款高性能邊緣側(cè)AI芯片,專注于智能視覺感知與計(jì)算,廣泛應(yīng)用于智慧城市、智能制造、機(jī)器人等領(lǐng)域。以下是其核心特性及應(yīng)用場景的詳細(xì)分析: *附件:AX6
    的頭像 發(fā)表于 03-04 11:15 ?3831次閱讀
    AI SoC # 愛芯元智<b class='flag-5'>AX650N</b>詳細(xì)介紹:原生支持Transformer架構(gòu)<b class='flag-5'>模型</b> 適用<b class='flag-5'>部署</b>DeepSeek R1

    愛芯通元NPU適配Qwen2.5-VL-3B視覺模態(tài)模型

    熟悉愛芯通元NPU的網(wǎng)友很清楚,從去年開始我們在側(cè)模態(tài)模型適配上一直處于主動(dòng)緊跟的節(jié)奏。先后適配了國內(nèi)最早開源的
    的頭像 發(fā)表于 04-21 10:56 ?1322次閱讀
    愛芯通元NPU適配Qwen2.5-VL-3B視覺<b class='flag-5'>多</b><b class='flag-5'>模態(tài)</b>大<b class='flag-5'>模型</b>

    愛芯元智發(fā)布第三代智能視覺芯片AX650N,為智慧生活賦能

    中國 上海 2023 年 3 月 6 日 ——人工智能視覺感知芯片研發(fā)及基礎(chǔ)算力平臺公司愛芯元智宣布推出第三代高算力、高能效比的SoC芯片——AX650N。這是繼AX620、
    發(fā)表于 03-07 10:57 ?2033次閱讀
    愛芯元智發(fā)布第三代智能視覺<b class='flag-5'>芯片</b><b class='flag-5'>AX650N</b>,為智慧生活賦能

    體驗(yàn)MiniCPM-V 2.6 模態(tài)能力

    模態(tài)組網(wǎng)
    jf_23871869
    發(fā)布于 :2025年01月20日 13:40:48

    【愛芯派 Pro 開發(fā)板試用體驗(yàn)】愛芯元智AX650N部署yolov8s 自定義模型

    愛芯元智AX650N部署yolov8s 自定義模型 本博客將向你展示零基礎(chǔ)一步步的部署好自己的yolov8s模型(博主展示的是自己訓(xùn)練的手
    發(fā)表于 11-24 20:40

    愛芯元智第三代智能視覺芯片AX650N高能效比SoC芯片

    愛芯元智正式推出第三代高算力、高能效比的SoC芯片——AX650N。這是繼AX620、AX630系列后,愛芯元智推出的又一款高性能智能視覺芯片
    的頭像 發(fā)表于 03-10 17:13 ?4860次閱讀

    基于AX650N部署EfficientViT

    側(cè)場景通常對模型推理的實(shí)時(shí)性要求較高,但大部分輕量級的Vision Transformer網(wǎng)絡(luò)仍無法在已有邊緣側(cè)/
    的頭像 發(fā)表于 05-26 10:30 ?1500次閱讀

    愛芯元智AX650N側(cè)、邊緣側(cè)Transformer最佳落地平臺

    Transformer是當(dāng)前各種大模型所采用的主要結(jié)構(gòu),而ChatGPT的火爆讓人們逐漸意識到人工智能有著更高的上限,并可以在計(jì)算機(jī)視覺領(lǐng)域發(fā)揮出巨大潛能。相比于在云端用GPU部署Transformer大模型,在邊緣
    的頭像 發(fā)表于 05-30 11:04 ?1387次閱讀
    愛芯元智<b class='flag-5'>AX650N</b>成<b class='flag-5'>端</b><b class='flag-5'>側(cè)</b>、邊緣<b class='flag-5'>側(cè)</b>Transformer最佳落地平臺

    愛芯元智AX620E和AX650系列芯片正式通過PSA Certified安全認(rèn)證

    萬物互聯(lián)的時(shí)代,安全性已成為物聯(lián)網(wǎng)產(chǎn)品設(shè)計(jì)及部署的基本要求。近日,愛芯元智AX620E和AX650系列芯片(包含AX630C/
    的頭像 發(fā)表于 04-23 15:45 ?1358次閱讀
    愛芯元智<b class='flag-5'>AX</b>620E和<b class='flag-5'>AX650</b>系列<b class='flag-5'>芯片</b>正式通過PSA Certified安全認(rèn)證

    PerfXCloud 重大更新 側(cè)模態(tài)模型 MiniCPM-Llama3-V 2.5 閃亮上架

    近日,PerfXCloud完成重大更新,上架了面壁小鋼炮 MiniCPM 系列的側(cè)模態(tài)模型
    的頭像 發(fā)表于 08-27 18:20 ?771次閱讀
    PerfXCloud 重大更新  <b class='flag-5'>端</b><b class='flag-5'>側(cè)</b><b class='flag-5'>多</b><b class='flag-5'>模態(tài)</b><b class='flag-5'>模型</b> <b class='flag-5'>MiniCPM-Llama3-V</b> 2.5 閃亮上架

    如何在邊緣獲得GPT4-V的能力:算力魔方+MiniCPM-V 2.6

    GPT4-V的能力:MiniCPM-V 2.6 。 MiniCPM-V 2.6是MiniCPM-V系列最新、性能最佳的模型,基于SigLip
    的頭像 發(fā)表于 01-20 13:40 ?585次閱讀
    如何在邊緣<b class='flag-5'>端</b>獲得GPT4-<b class='flag-5'>V</b>的能力:算力魔方+<b class='flag-5'>MiniCPM-V</b> 2.6

    重磅發(fā)布 | 矽速 M4N Dock 支持 DeepSeek R1,側(cè)模型部署新標(biāo)桿!

    01性能炸裂速度領(lǐng)先RK358815%,性能直逼OrinNano!久等了!矽速M(fèi)4NDock(愛芯派Pro,AX650N)已支持部署DeepSeekR1大模型,實(shí)測運(yùn)行速度超越RK3588達(dá)15
    的頭像 發(fā)表于 02-18 15:35 ?750次閱讀
    重磅發(fā)布 | 矽速 M4<b class='flag-5'>N</b> Dock 支持 DeepSeek R1,<b class='flag-5'>端</b><b class='flag-5'>側(cè)</b>大<b class='flag-5'>模型</b><b class='flag-5'>部署</b>新標(biāo)桿!