一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

面壁小鋼炮模型MiniCPM4.0發(fā)布,端側智能更進一步

Carol Li ? 來源:電子發(fā)燒友 ? 作者:李彎彎 ? 2025-06-08 08:18 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群



電子發(fā)燒友網報道(文/李彎彎)2025年6月6日,面壁智能CEO李大海在北京智源大會上發(fā)布有史以來最具想象力的面壁小鋼炮模型MiniCPM4.0,代號“前進四”,開源兩個版本,8B閃電稀疏版和0.5B最強小小鋼炮。





李大海表示,面壁智能是第一個把全模態(tài)模型帶到端側的公司。面壁智能小鋼炮,旨在把大模型放到離用戶最近的地方,做高效的端側智能。

MiniCPM4.0最大的特點——快

2019年面壁智能超前入局大模型,發(fā)布世界首個知識增強大模型ERNE,2020年發(fā)布國內首個中文大模型CPM-1,2021年發(fā)布持續(xù)學習發(fā)模型CPM-2,2022年發(fā)布可控生成大模型CPM-3;2023年,面壁智能又發(fā)布CPM-Bee多語言百億大模型,之后還發(fā)布了第三代千億參數多模態(tài)大模型CPM-Cricket,評分超越GPT-3.5,邏輯能力比肩GPT-4。

2024年面壁智能領先走向端側智能。2月發(fā)布MiniCPM-2B旗艦級端側模型;4月發(fā)布MiniCPM 2.0;9月發(fā)布MiniCPM-V 2.6,在端側性能實現(xiàn)全面對標 GPT-4V;12月發(fā)布MiniCPM 3.0,在包括自然語言理解、知識、代碼、數學等多項能力上超越OpenAI的 GPT-3.5;2025年1月,面壁智能發(fā)布MiniCPM-o 2.6端側全模態(tài)模型,性能比肩GPT-4o;2025年3月發(fā)布cpmGO,首個純端側智能體助手。



李大海介紹,面壁智能端側大模型面壁小鋼炮包括基座模型MiniCPM、旗艦多模態(tài)模型MiniCPM-V、旗艦全模態(tài)模型MiniCPM-o。截至目前,面壁小鋼炮旗艦端側大模型有超過1000萬下載量。李大海表示:“這是千千萬萬開發(fā)者對我們的認可,未來還會持續(xù)發(fā)布更好的端側大模型,賦能智能硬件的創(chuàng)新和開發(fā)?!?br />


“這次發(fā)布的面壁小鋼炮模型MiniCPM4.0版本,最大的特點就是快?!崩畲蠛U劦?,“相比其他模型,MiniCPM4.0-8B僅22%訓練開銷,在同等參數下,性能更強,可對標Qwen3-8B,超越Gemma3-12B?!?br />
MiniCPM4-MCP支持15個主流應用,包括Airbnb、Github mcp、Slack、PPTs、PowerPoint、office-Word-Mcp-Server、Computer Use、Desktop-commander、File_system、OpenAI Whisper等;MiniCPM4-Survey端側版表現(xiàn)比肩DeepResearch。



面壁小鋼炮正在進行廣泛的生態(tài)適配,適配主流芯片與開源框架部署,芯片如括華為、英特爾、聯(lián)發(fā)科高通;開源框架如LLM、LlamaFactory、AutoGPT、SGland等。李大海強調,依托分塊稀疏注意力機制,MiniCPM4.0在英特爾平臺上推理深度優(yōu)化實現(xiàn)兩倍加速。

多維度技術創(chuàng)新——架構高效、推理高效

MiniCPM4.0之所以能夠做到又快又好,源于系統(tǒng)級層層效率優(yōu)化,包括四個層面:架構高效、推理高效、學習高效、數據高效。



架構高效方面,MiniCPM4.0采用InfLLM升級版InfLLM 2.0稀疏注意力結構。李大海介紹說,稀疏度越高,計算量越小,速度越快。傳統(tǒng)Transformer模型每token需和序列中所有token進行相關性計算逐字重復計算,效率低下。InfLLM 稀疏注意力機制,對文本分塊分區(qū)域處理,只對最具相關性重點區(qū)城進行注意力計算“抽查”,更高效。

而且MiniCPM4.0采用高效雙頻換擋,即長文本用稀疏,短文本用稠密。



推理高效方面,面壁智能自研全套端側高性能推理框架。CPM.cu自研極速端側推理框架,稀疏、投機和量化的高效結合,F(xiàn)R-Spec輕量化投機采樣,并給小模型減負加速,使得速度提升5倍;BitCPM極致低位寬量化,端側極致內存容量友好,4-bit量化達業(yè)界SOTA等級,瘦身90%;Arklnfer自研跨平臺部署框架,面向多平臺端側芯片極致優(yōu)化,跨平臺高效投機采樣和限制解碼,端側多平臺 ModelZoo絲滑使用,速度提升2倍。

李大海表示,與云端不同,云端多采用英偉達、昇騰的芯片,而端側較為復雜,這種跨平臺部署框架對于大模型端側部署來說就極為重要。在他看來,面壁智能新帶來的面壁小鋼炮模型MiniCPM4.0,在多項技術的加持下,使用更少的數據,需要更少的訓練、更少的算力,因而成本也會下降,這有助于大模型能在更多場景實現(xiàn)落地。


聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 模型
    +關注

    關注

    1

    文章

    3516

    瀏覽量

    50368
  • 云模型
    +關注

    關注

    0

    文章

    10

    瀏覽量

    7093
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    Nordic PMIC全家桶,讓電源管理和節(jié)能更進一步

    使用 nPM2100 開始設計和開發(fā)應用。此外,nPM2100 評估套件 (EK) 也已全面上市,多家分銷商在發(fā)布當天提供庫存套件并進行銷售。 nPM2100 是款電源管理集成電路 (PMIC),旨在
    發(fā)表于 06-29 17:19

    恩智浦技術賦能下代家庭能源管理系統(tǒng)

    2024年11月發(fā)布了Matter 1.4版本,其中大亮點是它極大地擴展了對家庭能源管理系統(tǒng) (HEMS) 的支持。Matter 1.3引入了能源報告功能,實現(xiàn)大型家電和供電設備能源管理用例,而Matter 1.4則更進一步,
    的頭像 發(fā)表于 06-10 09:34 ?486次閱讀

    德賽西威與面壁智能發(fā)布模型語音交互方案

    日前,全球領先的移動出行科技公司德賽西威與模型技術領軍企業(yè)面壁智能共同發(fā)布業(yè)界首個基于高通
    的頭像 發(fā)表于 05-14 17:40 ?628次閱讀

    英特爾與面壁智能宣布建立戰(zhàn)略合作伙伴關系,共同研發(fā)端原生智能座艙,定義下代車載AI

    今日,英特爾與面壁智能簽署合作備忘錄。雙方宣布達成戰(zhàn)略級合作伙伴關系,旨在打造端原生智能座艙,定義下代車載AI。目前,雙方已合作推出“英
    的頭像 發(fā)表于 04-23 21:46 ?533次閱讀
    英特爾與<b class='flag-5'>面壁</b><b class='flag-5'>智能</b>宣布建立戰(zhàn)略合作伙伴關系,共同研發(fā)端<b class='flag-5'>側</b>原生<b class='flag-5'>智能</b>座艙,定義下<b class='flag-5'>一</b>代車載AI

    首創(chuàng)開源架構,天璣AI開發(fā)套件讓AI模型接入得心應手

    AI巨頭強強聯(lián)手,勢必為智能體化AI體驗時代按下超級加速鍵。 AI終端的下一步是“普適智能”,而不是“極限性能”。聯(lián)發(fā)科憑借天璣9400+強悍的
    發(fā)表于 04-13 19:52

    廣和通CES 2025發(fā)布Fibocom AI Stack,賦能千行百業(yè)應用

    近日盛大舉行的國際消費電子產品展覽會(CES 2025)上,廣和通隆重發(fā)布了其創(chuàng)新的Fibocom AI Stack解決方案。這方案的發(fā)布,標志著廣和通在推動
    的頭像 發(fā)表于 01-08 15:18 ?833次閱讀

    訊飛星火模型發(fā)布

    參數量小、內存占比小的模型,正成為“兵家必爭之地”。
    的頭像 發(fā)表于 12-04 16:07 ?1362次閱讀

    黑芝麻智能算法參考模型公布

    黑芝麻智能計劃推出支持華山及武當系列芯片的算法參考方案。該方案采用One Model架構,并在決策規(guī)劃單元引入了VLM視覺語言大模型和PRR行車規(guī)則的概率化表征子模塊,
    的頭像 發(fā)表于 12-03 12:30 ?920次閱讀
    黑芝麻<b class='flag-5'>智能</b><b class='flag-5'>端</b>到<b class='flag-5'>端</b>算法參考<b class='flag-5'>模型</b>公布

    谷歌計劃12月發(fā)布Gemini 2.0模型

    近日,有消息稱谷歌計劃在12月發(fā)布其下一代人工智能模型——Gemini 2.0。這消息引發(fā)了業(yè)界的廣泛關注,因為谷歌在人工智能領域
    的頭像 發(fā)表于 10-29 11:02 ?1132次閱讀

    科大訊飛發(fā)布訊飛星火4.0 Turbo大模型及星火多語言大模型

    近日,科大訊飛正式推出了其最新研發(fā)成果——訊飛星火4.0 Turbo大模型。這一發(fā)布不僅標志著科大訊飛在人工智能領域的又次重大突破,也預示
    的頭像 發(fā)表于 10-24 13:58 ?899次閱讀

    聯(lián)發(fā)科天璣9400發(fā)布:能效比與AI引領移動芯片行業(yè)革新

    在AI大模型的推動下,智能手機市場的高端化進程進一步加速,旗艦機型的競爭已不再單純依賴于“大力飛磚”式的極限性能比拼,而是更加注重綜合素質的提升。特別是在手機芯片領域,高性能與低功耗、高能效比的平衡成為了新的競爭焦點。
    的頭像 發(fā)表于 10-12 15:56 ?1134次閱讀

    通過展頻進一步優(yōu)化EMI

    電子發(fā)燒友網站提供《通過展頻進一步優(yōu)化EMI.pdf》資料免費下載
    發(fā)表于 09-04 09:32 ?1次下載
    通過展頻<b class='flag-5'>進一步</b>優(yōu)化EMI

    PerfXCloud 重大更新 多模態(tài)模型 MiniCPM-Llama3-V 2.5 閃亮上架

    近日,PerfXCloud完成重大更新,上架了面壁小鋼炮 MiniCPM 系列的多模態(tài)模型
    的頭像 發(fā)表于 08-27 18:20 ?790次閱讀
    PerfXCloud 重大更新  <b class='flag-5'>端</b><b class='flag-5'>側</b>多模態(tài)<b class='flag-5'>模型</b> <b class='flag-5'>MiniCPM</b>-Llama3-V 2.5 閃亮上架

    三星計劃10月發(fā)布Galaxy S24 FE,拓展中AI手機市場

    據8月14日外媒報道,三星電子正積極籌備在今年10月推出其全新的Galaxy S24 FE手機,并計劃在隨后的12月發(fā)布Galaxy A16手機,以此進一步鞏固和拓展其在中AI手機市場的地位。這
    的頭像 發(fā)表于 08-15 16:27 ?1074次閱讀

    基于AX650N芯片部署MiniCPM-V 2.0高效多模態(tài)大模型

    今年4月份,面壁智能&清華大學自然語言處理實驗室推出MiniCPM系列的最新多模態(tài)版本MiniCPM-V 2.0。該模型基于
    的頭像 發(fā)表于 07-15 09:34 ?1507次閱讀
    基于AX650N芯片部署<b class='flag-5'>MiniCPM</b>-V 2.0高效<b class='flag-5'>端</b><b class='flag-5'>側</b>多模態(tài)大<b class='flag-5'>模型</b>