一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Zyphra推出Zamba2-mini 1.2B模型

CHANBAEK ? 來源:網(wǎng)絡(luò)整理 ? 作者:網(wǎng)絡(luò)整理 ? 2024-08-29 18:13 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

近日,AI創(chuàng)新先鋒Zyphra公司在科技界投下了一顆震撼彈,正式揭曉其最新力作——Zamba2-mini 1.2B模型。這款被譽(yù)為端側(cè)SOTA(State-Of-The-Art)級別的小語言模型,以其卓越的性能參數(shù)和極致的壓縮效率,成為了業(yè)界關(guān)注的焦點(diǎn)。

Zamba2-mini 1.2B攜帶著驚人的12億參數(shù)量,卻能在嚴(yán)苛的4bit量化條件下,將內(nèi)存占用控制在驚人的700MB以下,這一成就無疑是對AI模型輕量化探索的一次重大突破。其背后,是Zyphra團(tuán)隊(duì)對模型架構(gòu)的深度優(yōu)化與大膽創(chuàng)新,成功融合了多種神經(jīng)網(wǎng)絡(luò)設(shè)計(jì)的精髓,既保留了大型密集變壓器模型的高質(zhì)量輸出特性,又實(shí)現(xiàn)了小模型難以企及的計(jì)算與內(nèi)存效率。

Zamba2-mini 1.2B的問世,不僅為端側(cè)設(shè)備提供了更為強(qiáng)大的智能支持,更預(yù)示著AI技術(shù)在實(shí)際應(yīng)用場景中的廣泛落地與深度融合。隨著這一技術(shù)的不斷成熟與普及,我們有理由相信,未來的端側(cè)AI將更加智能、高效,為人們的生活帶來更多便利與驚喜。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 變壓器
    +關(guān)注

    關(guān)注

    162

    文章

    7790

    瀏覽量

    139465
  • AI
    AI
    +關(guān)注

    關(guān)注

    88

    文章

    35164

    瀏覽量

    280024
  • 模型
    +關(guān)注

    關(guān)注

    1

    文章

    3521

    瀏覽量

    50434
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    在MAC mini4上安裝Ollama、Chatbox及模型交互指南

    作者:算力魔方創(chuàng)始人/英特爾創(chuàng)新大使劉力 一,簡介 本文將指導(dǎo)您如何在MAC mini4上安裝Ollama和Chatbox,并下載Deepseek-r1:32b模型。Ollama是一個(gè)用于管理和運(yùn)行
    的頭像 發(fā)表于 03-11 17:17 ?828次閱讀
    在MAC <b class='flag-5'>mini</b>4上安裝Ollama、Chatbox及<b class='flag-5'>模型</b>交互指南

    壁仞科技推出阿里QWQ-32B模型一體機(jī)

    能力等關(guān)鍵測試中展現(xiàn)出卓越性能。 作為國產(chǎn)AI算力重要推動(dòng)力量,壁仞科技不斷測試與更新適配最先進(jìn)大模型,聯(lián)合生態(tài)合作伙伴共同推出QWQ-32B模型一體機(jī)。 在
    的頭像 發(fā)表于 03-10 09:05 ?1226次閱讀
    壁仞科技<b class='flag-5'>推出</b>阿里QWQ-32<b class='flag-5'>B</b>大<b class='flag-5'>模型</b>一體機(jī)

    摩爾線程支持阿里云通義千問QwQ-32B開源模型

    近日,阿里云團(tuán)隊(duì)正式開源全新推理模型——通義千問QwQ-32B。摩爾線程在該模型發(fā)布后2小時(shí)內(nèi),迅速且高效完成了對千問QwQ-32B的支持。
    的頭像 發(fā)表于 03-07 17:48 ?721次閱讀
    摩爾線程支持阿里云通義千問QwQ-32<b class='flag-5'>B</b>開源<b class='flag-5'>模型</b>

    OpenAI o3-mini模型思維鏈遭質(zhì)疑

    近日,OpenAI公開了其大模型o3-mini的推理思維鏈,這一舉措使得免費(fèi)用戶和付費(fèi)用戶都能深入了解模型的思考過程。這一透明度的提升,原本旨在增強(qiáng)用戶對模型的信任和理解,然而卻意外引
    的頭像 發(fā)表于 02-08 10:57 ?644次閱讀

    OpenAI或?qū)?b class='flag-5'>推出o3 mini推理AI模型

    近日,據(jù)最新消息,OpenAI即將在幾周內(nèi)推出一款全新的推理AI模型——o3 mini。這一消息由OpenAI的首席執(zhí)行官Sam Altman在1月17日通過社交媒體平臺X發(fā)布的一篇文章中透露
    的頭像 發(fā)表于 01-21 10:06 ?644次閱讀

    OpenAI即將推出o3 mini推理AI模型

    計(jì)劃在接下來的幾周內(nèi)正式推出這一創(chuàng)新成果。 這一消息無疑為人工智能領(lǐng)域注入了新的活力。作為OpenAI的最新力作,o3 mini推理AI模型在技術(shù)上實(shí)現(xiàn)了諸多突破,旨在為用戶提供更加高效、精準(zhǔn)的推理服務(wù)。通過采用先進(jìn)的算法和
    的頭像 發(fā)表于 01-20 10:54 ?568次閱讀

    OpenAI即將推出o3-mini,降低高級推理門檻

    OpenAI在人工智能領(lǐng)域的探索與創(chuàng)新從未停歇,為開發(fā)者們帶來了一個(gè)又一個(gè)驚喜。近日,OpenAI開發(fā)者體驗(yàn)負(fù)責(zé)人傳來好消息,表示公司即將向廣大開發(fā)者推出全新的o3-mini模型。 這一消息的發(fā)布
    的頭像 發(fā)表于 01-18 11:23 ?839次閱讀

    圖森未來發(fā)布“Ruyi”視頻大模型,Ruyi-Mini-7B版本現(xiàn)已開源

    重大獻(xiàn)禮。 尤為值得一提的是,圖森未來已經(jīng)將Ruyi的Mini-7B版本正式開源,用戶現(xiàn)在可以通過huggingface平臺輕松下載并使用這一強(qiáng)大的工具。這一舉措無疑將極大地推動(dòng)視頻大模型在更廣泛領(lǐng)域的應(yīng)用和發(fā)展。 “Ruyi”模型
    的頭像 發(fā)表于 12-20 15:19 ?1422次閱讀

    Meta推出Llama 3.3 70B,AI大模型競爭白熱化

    在今年的AI領(lǐng)域,Meta也不甘落后,推出了其壓軸之作——Llama 3.3 70B模型。與此同時(shí),馬斯克的xAI也宣布其Grok模型從今天起全球免費(fèi)開放(但存在一定的使用限制)。
    的頭像 發(fā)表于 12-09 14:50 ?806次閱讀

    智譜推出四個(gè)全新端側(cè)模型 攜英特爾按下AI普及加速鍵

    ,GLM-Edge-4B-chat、GLM-Edge-1.5B-chat為端側(cè)大語言模型,GLM-Edge-V-5B、GLM-Edge-V-2B
    的頭像 發(fā)表于 12-02 17:13 ?600次閱讀
    智譜<b class='flag-5'>推出</b>四個(gè)全新端側(cè)<b class='flag-5'>模型</b> 攜英特爾按下AI普及加速鍵

    阿里國際推出全球首個(gè)B2B AI搜索引擎Accio

    近日,在歐洲科技峰會(huì)Web Summit上,阿里國際正式推出了全球首個(gè)B2B領(lǐng)域的AI搜索引擎——Accio。這一創(chuàng)新產(chǎn)品面向全球商家開放,標(biāo)志著阿里國際正式入局當(dāng)前備受矚目的AI Search賽道。
    的頭像 發(fā)表于 11-15 16:53 ?1213次閱讀

    PerfXCloud重磅升級 阿里開源最強(qiáng)視覺語言模型Qwen2-VL-7B強(qiáng)勢上線!

    體驗(yàn)吧! Qwen2-VL Qwen2-VL模型由阿里推出,在描述圖像、理解視頻以及解答視覺相關(guān)問題等方面表現(xiàn)極為卓越。該模型提供
    的頭像 發(fā)表于 10-23 11:07 ?774次閱讀
    PerfXCloud重磅升級  阿里開源最強(qiáng)視覺語言<b class='flag-5'>模型</b>Qwen<b class='flag-5'>2-VL-7B</b>強(qiáng)勢上線!

    英偉達(dá)發(fā)布AI模型 Llama-3.1-Nemotron-51B AI模型

    英偉達(dá)公司宣布推出 Llama-3.1-Nemotron-51B AI 模型,這個(gè)AI大模型是源自 Meta 公司的 Llama-3.1-70B
    的頭像 發(fā)表于 09-26 17:30 ?928次閱讀

    馬斯克旗下xAI對Grok-2-mini進(jìn)行速度升級

    科技巨頭馬斯克旗下的xAI公司近日宣布了一項(xiàng)重大進(jìn)展,其熱門語言模型Grok-2-mini成功完成了速度升級。
    的頭像 發(fā)表于 08-27 15:28 ?634次閱讀

    chatglm2-6b在P40上做LORA微調(diào)

    背景: 目前,大模型的技術(shù)應(yīng)用已經(jīng)遍地開花。最快的應(yīng)用方式無非是利用自有垂直領(lǐng)域的數(shù)據(jù)進(jìn)行模型微調(diào)。chatglm2-6b在國內(nèi)開源的大模型上,效果比較突出。本文章分享的內(nèi)容是用
    的頭像 發(fā)表于 08-13 17:12 ?847次閱讀
    chatglm<b class='flag-5'>2-6b</b>在P40上做LORA微調(diào)