一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

英偉達(dá)發(fā)布AI模型 Llama-3.1-Nemotron-51B AI模型

A面面觀 ? 2024-09-26 17:30 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

英偉達(dá)公司宣布推出 Llama-3.1-Nemotron-51B AI 模型,這個(gè)AI大模型是源自 Meta 公司的 Llama-3.1-70B大模型,基于使用了神經(jīng)架構(gòu)搜索(NAS)方法,推理速度比原70B大模型提升2.2倍,具備更準(zhǔn)確和更高效的運(yùn)算效率;能夠大幅降低運(yùn)行成本。

通過(guò)NAS技術(shù)微調(diào);大幅降低了內(nèi)存消耗、計(jì)算復(fù)雜性;Llama-3.1-Nemotron-51B AI 模型在單個(gè)H100 GPU上的表現(xiàn)非常優(yōu)秀,在推理過(guò)程中可以在單個(gè) GPU 上運(yùn)行 4 倍以上的工作負(fù)載。這使得單片H100 GPU即可處理更大型的推理任務(wù);這無(wú)疑是顯著的降低了訓(xùn)練成本。這為AI提供了高效、經(jīng)濟(jì)的方案。



聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 英偉達(dá)
    +關(guān)注

    關(guān)注

    22

    文章

    3953

    瀏覽量

    93809
  • AI大模型
    +關(guān)注

    關(guān)注

    0

    文章

    376

    瀏覽量

    618
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    AI模型不再依賴英偉達(dá)GPU?蘋果揭秘自研大模型

    ? 電子發(fā)燒友網(wǎng)報(bào)道(文/梁浩斌)過(guò)去幾年中爆發(fā)的AI算力需求,英偉達(dá)GPU成為了最大的贏家,無(wú)論是自動(dòng)駕駛還是AI模型,比如特斯拉、小鵬
    的頭像 發(fā)表于 08-05 06:07 ?4652次閱讀
    <b class='flag-5'>AI</b>大<b class='flag-5'>模型</b>不再依賴<b class='flag-5'>英偉</b><b class='flag-5'>達(dá)</b>GPU?蘋果揭秘自研大<b class='flag-5'>模型</b>

    使用 NPU 插件對(duì)量化的 Llama 3.1 8b 模型進(jìn)行推理時(shí)出現(xiàn)“從 __Int64 轉(zhuǎn)換為無(wú)符號(hào) int 的錯(cuò)誤”,怎么解決?

    安裝了 OpenVINO? GenAI 2024.4。 使用以下命令量化 Llama 3.1 8B 模型: optimum-cli export openvino -m meta-
    發(fā)表于 06-25 07:20

    NVIDIA 推出開(kāi)放推理 AI 模型系列,助力開(kāi)發(fā)者和企業(yè)構(gòu)建代理式 AI 平臺(tái)

    月 18 日 —— ?NVIDIA 今日發(fā)布具有推理功能的開(kāi)源 Llama Nemotron 模型系列,旨在為開(kāi)發(fā)者和企業(yè)提供業(yè)務(wù)就緒型基礎(chǔ),助力構(gòu)建能夠獨(dú)立工作或以團(tuán)隊(duì)形式完成復(fù)雜
    發(fā)表于 03-19 09:31 ?237次閱讀
    NVIDIA 推出開(kāi)放推理 <b class='flag-5'>AI</b> <b class='flag-5'>模型</b>系列,助力開(kāi)發(fā)者和企業(yè)構(gòu)建代理式 <b class='flag-5'>AI</b> 平臺(tái)

    IBM在watsonx.ai平臺(tái)推出DeepSeek R1蒸餾模型

    IBM近日宣布了一項(xiàng)重要更新,為其企業(yè)級(jí)AI開(kāi)發(fā)平臺(tái)watsonx.ai引入了DeepSeek R1的Llama 3.1 8B
    的頭像 發(fā)表于 02-14 10:21 ?534次閱讀

    英偉達(dá)發(fā)布Nemotron-CC大型AI訓(xùn)練數(shù)據(jù)庫(kù)

    近日,英偉達(dá)在其官方博客上宣布了一項(xiàng)重大進(jìn)展,推出了一款名為Nemotron-CC的大型英文AI訓(xùn)練數(shù)據(jù)庫(kù)。這一數(shù)據(jù)庫(kù)的發(fā)布,標(biāo)志著
    的頭像 發(fā)表于 01-14 14:14 ?487次閱讀

    NVIDIA推出開(kāi)放式Llama Nemotron系列模型

    作為 NVIDIA NIM 微服務(wù),開(kāi)放式 Llama Nemotron 大語(yǔ)言模型和 Cosmos Nemotron 視覺(jué)語(yǔ)言模型可在任何
    的頭像 發(fā)表于 01-09 11:11 ?757次閱讀

    Meta重磅發(fā)布Llama 3.3 70B:開(kāi)源AI模型的新里程碑

    新的高度。 一,技術(shù)突破:開(kāi)源智能的新高度 Llama 3.3 70B 模型發(fā)布,標(biāo)志著開(kāi)源AI模型
    的頭像 發(fā)表于 12-18 16:46 ?586次閱讀
    Meta重磅<b class='flag-5'>發(fā)布</b><b class='flag-5'>Llama</b> 3.3 70<b class='flag-5'>B</b>:開(kāi)源<b class='flag-5'>AI</b><b class='flag-5'>模型</b>的新里程碑

    Meta推出Llama 3.3 70B,AI模型競(jìng)爭(zhēng)白熱化

    在今年的AI領(lǐng)域,Meta也不甘落后,推出了其壓軸之作——Llama 3.3 70B模型。與此同時(shí),馬斯克的xAI也宣布其Grok模型從今
    的頭像 發(fā)表于 12-09 14:50 ?806次閱讀

    Llama 3 與開(kāi)源AI模型的關(guān)系

    在人工智能(AI)的快速發(fā)展中,開(kāi)源AI模型扮演著越來(lái)越重要的角色。它們不僅推動(dòng)了技術(shù)的創(chuàng)新,還促進(jìn)了全球開(kāi)發(fā)者社區(qū)的合作。Llama 3,作為一個(gè)新興的
    的頭像 發(fā)表于 10-27 14:42 ?780次閱讀

    Llama 3 模型與其他AI工具對(duì)比

    Llama 3模型與其他AI工具的對(duì)比可以從多個(gè)維度進(jìn)行,包括但不限于技術(shù)架構(gòu)、性能表現(xiàn)、應(yīng)用場(chǎng)景、定制化能力、開(kāi)源與成本等方面。以下是對(duì)Llama 3
    的頭像 發(fā)表于 10-27 14:37 ?1072次閱讀

    NVIDIA Nemotron-4 340B模型幫助開(kāi)發(fā)者生成合成訓(xùn)練數(shù)據(jù)

    Nemotron-4 340B 是針對(duì) NVIDIA NeMo 和 NVIDIA TensorRT-LLM 優(yōu)化的模型系列,該系列包含最先進(jìn)的指導(dǎo)和獎(jiǎng)勵(lì)模型,以及一個(gè)用于生成式
    的頭像 發(fā)表于 09-06 14:59 ?738次閱讀
    NVIDIA <b class='flag-5'>Nemotron</b>-4 340<b class='flag-5'>B</b><b class='flag-5'>模型</b>幫助開(kāi)發(fā)者生成合成訓(xùn)練數(shù)據(jù)

    英偉達(dá)震撼發(fā)布:全新AI模型參數(shù)規(guī)模躍升至80億量級(jí)

    8月23日,英偉達(dá)宣布,其全新AI模型面世,該模型參數(shù)規(guī)模高達(dá)80億,具有精度高、計(jì)算效益大等優(yōu)勢(shì),適用于GPU加速的數(shù)據(jù)中心、云及工作站環(huán)
    的頭像 發(fā)表于 08-23 16:08 ?1108次閱讀

    Meta Llama 3.1系列模型可在Google Cloud上使用

    我們很高興宣布,Llama 3.1 系列模型已添加到 Vertex AI Model Garden,這包括全新的 405B,即 Meta 迄
    的頭像 發(fā)表于 08-02 15:42 ?739次閱讀

    Meta發(fā)布全新開(kāi)源大模型Llama 3.1

    科技巨頭Meta近期震撼發(fā)布了其最新的開(kāi)源人工智能(AI模型——Llama 3.1,這一舉措標(biāo)志著Meta在
    的頭像 發(fā)表于 07-24 18:25 ?1788次閱讀

    NVIDIA AI Foundry 為全球企業(yè)打造自定義 Llama 3.1 生成式 AI 模型

    借助 NVIDIA AI Foundry,企業(yè)和各國(guó)現(xiàn)在能夠使用自有數(shù)據(jù)與 Llama 3.1 405B 和 NVIDIA Nemotron
    發(fā)表于 07-24 09:39 ?920次閱讀
    NVIDIA <b class='flag-5'>AI</b> Foundry 為全球企業(yè)打造自定義 <b class='flag-5'>Llama</b> <b class='flag-5'>3.1</b> 生成式 <b class='flag-5'>AI</b> <b class='flag-5'>模型</b>