一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

從2023 GTC談NVIDIA硬核技術

智能計算芯世界 ? 來源:Nvidia 2023開發(fā)者大會 ? 2023-03-28 09:28 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

2023 年 GTC 大會上,英偉達 CEO 發(fā)布了四個全新推理平臺,每個平臺都包含針對特定的 AIGC 推理工作負載優(yōu)化的 NVIDIA GPU 以及專用軟件:

1)用于圖像渲染和 AI 視頻的 L4。L4 提供增強的視頻解碼/轉(zhuǎn)碼、視頻流、增強現(xiàn)實以及生成 AI 視頻等功能,可提供比 CPU 高 120 倍的 AI 視頻性能,一臺 8 卡 L4 服務器能夠替代 100 多臺用于處理 AI 視頻的雙插槽 CPU 服務器。

2)用于 Omniverse、圖像生成、文本轉(zhuǎn)圖像等各類生成式 AI 的 L40。L40 針對圖形和支持 AI 的 2D、視頻和 3D 圖像生成進行了優(yōu)化。L40 平臺作為 Omniverse 的引擎,用于在數(shù)據(jù)中心構建和運行元宇宙應用程序,推理性能是云推理 GPU T4 的 10 倍。

3)用于大語言模型(LLM)推理的 H100 NVL。H100 NVLGPU 適用于大規(guī)模部署 ChatGPT 等大型 LLM。H100 NVL 通過 NVLINK 將兩張 H100 PCIE 橋接在一起,其中的每張卡擁有 94GB HBM3 內(nèi)存,同時內(nèi)置 Transformer 引擎。與目前唯一可以在云上處理 GPT 模型的 HXG A100 相比,一臺搭載四對 H100 NVL 和雙 GPU NVLINK 的服務器可以將推理速度提高 10 倍。

4)Grace Hopper Superchip 適用于推薦模型、向量數(shù)據(jù)庫和大型語言模型的 AI 數(shù)據(jù)庫,并通過 NVLink-C2C 技術為 Grace CPU 和 Hopper GPU 之間提供高達 900GB/s 的高速連接,CPU 查詢和存儲巨型嵌入表,GPU 負責將收到的結果進行推理,整體是 PCIE 速度的 7 倍。

一、DGX CloudAI超級計算服務DGX Cloud提供專用的NVIDIA DGX AI超級計算集群,搭配NVIDIA AI軟件,可讓企業(yè)立即訪問為生成AI和其他突破性應用程序訓練高級模型所需的基礎設施和軟件。該服務使每個企業(yè)都可以使用簡單的網(wǎng)絡瀏覽器訪問自己的AI超級計算機,企業(yè)按月租用DGX Cloud集群,確??煽焖佥p松地擴展大型多節(jié)點訓練工作負載的開發(fā),而無需等待通常需求量很大的加速計算資源。 NVIDIA Base Command平臺軟件:可使用其管理和監(jiān)控DGX Cloud訓練工作負載,該軟件可在DGX Cloud以及本地NVIDIA DGX超級計算機上提供無縫的用戶體驗。使用Base Command Platform,客戶可將其工作負載與每項工作所需的正確數(shù)量和類型的DGX基礎設施相匹配。DGX Cloud包括NVIDIA AI Enterprise,平臺的軟件層,提供端到端的AI框架和預訓練模型。今日發(fā)布的NVIDIA AI Enterprise 3.1提供了新的預訓練模型、優(yōu)化框架和加速數(shù)據(jù)科學軟件庫,為開發(fā)人員的AI項目提供了額外的快速啟動。行業(yè)巨頭案例:

①Amgen(世界領先的生物技術公司之一)正在使用DGX Cloud和NVIDIA BioNeMo大型語言模型軟件來加速藥物發(fā)現(xiàn),包括NVIDIA AI Enterprise軟件,內(nèi)含NVIDIA RAPIDS數(shù)據(jù)科學加速庫。

②CCC Intelligent Solutions (領先的財產(chǎn)和意外傷害保險經(jīng)濟云平臺,CCC)正在使用DGX Cloud來加速和擴展其AI模型的開發(fā)和培訓。

③ServiceNow(數(shù)字業(yè)務平臺提供商)將DGX Cloud與本地NVIDIA DGX超級計算機結合使用,以實現(xiàn)靈活、可擴展的混合云AI超級計算,這有助于推動其在大型語言模型、代碼生成和因果分析方面的AI研究。二、Picasso Service云服務

用途:用于構建和部署生成式AI驅(qū)動的圖像、視頻和3D應用程序,具有高級文本到圖像、文本到視頻和文本轉(zhuǎn)3D功能,可通過簡單云API提高創(chuàng)造力、設計和數(shù)字模擬的生產(chǎn)力。用法:軟件制造商、服務提供商和企業(yè)可使用Picasso在其專有數(shù)據(jù)上訓練NVIDIA Edify基礎模型,以構建使用自然文本提示的應用程序,從而為數(shù)百個用例快速創(chuàng)建和定制視覺內(nèi)容,包括產(chǎn)品設計、數(shù)字孿生、講故事和人物創(chuàng)作。拓展:要構建自定義應用程序,企業(yè)還可以從Picasso的Edify模型集開始,這些模型使用完全許可的數(shù)據(jù)進行預訓練,還可以使用Picasso來優(yōu)化和運行生成式AI模型。三、NVIDIA BioNeMo服務BioNeMo Service是一種用于早期藥物發(fā)現(xiàn)中生成AI的云服務,具有九種最先進的大型語言和擴散模型。可通過Web界面或完全托管的API訪問,并且可以在NVIDIA DGX Cloud上進一步訓練和優(yōu)化,生物學生成式AI的工作流程得到了優(yōu)化和統(tǒng)包。 BioNeMo服務具有九個AI生成模型,涵蓋了開發(fā)AI藥物發(fā)現(xiàn)管道的廣泛應用:AlphaFold 2、ESMFold和OpenFold用于根據(jù)一級氨基酸序列預測3D蛋白質(zhì)結構、用于蛋白質(zhì)特性預測的ESM-1nv和ESM-2、用于蛋白質(zhì)生成的ProtGPT2、MegaMolBART和MoFlow用于小分子生成、用于預測小分子與蛋白質(zhì)結合結構的DiffDock等。

21f8ab8a-ccf8-11ed-bfe3-dac502259ad0.png

四、推出四種配置:L4、L40、H100 NVL、Grace Hopper

L4:一臺8-GPU L4服務器將取代一百多臺用于處理AI視頻的雙插槽CPU服務器。L40:針對Omniverse、圖形渲染以及文本轉(zhuǎn)圖像和文本轉(zhuǎn)視頻等生成式AI,推出L40,其性能是云推理GPU T4的10倍。

H100 NVL:針對ChatGPT等大型語言模型的推理,推出Hopper GPU,配備雙GPU NVLink的 PCIE H100 , H100 NVL配備94GB HBM3顯存,可處理擁有1750億參數(shù)的GPT-3, 同時還可支持商用PCIE服務器輕松擴展。

Grace Hopper:新超級芯片,通過900GB/秒高速一致性芯片到芯片接口,非常適合處理大型數(shù)據(jù)集,例如推薦系統(tǒng)和大型語言模型的AI數(shù)據(jù)庫借助Grace Hopper,Grace可以查詢嵌入表,并將結果直接傳入到Hopper,速度比PCIE快7倍。

五、Omniverse應用Omniverse是實現(xiàn)工業(yè)數(shù)字化的數(shù)字到物理操作系統(tǒng),是云原生,同時不限平臺,可讓團隊隨時隨地在我們的虛擬工場中展開協(xié)作。Omniverse網(wǎng)絡中的網(wǎng)絡正在呈指數(shù)級增長,還連接了Siemens Teamcenter、NX和Process Simulate、RockWell Automation Emulate3D、Cesium、Unity等許多應用。應用于汽車企業(yè)數(shù)字化:①沃爾沃汽車公司和通用汽車使用Omniverse USD Composer連接和統(tǒng)一其資產(chǎn)工作流,并將汽車零部件在虛擬環(huán)境中組裝成數(shù)字孿生汽車,在工程和仿真中, Omniverse將Powerflow空氣動力學可視化。 ②新一代梅賽德斯-奔馳和捷豹陸虎汽車,使用Omniverse Drive Sim生成,梅賽德斯奔馳使用Omniverse為新車型構建、優(yōu)化和規(guī)劃組裝流水線。 ③豐田公司使用Omniverse構建工廠的數(shù)字孿生。

三款專為Omniverse設計的系統(tǒng):

①新工作站,由NVIDIA Ada RTX GPU和英特爾最新款CPU提供動力支持,適合光線追蹤、物理仿真、神經(jīng)圖形和生成式AI,2023年3月起,BOXX、戴爾、惠普、聯(lián)想將提供這款工作站。

②新型NVIDIA OVX服務器,由Omniverse優(yōu)化而來,OVX由服務器GPU Ada RTX L40和BlueField-3組成,將由戴爾、HPE、Quanta、技嘉、聯(lián)想和Supermicro提供。

③Omniverse Cloud,基于NVIDIA OVX運算系統(tǒng)推出, 每一層Omniverse堆棧包括芯片、系統(tǒng)、網(wǎng)絡和軟件都是新發(fā)明,正將Omniverse連接到微軟365生產(chǎn)力套件。

六、超算及云服務

發(fā)布Grace、Grace-Hopper和BlueField-3三款新芯片,適用于超級節(jié)能加速數(shù)據(jù)中心,更新了100個加速庫,包括用于量子計算的cuQuantum、用于組合優(yōu)化的cuOpt、以及用于計算光刻的cuLitho(與臺積電、ASML和Synopsys合作,達到2nm及更高制程),可將計算光刻用時提速40倍。計算光刻:500套DGX H100(包含4000顆Hopper GPU)可完成與4萬顆CPU運算服務器相同的工作量,但速度快40倍,功耗低9倍,即意味著GPU加速后,生產(chǎn)光掩模的計算光刻工作用時可以從幾周減少到八小時。 NVIDIA DGX AI超級計算機是生成式大型言模型取得突破的引擎,DGX H100 AI超級計算機正在生產(chǎn),并即將通過全球不斷擴大的OEM和云服務合作伴網(wǎng)絡面世。DGX沒有止步于研究,正在成為現(xiàn)代化AI工廠,Nvidia通過與Azure、Google GCP、Oracle OCI合作,拓展NVIDIA DGX Cloud業(yè)務模式。

七、總結

英偉達推出了新的推理平臺,包括四種配置和一個體系架構:

①適用于處理AI視頻的8-GPU服務器L4。

②適用于Omniverse和圖形渲染的L40。

③適用于擴展LLM推理的H100PCIE。

④適用于推薦系統(tǒng)和向量數(shù)據(jù)庫的Grace-Hopper。 此外,通過與Google合作,Google GCP成為首款NVIDIA AI云,NVIDIA AI Foundations是一個云服務和代工廠,用于構建自定義語言模型和生成式AI,包括語言視覺和生物學模型構建服務。

Omniverse是實現(xiàn)工業(yè)數(shù)字化的數(shù)字到物理操作系統(tǒng),可以統(tǒng)一端到端工作流,并將價值3萬億美元的汽車行業(yè)數(shù)字化;在Azure上進行托管,與微軟合作,將Omniverse Cloud引入各行業(yè)。

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • NVIDIA
    +關注

    關注

    14

    文章

    5299

    瀏覽量

    106303
  • 超級計算機
    +關注

    關注

    2

    文章

    472

    瀏覽量

    42456
  • 數(shù)字化
    +關注

    關注

    8

    文章

    9500

    瀏覽量

    63503

原文標題:從2023 GTC談NVIDIA硬核技術

文章出處:【微信號:AI_Architect,微信公眾號:智能計算芯世界】歡迎添加關注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    小米將投入資金超100億元,爭取在“硬核技術”上突圍

    小米公司今年成立10周年了,以往給大家的印象就是性價比制勝,不過這兩年來小米一直在轉(zhuǎn)型技術領先。雷軍今天在采訪中更表態(tài),要下決心突圍硬核技術。
    的頭像 發(fā)表于 10-15 09:38 ?1760次閱讀

    GTC2022大會亮點:RAPIDS是NVIDIA備受歡迎的NVIDIA SDK之一

    GTC2022大會亮點:RAPIDS是NVIDIA備受歡迎的NVIDIA SDK之一,僅次于用于深度學習的cuDNN。
    的頭像 發(fā)表于 03-24 16:43 ?1474次閱讀
    <b class='flag-5'>GTC</b>2022大會亮點:RAPIDS是<b class='flag-5'>NVIDIA</b>備受歡迎的<b class='flag-5'>NVIDIA</b> SDK之一

    NVIDIA GTC 2023看點:AI計算系統(tǒng)、生成式AI 、工業(yè)元宇宙與機器人

    NVIDIA GTC 2023看點:AI 計算系統(tǒng)、生成式 AI 、工業(yè)元宇宙與機器人 GTC 2023 線上大會將于 3 月 20 日至
    的頭像 發(fā)表于 03-22 13:42 ?1735次閱讀
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>GTC</b> <b class='flag-5'>2023</b>看點:AI計算系統(tǒng)、生成式AI 、工業(yè)元宇宙與機器人

    NVIDIA GTC 2023:GPU算力是AI的必需品

    OpenAI發(fā)布GPT-4,到百度發(fā)布文心一言;AI開始了爆走模式,現(xiàn)在我們來看看 NVIDIA GTC 2023 。 手握GPU算力的NVIDI
    的頭像 發(fā)表于 03-22 15:23 ?3527次閱讀
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>GTC</b> <b class='flag-5'>2023</b>:GPU算力是AI的必需品

    NVIDIA GTC 2023:摩爾定律的動力來源是AI

    NVIDIA GTC 2023:摩爾定律的動力來源是AI 在 NVIDIA GTC 2023
    的頭像 發(fā)表于 03-22 16:48 ?1857次閱讀
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>GTC</b> <b class='flag-5'>2023</b>:摩爾定律的動力來源是AI

    英偉達 GTC 2023上黃仁勛生成式AI

    英偉達 GTC 2023上黃仁勛生成式AI 黃教主在GTC 2023上大談特生成式AI,同時
    的頭像 發(fā)表于 03-22 17:14 ?2134次閱讀
    英偉達 <b class='flag-5'>GTC</b> <b class='flag-5'>2023</b>上黃仁勛<b class='flag-5'>談</b>生成式AI

    GTC 2023上英偉達發(fā)布NVIDIA DGX Cloud人工智能云服務

    2023 GTC大會上線,在大會的主題演講中,黃仁勛圍繞AI、量子計算、芯片等前沿科技,發(fā)布了一系列前沿技術和產(chǎn)品。包括:L4 Tensor Core GPU、L40 GPU、H100 NVL
    的頭像 發(fā)表于 03-22 19:16 ?3826次閱讀
    <b class='flag-5'>GTC</b> <b class='flag-5'>2023</b>上英偉達發(fā)布<b class='flag-5'>NVIDIA</b> DGX Cloud人工智能云服務

    GTC 2023NVIDIA cuLitho將加速計算引入計算光刻技術領域的突破性成果

    領域的突破成果.NVIDIA宣布推出一項將加速計算引入計算光刻技術領域的突破性成果。在當前生產(chǎn)工藝接近物理極限的情況下,這項突破使ASML、TSMC和Synopsys等半導體行業(yè)領導者能夠加快新一代芯片的設計和制造。 官網(wǎng)直播截圖 在2
    的頭像 發(fā)表于 03-22 19:29 ?1.1w次閱讀
    <b class='flag-5'>GTC</b> <b class='flag-5'>2023</b>:<b class='flag-5'>NVIDIA</b> cuLitho將加速計算引入計算光刻<b class='flag-5'>技術</b>領域的突破性成果

    GTC 2023上黃仁勛AI ChatGPT僅是一個起點NVIDIA將AI引入各行各業(yè)

    GTC 2023上黃仁勛AI ChatGPT僅是一個起點NVIDIA將AI引入各行各業(yè) ChatGPT是非常火爆但是; ChatGPT僅是一個起點。
    的頭像 發(fā)表于 03-22 19:42 ?2787次閱讀
    <b class='flag-5'>GTC</b> <b class='flag-5'>2023</b>上黃仁勛<b class='flag-5'>談</b>AI ChatGPT僅是一個起點<b class='flag-5'>NVIDIA</b>將AI引入各行各業(yè)

    GTC 2023 NVIDIA將加速計算引入半導體光刻 計算光刻技術提速40倍

    GTC 2023 NVIDIA將加速計算引入半導體光刻 計算光刻技術提速40倍 NVIDIA cuLitho的計算光刻庫可以將計算光刻
    的頭像 發(fā)表于 03-23 18:55 ?8379次閱讀
    <b class='flag-5'>GTC</b> <b class='flag-5'>2023</b> <b class='flag-5'>NVIDIA</b>將加速計算引入半導體光刻 計算光刻<b class='flag-5'>技術</b>提速40倍

    周五研討會預告 | 回顧 GTC23 精彩內(nèi)容,助力創(chuàng)業(yè)生態(tài)發(fā)展 — NVIDIA 初創(chuàng)加速計劃 Omniverse 加速營

    新一期? NVIDIA 初創(chuàng)加速計劃 Omniverse TM 加速營 即將開始,來自 NVIDIA 、麗臺科技的技術專家以及國泰創(chuàng)投的投融資專家將齊聚一堂,解讀 GTC
    的頭像 發(fā)表于 04-21 05:45 ?580次閱讀
    周五研討會預告 | 回顧 <b class='flag-5'>GTC</b>23 精彩內(nèi)容,助力創(chuàng)業(yè)生態(tài)發(fā)展 — <b class='flag-5'>NVIDIA</b> 初創(chuàng)加速計劃 Omniverse 加速營

    NVIDIA GTC 2025大會即將啟幕

    NVIDIA 宣布,全球頂尖的 AI 盛會 GTC 2025 將于 3 月 17 至 21 日重返美國加州圣何塞,屆時 AI 領域的精英人士將齊聚 GTC,展示當前物理 AI、代理式 AI 和科學
    的頭像 發(fā)表于 03-10 17:19 ?1058次閱讀

    益登科技邀您相約NVIDIA GTC 2025

    NVIDIA GTC人工智能大會將于下周在美國加州圣何塞舉行。
    的頭像 發(fā)表于 03-11 17:33 ?805次閱讀

    NVIDIA GTC 2025精華一文讀完 黃仁勛在GTC上的主題演講

    來自 NVIDIA 年度最大活動 GTC 的精華新聞,內(nèi)容涵蓋最新服務和硬件、技術演示以及 AI 的未來發(fā)展趨勢。 GTC 2025 將揭示 AI 的最新發(fā)展趨勢。這里不僅有最新
    的頭像 發(fā)表于 03-20 14:54 ?1039次閱讀
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>GTC</b> 2025精華一文讀完 黃仁勛在<b class='flag-5'>GTC</b>上的主題演講

    颯特紅外如何用硬核技術重構救援效率

    ,必須能在人類視覺失效的「盲區(qū)」里,讓生命信號清晰顯現(xiàn)。今天,就以搜救場景為核心,聊聊颯特紅外如何用硬核技術重構救援效率。
    的頭像 發(fā)表于 05-10 09:26 ?376次閱讀