一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

DeepSeek扔的第二枚開(kāi)源王炸是什么

A面面觀 ? 2025-02-26 11:05 ? 次閱讀

在DeepSeek啟動(dòng)的“開(kāi)源周”上(Open Source Week)DeepSeek將陸續(xù)開(kāi)源5個(gè)代碼庫(kù),大家關(guān)心的DeepSeek扔的第二枚開(kāi)源王炸是什么?我們這里來(lái)簡(jiǎn)單介紹一下。

DeepSeek在其開(kāi)源周活動(dòng)中連續(xù)扔出了兩枚震撼業(yè)界的“開(kāi)源王炸”--FlashMLA與DeepEP。

在25日,也就是DeepSeek開(kāi)源周的第二天,DeepSeek發(fā)布了名為DeepEP的開(kāi)源代碼庫(kù)。DeepEP是全球首個(gè)專為MoE(混合專家)模型訓(xùn)練和推理設(shè)計(jì)的通信庫(kù),它的出現(xiàn)填補(bǔ)了該領(lǐng)域?qū)S霉ぞ叩目瞻住oE模型作為一種能夠有效提升AI模型性能和擴(kuò)展性的架構(gòu),近年來(lái)在自然語(yǔ)言處理、計(jì)算機(jī)視覺(jué)等領(lǐng)域得到了廣泛應(yīng)用。然而,MoE模型在訓(xùn)練和推理過(guò)程中,面臨著通信開(kāi)銷大、算力需求高等挑戰(zhàn)。DeepEP正是針對(duì)這些痛點(diǎn),通過(guò)優(yōu)化GPU之間的信息傳輸效率,極大地緩解了從業(yè)者的算力焦慮。

業(yè)界人士多認(rèn)為DeepEP是首個(gè)用于 MoE 模型訓(xùn)練和推理的開(kāi)源 EP 通信庫(kù),它填補(bǔ)了MoE模型專用通信工具的空白,為大規(guī)模分布式AI訓(xùn)練和實(shí)時(shí)推理場(chǎng)景提供了更高效的底層支持。

DeepEP的核心優(yōu)勢(shì)在于其高效的通信機(jī)制。在傳統(tǒng)的分布式AI訓(xùn)練中,GPU之間的通信往往成為性能瓶頸。DeepEP通過(guò)一系列創(chuàng)新技術(shù),如低延遲通信協(xié)議、智能數(shù)據(jù)調(diào)度等,顯著提升了GPU之間的通信效率。這意味著,原本需要龐大算力支持的重型任務(wù),現(xiàn)在可以在更少的GPU上高效完成。據(jù)DeepSeek官方介紹,使用DeepEP后,某些MoE模型的訓(xùn)練速度可提升數(shù)倍,同時(shí)降低了對(duì)硬件資源的依賴。

wKgZPGe-hzaAY0kcAAFPhfhWeVs959.png

DeepEP的技術(shù)性能特點(diǎn)概述:

EP為Expert Parallelism(專家并行),是一種在大規(guī)模分布式AI模型訓(xùn)練中使用的技術(shù),能用于提升模型并行處理能力和訓(xùn)練效率。

1、高效通信架構(gòu)

支持優(yōu)化的全對(duì)全通信模式,實(shí)現(xiàn)節(jié)點(diǎn)內(nèi)和節(jié)點(diǎn)間的NVLink與RDMA互聯(lián),提升數(shù)據(jù)傳輸效率

2、多精度與調(diào)度優(yōu)化

原生支持FP8低精度運(yùn)算調(diào)度,降低計(jì)算資源消耗。

3、重性能內(nèi)核

據(jù)介紹,高吞吐量?jī)?nèi)核可適用于訓(xùn)練和推理預(yù)填充場(chǎng)景,最大化數(shù)據(jù)處理能力;

4、低延遲內(nèi)核

它針對(duì)推理解碼場(chǎng)景設(shè)計(jì),采用純RDMA通信和自適應(yīng)路由技術(shù),減少延遲。

5、資源控制與重疊機(jī)制

通過(guò)靈活的GPU資源控制策略,實(shí)現(xiàn)計(jì)算與通信過(guò)程的高效重疊,避免資源閑置。

6、深度優(yōu)化場(chǎng)景

針對(duì)NVLink到RDMA的非對(duì)稱帶寬轉(zhuǎn)發(fā)場(chǎng)景進(jìn)行專項(xiàng)優(yōu)化,提升異構(gòu)網(wǎng)絡(luò)下的傳輸性能;

支持SM(Streaming Multiprocessors)數(shù)量動(dòng)態(tài)控制,平衡不同任務(wù)(如訓(xùn)練與推理)的吞吐量需求。

DeepEP與FlashMLA的對(duì)比

DeepSeek在其開(kāi)源周活動(dòng)中首個(gè)開(kāi)源的項(xiàng)目是FlashMLA;FlashMLA讓AI大模型低成本卻有高性能。

DeepSeek扔的第二枚開(kāi)源王炸是全棧通信庫(kù)DeepEP。與第一枚開(kāi)源王炸FlashMLA相比,兩者在多個(gè)方面存在顯著差異。以下是對(duì)這兩者的詳細(xì)對(duì)比以及外媒的熱議:

1. 功能定位:

● DeepEP:它是全球首個(gè)面向MoE(Mixture of Experts)模型的全棧通信庫(kù),旨在優(yōu)化GPU之間的信息傳輸效率,從而極大提升AI模型的訓(xùn)練與推理效率。

● FlashMLA:專為英偉達(dá)Hopper架構(gòu)GPU(如H800/H100)優(yōu)化的高效MLA解碼內(nèi)核,旨在顯著提升AI的加速能力,特別是在處理長(zhǎng)短句子并行任務(wù)時(shí)能夠動(dòng)態(tài)調(diào)整計(jì)算資源分配,避免算力浪費(fèi)。

2. 技術(shù)特點(diǎn):

● DeepEP:具備高效的全員通信能力,支持NVLink與RDMA技術(shù),提供高吞吐量的訓(xùn)練預(yù)填充內(nèi)核以及低延遲的推理解碼內(nèi)核。原生支持FP8調(diào)度,靈活的GPU資源管理能力使得計(jì)算和通信可以重疊進(jìn)行。

● FlashMLA:專為高性能顯卡設(shè)計(jì),能夠充分挖掘顯卡性能潛力,被視為AI加速的“渦輪增壓器”。

3. 硬件兼容性:

● DeepEP:具有更廣泛的硬件兼容性,不受特定GPU架構(gòu)的限制。

● FlashMLA:目前僅適配Hopper架構(gòu)GPU,國(guó)產(chǎn)GPU的兼容性尚待驗(yàn)證。

DeepSeek的這兩枚開(kāi)源王炸在國(guó)際上引起了廣泛關(guān)注。外媒對(duì)DeepSeek的評(píng)價(jià)普遍較高,認(rèn)為其打破了人們對(duì)人工智能研發(fā)需要“高投入、長(zhǎng)周期”的傳統(tǒng)認(rèn)知,提供了低成本、高效能的解決方案。同時(shí),DeepSeek的開(kāi)源策略也被視為一種促進(jìn)全球科技進(jìn)步的積極舉措。

具體來(lái)說(shuō),外媒對(duì)DeepEP和FlashMLA的關(guān)注點(diǎn)有所不同。對(duì)于DeepEP,外媒主要關(guān)注其在優(yōu)化GPU通信效率、提升AI模型訓(xùn)練與推理效率方面的潛力。而對(duì)于FlashMLA,外媒則更側(cè)重于其在提升AI加速能力、挖掘顯卡性能潛力方面的表現(xiàn)。

wKgZPGe-hzaARqqDAAE3up7dZtc800.png




DeepSeek的第二枚開(kāi)源王炸DeepEP與第一枚開(kāi)源王炸FlashMLA在功能定位、技術(shù)特點(diǎn)、硬件兼容性和開(kāi)源時(shí)間等方面存在顯著差異。外媒對(duì)這兩者的評(píng)價(jià)普遍積極,認(rèn)為它們?yōu)槿斯ぶ悄茴I(lǐng)域帶來(lái)了新的突破和進(jìn)步。


我們知道每一次技術(shù)的突破都可能成為推動(dòng)行業(yè)發(fā)展的關(guān)鍵力量。也能夠帶來(lái)更多產(chǎn)業(yè)鏈的機(jī)遇。比如AI 能力和性能不斷提升,模型的規(guī)模和復(fù)雜度持續(xù)增長(zhǎng),面對(duì)信息速率和密度不斷提升的AI,技術(shù)進(jìn)步也會(huì)遵循摩爾定律,那硬件互連準(zhǔn)備好了嗎?

DeepSeek啟動(dòng)的“開(kāi)源周”連續(xù)5天(2月24日至28日);歡迎大家繼續(xù)關(guān)注DeepSeek的大招。期待更多讓我們驚喜的東西能夠面世。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 開(kāi)源
    +關(guān)注

    關(guān)注

    3

    文章

    3533

    瀏覽量

    43306
  • DeepSeek
    +關(guān)注

    關(guān)注

    1

    文章

    755

    瀏覽量

    1083
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    FPGA+AI組合如何重塑未來(lái)世界:看看DeepSeek東方神秘力量如何預(yù)測(cè)

    近期,DeepSeek這個(gè)名字在AI圈徹底炸開(kāi)了鍋并且關(guān)于DeepSeek的消息網(wǎng)絡(luò)鋪天蓋地,短視頻,朋友圈隨處可見(jiàn)不少網(wǎng)友留言稱其是“來(lái)自東方的神秘力量”又一次震撼海外人士心臟“這太瘋狂了
    的頭像 發(fā)表于 04-14 09:54 ?418次閱讀
    FPGA+AI<b class='flag-5'>王</b><b class='flag-5'>炸</b>組合如何重塑未來(lái)世界:看看<b class='flag-5'>DeepSeek</b>東方神秘力量如何預(yù)測(cè)

    HarmonyOS NEXT開(kāi)發(fā)實(shí)戰(zhàn):DevEco Studio中DeepSeek的使用

    。安裝完成后,打開(kāi)DevEco Studio,創(chuàng)建一個(gè)新的鴻蒙應(yīng)用項(xiàng)目,選擇適合的模板(如Empty Ability)。 第二步:安裝CodeGPT插件 在DevEco Studio上安裝插件:打開(kāi)
    發(fā)表于 03-07 14:56

    摩爾線程全面支持DeepSeek開(kāi)源周成果

    DeepSeek開(kāi)源周正式收官,作為國(guó)內(nèi)率先原生支持FP8計(jì)算精度的國(guó)產(chǎn)GPU企業(yè),摩爾線程迅速響應(yīng),并在短時(shí)間內(nèi),成功實(shí)現(xiàn)對(duì)DeepSeek各個(gè)開(kāi)源項(xiàng)目的全面支持,涵蓋FlashML
    的頭像 發(fā)表于 03-04 10:06 ?338次閱讀

    FPGA+AI組合如何重塑未來(lái)世界:看看DeepSeek東方神秘力量如何預(yù)測(cè)......

    近期,DeepSeek這個(gè)名字在AI圈徹底炸開(kāi)了鍋并且關(guān)于DeepSeek的消息網(wǎng)絡(luò)鋪天蓋地,短視頻,朋友圈隨處可見(jiàn)不少網(wǎng)友留言稱其是“來(lái)自東方的神秘力量”又一次震撼海外人士心臟“這太瘋狂了
    發(fā)表于 03-03 11:21

    摩爾線程支持DeepSeek開(kāi)源通信庫(kù)DeepEP和并行算法DualPipe

    DeepSeek開(kāi)源周第四日,摩爾線程宣布已成功支持DeepSeek開(kāi)源通信庫(kù)DeepEP和并行算法DualPipe,并發(fā)布相關(guān)開(kāi)源代碼倉(cāng)庫(kù)
    的頭像 發(fā)表于 02-28 15:58 ?340次閱讀

    DeepSeek宣布開(kāi)源DeepGEMM

    DeepGEMM 是一個(gè)專為簡(jiǎn)潔高效的 FP8 通用矩陣乘法(GEMM)設(shè)計(jì)的庫(kù),具有細(xì)粒度縮放功能,在Deepseek開(kāi)源周的第三天Deepseek正式宣布開(kāi)源DeepGEMM。 據(jù)
    的頭像 發(fā)表于 02-26 15:33 ?807次閱讀

    DeepSeek第二枚開(kāi)源是什么,跟第一有何不同?強(qiáng)烈引發(fā)外媒熱議

    在科技日新月異的今天,每一次技術(shù)的突破都可能成為推動(dòng)行業(yè)發(fā)展的關(guān)鍵力量。近日,AI領(lǐng)域的獨(dú)角獸企業(yè)DeepSeek,在其開(kāi)源周活動(dòng)中連續(xù)扔出了兩震撼業(yè)界的“開(kāi)源
    的頭像 發(fā)表于 02-26 11:10 ?649次閱讀
    <b class='flag-5'>DeepSeek</b><b class='flag-5'>扔</b>的<b class='flag-5'>第二枚</b><b class='flag-5'>開(kāi)源</b><b class='flag-5'>王</b><b class='flag-5'>炸</b>是什么,跟第一<b class='flag-5'>枚</b>有何不同?強(qiáng)烈引發(fā)外媒熱議

    沐曦GPU跑通DeepSeek開(kāi)源代碼庫(kù)FlashMLA

    今日,DeepSeek正式啟動(dòng)"開(kāi)源周"計(jì)劃,首發(fā)代碼庫(kù)FlashMLA一經(jīng)開(kāi)源即引發(fā)全網(wǎng)關(guān)注。截至發(fā)稿,該項(xiàng)目已在GitHub斬獲超7.2K Star!
    的頭像 發(fā)表于 02-25 16:25 ?619次閱讀

    百度搜索,能否將DeepSeek變成“內(nèi)功”?

    實(shí)測(cè)之后,會(huì)發(fā)現(xiàn)百度搜索和DeepSeek稱得上“組合”
    的頭像 發(fā)表于 02-21 10:04 ?2140次閱讀
    百度搜索,能否將<b class='flag-5'>DeepSeek</b>變成“內(nèi)功”?

    鴻蒙原生應(yīng)用開(kāi)發(fā)也可以使用DeepSeek

    ,請(qǐng)?jiān)L問(wèn)華為開(kāi)發(fā)者官網(wǎng)下載并安裝最新版本5.0.7.210。安裝完成后,打開(kāi)DevEco Studio,創(chuàng)建一個(gè)新的鴻蒙應(yīng)用項(xiàng)目,選擇適合的模板(如Empty Ability)。 第二步:安裝
    發(fā)表于 02-20 18:06

    Banana Pi開(kāi)源社區(qū)基于瑞芯微RK3588開(kāi)發(fā)板,DeepSeek開(kāi)發(fā)利器

    Banana Pi開(kāi)源社區(qū)基于瑞芯微RK3588開(kāi)發(fā)板,DeepSeek開(kāi)發(fā)利器
    的頭像 發(fā)表于 02-19 18:25 ?1103次閱讀
    Banana Pi<b class='flag-5'>開(kāi)源</b>社區(qū)基于瑞芯微RK3588開(kāi)發(fā)板,<b class='flag-5'>DeepSeek</b>開(kāi)發(fā)利器

    開(kāi)源大模型DeepSeek的開(kāi)放內(nèi)容詳析

    當(dāng)大家討論為什么 DeepSeek 能夠形成全球刷屏之勢(shì),讓所有廠商、平臺(tái)都集成之時(shí),「開(kāi)源」成為了最大的關(guān)鍵詞之一,圖靈獎(jiǎng)得主 Yann LeCun 稱其是「開(kāi)源的勝利」。模型開(kāi)源
    的頭像 發(fā)表于 02-19 09:48 ?1032次閱讀
    <b class='flag-5'>開(kāi)源</b>大模型<b class='flag-5'>DeepSeek</b>的開(kāi)放內(nèi)容詳析

    了解DeepSeek-V3 和 DeepSeek-R1兩個(gè)大模型的不同定位和應(yīng)用選擇

    DeepSeek-V3 和 DeepSeek-R1 是深度求索公司(DeepSeek)推出的兩個(gè)不同定位的大模型,其核心差異主要體現(xiàn)在目標(biāo)場(chǎng)景、能力側(cè)重和技術(shù)優(yōu)化方向上。以下是者的實(shí)
    發(fā)表于 02-14 02:08

    deepseek國(guó)產(chǎn)芯片加速 DeepSeek的國(guó)產(chǎn)AI芯片天團(tuán)

    遙想兩年前,ChatGPT給了世界一記AI沖擊,而DeepSeek無(wú)疑是第二記沖擊。我們不僅對(duì)DeepSeek強(qiáng)勁的性能所震撼,也讓遠(yuǎn)在大洋彼岸的OpenAI、谷歌、META等一眾玩家感受到莫大壓力
    的頭像 發(fā)表于 02-10 15:07 ?2695次閱讀
    <b class='flag-5'>deepseek</b>國(guó)產(chǎn)芯片加速 <b class='flag-5'>DeepSeek</b>的國(guó)產(chǎn)AI芯片天團(tuán)

    深度解析deepseek開(kāi)源是什么意思

    Deepseek開(kāi)源是指Deepseek項(xiàng)目的源代碼被公開(kāi),允許任何人免費(fèi)查看、使用、修改和分發(fā)。
    的頭像 發(fā)表于 02-06 09:29 ?3129次閱讀