一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

浪潮信息趙帥:開放計算創(chuàng)新 應(yīng)對Scaling Law挑戰(zhàn)

全球TMT ? 來源:全球TMT ? 作者:全球TMT ? 2024-08-15 16:02 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

北京2024年8月15日/美通社/ -- 日前在2024開放計算中國峰會上,浪潮信息服務(wù)器產(chǎn)品線總經(jīng)理趙帥表示,智能時代,開源模型和開放計算激發(fā)了人工智能產(chǎn)業(yè)生態(tài)的創(chuàng)新活力,面對大模型Scaling Law帶來的AI基礎(chǔ)設(shè)施Scale up和Scale out的挑戰(zhàn),數(shù)據(jù)中心需要以開放創(chuàng)新加速算力系統(tǒng)、管理和基礎(chǔ)設(shè)施的全向Scale進程,推動AI產(chǎn)業(yè)的創(chuàng)新發(fā)展。

wKgaoma9th6AVbJVAAC1lErw8VU701.jpg


開源開放推動人工智能創(chuàng)新與算力生態(tài)的全面發(fā)展

生成式人工智能的飛躍式進步正在加速智能時代的到來,數(shù)據(jù)中心基礎(chǔ)設(shè)施面臨全方位創(chuàng)新,將越來越依賴更加廣泛的全球化開放協(xié)作,加速AI技術(shù)創(chuàng)新與應(yīng)用,共同構(gòu)建一個充滿創(chuàng)新活力的智能世界,而激發(fā)人工智能創(chuàng)新活力,開源開放是核心和源泉。

模型開源激發(fā)人工智能創(chuàng)新活力。隨著開源大模型能力的不斷增強和開源生態(tài)的持續(xù)壯大,帶動模型、應(yīng)用到產(chǎn)業(yè)的全面發(fā)展,三分之二的基礎(chǔ)模型選擇開源,超過80%以上的AI項目使用開源框架進行開發(fā),開源模型的下載量突破3億次,并衍生出超過 3萬個新模型,Llama 3.1、通義千問、源2.0等開源大模型成為人工智能創(chuàng)新的驅(qū)動力。

硬件開放完善人工智能算力生態(tài)。人工智能帶來指數(shù)級增長的算力需求,全球已有上百家公司投入新型AI芯片的研發(fā)與設(shè)計,百花齊放的算力芯片需要統(tǒng)一的算力平臺才能快速推向市場,實現(xiàn)落地。開放加速規(guī)范OAM的出現(xiàn)大大加速多元算力芯片的適配兼容過程,大幅降低資源投入,使算力部署和迭代提速,支撐上層大模型和AIGC應(yīng)用的快速迭代成熟。目前,90% 高端AI芯片基于OAM規(guī)范設(shè)計,去年浪潮信息剛剛發(fā)布的基于OAM規(guī)范的開放加速計算平臺NF5698G7與多款主流AI加速芯片適配兼容,基于OAM的智算產(chǎn)業(yè)生態(tài)圈日趨完善。

我們可以看到,AI時代,算力正在呈現(xiàn)出多元化的發(fā)展趨勢。為應(yīng)對AIGC、云計算、大數(shù)據(jù)等應(yīng)用復(fù)雜且不斷變化的計算需求,不僅僅是GPU,CPU、FPGAASIC等芯片也在朝著更加多樣化和專用化的方向發(fā)展。而且無論是手機、電腦、邊緣設(shè)備、CPU通用服務(wù)器、加速服務(wù)器都具有了AI計算的能力,可以說一切計算皆AI,AI算力已經(jīng)深入到千行百業(yè),滲透進每一個計算設(shè)備里。面向人工智能的算力范式不斷革新,基于CPU的通用服務(wù)器不僅要承載大數(shù)據(jù)、關(guān)鍵計算、科學(xué)計算外,也要承擔AI應(yīng)用的重要任務(wù),這也是CPU通用服務(wù)器的重大機遇。

但隨著應(yīng)用范式的多樣化,目前x86、ARM、RISC-V等不同架構(gòu)的CPU處理器百花齊放,僅中國,就有10多種CPU處理器,不同CPU協(xié)議標準不統(tǒng)一,同時為了更好的適合AI推理高并行的計算特點,CPU總線互聯(lián)帶寬、內(nèi)存帶寬及容量也需要特別優(yōu)化,使得系統(tǒng)功耗、總線速率、電流密度不斷提升……多種因素疊加之下,硬件開發(fā)、固件適配、部件測試資源等時間激增,給算力系統(tǒng)設(shè)計帶來巨大挑戰(zhàn)。

為了縮短從芯片到算力系統(tǒng)的轉(zhuǎn)化時間,給用戶提供更快、更好的算力支撐,CPU端也亟需構(gòu)建智算時代的CPU統(tǒng)一底座, 能夠兼容不同芯片廠商、多代產(chǎn)品。2024開放計算中國峰會上,開放算力模組(OCM)規(guī)范正式啟動,首批成員包括中國電子標準院、百度、小紅書、浪潮信息、聯(lián)想、超聚變、英特爾AMD等機構(gòu)和企業(yè)。

wKgZoma9th-AL50sAADMAXcn7K4485.jpg


全新的開放算力模組OCM規(guī)范,旨在建立基于處理器的標準化算力模組單元,通過統(tǒng)一不同處理器算力單元對外高速互連、管理協(xié)議、供電接口等,實現(xiàn)服務(wù)器主板平臺的深度解耦和模塊化設(shè)計,兼容不同架構(gòu)的多代處理器芯片,方便客戶根據(jù)人工智能、云計算、大數(shù)據(jù)等多樣化應(yīng)用場景,靈活、快速匹配最適合的算力平臺,推動算力產(chǎn)業(yè)高質(zhì)量快速發(fā)展。

OCM規(guī)范是國內(nèi)首個服務(wù)器計算模組設(shè)計規(guī)范,產(chǎn)業(yè)界上下游伙伴將基于OCM規(guī)范,共同建立標準化的算力模組單元,構(gòu)建開放合作、融合創(chuàng)新的產(chǎn)業(yè)生態(tài),為用戶提供更多通用性強、綠色高效、安全可靠的算力選擇。

以開放創(chuàng)新的全向Scale應(yīng)對大模型第一性原理

算力、算法和數(shù)據(jù)是推動人工智能發(fā)展的三駕馬車,自Transformer架構(gòu)出現(xiàn)以來,大模型性能與其參數(shù)量、計算當量、數(shù)據(jù)量的協(xié)同作用尤為顯著,業(yè)界稱之為大語言模型的第一性原理——Scaling Law。

智算時代,需要用開放的理念來加速算力系統(tǒng)全向Scale,從而應(yīng)對大模型的Scaling Law。隨著大模型能力的持續(xù)進化,算法規(guī)模和復(fù)雜性不斷增加、數(shù)據(jù)量越來越大,算力需求也在不斷攀升,需要同時應(yīng)對單系統(tǒng)性能提升Scale up與多系統(tǒng)大規(guī)模擴展Scale out兩個方向擴展的挑戰(zhàn),對數(shù)據(jù)中心基礎(chǔ)設(shè)施、算力管理、迭代升級等都提出了更高要求。

wKgaoma9th-AbzXlAABtwq38_7g324.jpg

在算力方面,智算中心需要同時應(yīng)對兩個方向的擴展,分別是強算力支持、一機多芯、多元多模的單機系統(tǒng)Scale up要求和大規(guī)模AI組網(wǎng)、高帶寬、資源池化的大規(guī)?;瘮U展Scale out要求,以開放加速模組和開放網(wǎng)絡(luò)實現(xiàn)算力的Scale。UBB2.0開放標準支持更高算力規(guī)格的加速卡、可以實現(xiàn)更大的OAM domain互聯(lián),未來可以支持8000+ 張加速卡Scale up,突破大模型All to All通信過程中的互聯(lián)瓶頸。同時,大模型的發(fā)展需要更大規(guī)模的算力系統(tǒng),浪潮信息開放網(wǎng)絡(luò)交換機可實現(xiàn)16000+個計算節(jié)點10萬+加速卡的Scale out組網(wǎng),滿足加速卡之間的互聯(lián)通信需求,帶寬利用率高達95%+。

在管理方面,需要解決跨平臺適配、模塊化架構(gòu)、快速迭代的Scale要求,以開放的固件解決方案實現(xiàn)了管理的Scale。當前,異構(gòu)算力多元分化,異步迭代,管理接口規(guī)范各不相同,導(dǎo)致固件平臺分支版本龐大,相互割裂,無法歸一,單一企業(yè)資源在維護和適配如此眾多的分支版本方面捉襟見肘。為解決一系列管理挑戰(zhàn),需要依托于開源社區(qū)的開源固件平臺,構(gòu)建原生解耦架構(gòu)提升可擴展性,建立統(tǒng)一標準的接口規(guī)范,支持用戶對于自主模塊進行定制化,實現(xiàn)標準接口規(guī)范下的異步、自主定制迭代,以滿足智算時代的算力迭代需求。

在基礎(chǔ)設(shè)施方面,數(shù)據(jù)中心面臨智能算力擴展的兩大Scale挑戰(zhàn):一是GPU、CPU算力提升,單芯片單卡功耗急劇增加,單機柜在供電和制冷上面臨著Scale up支撐挑戰(zhàn);同時,Scaling Law驅(qū)動GPU規(guī)模無限膨脹,達到萬卡、十萬卡級別,帶來了數(shù)據(jù)中心層級Scale out的支撐挑戰(zhàn),需要開放標準和開放生態(tài)將實現(xiàn)基礎(chǔ)實施的Scale,滿足快速建設(shè)、高算力/高能耗支撐要求。采用開放標準、開放生態(tài)構(gòu)建的數(shù)據(jù)中心基礎(chǔ)設(shè)施,能更好地匹配智算時代多元、異構(gòu)算力的擴展和迭代速度,進而支撐上層智能應(yīng)用的進一步普及。以浪潮信息為例,基于開放標準推出的液冷冷板組件,支撐單機系統(tǒng)內(nèi)GPU和CPU核心算力原件Scale up擴展;推出模塊化、標準接口的120kw機柜,兼容液冷、風冷場景,支撐柜內(nèi)更大的部署需求;推出基于開放標準的預(yù)制化集裝箱數(shù)據(jù)中心,大幅壓縮建設(shè)周期,其擴展性很好的滿足了AI算力系統(tǒng)的Scale需要。

開放計算為數(shù)據(jù)中心的全向Scale,提供了一個可以迅速傳遞到整個產(chǎn)業(yè)鏈的"通道"。目前,開放加速模組和開放網(wǎng)絡(luò)實現(xiàn)了算力的Scale,開放固件解決方案實現(xiàn)了管理的Scale,開放標準和開放生態(tài)實現(xiàn)了基礎(chǔ)設(shè)施的Scale。開放計算對于智算時代至關(guān)重要,需要用開放應(yīng)對多元算力,用開放促進算力的Scale,基于開放創(chuàng)新構(gòu)建的全向Scale能力將會成為未來AI基礎(chǔ)設(shè)施的核心驅(qū)動力,加速智算時代的創(chuàng)新,加速人工智能的前行。

審核編輯 黃宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 服務(wù)器
    +關(guān)注

    關(guān)注

    13

    文章

    9795

    瀏覽量

    88001
  • 浪潮
    +關(guān)注

    關(guān)注

    1

    文章

    475

    瀏覽量

    24701
  • AI
    AI
    +關(guān)注

    關(guān)注

    88

    文章

    35164

    瀏覽量

    280013
  • 人工智能
    +關(guān)注

    關(guān)注

    1807

    文章

    49029

    瀏覽量

    249575
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    3146

    瀏覽量

    4074
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    飛利信與浪潮信息達成戰(zhàn)略合作

    近日,2025年浪潮信息北京ISP戰(zhàn)略伙伴簽約授牌儀式成功舉辦。浪潮信息與北京飛利信電子技術(shù)有限公司等22家戰(zhàn)略合作伙伴達成簽約,其中將面向北京人工智能應(yīng)用大市場,在產(chǎn)品技術(shù)共創(chuàng)、行業(yè)場景深化及區(qū)域
    的頭像 發(fā)表于 06-24 17:37 ?556次閱讀

    天瞳威視與浪潮信息達成戰(zhàn)略合作,推進高階智駕車載計算系統(tǒng)創(chuàng)新

    北京2025年3月22日?/美通社/ -- 近日,蘇州天瞳威視電子科技有限公司與浪潮信息旗下蘇州元腦智能科技有限公司達成戰(zhàn)略合作協(xié)議。此次合作依托浪潮信息提供的車載算力平臺硬件系統(tǒng)、底層軟件環(huán)境
    的頭像 發(fā)表于 03-27 16:55 ?361次閱讀
    天瞳威視與<b class='flag-5'>浪潮信息</b>達成戰(zhàn)略合作,推進高階智駕車載<b class='flag-5'>計算</b>系統(tǒng)<b class='flag-5'>創(chuàng)新</b>

    浪潮信息發(fā)布元腦R1推理服務(wù)器

    。 DeepSeek R1 671B模型作為業(yè)界領(lǐng)先的深度學(xué)習模型,其部署一直面臨著較高的難度和成本。而浪潮信息的元腦R1推理服務(wù)器通過一系列的技術(shù)創(chuàng)新,成功打破了這一瓶頸。該服務(wù)器能夠充分利用其強大的計算能力,實現(xiàn)對DeepS
    的頭像 發(fā)表于 02-17 10:32 ?707次閱讀

    浪潮信息存儲SATA SSD:技術(shù)創(chuàng)新引領(lǐng)數(shù)據(jù)存儲新時代

    在智慧時代,數(shù)據(jù)存儲需求日益增長,對存儲產(chǎn)品的性能和穩(wěn)定性提出了更高要求。浪潮信息存儲,作為行業(yè)內(nèi)的佼佼者,積極響應(yīng)市場需求,通過自主研發(fā),不斷積累技術(shù)優(yōu)勢,致力于為用戶提供高性能、高穩(wěn)定性的存儲
    的頭像 發(fā)表于 02-07 13:41 ?649次閱讀

    浪潮信息存儲SATA SSD:以技術(shù)創(chuàng)新,開啟數(shù)據(jù)存儲新篇章

    計算平臺以及個人用戶的數(shù)字化需求,迫切需要高效、可靠的存儲解決方案。 浪潮信息存儲積極響應(yīng)市場需求,通過自主研發(fā)不斷積累技術(shù)優(yōu)勢,推出了SATA、NVMe、雙端口、ZNS等全系列存儲產(chǎn)品。近期,浪潮信息自研SATA SSD新品—
    的頭像 發(fā)表于 01-24 10:02 ?454次閱讀

    浪潮信息與智源研究院攜手共建大模型多元算力生態(tài)

    近日,浪潮信息與北京智源人工智能研究院正式簽署戰(zhàn)略合作協(xié)議,雙方將緊密合作,共同構(gòu)建大模型多元算力開源創(chuàng)新生態(tài)。 此次合作旨在提升大模型創(chuàng)新研發(fā)的算力效率,降低大模型應(yīng)用開發(fā)的算力門檻,推動
    的頭像 發(fā)表于 12-31 11:49 ?604次閱讀

    浪潮信息剖析智能時代數(shù)據(jù)存儲領(lǐng)域面臨的挑戰(zhàn)與機遇

    在當今數(shù)字化時代,算力與存力的協(xié)同增長已成為驅(qū)動各行各業(yè)發(fā)展的關(guān)鍵力量。特別是在人工智能(AI)這一前沿領(lǐng)域,隨著數(shù)據(jù)量的爆炸式增長,對存儲系統(tǒng)的需求日益復(fù)雜和多樣。近期,在首屆CCF中國存儲大會上,浪潮信息存儲首席架構(gòu)師孫斌深刻剖析了智能時代數(shù)據(jù)存儲領(lǐng)域面臨的挑戰(zhàn)與機遇
    的頭像 發(fā)表于 12-30 09:43 ?781次閱讀

    浪潮信息與智源研究院達成戰(zhàn)略合作協(xié)議

    近日,浪潮信息與智源研究院達成戰(zhàn)略合作協(xié)議,雙方將緊密協(xié)作共建大模型多元算力開源創(chuàng)新生態(tài),提升大模型創(chuàng)新研發(fā)的算力效率,降低大模型應(yīng)用開發(fā)的算力門檻。目前,智源Triton算子庫FlagGems已
    的頭像 發(fā)表于 12-26 10:25 ?588次閱讀

    浪潮信息與17家元腦伙伴共簽億級分銷協(xié)議

    。 此次簽約標志著浪潮信息與這些元腦伙伴將在產(chǎn)品技術(shù)創(chuàng)新、市場拓展及解決方案等多個領(lǐng)域展開深入合作。雙方將充分發(fā)揮各自優(yōu)勢,共同推動技術(shù)革新,加速智能化轉(zhuǎn)型的步伐,為千行百業(yè)的數(shù)字化轉(zhuǎn)型注入強勁動力。 浪潮信息作為國內(nèi)領(lǐng)先
    的頭像 發(fā)表于 12-25 15:46 ?761次閱讀

    浪潮信息AI存儲性能測試的領(lǐng)先之道

    MLCommons,一個致力于推動全球 AI系統(tǒng)發(fā)展的頂級工程聯(lián)盟,匯聚了包括谷歌、斯坦福大學(xué)在內(nèi)的眾多頂尖企業(yè)和研究機構(gòu)。作為該聯(lián)盟的創(chuàng)始成員之一,浪潮信息自2020年起便積極參與其中,共同探索
    的頭像 發(fā)表于 10-29 16:30 ?659次閱讀
    <b class='flag-5'>浪潮信息</b>AI存儲性能測試的領(lǐng)先之道

    浪潮信息發(fā)布元腦企智一體機

    在2024中國算力大會上,浪潮信息正式發(fā)布了其創(chuàng)新的元腦企智一體機。這款一體機融合了元腦企智EPAI企業(yè)大模型開放平臺和元腦服務(wù)器,通過軟硬件協(xié)同的一體化設(shè)計,實現(xiàn)了快速交付、開箱即用、極致性能和安全高效的大模型開發(fā)能力。
    的頭像 發(fā)表于 09-30 16:50 ?1946次閱讀

    浪潮信息:元腦企智EPAI助力金融大模型快速落地

    近日,2024金融科技應(yīng)用創(chuàng)新發(fā)展大會暨農(nóng)村金融機構(gòu)信息化發(fā)展創(chuàng)新座談會在上海舉辦。浪潮信息推出元腦企智EPAI企業(yè)大模型開發(fā)平臺,面向金融業(yè)務(wù)場景,實現(xiàn)7天完成POC驗證、2個月上線
    的頭像 發(fā)表于 09-20 16:07 ?706次閱讀
    <b class='flag-5'>浪潮信息</b>:元腦企智EPAI助力金融大模型快速落地

    33家元腦區(qū)域伙伴與浪潮信息簽署戰(zhàn)略合作協(xié)議

    近日,2024年浪潮信息區(qū)域ISP伙伴戰(zhàn)略簽約儀式圓滿落幕,標志著浪潮信息在人工智能領(lǐng)域的合作版圖再度擴大。此次盛會匯聚了全國范圍內(nèi)33家實力雄厚的億級及千萬級元腦區(qū)域伙伴,共同簽署戰(zhàn)略合作協(xié)議,攜手開啟AI應(yīng)用新篇章。
    的頭像 發(fā)表于 08-14 16:25 ?746次閱讀

    33家區(qū)域ISP伙伴與浪潮信息簽署戰(zhàn)略合作協(xié)議

    ,涉及互聯(lián)網(wǎng)、電信、金融和制造等人工智能應(yīng)用落地的前沿行業(yè),雙方將依托浪潮信息元腦生態(tài)體系,以大模型開發(fā)平臺"元腦企智"EPAI為引擎,結(jié)合區(qū)域伙伴的行業(yè)優(yōu)勢,共同把握人工智能時代的新機遇,推動AI產(chǎn)業(yè)的發(fā)展。 ? 區(qū)域ISP伙伴:架起AI技術(shù)與應(yīng)用創(chuàng)新的橋梁
    的頭像 發(fā)表于 08-14 15:43 ?616次閱讀
    33家區(qū)域ISP伙伴與<b class='flag-5'>浪潮信息</b>簽署戰(zhàn)略合作協(xié)議

    澎湃認證:浪潮信息集中式存儲攜手長擎安全操作系統(tǒng)24完成兼容性認證

    /AS系列產(chǎn)品完全兼容,滿足功能需求,系統(tǒng)運行可靠穩(wěn)定,性能表現(xiàn)優(yōu)異。 ? ? 浪潮信息澎湃技術(shù)認證是浪潮信息基于自身多元、創(chuàng)新的通用計算平臺,與供應(yīng)鏈及軟件服務(wù)等生態(tài)合作伙伴共同構(gòu)建
    的頭像 發(fā)表于 07-19 13:53 ?507次閱讀
    澎湃認證:<b class='flag-5'>浪潮信息</b>集中式存儲攜手長擎安全操作系統(tǒng)24完成兼容性認證