一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

浪潮信息劉軍:智算力系統(tǒng)創(chuàng)新 加速生成式AI產業(yè)發(fā)展

全球TMT ? 來源:全球TMT ? 作者:全球TMT ? 2023-12-06 14:08 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

北京2023年12月6日/美通社/ --11月29日,在北京舉行的2023人工智能計算大會(AICC)上,浪潮信息高級副總裁劉軍在主題演講《智算力系統(tǒng)創(chuàng)新 加速生成式AI產業(yè)發(fā)展》中分享了浪潮信息對于智算力系統(tǒng)創(chuàng)新和AI產業(yè)發(fā)展的思考。

wKgZomVwD_WAbed4AADVM889aU0323.jpg


以下為演講實錄整理

當前,生成式人工智能和大模型推動算力需求高速增長,如何通過智算力系統(tǒng)來更好地支撐AI創(chuàng)新與應用,已經成為智算產業(yè)的關鍵。應對生成式AI的發(fā)展和挑戰(zhàn),應該從算力系統(tǒng)、AI軟件基礎設施(AI Infra)、算法模型和產業(yè)生態(tài)4個方面來進行綜合考量,從而加速智能產業(yè)的落地。

智算系統(tǒng)創(chuàng)新,解決生成式AI的算力挑戰(zhàn)

在算力系統(tǒng)層面,生成式人工智能面臨的挑戰(zhàn)主要來自計算、數(shù)據(jù)和互聯(lián)三個方面:

在計算層面,算力多元化趨勢愈發(fā)明顯,導致AI算力系統(tǒng)開發(fā)適配周期長、定制開發(fā)投入大、業(yè)務遷移時間久。此外,大模型訓練對算力規(guī)模要求高,在單芯片算力有限的情況下,必須通過構建更大規(guī)模的集群來獲得性能的擴展。

在數(shù)據(jù)層面,大模型從文本、圖片等單模態(tài)向多模態(tài)、跨模態(tài)演進,訓練的數(shù)據(jù)集達到TB級甚至PB級,且不同作業(yè)階段對于數(shù)據(jù)存儲的要求呈現(xiàn)多元化趨勢。

在互聯(lián)層面,傳統(tǒng)RoCE網絡因ECMP哈希不均導致40%以上的網絡帶寬被浪費,且尾時延高導致網絡通信時間占比訓練時間高達40%,極大降低了計算效率。同時,網絡是集群共享資源,當集群規(guī)模達到一定量級后,網絡性能波動會影響到所有計算資源的利用率,網絡故障會影響數(shù)十個甚至更多加速卡的連通性。

面對三重挑戰(zhàn),浪潮信息總結了多年產品研發(fā)和用戶服務經驗,提出三部分解決之道。

在計算方面,首先要針對多元算力,以統(tǒng)一的系統(tǒng)架構和統(tǒng)一的接口規(guī)范來兼容各類AI加速卡,保障芯片算力的高效釋放。浪潮信息早在2018年就著力開放多元的AI算力平臺設計,最新發(fā)布的G7多元算力平臺是業(yè)界唯一可以同時兼容SXM、OAI加速卡并實現(xiàn)8卡全互聯(lián)、16卡全互聯(lián)和混合立方互聯(lián)系統(tǒng)拓撲的AI算力平臺。為了保障更大規(guī)模的節(jié)點擴展性能,浪潮信息研制的開放加速計算架構支持PCIe、RocE和多種私有互聯(lián)協(xié)議,節(jié)點內和跨節(jié)點卡間互聯(lián)最大達到896 GB/s,跨節(jié)點通過免網卡RDMA實現(xiàn)高效擴展,集群性能加速比超過90%。

在數(shù)據(jù)存儲方面,針對大模型的數(shù)據(jù)存儲需求,浪潮信息在業(yè)界率先實現(xiàn)了一套集群系統(tǒng)同時支持文件、對象、大數(shù)據(jù)等多種非結構化協(xié)議的無損互訪,同時支持閃存、磁盤、磁帶、光盤四類存儲介質,并支持數(shù)據(jù)全生命周期熱、溫、冷、冰四級存儲管理,以一套存儲架構支持一個數(shù)據(jù)中心,真正實現(xiàn)了數(shù)據(jù)融合、管理融合。

在網絡互聯(lián)方面,浪潮信息專為生成式AI計算場景發(fā)布旗艦51.2T高性能交換機,為企業(yè)級智算網絡提供高吞吐、高可擴展、高可靠的智算網絡產品及方案,解決了傳統(tǒng)RoCE方案普遍存在的有效帶寬低、尾時延高、故障收斂慢等問題,將大模型訓練性能提升38%以上,性能接近InfiniBand,助力AI用戶高效釋放大模型生產力。

AI Infra全棧優(yōu)化:釋放多元算力、提升大模型算力效率

大模型算法開發(fā)的鏈條冗長,這意味著需要諸多的工程化工具支撐。因此,在算力系統(tǒng)外,AI軟件基礎設施(AI Infra)也亟需創(chuàng)新。

AIGC大模型開發(fā)是一項極其復雜的系統(tǒng)工程,即便解決了底層算力供給的問題,仍面臨建不了和用不好的問題。"建不好"是指構建算力平臺不僅需要服務器、存儲、網絡等硬件集成,還需要考慮不同硬件和軟件之間的兼容性和版本選擇,確保驅動和工具的適配性和穩(wěn)定性;"用不好"則體現(xiàn)在算力平臺效率低、穩(wěn)定性不足、故障頻發(fā)等現(xiàn)實困擾。

為加速模型生產和落地應用,浪潮信息在AI Infra層面開發(fā)了大模型智算軟件棧OGAI (Open GenAI Infra)。在算力部署方面,OGAI開源了業(yè)界首個AI算力集群系統(tǒng)環(huán)境部署方案PODsys;在大規(guī)模訓練的長時保障方面,從算力調度平臺層實現(xiàn)了自動化斷點續(xù)訓;在多元算力接入方面以標準化、模塊化接入方式穩(wěn)定接入超過40+芯片;在數(shù)據(jù)治理方面構建了流程化、可自定義的數(shù)據(jù)清洗pipeline,有效縮短數(shù)據(jù)清洗時間、提升文本審核過濾準確率;在計算效率優(yōu)化方面,通過對分布式并行算法的極致優(yōu)化,將千億參數(shù)模型的訓練計算效率提升到54%;在多模型管理方面已經支持了超過10個業(yè)界主流的開源大模型和元腦生態(tài)大模型,用實踐證明AI Infra全?;A軟件和工作流的創(chuàng)新是多元算力高效釋放、提升大模型算力效率的關鍵。

wKgaomVwD_WAefIEAACLCtTuxXI341.jpg


基礎大模型,生成式AI落地發(fā)展的核心支撐

當前,大模型技術正在推動生成式人工智能產業(yè)迅猛發(fā)展,而基礎大模型的關鍵能力則是大模型在行業(yè)和應用落地時能力表現(xiàn)的核心支撐。但是,基礎大模型在持續(xù)進化的過程中,依然面臨著數(shù)據(jù)、算法、算力等關鍵因素的挑戰(zhàn)與制約。

目前,受政策支持、算力水平提升、數(shù)據(jù)資源龐大以及科研實力增強等利好因素的推動,中國在基礎大模型方面取得一定成績,但仍需加大在基礎性技術方面的原創(chuàng)性突破,夯實底層模型和算法能力。

浪潮信息從實踐入手,加大模型結構創(chuàng)新、高質量數(shù)據(jù)準備、高效算力利用投入,并將這些技術運用在了"源2.0"大模型上,在編程、推理、邏輯等方面展示了先進的能力。

在算法方面,"源2.0"提出并采用了一種新型的注意力算法結構,有效提升了模型自然語言的表達能力與生成精度;在數(shù)據(jù)方面,"源2.0"在訓練數(shù)據(jù)來源、數(shù)據(jù)增強和合成方法等方面進行了全面創(chuàng)新,最終增強模型數(shù)理邏輯能力;在算力方面,"源2.0"采用非均勻流水并行+優(yōu)化器參數(shù)并行+數(shù)據(jù)并行+ Loss計算分塊的策略,顯著降低大模型對于芯片間互聯(lián)帶寬的要求,讓模型訓練在"條件有限"的算力規(guī)模下實現(xiàn)高效率工作。

源2.0作為千億級基礎大模型,在業(yè)界公開的評測上進行了代碼生成、數(shù)學問題求解、事實問答方面的能力測試,展示了較為先進的能力表現(xiàn)。為了滿足不同行業(yè)、不同場景的能力要求,浪潮信息全面開源"源2.0"全系列大模型,以最便捷的方式支持用戶建設自己的智能化產品與能力,結合行業(yè)特點進行框架、模型、數(shù)據(jù)的垂直整合,提升基礎大模型的準確性和可用性。

生態(tài)聚進,聯(lián)合創(chuàng)新,加速AI應用落地

有了強大的基礎大模型,還需要進一步深入應用場景。將大模型的能力賦能到產業(yè)環(huán)節(jié)之中,需要多廠商的深度配合。面對生態(tài)復雜離散、產業(yè)AI落地困難的挑戰(zhàn),浪潮信息提出元腦生態(tài),聚合優(yōu)質伙伴協(xié)同創(chuàng)新,通過"技術支持、方案聯(lián)合、平臺共享"實現(xiàn)不同廠商之間的優(yōu)勢互補。

目前,元腦生態(tài)以浪潮信息的AI算力平臺、AI資源平臺和AI算法平臺為支撐,已經對接40多家芯片廠商,400+算法廠商,4000+系統(tǒng)集成商,通過多元的算力供給、全棧的AI Infra軟件棧、豐富的大模型經驗,實現(xiàn)"百模"與"千行"的對接,助力千行百業(yè)加速生成式AI 產業(yè)創(chuàng)新,高效釋放生產力。

wKgZomVwD_aAfwb3AAC6aEemKOQ326.jpg


智算力是創(chuàng)新力,AIGC與數(shù)字經濟、實體經濟的深度融合,將會創(chuàng)造出更多顛覆性的社會價值、經濟價值,而浪潮信息將秉持開放、共享、共建的發(fā)展理念,抓住AIGC市場機遇,共同推進人工智能落地。

審核編輯 黃宇

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • AI
    AI
    +關注

    關注

    88

    文章

    35156

    瀏覽量

    279849
  • 人工智能
    +關注

    關注

    1806

    文章

    49024

    瀏覽量

    249492
  • 數(shù)字經濟

    關注

    2

    文章

    1104

    瀏覽量

    18888
  • 算力
    +關注

    關注

    2

    文章

    1201

    瀏覽量

    15654
  • AIGC
    +關注

    關注

    1

    文章

    388

    瀏覽量

    2464
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    飛利信與浪潮信息達成戰(zhàn)略合作

    近日,2025年浪潮信息北京ISP戰(zhàn)略伙伴簽約授牌儀式成功舉辦。浪潮信息與北京飛利信電子技術有限公司等22家戰(zhàn)略合作伙伴達成簽約,其中將面向北京人工智能應用大市場,在產品技術共創(chuàng)、行業(yè)場景深化及區(qū)域
    的頭像 發(fā)表于 06-24 17:37 ?553次閱讀

    天瞳威視與浪潮信息達成戰(zhàn)略合作,推進高階智駕車載計算系統(tǒng)創(chuàng)新

    北京2025年3月22日?/美通社/ -- 近日,蘇州天瞳威視電子科技有限公司與浪潮信息旗下蘇州元腦智能科技有限公司達成戰(zhàn)略合作協(xié)議。此次合作依托浪潮信息提供的車載力平臺硬件系統(tǒng)、底
    的頭像 發(fā)表于 03-27 16:55 ?357次閱讀
    天瞳威視與<b class='flag-5'>浪潮信息</b>達成戰(zhàn)略合作,推進高階智駕車載計算<b class='flag-5'>系統(tǒng)</b><b class='flag-5'>創(chuàng)新</b>

    AI 力報告來了!2025中國AI力市場將達 259 億美元

    報告來源:IDC、浪潮信息2月13日,國際數(shù)據(jù)公司(IDC)攜手浪潮信息,重磅發(fā)布《2025年中國人工智能計算力發(fā)展評估報告》。當下,大模型與生成
    的頭像 發(fā)表于 03-07 13:27 ?804次閱讀
    <b class='flag-5'>AI</b> <b class='flag-5'>算</b>力報告來了!2025中國<b class='flag-5'>AI</b><b class='flag-5'>算</b>力市場將達 259 億美元

    聯(lián)想:共筑AI生態(tài),引領數(shù)字創(chuàng)新

    入選“先鋒榜·2024年度數(shù)字創(chuàng)新領軍人物”。 在峰會上,分享了他對當前中國AI產業(yè)生態(tài)的看法。他指出,一個涵蓋芯片、操作
    的頭像 發(fā)表于 01-23 10:28 ?748次閱讀

    浪潮信息與實驗室合作部署42kW風冷力倉

    近日,浪潮信息與某知名實驗室攜手簽署了合作協(xié)議,共同推進AI for Science領域的科研創(chuàng)新。根據(jù)協(xié)議內容,雙方將采用先進的42kW智風冷
    的頭像 發(fā)表于 01-09 14:18 ?472次閱讀

    浪潮信息與智源研究院攜手共建大模型多元力生態(tài)

    人工智能技術的快速發(fā)展浪潮信息與智源研究院將充分整合各自在力、算法和技術創(chuàng)新方面的優(yōu)勢資源,共同探索大模型多元力的新應用和新模式。 目
    的頭像 發(fā)表于 12-31 11:49 ?603次閱讀

    浪潮信息剖析智能時代數(shù)據(jù)存儲領域面臨的挑戰(zhàn)與機遇

    在當今數(shù)字化時代,力與存力的協(xié)同增長已成為驅動各行各業(yè)發(fā)展的關鍵力量。特別是在人工智能(AI)這一前沿領域,隨著數(shù)據(jù)量的爆炸增長,對存儲系統(tǒng)
    的頭像 發(fā)表于 12-30 09:43 ?780次閱讀

    浪潮信息與智源研究院達成戰(zhàn)略合作協(xié)議

    近日,浪潮信息與智源研究院達成戰(zhàn)略合作協(xié)議,雙方將緊密協(xié)作共建大模型多元力開源創(chuàng)新生態(tài),提升大模型創(chuàng)新研發(fā)的力效率,降低大模型應用開發(fā)的
    的頭像 發(fā)表于 12-26 10:25 ?583次閱讀

    浪潮信息與17家元腦伙伴共簽億級分銷協(xié)議

    。 此次簽約標志著浪潮信息與這些元腦伙伴將在產品技術創(chuàng)新、市場拓展及解決方案等多個領域展開深入合作。雙方將充分發(fā)揮各自優(yōu)勢,共同推動技術革新,加速智能化轉型的步伐,為千行百業(yè)的數(shù)字化轉型注入強勁動力。
    的頭像 發(fā)表于 12-25 15:46 ?760次閱讀

    浪潮信息AI存儲性能測試的領先之道

    MLCommons,一個致力于推動全球 AI系統(tǒng)發(fā)展的頂級工程聯(lián)盟,匯聚了包括谷歌、斯坦福大學在內的眾多頂尖企業(yè)和研究機構。作為該聯(lián)盟的創(chuàng)始成員之一,浪潮信息自2020年起便積極參與其
    的頭像 發(fā)表于 10-29 16:30 ?657次閱讀
    <b class='flag-5'>浪潮信息</b><b class='flag-5'>AI</b>存儲性能測試的領先之道

    浪潮信息:元腦企智EPAI助力金融大模型快速落地

    浪潮信息AI力底座建設、大模型開發(fā)領域積累的成熟、成功經驗工具化,助力金融機構又快、又穩(wěn)地部署生成
    的頭像 發(fā)表于 09-20 16:07 ?703次閱讀
    <b class='flag-5'>浪潮信息</b>:元腦企智EPAI助力金融大模型快速落地

    NVIDIA在加速計算和生成AI領域的創(chuàng)新

    在最新發(fā)布的公司 2024 財年可持續(xù)發(fā)展報告開篇的一封信中,NVIDIA 創(chuàng)始人兼首席執(zhí)行官黃仁勛介紹了 NVIDIA 在加速計算和生成 AI
    的頭像 發(fā)表于 09-09 09:18 ?920次閱讀

    開啟全新AI時代 智能嵌入系統(tǒng)快速發(fā)展——“第六屆國產嵌入操作系統(tǒng)技術與產業(yè)發(fā)展論壇”圓滿結束

    嵌入系統(tǒng)是電子信息產業(yè)的基礎,是智能系統(tǒng)的核心。大模型催生AI走入千家萬戶、喚醒端側AI的需求
    發(fā)表于 08-30 17:24

    浪潮信息趙帥:開放計算創(chuàng)新 應對Scaling Law挑戰(zhàn)

    Scaling Law帶來的AI基礎設施Scale up和Scale out的挑戰(zhàn),數(shù)據(jù)中心需要以開放創(chuàng)新加速力系統(tǒng)、管理和基礎設施的全向Scale進程,推動
    的頭像 發(fā)表于 08-15 16:02 ?503次閱讀
    <b class='flag-5'>浪潮信息</b>趙帥:開放計算<b class='flag-5'>創(chuàng)新</b> 應對Scaling Law挑戰(zhàn)

    33家區(qū)域ISP伙伴與浪潮信息簽署戰(zhàn)略合作協(xié)議

    ,涉及互聯(lián)網、電信、金融和制造等人工智能應用落地的前沿行業(yè),雙方將依托浪潮信息元腦生態(tài)體系,以大模型開發(fā)平臺"元腦企智"EPAI為引擎,結合區(qū)域伙伴的行業(yè)優(yōu)勢,共同把握人工智能時代的新機遇,推動AI產業(yè)
    的頭像 發(fā)表于 08-14 15:43 ?616次閱讀
    33家區(qū)域ISP伙伴與<b class='flag-5'>浪潮信息</b>簽署戰(zhàn)略合作協(xié)議