一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

大模型時(shí)代,國產(chǎn)AI芯片最新進(jìn)展!算力集群化是必然趨勢

Carol Li ? 來源:電子發(fā)燒友網(wǎng) ? 作者:李彎彎 ? 2023-07-11 09:05 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

電子發(fā)燒友網(wǎng)報(bào)道(文/李彎彎)在剛過去的2023世界人工智能大會(huì)上,大模型可以說是其中的大亮點(diǎn)之一,華為盤古、商湯日日新、網(wǎng)易伏羲等30多款國產(chǎn)AI大模型集中亮相。與此同時(shí),各類人工智能芯片公司、算力提供商也針對(duì)大模型展示了相應(yīng)的方案。

大模型時(shí)代,國產(chǎn)AI芯片進(jìn)展如何?

在這次大會(huì)上,瀚博半導(dǎo)體、燧原科技、登臨科技、天數(shù)智芯等紛紛展示了針對(duì)大模型的產(chǎn)品方案,呈現(xiàn)出國產(chǎn)AI芯片在大模型領(lǐng)域的進(jìn)展情況。

瀚博半導(dǎo)體成立于2018年12月,是一家自研GPU芯片及解決方案提供商。在此次大會(huì)上,瀚博發(fā)布了第二代GPU SG100,并推出南禺系列GPU加速卡VG1600、VG1800、VG14,以及LLM大模型AI加速卡VA1L、AIGC大模型一體機(jī)、VA12高性能生成式AI加速卡等6款新品。

據(jù)介紹,瀚博SG100芯片采用7nm先進(jìn)制程,具備業(yè)界領(lǐng)先的渲染性能,同時(shí)兼具低延時(shí)高吞吐的AI算力和強(qiáng)大的視頻處理能力。

值得關(guān)注的,針對(duì)大模型時(shí)代算力需求,瀚博本次首發(fā)了LLM大模型AI加速卡VA1L,具備200 TOPS INT8/72 TFLOPS FP16算力,并支持ChatGPT、LLaMA、Stable Diffusion等主流AIGC網(wǎng)絡(luò)模型。

與此同時(shí),瀚博此次還推出了AIGC大模型一體機(jī),共使用8張LLM大模型AI加速卡VA1L,支持512GB顯存,進(jìn)而支持1750億參數(shù)的大模型。

另外,作為瀚博VA1和VA10的升級(jí)版,VA12是一塊通用AI加速卡,支持檢測、分類、分割、視頻增強(qiáng)、語義理解、BERT、Transfomer和視頻編解碼等應(yīng)用。

燧原科技在此次大會(huì)上發(fā)布了燧原曜圖文生圖MaaS平臺(tái)服務(wù)產(chǎn)品。該產(chǎn)品以燧原科技“邃思”系列芯片為算力支撐,由首都在線提供計(jì)算服務(wù),燧原曜圖MaaS平臺(tái)服務(wù)產(chǎn)品為用戶提供面向AIGC時(shí)代的高效易用、安全可靠、企業(yè)級(jí)的文生圖服務(wù)。

燧原科技表示,它具備開箱即用可用、所想即所見、創(chuàng)意無限的文本生成圖像能力,通過軟硬一體方案降低大規(guī)模AIGC應(yīng)用的工程難度與算力成本,開啟AIGC應(yīng)用規(guī)?;涞貢r(shí)代。

燧原科技創(chuàng)始人兼CEO趙立東在某論壇上提到,目前燧原已經(jīng)為大型科研機(jī)構(gòu)部署了千卡規(guī)模的AI訓(xùn)練算力集群,并成功落地;而且與騰訊合作,在OCR文字識(shí)別、智能交互、智能會(huì)議等方面,性能達(dá)到了業(yè)界同類產(chǎn)品兩倍以上,性價(jià)比上具有很高優(yōu)勢。此外,在智慧城市方面,燧原完成2022年成都高新區(qū)國產(chǎn)化AI視頻基礎(chǔ)設(shè)施平臺(tái)項(xiàng)目建設(shè)。

此次大會(huì)上,登臨科技展示了最新一代創(chuàng)新通用GPU產(chǎn)品Goldwasser II系列以及基于開源大語言模型可交互界面。據(jù)了解,Goldwasser II針對(duì)基于Transformer和生成式AI 大模型進(jìn)行專門優(yōu)化,在性能有大幅提升,已于2022年流片,目前已開始規(guī)?;慨a(chǎn)和商業(yè)客戶驗(yàn)證。據(jù)現(xiàn)有客戶測試結(jié)果,二代產(chǎn)品針對(duì)基于transformer類型的模型提供3-5倍的性能提升,大幅降低類ChatGPT及生成式AI應(yīng)用的硬件成本。

天數(shù)智芯在此次會(huì)上也展示了在大模型訓(xùn)練、推理所取得的顯著進(jìn)展,包括圖片識(shí)別/以圖搜圖、3D建模、大模型推理等。在大模型領(lǐng)域,天數(shù)智芯今年上半年,搭建了40P算力320張?zhí)燠?00加速卡算力集群,完成智源研究院70億參數(shù)大模型全量訓(xùn)練,

天垓100是天數(shù)智芯2018年研發(fā)的通用AI訓(xùn)練芯片,據(jù)天數(shù)智芯董事長蓋魯江介紹,目前天垓100這款產(chǎn)品還已經(jīng)成功跑通了清華智譜 AI 大模型ChatGLM,Meta研發(fā)的LLaMA模型。此外,天數(shù)智芯正在幫智源研究院跑650億參數(shù)的模型,預(yù)計(jì)10月份可以跑完。

針對(duì)于A800芯片在無許可證的情況下將被禁售的話題,蓋魯江談到,事實(shí)上,不管英偉達(dá)的產(chǎn)品能不能賣給中國,我們的產(chǎn)品已經(jīng)能夠用起來了。

算力集群化是發(fā)展趨勢

伴隨大模型帶來的生成式AI突破,人工智能正在進(jìn)入一個(gè)新的時(shí)代。算力是人工智能產(chǎn)業(yè)創(chuàng)新的基礎(chǔ),大模型的持續(xù)創(chuàng)新,驅(qū)動(dòng)算力需求的爆炸式增長??梢哉f,大模型訓(xùn)練的效率或者是創(chuàng)新的速度,根本上取決于算力的大小。

然而,中國的算力已經(jīng)成為一個(gè)越來越稀缺的資源。華為輪值董事長胡厚崑在某論壇上談到,大模型的研發(fā)高度依賴高端AI芯片、集群及生態(tài)。高計(jì)算性能、高通信帶寬和大顯存成為大模型訓(xùn)練必不可少的算力底座,單AI芯片進(jìn)步速度還未跟上大模型對(duì)大算力的需求,算力集群化成為不可逆轉(zhuǎn)的發(fā)展趨勢。

在2023世界人工智能大會(huì)上,華為宣布昇騰AI集群全面升級(jí),集群規(guī)模從最初的4000卡集群擴(kuò)展至16000卡,擁有更快的訓(xùn)練速度和30天以上的穩(wěn)定訓(xùn)練周期。

胡厚崑表示,華為在各個(gè)單點(diǎn)創(chuàng)新的基礎(chǔ)上,充分發(fā)揮云、計(jì)算、存儲(chǔ)、網(wǎng)絡(luò)以及能源的綜合優(yōu)勢,進(jìn)行架構(gòu)創(chuàng)新,推出了昇騰AI集群,相當(dāng)于把AI算力中心當(dāng)成一臺(tái)超級(jí)計(jì)算機(jī)來設(shè)計(jì),使得昇騰AI集群性能更高,并且可靠性更高。

據(jù)他介紹,昇騰AI集群目前已經(jīng)可以達(dá)到10%以上的大模型訓(xùn)練效率的提升,可以提供10倍以上的系統(tǒng)穩(wěn)定的提高,支持長期穩(wěn)定訓(xùn)練。

華為昇騰計(jì)算業(yè)務(wù)總裁張迪煊表示,基于昇騰AI,原生孵化和適配了30多個(gè)大模型,到目前為止,中國有一半左右的大模型創(chuàng)新,都是由昇騰AI來支持的。

除了華為,阿里、騰訊等也打造了較大的算力集群,不過主要還是依靠英偉達(dá)的GPU芯片。阿里云表示,其擁有國內(nèi)最強(qiáng)的智能算力儲(chǔ)備,智算集群可支持最大十萬卡GPU規(guī)模,承載多個(gè)萬億參數(shù)大模型同時(shí)在線訓(xùn)練。

騰訊云此前大量采購了英偉達(dá)A100/H800芯片,發(fā)布新一代HCC高性能計(jì)算集群,用于大模型訓(xùn)練、自動(dòng)駕駛、科學(xué)計(jì)算等領(lǐng)域?;谛乱淮?,騰訊團(tuán)隊(duì)在同等數(shù)據(jù)集下,將萬億參數(shù)的AI大模型混元NLP訓(xùn)練由50天縮短到4天。

小結(jié)

無論是大模型的訓(xùn)練,還是后期的推理部署,對(duì)算力的需求都相當(dāng)大。雖然,當(dāng)前國產(chǎn)AI芯片與國際領(lǐng)先GPU產(chǎn)品在大模型的訓(xùn)練上有差距,不過可以看到,已經(jīng)有不少產(chǎn)品,在較大模型的訓(xùn)練上已經(jīng)取得成績,后續(xù)必然還會(huì)有更大的進(jìn)展。同時(shí),為了滿足大模型對(duì)大算力的需求,算力集群化將會(huì)是未來趨勢。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    88

    文章

    35182

    瀏覽量

    280205
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    百度在AI領(lǐng)域的最新進(jìn)展

    近日,我們在武漢舉辦了Create2025百度AI開發(fā)者大會(huì),與全球各地的5000多名開發(fā)者,分享了百度在AI領(lǐng)域的新進(jìn)展。
    的頭像 發(fā)表于 04-30 10:14 ?631次閱讀

    谷歌Gemini API最新進(jìn)展

    體驗(yàn)的 Live API 的最新進(jìn)展,以及正式面向開發(fā)者開放的高質(zhì)量視頻生成工具 Veo 2。近期,我們面向在 Google AI Studio 中使用 Gemini API 的開發(fā)者推出了許多不容錯(cuò)過的重要更新,一起來看看吧。
    的頭像 發(fā)表于 04-12 16:10 ?1029次閱讀

    華為公布AI基礎(chǔ)設(shè)施架構(gòu)突破性新進(jìn)展

    近日,華為公司常務(wù)董事、華為云計(jì)算CEO張平安在華為云生態(tài)大會(huì)2025上公布了AI基礎(chǔ)設(shè)施架構(gòu)突破性新進(jìn)展——推出基于新型高速總線架構(gòu)的CloudMatrix 384超節(jié)點(diǎn)集群,并宣布已在蕪湖數(shù)據(jù)中心規(guī)模上線。
    的頭像 發(fā)表于 04-12 15:09 ?1031次閱讀

    DeepSeek推動(dòng)AI需求:800G光模塊的關(guān)鍵作用

    的100G光模塊已無法滿足高效能AI訓(xùn)練和推理所需的大規(guī)模數(shù)據(jù)傳輸。為了應(yīng)對(duì)這一挑戰(zhàn),400G、800G乃至1.6T光模塊的出現(xiàn)成為行業(yè)必然趨勢。特別是隨著DeepSeek等模型的規(guī)模擴(kuò)大,如何提升
    發(fā)表于 03-25 12:00

    京東方華燦光電氮化鎵器件的最新進(jìn)展

    日前,京東方華燦的氮化鎵研發(fā)總監(jiān)馬歡應(yīng)半導(dǎo)體在線邀請,分享了關(guān)于氮化鎵器件的最新進(jìn)展,引起了行業(yè)的廣泛關(guān)注。隨著全球半導(dǎo)體領(lǐng)域?qū)Ω咝阅?、高效率器件的需求不斷加大,氮化鎵(GaN)技術(shù)逐漸成為新一代電子器件的熱點(diǎn),其優(yōu)越的性能使其在電源轉(zhuǎn)換和射頻應(yīng)用中展現(xiàn)出巨大的潛力。
    的頭像 發(fā)表于 03-13 11:44 ?844次閱讀

    垂直氮化鎵器件的最新進(jìn)展和可靠性挑戰(zhàn)

    過去兩年中,氮化鎵雖然發(fā)展迅速,但似乎已經(jīng)遇到了瓶頸。與此同時(shí),不少垂直氮化鎵的初創(chuàng)企業(yè)倒閉或者賣盤,這引發(fā)大家對(duì)垂直氮化鎵未來的擔(dān)憂。為此,在本文中,我們先對(duì)氮化鎵未來的發(fā)展進(jìn)行分析,并討論了垂直氮化鎵器件開發(fā)的最新進(jìn)展以及相關(guān)的可靠性挑戰(zhàn)。
    的頭像 發(fā)表于 02-17 14:27 ?1199次閱讀
    垂直氮化鎵器件的<b class='flag-5'>最新進(jìn)展</b>和可靠性挑戰(zhàn)

    FF將發(fā)布FX品牌最新進(jìn)展

    "、"FF"或 "公司")今天宣布,將于2025年1月8日盤后公布其自2024年9月19日FX品牌發(fā)布以來的最新進(jìn)展,包括最新項(xiàng)目進(jìn)展、重大里程碑、新產(chǎn)品品類戰(zhàn)略及下一步計(jì)劃。
    的頭像 發(fā)表于 01-03 15:58 ?659次閱讀

    揭秘超以太網(wǎng)聯(lián)盟(UEC)1.0 規(guī)范最新進(jìn)展(2024Q4)

    近期,由博通、思科、Arista、微軟、Meta等國際頂級(jí)半導(dǎo)體、設(shè)備和云廠商牽頭成立的超以太網(wǎng)聯(lián)盟(UEC)在OCP Global Summit上對(duì)外公布其最新進(jìn)展——UEC規(guī)范1.0的預(yù)覽版本。讓我們一睹為快吧!
    的頭像 發(fā)表于 11-18 16:53 ?1364次閱讀
    揭秘超以太網(wǎng)聯(lián)盟(UEC)1.0 規(guī)范<b class='flag-5'>最新進(jìn)展</b>(2024Q4)

    Qorvo在射頻和電源管理領(lǐng)域的最新進(jìn)展

    了半導(dǎo)體行業(yè)的重大變革,還成功引領(lǐng)Qorvo成為射頻技術(shù)的領(lǐng)導(dǎo)者。在本次專訪中,Philip將為大家分享Qorvo在射頻和電源管理領(lǐng)域的最新進(jìn)展,并探討HPA事業(yè)部如何通過技術(shù)創(chuàng)新應(yīng)對(duì)全球電氣化和互聯(lián)化的挑戰(zhàn)。
    的頭像 發(fā)表于 11-17 10:57 ?912次閱讀

    芯片和封裝級(jí)互連技術(shù)的最新進(jìn)展

    近年來,計(jì)算領(lǐng)域發(fā)生了巨大變化,通信已成為系統(tǒng)性能的主要瓶頸,而非計(jì)算本身。這一轉(zhuǎn)變使互連技術(shù) - 即實(shí)現(xiàn)計(jì)算系統(tǒng)各組件之間數(shù)據(jù)交換的通道 - 成為計(jì)算機(jī)架構(gòu)創(chuàng)新的焦點(diǎn)。本文探討了通用、專用和量子計(jì)算系統(tǒng)中芯片和封裝級(jí)互連的最新進(jìn)展,并強(qiáng)調(diào)了這一快速發(fā)展領(lǐng)域的關(guān)鍵技術(shù)、挑
    的頭像 發(fā)表于 10-28 09:50 ?1154次閱讀

    AI模型的最新研究進(jìn)展

    AI模型的最新研究進(jìn)展體現(xiàn)在多個(gè)方面,以下是對(duì)其最新進(jìn)展的介紹: 一、技術(shù)創(chuàng)新與突破 生成式AI技術(shù)的爆發(fā) : 生成式
    的頭像 發(fā)表于 10-23 15:19 ?1542次閱讀

    【「大模型時(shí)代的基礎(chǔ)架構(gòu)」閱讀體驗(yàn)】+ 未知領(lǐng)域的感受

    國慶前就收到《大模型時(shí)代的基礎(chǔ)架構(gòu)》一書,感謝電子發(fā)燒友論壇。歡度國慶之余,今天才靜下心來體驗(yàn)此書,書不厚,200余頁,彩色圖例,印刷精美! 當(dāng)初申請此書,主要是看到副標(biāo)題“大模型
    發(fā)表于 10-08 10:40

    開啟全新AI時(shí)代 智能嵌入式系統(tǒng)快速發(fā)展——“第六屆國產(chǎn)嵌入式操作系統(tǒng)技術(shù)與產(chǎn)業(yè)發(fā)展論壇”圓滿結(jié)束

    計(jì)算機(jī)學(xué)院牛建偉教授主持。 中科院軟件所副所長、總工程師,武延軍研究員做了“AI模型時(shí)代下的操作系統(tǒng)發(fā)展思考”主題演講。 武延軍介紹了操作系統(tǒng)的發(fā)展歷程,指出應(yīng)用的高速發(fā)展給操作系統(tǒng)帶來的
    發(fā)表于 08-30 17:24

    模型時(shí)代需求

    現(xiàn)在AI已進(jìn)入大模型時(shí)代,各企業(yè)都爭相部署大模型,但如何保證大模型
    發(fā)表于 08-20 09:04

    名單公布!【書籍評(píng)測活動(dòng)NO.41】大模型時(shí)代的基礎(chǔ)架構(gòu):大模型中心建設(shè)指南

    工作日內(nèi)未聯(lián)系,視為放棄本次試用評(píng)測資格! 書籍介紹 大模型是近年來引人注目的熱點(diǎn)之一。大模型蓬勃發(fā)展的基礎(chǔ),是針對(duì)其需求設(shè)計(jì)的及基礎(chǔ)架構(gòu)。本書針對(duì)如何為大
    發(fā)表于 08-16 18:33