一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

阿里云暫停A100服務(wù)器出租,AI算力奇缺!國(guó)產(chǎn)AI芯片任重道遠(yuǎn)

Carol Li ? 來(lái)源:電子發(fā)燒友網(wǎng) ? 作者:李彎彎 ? 2023-11-09 09:08 ? 次閱讀

電子發(fā)燒友網(wǎng)報(bào)道(文/李彎彎)上個(gè)月,美國(guó)發(fā)布更新針對(duì)AI芯片的出口管制規(guī)定,新措施意在填補(bǔ)去年10月發(fā)布法規(guī)中的漏洞。這樣意味著,除了英偉達(dá)A100/H100之外,其針對(duì)中國(guó)市場(chǎng)推出的替代版本A800/H800等GPU對(duì)華出售也將受到限制。

近日,阿里云A100服務(wù)器業(yè)務(wù)暫停出租的消息傳出。這反映出,美國(guó)對(duì)AI芯片的出口管制規(guī)定,已經(jīng)對(duì)中國(guó)的算力供應(yīng)造成影響。當(dāng)前的情況是,需求側(cè)大模型正在快速發(fā)展,對(duì)算力的需求不斷提升;供給側(cè)英偉達(dá)GPU芯片對(duì)華銷(xiāo)售受阻,市面上A100/A800等現(xiàn)貨價(jià)格水漲船高,算力租賃服務(wù)售價(jià)同樣如此。而阿里云在滿(mǎn)足自身大模型研發(fā)需求之外,也已經(jīng)沒(méi)有足夠多算力用于對(duì)外出租。

捉襟見(jiàn)肘的AI算力

目前,國(guó)內(nèi)各大互聯(lián)網(wǎng)廠商都已經(jīng)推出自己的大模型產(chǎn)品,并在不斷探索技術(shù)和應(yīng)用創(chuàng)新,同時(shí)各行各業(yè)的企業(yè),無(wú)論大小,都在嘗試將大模型技術(shù)引入自己的產(chǎn)品和解決方案中。而無(wú)論是大模型的研究和應(yīng)用,其訓(xùn)練和推理過(guò)程都需要依靠強(qiáng)大的算力作支撐。

百度、騰訊、字節(jié)、阿里作為國(guó)內(nèi)主要的云服務(wù)廠商。相較之下,購(gòu)買(mǎi)和積累了更多的GPU產(chǎn)品。其中,字節(jié)跳動(dòng)A100 和V100顯卡總數(shù)接近10萬(wàn)塊,阿里巴巴集團(tuán)也大概擁有10萬(wàn)塊頂級(jí)顯卡。騰訊因?yàn)樵?022年底砍掉一批英偉達(dá)訂單,其擁有的GPU數(shù)量較少。相對(duì)來(lái)說(shuō),百度所擁有的頂級(jí)GPU數(shù)量也偏少。

近年來(lái),大模型熱潮如龍卷風(fēng)般襲來(lái),這對(duì)GPU的需求不斷增加,上述各大廠商也加大了向英偉達(dá)GPU所下的訂單,以擴(kuò)大自己的基礎(chǔ)硬件設(shè)施儲(chǔ)備。今年8月,百度、字節(jié)、騰訊和阿里向英偉達(dá)下單訂購(gòu)50億美元的芯片,其中價(jià)值10億美元約10萬(wàn)顆英偉達(dá)A800芯片,將在年內(nèi)交付。另外價(jià)值40億美元的芯片將于2024年交付。

然而,在上個(gè)月美國(guó)發(fā)布AI芯片出口管制新規(guī)之后,這些訂單都將不能如期交付。這意味著各大互聯(lián)網(wǎng)廠商面臨著不同程度的GPU芯片緊缺的局面。

阿里云此次暫停A100服務(wù)器對(duì)外出租可想而知就是如此。阿里云是全球領(lǐng)先的云計(jì)算服務(wù)提供商之一,它提供各種各樣的云計(jì)算產(chǎn)品和服務(wù),包括云服務(wù)器租賃。

阿里云云服務(wù)器租賃是一種將計(jì)算資源分配給用戶(hù)的服務(wù),用戶(hù)可以通過(guò)互聯(lián)網(wǎng)租用虛擬化的服務(wù)器資源。這些服務(wù)器資源是在阿里云數(shù)據(jù)中心中運(yùn)行的,用戶(hù)只需要根據(jù)自己的需求選擇適合自己的云服務(wù)器,并根據(jù)需要支付租金。

在10月31日開(kāi)幕的2023年云棲大會(huì)上,阿里巴巴集團(tuán)董事會(huì)主席蔡崇信談到,在當(dāng)下的智能化時(shí)代,阿里巴巴要致力于打造AI時(shí)代最開(kāi)放的云。他表示,目前,中國(guó)有80%的科技企業(yè)和一半的大模型公司都跑在阿里云上。

除了對(duì)外出租,阿里云正在研發(fā)和迭代自己的通義千問(wèn)大模型,這對(duì)GPU算力的需求很高。舉例來(lái)看,OpenAI的GPT-3訓(xùn)練使用了128臺(tái)英偉達(dá)A100服務(wù)器(訓(xùn)練34天),對(duì)應(yīng)640P算力,GPT-4模型訓(xùn)練使用了3125臺(tái)英偉達(dá)A100 服務(wù)器(訓(xùn)練90-100天),對(duì)應(yīng)15625P算力。從GPT-3至GPT-4模型參數(shù)規(guī)模增加約10倍,用于訓(xùn)練的GPU數(shù)量增加了近24倍。

根據(jù)行業(yè)人士的推測(cè),國(guó)內(nèi)頭部大模型廠商如果對(duì)標(biāo)GPT-3模型的訓(xùn)練需求,需要1920臺(tái)A100/A800服務(wù)器,對(duì)應(yīng)15360張GPU。如果對(duì)標(biāo)GPT-4模型的訓(xùn)練需求,則額外需要13705臺(tái)A100/A800服務(wù)器,對(duì)應(yīng)近11萬(wàn)張GPU。

根據(jù)此前傳出的一份交流紀(jì)要里,阿里云AI專(zhuān)家提到,阿里云在云上有上萬(wàn)片的A100,整體能夠達(dá)到10萬(wàn)片,集團(tuán)體量應(yīng)該是阿里云的5倍。該AI專(zhuān)家提到,大模型大規(guī)模的應(yīng)用,成本也很高,比如ChatGPT完成一個(gè)推理任務(wù),需要5張A100在2秒鐘之內(nèi)做一次推理。

大致來(lái)看,1萬(wàn)張頂級(jí)顯卡才剛剛算是能夠跨進(jìn)大模型的門(mén)。而如果要訓(xùn)練更高級(jí)別的大模型,對(duì)GPU的需求將會(huì)呈大幅度增長(zhǎng)。就如上文所述,阿里云擁有大約1萬(wàn)張A100,已經(jīng)足夠其訓(xùn)練大模型產(chǎn)品,然而如果它想訓(xùn)練出對(duì)標(biāo)GPT-4的模型,可能就要用上阿里集團(tuán)目前所有的GPU卡。

逐漸能用的國(guó)產(chǎn)AI芯片

隨著大模型的研發(fā)和應(yīng)用,以及美國(guó)對(duì)AI芯片的出口管制,目前市場(chǎng)面現(xiàn)有的英偉達(dá)GPU芯片已經(jīng)漲到天價(jià),而且所剩不多,各個(gè)算力租賃服務(wù)企業(yè)價(jià)格也在不斷上漲。阿里云或許是為了率先滿(mǎn)足自己對(duì)算力的需求,只得暫停A100服務(wù)器對(duì)外出租。

然而這些舉措都沒(méi)有辦法真正解決,目前國(guó)內(nèi)對(duì)可用于大模型訓(xùn)練和推理的AI芯片的需求問(wèn)題。近日,面對(duì)美國(guó)加強(qiáng)對(duì)華人工智能芯片管制,英特爾率先提出應(yīng)變策略。據(jù)英特爾供應(yīng)鏈透露,英特爾已針對(duì)最新發(fā)布的Gaudi2推出降規(guī)版出貨,預(yù)計(jì)將不受新禁令影響。

不過(guò),即使Gaudi2降規(guī)版短期內(nèi)能夠出貨,然而其性能必然是會(huì)大打折扣的。要知道,之前英偉達(dá)在符合去年10月法規(guī)的基礎(chǔ)上,推出的A800/H800,相對(duì)于A100/H100在關(guān)鍵性能上就已經(jīng)大幅限制,如今要符合更新后的出口管制規(guī)定,Gaudi2降規(guī)版計(jì)算性能還得更進(jìn)一步下調(diào)。

期待國(guó)產(chǎn)AI算力芯片的突圍,才是長(zhǎng)久之計(jì)。事實(shí)上,目前已經(jīng)有一些國(guó)產(chǎn)企業(yè)的人工智能芯片,受到客戶(hù)的青睞。比如弘信電子近日發(fā)布公告稱(chēng),已與上海燧原科技有限公司簽署采購(gòu)協(xié)議,擬長(zhǎng)期向燧原科技采購(gòu)一定數(shù)量的人工智能加速卡及配套產(chǎn)品作為原材料。本次公司已正式向燧原科技下發(fā)9152片芯片采購(gòu)訂單,計(jì)劃于年底前完成全部芯片的交付,快速形成國(guó)產(chǎn)算力落地。

近日也有消息傳出,百度為200臺(tái)服務(wù)器訂購(gòu)了1600片昇騰910B AI芯片。到10月份,華為已向百度交付了超過(guò)60%的訂單。而且此前科大訊飛此前就已經(jīng)采用華為昇騰910B芯片,該公司還表示,當(dāng)前華為昇騰910B能力已經(jīng)基本做到可對(duì)標(biāo)英偉達(dá)A100。

總結(jié)

可以看到,在當(dāng)前大模型的不斷發(fā)展,及美國(guó)對(duì)AI芯片的出口管制下,算力已經(jīng)出現(xiàn)了極度緊缺的情況。雖然英特爾表示,已發(fā)布針對(duì)最新發(fā)布的Gaudi2推出降規(guī)版。然而可想而知其性能將會(huì)大打折扣,而且不能確保美國(guó)后續(xù)不會(huì)針對(duì)降規(guī)版也實(shí)施限制。長(zhǎng)久來(lái)看,發(fā)展中國(guó)自己的AI算力芯片極其重要,而如今已經(jīng)有國(guó)產(chǎn)的AI芯片可以用于大模型的訓(xùn)練和推理,這無(wú)疑給國(guó)產(chǎn)AI芯片在未來(lái)的發(fā)展中增添了更多信心。






聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    33554

    瀏覽量

    274198
  • 阿里云
    +關(guān)注

    關(guān)注

    3

    文章

    998

    瀏覽量

    43748
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    RAKsmart服務(wù)器如何賦能AI開(kāi)發(fā)與部署

    AI開(kāi)發(fā)與部署的復(fù)雜性不僅體現(xiàn)在算法設(shè)計(jì)層面,更依賴(lài)于底層基礎(chǔ)設(shè)施的支撐能力。RAKsmart服務(wù)器憑借其高性能硬件架構(gòu)、靈活的資源調(diào)度能力以及面向AI場(chǎng)景的深度優(yōu)化,正在成為企業(yè)突破
    的頭像 發(fā)表于 04-30 09:22 ?86次閱讀

    智能服務(wù)器應(yīng)用領(lǐng)域

    加速金融模型訓(xùn)練與實(shí)時(shí)交易決策,頭部機(jī)構(gòu)平臺(tái)規(guī)模超3.8萬(wàn)臺(tái)服務(wù)器?。 二、?醫(yī)療健康? 藥物研發(fā)與基因測(cè)序?:AI
    的頭像 發(fā)表于 04-21 09:09 ?127次閱讀
    智能<b class='flag-5'>算</b><b class='flag-5'>力</b><b class='flag-5'>服務(wù)器</b>應(yīng)用領(lǐng)域

    智能最具潛力的行業(yè)領(lǐng)域

    ?; 數(shù)據(jù)治理與聯(lián)合創(chuàng)新?:民生銀行與華為、阿里等共建AI實(shí)驗(yàn)室,通過(guò)“數(shù)據(jù)湖+模型體系”提升服務(wù)精準(zhǔn)度?;
    的頭像 發(fā)表于 04-11 08:20 ?151次閱讀
    智能<b class='flag-5'>算</b><b class='flag-5'>力</b>最具潛力的行業(yè)領(lǐng)域

    RAKsmart服務(wù)器如何重塑AI高并發(fā)格局

    AI大模型參數(shù)量突破萬(wàn)億級(jí)、實(shí)時(shí)推理需求激增的當(dāng)下,傳統(tǒng)服務(wù)器架構(gòu)的并發(fā)處理能力已逼近物理極限。RAKsmart通過(guò)“硬件重構(gòu)+軟件定義”的雙引擎創(chuàng)新,推出新一代AI服務(wù)器解決方案。
    的頭像 發(fā)表于 04-03 10:37 ?170次閱讀

    如何在RAKsmart服務(wù)器上實(shí)現(xiàn)企業(yè)AI模型部署

    AI模型的訓(xùn)練與部署需要強(qiáng)大的支持、穩(wěn)定的網(wǎng)絡(luò)環(huán)境和專(zhuān)業(yè)的技術(shù)管理。RAKsmart作為全球領(lǐng)先的服務(wù)器托管與計(jì)算
    的頭像 發(fā)表于 03-27 09:46 ?189次閱讀

    DeepSeek推動(dòng)AI需求:800G光模塊的關(guān)鍵作用

    隨著人工智能技術(shù)的飛速發(fā)展,AI需求正以前所未有的速度增長(zhǎng)。DeepSeek等大模型的訓(xùn)練與推理任務(wù)對(duì)的需求持續(xù)攀升,直接推動(dòng)了
    發(fā)表于 03-25 12:00

    千卡破局:科通技術(shù)以&quot;AI大模型+AI芯片&quot;重構(gòu)智底座

    “科通技術(shù)”)推出的“DeepSeek+AI芯片”全場(chǎng)景方案,在AI領(lǐng)域取得重大突破。除了GPU的
    的頭像 發(fā)表于 03-17 11:14 ?340次閱讀

    Firefly 服務(wù)器系列:覆蓋多個(gè)領(lǐng)域的高解決方案

    Firefly專(zhuān)注于以計(jì)算和大數(shù)據(jù)為核心的服務(wù)器產(chǎn)品開(kāi)發(fā)與應(yīng)用,陸續(xù)推出支持多種計(jì)算單元的ARM服務(wù)器,覆蓋多個(gè)行業(yè)及領(lǐng)域,為客戶(hù)提供優(yōu)質(zhì)的解決方案。Firefly服務(wù)器系列產(chǎn)品
    的頭像 發(fā)表于 02-19 16:34 ?428次閱讀
    Firefly <b class='flag-5'>服務(wù)器</b>系列:覆蓋多個(gè)領(lǐng)域的高<b class='flag-5'>算</b><b class='flag-5'>力</b>解決方案

    巨人網(wǎng)絡(luò)與阿里深化AI合作

    巨人網(wǎng)絡(luò)近日宣布與阿里進(jìn)一步深化合作關(guān)系,雙方將在游戲場(chǎng)景的AI落地應(yīng)用及生態(tài)建設(shè)等領(lǐng)域展開(kāi)更為緊密的合作,共同推動(dòng)
    的頭像 發(fā)表于 02-14 14:06 ?380次閱讀

    企業(yè)AI租賃是什么

    企業(yè)AI租賃是指企業(yè)通過(guò)互聯(lián)網(wǎng)向?qū)I(yè)的提供商租用所需的計(jì)算資源,以滿(mǎn)足其AI應(yīng)用的需求。
    的頭像 發(fā)表于 11-14 09:30 ?2033次閱讀

    一體架構(gòu)創(chuàng)新助力國(guó)產(chǎn)AI芯片騰飛

    在灣芯展SEMiBAY2024《AI芯片與高性能計(jì)算(HPC)應(yīng)用論壇》上,億鑄科技高級(jí)副總裁徐芳發(fā)表了題為《存一體架構(gòu)創(chuàng)新助力國(guó)產(chǎn)
    的頭像 發(fā)表于 10-23 14:48 ?694次閱讀

    什么是AI服務(wù)器?AI服務(wù)器的優(yōu)勢(shì)是什么?

    AI服務(wù)器是一種專(zhuān)門(mén)為人工智能應(yīng)用設(shè)計(jì)的服務(wù)器,它采用異構(gòu)形式的硬件架構(gòu),通常搭載GPU、FPGA、ASIC等加速芯片,利用CPU與加速芯片
    的頭像 發(fā)表于 09-21 11:43 ?1637次閱讀

    AI服務(wù)器:開(kāi)啟智能計(jì)算新時(shí)代

    一、AI服務(wù)器的定義與特點(diǎn) AI服務(wù)器的定義 AI
    的頭像 發(fā)表于 08-09 16:08 ?1425次閱讀

    AI服務(wù)器散熱,需要用到哪些導(dǎo)熱界面材料?

    在數(shù)字經(jīng)濟(jì)、AI大模型等發(fā)展的帶動(dòng)下,全球服務(wù)器的市場(chǎng)需求急劇提升,利用其強(qiáng)大的計(jì)算能力,能夠處理復(fù)雜的算法和海量數(shù)據(jù)。與此同時(shí),生成式人工智能的大需求也拉高了
    的頭像 發(fā)表于 05-30 10:44 ?1229次閱讀
    <b class='flag-5'>AI</b>高<b class='flag-5'>算</b><b class='flag-5'>力</b><b class='flag-5'>服務(wù)器</b>散熱,需要用到哪些導(dǎo)熱界面材料?

    智能存在缺口,AI服務(wù)器市場(chǎng)規(guī)模持續(xù)提升

    商的資本支出將大幅增加。全球前四大服務(wù)商資本支出調(diào)升,預(yù)計(jì)將從2023年的1400億美元提升至2024年的超過(guò)2000億美元。 ? AI 服務(wù)器市場(chǎng)規(guī)模持續(xù)增長(zhǎng) ? 近些年,人工智能
    的頭像 發(fā)表于 05-22 00:14 ?3369次閱讀