一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線(xiàn)課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

9個(gè)為人工智能、機(jī)器學(xué)習(xí)和深度學(xué)習(xí)準(zhǔn)備數(shù)據(jù)中心的優(yōu)秀實(shí)踐

如意 ? 來(lái)源:企業(yè)網(wǎng)D1Net ? 作者:HERO編譯 ? 2020-10-09 15:57 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

圍繞圖形處理單元(GPU)計(jì)算的生態(tài)系統(tǒng)如今正在迅速發(fā)展,以提高GPU工作負(fù)載的效率和可擴(kuò)展性。然而,在避免存儲(chǔ)和網(wǎng)絡(luò)中潛在的瓶頸的同時(shí),也有一些技巧可以很大限度地提高GPU的利用率。

人工智能機(jī)器學(xué)習(xí)、深度學(xué)習(xí)應(yīng)用程序的密集需求對(duì)數(shù)據(jù)中心的性能、可靠性和可擴(kuò)展性提出了挑戰(zhàn),尤其是在IT架構(gòu)師模仿公共云的設(shè)計(jì)以簡(jiǎn)化向混合云和內(nèi)部部署的過(guò)渡時(shí)。

Excelero公司首席技術(shù)官Sven Breuner和首席架構(gòu)師Kirill Shoikhet為此分享了9個(gè)為人工智能、機(jī)器學(xué)習(xí)和深度學(xué)習(xí)準(zhǔn)備數(shù)據(jù)中心的優(yōu)秀實(shí)踐。

數(shù)據(jù)點(diǎn)1:了解目標(biāo)系統(tǒng)性能、投資回報(bào)率和可擴(kuò)展性計(jì)劃。

隨著人工智能成為核心業(yè)務(wù)的重要組成部分,大多數(shù)組織都從最初的少量預(yù)算和少量培訓(xùn)數(shù)據(jù)集入手,并為無(wú)縫快速的系統(tǒng)增長(zhǎng)準(zhǔn)備基礎(chǔ)設(shè)施。需要構(gòu)建所選的硬件和軟件基礎(chǔ)設(shè)施,以實(shí)現(xiàn)靈活的橫向擴(kuò)展,以避免在每個(gè)新的增長(zhǎng)階段產(chǎn)生破壞性的變化。數(shù)據(jù)科學(xué)家與系統(tǒng)管理員之間的密切協(xié)作對(duì)于了解性能要求,并了解基礎(chǔ)設(shè)施可能需要隨著時(shí)間的發(fā)展而變得至關(guān)重要。

數(shù)據(jù)點(diǎn)2:現(xiàn)在或?qū)?lái)評(píng)估集群多個(gè)GPU系統(tǒng)。

在一臺(tái)服務(wù)器中采用多個(gè)GPU可以在系統(tǒng)內(nèi)部實(shí)現(xiàn)有效的數(shù)據(jù)共享和通信,并具有成本效益,參考設(shè)計(jì)假定將來(lái)可以集群使用,并且在單個(gè)服務(wù)器中最多支持16個(gè)GPU。多個(gè)GPU服務(wù)器需要準(zhǔn)備好以很高的速率讀取傳入的數(shù)據(jù),以使GPU高效運(yùn)行,這意味著它需要一個(gè)超高速的網(wǎng)絡(luò)連接,以及用于訓(xùn)練數(shù)據(jù)庫(kù)的存儲(chǔ)系統(tǒng)。但是在某個(gè)時(shí)候,單臺(tái)服務(wù)器將不再足以在合理的時(shí)間內(nèi)處理增長(zhǎng)的訓(xùn)練數(shù)據(jù)庫(kù),因此在設(shè)計(jì)中構(gòu)建共享存儲(chǔ)基礎(chǔ)設(shè)施將使隨著人工智能、機(jī)器學(xué)習(xí)、深度學(xué)習(xí)使用的擴(kuò)展,添加GPU服務(wù)器變得更容易。

數(shù)據(jù)點(diǎn)3:評(píng)估人工智能工作流程各個(gè)階段的瓶頸。

數(shù)據(jù)中心基礎(chǔ)設(shè)施需要能夠同時(shí)處理人工智能工作流程的所有階段。對(duì)于具有成本效益的數(shù)據(jù)中心來(lái)說(shuō),擁有一個(gè)可靠的資源調(diào)度和共享概念是至關(guān)重要的。因此,盡管數(shù)據(jù)科學(xué)家獲得了需要攝取和準(zhǔn)備的新數(shù)據(jù),但其他人將訓(xùn)練他們的可用數(shù)據(jù),而其他人則使用先前生成的模型進(jìn)行訓(xùn)練用于生產(chǎn)。Kubernetes已成為解決這一問(wèn)題的一種主要解決方案,使云計(jì)算技術(shù)易于在內(nèi)部部署使用,并使混合部署變得可行。

數(shù)據(jù)點(diǎn)4:查看用于優(yōu)化GPU利用率和性能的策略。

許多人工智能、機(jī)器學(xué)習(xí)、深度學(xué)習(xí)應(yīng)用程序的計(jì)算密集型性質(zhì)使基于GPU的服務(wù)器成為常見(jiàn)選擇。但是,盡管GPU可以有效地從內(nèi)存加載數(shù)據(jù),但是訓(xùn)練數(shù)據(jù)集通常遠(yuǎn)遠(yuǎn)超過(guò)內(nèi)存,并且涉及的大量文件變得更加難以攝取。在GPU服務(wù)器之間以及與存儲(chǔ)基礎(chǔ)設(shè)施之間,實(shí)現(xiàn)GPU數(shù)量與可用CPU功率、內(nèi)存和網(wǎng)絡(luò)帶寬之間的優(yōu)秀平衡至關(guān)重要。

數(shù)據(jù)點(diǎn)5:支持訓(xùn)練和推理階段的需求。

在訓(xùn)練系統(tǒng)“看貓”的經(jīng)典示例中,計(jì)算機(jī)執(zhí)行一個(gè)數(shù)字游戲,需要查看大量不同顏色的貓。由于包含大量并行文件讀取的訪(fǎng)問(wèn)的性質(zhì),NVMe閃存通過(guò)提供超低的訪(fǎng)問(wèn)延遲和每秒的大量讀取操作很好地滿(mǎn)足了這些要求。在推理階段,挑戰(zhàn)是相似的,因?yàn)閷?duì)象識(shí)別通常是實(shí)時(shí)發(fā)生的——另一個(gè)使用案例中,NVMe閃存也提供了延遲優(yōu)勢(shì)。

數(shù)據(jù)點(diǎn)6:考慮并行文件系統(tǒng)和替代方案。

諸如IBM公司的SpectrumScale或BeeGFS之類(lèi)的并行文件系統(tǒng)可以幫助有效地處理大量小文件的元數(shù)據(jù),并通過(guò)在網(wǎng)絡(luò)上每秒交付數(shù)萬(wàn)個(gè)小文件,從而使機(jī)器學(xué)習(xí)數(shù)據(jù)集的分析速度提高3到4倍。鑒于訓(xùn)練數(shù)據(jù)的只讀性質(zhì),因此在將數(shù)據(jù)卷直接提供給GPU服務(wù)器并通過(guò)Kubernetes之類(lèi)的框架以共享方式共享它們時(shí),也可以完全避免使用并行文件系統(tǒng)。

數(shù)據(jù)點(diǎn)7:選擇正確的網(wǎng)絡(luò)主干。

人工智能、機(jī)器學(xué)習(xí)、深度學(xué)習(xí)通常是一種新的工作負(fù)載,將其重新安裝到現(xiàn)有的網(wǎng)絡(luò)基礎(chǔ)設(shè)施中通常無(wú)法支持復(fù)雜計(jì)算和快速高效數(shù)據(jù)傳輸所需的低延遲、高帶寬、高消息速率和智能卸載。基于RDMA的網(wǎng)絡(luò)傳輸RoCE(融合以太網(wǎng)上的RDMA)和InfiniBand已成為滿(mǎn)足這些新需求的標(biāo)準(zhǔn)。

數(shù)據(jù)點(diǎn)8:考慮四個(gè)存儲(chǔ)系統(tǒng)的性?xún)r(jià)比杠桿。

(1)高讀取吞吐量和低延遲,不限制混合部署,可以在云平臺(tái)或內(nèi)部部署資源上運(yùn)行。

(2)數(shù)據(jù)保護(hù)。人工智能、機(jī)器學(xué)習(xí)、深度學(xué)習(xí)存儲(chǔ)系統(tǒng)通常比數(shù)據(jù)中心中的其他系統(tǒng)要快得多,因此在發(fā)生故障后從備份中恢復(fù)可能會(huì)花費(fèi)很長(zhǎng)時(shí)間,并且會(huì)中斷正在進(jìn)行的操作。深度學(xué)習(xí)訓(xùn)練的只讀性質(zhì)使其非常適合于分布式擦除編碼,在這種存儲(chǔ)中,最高容錯(cuò)能力已經(jīng)內(nèi)置在主存儲(chǔ)系統(tǒng)中,原始容量和可用容量之間的差異很小。

(3)容量彈性可適應(yīng)任何大小或類(lèi)型的驅(qū)動(dòng)器,以便隨著閃存介質(zhì)的發(fā)展和閃存驅(qū)動(dòng)器特性的擴(kuò)展,數(shù)據(jù)中心可以在最重要的情況下很大限度地提高性?xún)r(jià)比。

(4)性能。由于人工智能數(shù)據(jù)集需要隨著時(shí)間的推移而增長(zhǎng),以進(jìn)一步提高模型的準(zhǔn)確性,因此存儲(chǔ)基礎(chǔ)設(shè)施應(yīng)實(shí)現(xiàn)接近線(xiàn)性的縮放系數(shù),在這種情況下,每增加一次存儲(chǔ)都會(huì)帶來(lái)同等的增量性能。這使得組織可以從小規(guī)模開(kāi)始,并根據(jù)業(yè)務(wù)需要而無(wú)中斷地增長(zhǎng)。

數(shù)據(jù)點(diǎn)9:設(shè)置基準(zhǔn)和性能指標(biāo)以幫助實(shí)現(xiàn)可擴(kuò)展性。

例如,對(duì)于深度學(xué)習(xí)存儲(chǔ),一個(gè)重要指標(biāo)可能是每個(gè)GPU每秒處理X個(gè)文件(通常為數(shù)千或數(shù)萬(wàn)個(gè)),其中每個(gè)文件的平均大小為Y(從幾十個(gè)到數(shù)千個(gè))kB 。預(yù)先建立適當(dāng)?shù)幕鶞?zhǔn)和性能指標(biāo)有助于從一開(kāi)始就確定架構(gòu)方法和解決方案,并指導(dǎo)后續(xù)擴(kuò)展。
責(zé)編AJX

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    88

    文章

    35099

    瀏覽量

    279539
  • 機(jī)器學(xué)習(xí)

    關(guān)注

    66

    文章

    8501

    瀏覽量

    134583
  • 深度學(xué)習(xí)
    +關(guān)注

    關(guān)注

    73

    文章

    5561

    瀏覽量

    122789
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    如何有效地管理人工智能數(shù)據(jù)中心的電源

    作者:Kenton Williston 投稿人:DigiKey 北美編輯 人工智能 (AI) 和機(jī)器學(xué)習(xí) (ML) 的興起提出了前所未有的電力需求。下一代數(shù)據(jù)中心在電源管理、效率和可靠
    的頭像 發(fā)表于 05-25 11:30 ?249次閱讀
    如何有效地管理<b class='flag-5'>人工智能</b><b class='flag-5'>數(shù)據(jù)中心</b>的電源

    數(shù)學(xué)專(zhuān)業(yè)轉(zhuǎn)人工智能方向:考研/就業(yè)前景分析及大學(xué)四年學(xué)習(xí)路徑全揭秘

    隨著AI技術(shù)的不斷進(jìn)步,專(zhuān)業(yè)人才的需求也日益增長(zhǎng)。數(shù)學(xué)作為AI的基石,為機(jī)器學(xué)習(xí)、深度學(xué)習(xí)、數(shù)據(jù)分析等提供了理論基礎(chǔ)和工具,因此越來(lái)越多的數(shù)
    的頭像 發(fā)表于 02-07 11:14 ?1097次閱讀
    數(shù)學(xué)專(zhuān)業(yè)轉(zhuǎn)<b class='flag-5'>人工智能</b>方向:考研/就業(yè)前景分析及大學(xué)四年<b class='flag-5'>學(xué)習(xí)</b>路徑全揭秘

    人工智能機(jī)器學(xué)習(xí)以及Edge AI的概念與應(yīng)用

    人工智能相關(guān)各種技術(shù)的概念介紹,以及先進(jìn)的Edge AI(邊緣人工智能)的最新發(fā)展與相關(guān)應(yīng)用。 人工智能機(jī)器學(xué)習(xí)是現(xiàn)代科技的核心技術(shù)
    的頭像 發(fā)表于 01-25 17:37 ?928次閱讀
    <b class='flag-5'>人工智能</b>和<b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>以及Edge AI的概念與應(yīng)用

    人工智能對(duì)數(shù)據(jù)中心基礎(chǔ)設(shè)施帶來(lái)了哪些挑戰(zhàn)

    在加密貨幣和人工智能/機(jī)器學(xué)習(xí)(AI/ML)等新興應(yīng)用的驅(qū)動(dòng)下,數(shù)據(jù)中心的能耗巨大,并將快速增長(zhǎng)以滿(mǎn)足用戶(hù)需求。根據(jù)國(guó)際能源署(IEA)的最新報(bào)告,2022 年
    發(fā)表于 12-31 13:48 ?400次閱讀
    <b class='flag-5'>人工智能對(duì)數(shù)據(jù)中心</b>基礎(chǔ)設(shè)施帶來(lái)了哪些挑戰(zhàn)

    【「具身智能機(jī)器人系統(tǒng)」閱讀體驗(yàn)】+數(shù)據(jù)在具身人工智能中的價(jià)值

    嵌入式人工智能(EAI)將人工智能集成到機(jī)器人等物理實(shí)體中,使它們能夠感知、學(xué)習(xí)環(huán)境并與之動(dòng)態(tài)交互。這種能力使此類(lèi)機(jī)器人能夠在人類(lèi)社會(huì)中有效
    發(fā)表于 12-24 00:33

    人工智能工程師高頻面試題匯總——機(jī)器學(xué)習(xí)

    隨著人工智能技術(shù)的突飛猛進(jìn),AI工程師成為了眾多求職者夢(mèng)寐以求的職業(yè)。想要拿下這份工作,面試的時(shí)候得展示出你不僅技術(shù)過(guò)硬,還得能解決問(wèn)題。所以,提前準(zhǔn)備一些面試常問(wèn)的問(wèn)題,比如機(jī)器學(xué)習(xí)
    的頭像 發(fā)表于 12-04 17:00 ?1534次閱讀
    <b class='flag-5'>人工智能</b>工程師高頻面試題匯總——<b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>篇

    嵌入式和人工智能究竟是什么關(guān)系?

    、連接主義和深度學(xué)習(xí)等不同的階段。目前,人工智能已經(jīng)廣泛應(yīng)用于各種領(lǐng)域,如自然語(yǔ)言處理、計(jì)算機(jī)視覺(jué)、智能推薦等。 嵌入式系統(tǒng)和人工智能在許
    發(fā)表于 11-14 16:39

    人工智能對(duì)數(shù)據(jù)中心的挑戰(zhàn)

    在加密貨幣和人工智能/機(jī)器學(xué)習(xí)(AI/ML)等新興應(yīng)用的驅(qū)動(dòng)下,數(shù)據(jù)中心的能耗巨大,并將快速增長(zhǎng)以滿(mǎn)足用戶(hù)需求。根據(jù)國(guó)際能源署(IEA)的最新報(bào)告,2022 年
    的頭像 發(fā)表于 11-13 16:05 ?777次閱讀
    <b class='flag-5'>人工智能對(duì)數(shù)據(jù)中心</b>的挑戰(zhàn)

    具身智能機(jī)器學(xué)習(xí)的關(guān)系

    具身智能(Embodied Intelligence)和機(jī)器學(xué)習(xí)(Machine Learning)是人工智能領(lǐng)域的兩個(gè)重要概念,它們之間存
    的頭像 發(fā)表于 10-27 10:33 ?1047次閱讀

    人工智能、機(jī)器學(xué)習(xí)深度學(xué)習(xí)存在什么區(qū)別

    人工智能指的是在某種程度上顯示出類(lèi)似人類(lèi)智能的設(shè)備。AI有很多技術(shù),但其中一個(gè)很大的子集是機(jī)器學(xué)習(xí)——讓算法從
    發(fā)表于 10-24 17:22 ?2974次閱讀
    <b class='flag-5'>人工智能</b>、<b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>和<b class='flag-5'>深度</b><b class='flag-5'>學(xué)習(xí)</b>存在什么區(qū)別

    《AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》第二章AI for Science的技術(shù)支撐學(xué)習(xí)心得

    人工智能在科學(xué)研究中的核心技術(shù),包括機(jī)器學(xué)習(xí)、深度學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)等。這些技術(shù)構(gòu)成了AI for Science的基石,使得AI能夠處理和分析
    發(fā)表于 10-14 09:16

    《AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》第一章人工智能驅(qū)動(dòng)的科學(xué)創(chuàng)新學(xué)習(xí)心得

    人工智能:科學(xué)研究的加速器 第一章清晰地闡述了人工智能作為科學(xué)研究工具的強(qiáng)大功能。通過(guò)機(jī)器學(xué)習(xí)、深度學(xué)
    發(fā)表于 10-14 09:12

    Molex連接器助力構(gòu)建未來(lái)數(shù)據(jù)中心 充分發(fā)揮人工智能AI的力量

    隨著高性能計(jì)算,在人工智能(AI)和機(jī)器學(xué)習(xí)(ML)領(lǐng)域中不斷演進(jìn),各種應(yīng)用對(duì)復(fù)雜計(jì)算能力、海量存儲(chǔ)容量和無(wú)縫連接提出了前所未有的需求。電子組件之間實(shí)現(xiàn)更快速、更高效的通信,能夠促使專(zhuān)門(mén)構(gòu)建的生成式
    的頭像 發(fā)表于 08-29 11:57 ?2498次閱讀
    Molex連接器助力構(gòu)建未來(lái)<b class='flag-5'>數(shù)據(jù)中心</b> 充分發(fā)揮<b class='flag-5'>人工智能</b>AI的力量

    FPGA在人工智能中的應(yīng)用有哪些?

    定制化的硬件設(shè)計(jì),提高了硬件的靈活性和適應(yīng)性。 綜上所述,F(xiàn)PGA在人工智能領(lǐng)域的應(yīng)用前景廣闊,不僅可以用于深度學(xué)習(xí)的加速和云計(jì)算的加速,還可以針對(duì)特定應(yīng)用場(chǎng)景進(jìn)行定制化計(jì)算,為人工智能
    發(fā)表于 07-29 17:05

    深度學(xué)習(xí)模型有哪些應(yīng)用場(chǎng)景

    深度學(xué)習(xí)模型作為人工智能領(lǐng)域的重要分支,已經(jīng)在多個(gè)應(yīng)用場(chǎng)景中展現(xiàn)出其巨大的潛力和價(jià)值。這些應(yīng)用不僅改變了我們的日常生活,還推動(dòng)了科技進(jìn)步和產(chǎn)業(yè)升級(jí)。以下將詳細(xì)探討深度
    的頭像 發(fā)表于 07-16 18:25 ?4081次閱讀