一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

內(nèi)存速度存儲設計新的存儲接口技術(shù) NVMe非常適合機器學習

電子工程師 ? 來源:yxw ? 2019-05-13 11:19 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

各領域的業(yè)務都在將以AI為例的機器學習技術(shù)引入其流程中,以期為客戶帶來更好的產(chǎn)品,為股東創(chuàng)造更高的營收成果。然而,要有效部署AI,需要自定義的機器學習模型、大量的計算和數(shù)量不可預估的數(shù)據(jù)。處理PB級數(shù)據(jù),無論這數(shù)據(jù)是來自于最小的物聯(lián)網(wǎng)設備還是世界上最大的城市,這一任務對設計于兆字節(jié)和毫秒的時代的存儲技術(shù)來說都將是一大挑戰(zhàn)。

為機器學習提供所有的數(shù)據(jù),就需要為內(nèi)存速度存儲設計一項新的存儲接口技術(shù):NVM Express (NVMe)。NVMe與SATASAS不同,它消除了磁盤為中心協(xié)議的延遲誘導水平,而使用更快的通用處理器連接技術(shù)和PCI Express (PCIe)來減少延遲,為每個設備提供大量的帶寬能力。對于PB級別的專注和微秒的處理使得NVMe非常適合機器學習。

數(shù)據(jù)是AI傳遞途徑

機器學習的關(guān)鍵是數(shù)據(jù)。生成有意義的結(jié)果需要處理大量數(shù)據(jù),這就要求我們有經(jīng)過深思熟慮的數(shù)據(jù)工作流程。每個公司都有著不同的數(shù)據(jù)工作流程,以滿足其自身的業(yè)務需求,流程可大概分為以下階段:收集、準備、設計和訓練。這四個階段的數(shù)據(jù)工作流程輸出的通常是可以對邊緣或核心的新數(shù)據(jù)進行推斷的模型。由于需要大量的數(shù)據(jù),因此所有階段都需要通過其對數(shù)據(jù)流的優(yōu)化,避免出現(xiàn)瓶頸。NVMe接口的設計就是為了滿足此要求,可以通過以下四種方式為AI的傳遞途徑提供幫助:

更快捷、更經(jīng)濟實惠的數(shù)據(jù)收集

更快速的數(shù)據(jù)集準備周期

更短的模型設計周期轉(zhuǎn)變時間

更有硬件效率的模型訓練

NVMe用于更智能的數(shù)據(jù)收集

實現(xiàn)AI首先會面臨到的挑戰(zhàn)即是如何將原始數(shù)據(jù)收集到集中式數(shù)據(jù)存儲中。這些數(shù)據(jù)的種類幾乎是無限的:包括來自IOT設備的傳感器報告、網(wǎng)絡日志、制造質(zhì)量報告等。事實上,數(shù)據(jù)是由例如Apache Spark?之類的工具或商業(yè)服務對該任務進行處理,然后在新的數(shù)據(jù)流中進行篩選,最后將非結(jié)構(gòu)化數(shù)據(jù)輸出到NoSQL數(shù)據(jù)庫集群中。NVMe在提高其反應速度的同時,還能減少占用這些服務器的物理空間。

傳統(tǒng)的非結(jié)構(gòu)化查詢語言(NoSQL=Not Only SQL)集群由具有多個本地硬盤接口的服務器和SATA硬盤組成。硬盤確實為PB級的數(shù)據(jù)提供了經(jīng)濟實惠的存儲方法,但要實現(xiàn)更大的帶寬,需要通過幾十個SATA或SAS硬盤與服務器連接。此架構(gòu)明顯增加了單個服務器的大小,并且快速填充數(shù)據(jù)中心的機架,其中CPU服務器卻大多處于空閑的狀態(tài)。

單獨的NVMe接口即可為多種獨立的SATA或SAS接口提供所需的帶寬,且只需要一個附加卡或2.5寸硬盤。用更小的NVMe SSD替換單個NoSQL服務器的大硬盤陣列,可以縮小單個NoSQL節(jié)點并顯著減少整個機架的空間。

NVMe用于更智能數(shù)據(jù)準備

當今AI訓練的一個必要前提就是擁有TB級或PB級的數(shù)據(jù)。但通常該數(shù)據(jù)并不是隨時可用的格式。需要將數(shù)據(jù)轉(zhuǎn)化成更容易被AI傳遞途徑處理的格式,過濾掉異常值和虛假數(shù)據(jù)。對于部分不適合使用或不能合法使用的數(shù)據(jù),例如受到保護的個人信息,也可能需要在這一階段將其過濾掉。

這種處理需求可能會超過一個存儲系統(tǒng)的可受范圍,如果該存儲系統(tǒng)不是為高吞吐量而設計的話。與NVMe基于PCIe高達6.4GB/s或更高的帶寬相比,SAS和SATA的每個接口的有限帶寬顯得相對緩慢。同時在這一準備階段,帶寬不是存儲系統(tǒng)的唯一要求:并行性也是一大關(guān)鍵因素。由于處理的數(shù)據(jù)量非常大,因此,在這一處理階段,并行操作存在于集群中的多個服務器,以及在單個服務器中多個核心上。NVMe支持高達64K的命令隊列和64K的命令,簡化了這些服務器內(nèi)的并行操作。

NVMe用于更智能的模型設計

在將數(shù)據(jù)清理、準備成統(tǒng)一且容易理解的格式后,數(shù)據(jù)科學家的工作才正要開始。由于每個問題都是不同的,因此很多時候,科學家需要迭代地開發(fā)出獨特的機器學習結(jié)構(gòu)。只有在多次試驗和失敗后,較小的數(shù)據(jù)子集才能成為候選的可訓練模型,發(fā)送到下一個處理階段。畢竟在所有科學工程項目在得到最終解決方案前,都會經(jīng)歷過許多錯誤,因此需要進行多次的嘗試。

在試錯的過程中,單個循環(huán)的速度會對最后的模型設計和產(chǎn)生的機器學習模型的質(zhì)量造成外部影響。而將設計測試的循環(huán)時間從10個小時縮短到8個小時,會使數(shù)據(jù)科學家的效率翻倍。科學家可以在早上設計和運行測試,獲得結(jié)果,并及時調(diào)整參數(shù),而不是在早上開始工作,直到第二天才看到結(jié)果。以每天進行一個測試的效率來說,科學家在下午下班前就能開始另一項工作,每天能有兩個循環(huán)的效率。

就如之前的階段,NVMe帶寬和并行性發(fā)揮其作用,幫助提高數(shù)據(jù)科學家的效率。在科學家們的個人工作室,他們對模型進行沙盤推演的測試,利用NVMe的低延時性運行系統(tǒng)、測試數(shù)據(jù)集,并為分析和測試運行提供更快的暫存空間。

NVMe用于更智能的模型訓練

在數(shù)據(jù)工程師將數(shù)據(jù)格式化成為可用于機器學習的格式,同時數(shù)據(jù)科學家對學習模型的結(jié)構(gòu)進行設計后,網(wǎng)絡的實際訓練才正式開始。通過無數(shù)配備了加速器的機器將格式化后的數(shù)據(jù)提取出來,并用它來提煉模型的參數(shù),直到將數(shù)據(jù)匯聚成一個模型,才可用于實際的推理應用。

基于GPU的早期加速技術(shù)很少受到I/O的限制,因此存儲性能往往不是我們關(guān)注的焦點。運行服務器的通用CPU有充足的時間處理I/O操作,并為GPU準備下一批數(shù)據(jù)。但這在現(xiàn)今早已不適用了,其擁有FPGA,甚至實現(xiàn)了ASIC硬件定制以進行模式訓練。

相比以前的技術(shù),由于現(xiàn)代機器學習加速器可以更快地處理數(shù)量級的數(shù)據(jù),運行服務器的通用CPU需要能有效地處理I/O數(shù)量級的模式。像SATA和SAS這樣的傳統(tǒng)I/O棧浪費了寶貴的CPU周期,將I/O請求轉(zhuǎn)換為上世紀設計的協(xié)議。這樣就增加了I/O請求的延遲,會直接影響加速器的使用。這些遺留I/O棧也增加了主機CPU的負載,限制了每個處理器上可運行的加速器的數(shù)量。

由于從一開始就將NVMe設計成為內(nèi)存速度存儲協(xié)議,因此其不會產(chǎn)生協(xié)議轉(zhuǎn)換的成本。這就減少了處理器的負載,有助于保證及時將數(shù)據(jù)反饋到下一代加速器中。目前正在研究的NVMe協(xié)議具有一個激動人心的擴展—控制器內(nèi)存緩沖(CMB),允許NVMe設備在不受主機干預的情況下,得以直接處理內(nèi)存轉(zhuǎn)換并進一步減少負載。

NVMe-用于更智能的AI

機器學習和AI是建立在數(shù)據(jù)之上。從最初的數(shù)據(jù)收集、將其處理為可用的格式、開發(fā)學習架構(gòu)、到最后訓練的模型都需要一個在PB級規(guī)模上有效的存儲接口,并且針對微秒級延遲進行優(yōu)化。NVMe作為一項提升內(nèi)存速度的存儲技術(shù)能為機器學習和其它應用提供所需的存儲接口。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    88

    文章

    35065

    瀏覽量

    279319
  • 機器學習
    +關(guān)注

    關(guān)注

    66

    文章

    8501

    瀏覽量

    134562
  • nvme
    +關(guān)注

    關(guān)注

    0

    文章

    251

    瀏覽量

    23229
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    半導體存儲芯片核心解析

    性能和可靠性。當前絕對主流。 應用:固態(tài)硬盤、eMMC/UFS (手機/平板內(nèi)置存儲)、SD/TF卡、U盤、數(shù)據(jù)中心存儲。 關(guān)鍵指標:容量(GB/TB)、接口速度(SATA, PCI
    發(fā)表于 06-24 09:09

    NVMe協(xié)議研究掃盲

    的不斷完善,越來越多的系統(tǒng)和應用采用NVMe存儲接口的SSD,這種技術(shù)將成為未來存儲領域的主流。 NVM
    發(fā)表于 06-02 23:28

    高速緩沖存儲器是內(nèi)存還是外存,高速緩沖存儲器是為了解決什么

    高速緩沖存儲器(Cache)是內(nèi)存的一種特殊形式,但它與通常所說的主存儲器(RAM)有所不同。在計算機存儲體系中,Cache位于CPU和主存儲
    的頭像 發(fā)表于 01-29 11:48 ?1384次閱讀

    EMMC存儲技術(shù)的優(yōu)缺點

    EMMC存儲技術(shù)的優(yōu)點 1. 高性能 EMMC存儲技術(shù)以其高性能而聞名。它使用高速的串行接口,如HS400或HS200,能夠提供高達400M
    的頭像 發(fā)表于 12-25 09:23 ?2451次閱讀

    存儲技術(shù)未來演進:NVMe over Fabrics (NVMeoF)

    眾所周知,NVMe 是一個邏輯設備接口規(guī)范,NVM代表非易失性存儲器(Non-Volatile Memory)的首字母縮略字,是固態(tài)硬盤(SSD)的常見的閃存形式。SSD 通常分為兩類接口
    的頭像 發(fā)表于 11-16 10:44 ?1806次閱讀
    <b class='flag-5'>存儲</b><b class='flag-5'>技術(shù)</b>未來演進:<b class='flag-5'>NVMe</b> over Fabrics (NVMeoF)

    PCIe與NVMe存儲的關(guān)系

    在現(xiàn)代計算機系統(tǒng)中,存儲技術(shù)的發(fā)展對于提高整體性能至關(guān)重要。PCI Express(PCIe)和NVMe(Non-Volatile Memory Express)是兩種關(guān)鍵技術(shù),它們共
    的頭像 發(fā)表于 11-06 09:29 ?2306次閱讀

    一文詳解計算型存儲協(xié)議框架

    側(cè),稱為計算型存儲(Computational Storage),通過存儲側(cè)卸載數(shù)據(jù)預處理,如數(shù)據(jù)校驗、解壓、數(shù)據(jù)提取,甚至卸載局部機器學習訓練,從而減輕計算側(cè)的算力負載和
    的頭像 發(fā)表于 10-31 14:20 ?1095次閱讀
    一文詳解計算型<b class='flag-5'>存儲</b>協(xié)議框架

    內(nèi)存儲器的特點是速度快成本低容量小對嗎

    最低的。 1. 內(nèi)存儲器的分類 內(nèi)存儲器可以根據(jù)其存儲技術(shù)、速度、容量和用途進行分類。 1.1 按存儲
    的頭像 發(fā)表于 10-14 10:05 ?1598次閱讀

    內(nèi)存儲器由什么組成

    內(nèi)存儲器,通常稱為內(nèi)存或RAM(隨機存取存儲器),是計算機系統(tǒng)中用于存儲數(shù)據(jù)和程序的硬件組件。它是計算機運行時的主要工作區(qū)域,因為CPU(中央處理單元)直接從
    的頭像 發(fā)表于 10-14 09:58 ?1604次閱讀

    內(nèi)存儲器主要用來存儲什么

    內(nèi)存儲器(內(nèi)部存儲器)是計算機硬件的重要組成部分,它直接與中央處理器(CPU)相連,用于存儲正在運行的程序和當前處理的數(shù)據(jù)。內(nèi)存儲器的容量、速度
    的頭像 發(fā)表于 10-14 09:55 ?2471次閱讀

    內(nèi)存儲器分為隨機存儲器和什么

    內(nèi)存儲器是計算機系統(tǒng)中用于臨時存儲數(shù)據(jù)和程序的關(guān)鍵部件,它直接影響到計算機的運行速度和性能。內(nèi)存儲器主要分為兩大類:隨機存儲器(RAM,Ra
    的頭像 發(fā)表于 10-14 09:54 ?2875次閱讀

    Synology如何使用Nvme固態(tài)做存儲空間

    Synology 如何使用Nvme固態(tài)做存儲空間
    發(fā)表于 10-09 10:55 ?0次下載

    國產(chǎn)NVMe SSD擴展卡:驅(qū)動存儲新紀元

    NVMe技術(shù)的標準化接口使得不同廠商的設備能夠更好地兼容和互操作,提升了存儲系統(tǒng)的靈活性和擴展性。
    的頭像 發(fā)表于 08-17 14:59 ?1757次閱讀
    國產(chǎn)<b class='flag-5'>NVMe</b> SSD擴展卡:驅(qū)動<b class='flag-5'>存儲</b>新紀元

    防水和防振動功能2.5 英寸SAS/SATA硬盤抽取盒 非常適合車載數(shù)據(jù)存儲

    首創(chuàng)的防水和防振動功能 2.5 英寸 SAS/SATA 硬盤抽取盒 – 非常適合車載數(shù)據(jù)存儲
    的頭像 發(fā)表于 08-12 19:16 ?655次閱讀
    防水和防振動功能2.5 英寸SAS/SATA硬盤抽取盒 <b class='flag-5'>非常</b><b class='flag-5'>適合</b>車載數(shù)據(jù)<b class='flag-5'>存儲</b>

    手機主流存儲eMMC、UFS與NVMe的區(qū)別

    近幾年,手機影像不斷發(fā)展,照片+視頻占據(jù)大量存儲空間,在愈發(fā)膨脹的微信、手游以及各種APP面前,存儲空間愈發(fā)不夠。該存儲空間即是手機存儲容量(ROM),市面上常見的手機快閃記憶體標準共
    的頭像 發(fā)表于 07-16 16:42 ?4111次閱讀
    手機主流<b class='flag-5'>存儲</b>eMMC、UFS與<b class='flag-5'>NVMe</b>的區(qū)別