一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

新型系統(tǒng)可以自動“學(xué)習(xí)”如何在數(shù)千臺服務(wù)器上調(diào)度數(shù)據(jù)處理操作

倩倩 ? 來源:綠色消費網(wǎng) ? 2020-04-26 14:56 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

麻省理工學(xué)院的研究人員開發(fā)的新型系統(tǒng)可以自動“學(xué)習(xí)”如何在數(shù)千臺服務(wù)器上調(diào)度數(shù)據(jù)處理操作,而這通常是由不精確的人工設(shè)計算法完成的任務(wù)。這樣做可以幫助當(dāng)今耗電的數(shù)據(jù)中心更加高效地運行。

數(shù)據(jù)中心可以包含數(shù)以萬計的服務(wù)器,這些服務(wù)器不斷運行來自開發(fā)人員和用戶的數(shù)據(jù)處理任務(wù)。群集調(diào)度算法可實時跨服務(wù)器分配傳入任務(wù),以有效利用所有可用的計算資源并快速完成工作。

但是,傳統(tǒng)上,人們會根據(jù)一些基本準(zhǔn)則(“策略”)和各種折衷來微調(diào)那些調(diào)度算法。例如,他們可以對算法進行編碼,以快速完成某些作業(yè),或者在作業(yè)之間平均分配資源。但是工作負(fù)載(意味著組合任務(wù)的組)各種各樣。因此,人類幾乎不可能針對特定的工作負(fù)載優(yōu)化其調(diào)度算法,因此,他們常常無法發(fā)揮其真正的效率潛力。

麻省理工學(xué)院的研究人員將所有手動編碼轉(zhuǎn)移到了機器上。在SIGCOMM上發(fā)表的一篇論文中,他們描述了一種利用“強化學(xué)習(xí)”(RL)(一種反復(fù)試驗的機器學(xué)習(xí)技術(shù))來針對特定服務(wù)器群集中特定工作負(fù)載量身定制調(diào)度決策的系統(tǒng)。

為此,他們建立了新穎的RL技術(shù),可以對復(fù)雜的工作量進行訓(xùn)練。在培訓(xùn)中,系統(tǒng)嘗試了多種可能的方式來跨服務(wù)器分配傳入的工作負(fù)載,最終在利用計算資源和快速處理速度方面找到了最佳折衷方案。除了“減少工作完成時間”這樣的簡單指令,不需要人工干預(yù)。

與最佳的手寫調(diào)度算法相比,研究人員的系統(tǒng)完成工作的速度提高了大約20%到30%,而在交通繁忙時則完成速度提高了一倍。但是,大多數(shù)情況下,系統(tǒng)會學(xué)習(xí)如何有效壓縮工作負(fù)載而幾乎沒有浪費。結(jié)果表明,該系統(tǒng)可以使數(shù)據(jù)中心使用更少的資源,以更高的速度處理相同的工作負(fù)載。

電氣工程和計算機科學(xué)系的博士生Hongzi Mao說:“如果您有使用機器進行反復(fù)試驗的方法,他們可以嘗試以不同的方式安排作業(yè),并自動找出哪種策略比其他方法更好。” (EECS)?!斑@可以自動提高系統(tǒng)性能。利用率的任何微小提高,即使提高1%,都可以節(jié)省數(shù)百萬美元,并為數(shù)據(jù)中心節(jié)省大量能源。”

EECS教授和計算機科學(xué)與人工智能實驗室(CSAIL)的研究員穆罕默德·阿里扎德(Mohammad Alizadeh)補充說:“制定調(diào)度決策沒有萬能的選擇?!?“在現(xiàn)有系統(tǒng)中,這些是您必須預(yù)先決定的硬編碼參數(shù)。相反,我們的系統(tǒng)將根據(jù)數(shù)據(jù)中心和工作負(fù)載學(xué)習(xí)調(diào)整其調(diào)度策略特征。”

通常,數(shù)據(jù)處理作業(yè)進入數(shù)據(jù)中心,以“節(jié)點”和“邊緣”的圖形表示。每個節(jié)點代表一些需要完成的計算任務(wù),其中節(jié)點越大,所需的計算能力越強。連接節(jié)點的邊緣將連接的任務(wù)鏈接在一起。調(diào)度算法根據(jù)各種策略將節(jié)點分配給服務(wù)器。

但是傳統(tǒng)的RL系統(tǒng)并不習(xí)慣于處理這樣的動態(tài)圖。這些系統(tǒng)使用軟件“代理”進行決策并接收反饋信號作為獎勵。從本質(zhì)上講,它會嘗試在給定的上下文中學(xué)習(xí)任何理想行為,從而最大化其對任何給定動作的回報。例如,它們可以幫助機器人學(xué)習(xí)如何執(zhí)行與通過與環(huán)境交互來拾取物體等任務(wù),但這涉及通過更容易設(shè)置的像素網(wǎng)格處理視頻或圖像。

為了構(gòu)建他們的基于RL的調(diào)度程序Decima,研究人員必須開發(fā)一種模型,該模型可以處理圖形結(jié)構(gòu)的作業(yè),并可以擴展到大量作業(yè)和服務(wù)器。他們系統(tǒng)的“代理”是一種調(diào)度算法,該算法利用了圖神經(jīng)網(wǎng)絡(luò),通常用于處理圖結(jié)構(gòu)數(shù)據(jù)。為了提出適合計劃的圖神經(jīng)網(wǎng)絡(luò),他們實現(xiàn)了一個自定義組件,該組件聚集了跨圖路徑的信息-例如快速估計完成圖的給定部分需要多少計算。這對于作業(yè)調(diào)度很重要,因為“子”(下)節(jié)點要等到其“父”(上)節(jié)點完成后才能開始執(zhí)行,因此,預(yù)測圖表中沿不同路徑的未來工作對于制定良好的調(diào)度決策至關(guān)重要。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 算法
    +關(guān)注

    關(guān)注

    23

    文章

    4710

    瀏覽量

    95387
  • 服務(wù)器
    +關(guān)注

    關(guān)注

    13

    文章

    9795

    瀏覽量

    87986
  • 數(shù)據(jù)中心
    +關(guān)注

    關(guān)注

    16

    文章

    5230

    瀏覽量

    73520
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    服務(wù)器數(shù)據(jù)恢復(fù)—ocfs2文件系統(tǒng)被格式化為Ext4文件系統(tǒng)數(shù)據(jù)恢復(fù)案例

    服務(wù)器存儲數(shù)據(jù)恢復(fù)環(huán)境&故障: 人為誤操作將Ext4文件系統(tǒng)誤裝入一臺服務(wù)器存儲上的Ocfs2文件系統(tǒng)
    的頭像 發(fā)表于 06-10 12:03 ?212次閱讀
    <b class='flag-5'>服務(wù)器</b><b class='flag-5'>數(shù)據(jù)</b>恢復(fù)—ocfs2文件<b class='flag-5'>系統(tǒng)</b>被格式化為Ext4文件<b class='flag-5'>系統(tǒng)</b>的<b class='flag-5'>數(shù)據(jù)</b>恢復(fù)案例

    無人職守自動安裝部署操作系統(tǒng)指南

    當(dāng)組織有服務(wù)器需要部署linux系統(tǒng)時,需要通過網(wǎng)絡(luò)方式安裝并結(jié)合自動應(yīng)答文件,實現(xiàn)無人職守自動安裝部署操作系統(tǒng)。這種方式需要我們至少配置一
    的頭像 發(fā)表于 05-22 13:38 ?364次閱讀
    無人職守<b class='flag-5'>自動</b>安裝部署<b class='flag-5'>操作系統(tǒng)</b>指南

    服務(wù)器數(shù)據(jù)恢復(fù)—Linux系統(tǒng)服務(wù)器崩潰的數(shù)據(jù)恢復(fù)案例

    服務(wù)器數(shù)據(jù)恢復(fù)環(huán)境: linux操作系統(tǒng)服務(wù)器中有一組由4塊SAS接口硬盤組建的raid5陣列。 服務(wù)器故障:
    的頭像 發(fā)表于 05-20 15:46 ?199次閱讀

    服務(wù)器數(shù)據(jù)恢復(fù)—Zfs文件系統(tǒng)服務(wù)器數(shù)據(jù)恢復(fù)案例

    服務(wù)器數(shù)據(jù)恢復(fù)環(huán)境&故障: 一zfs文件系統(tǒng)服務(wù)器,管理員誤操作刪除了
    的頭像 發(fā)表于 01-16 17:27 ?386次閱讀

    cmp在數(shù)據(jù)處理中的應(yīng)用 如何優(yōu)化cmp性能

    ,然后在多個處理器上并行處理,顯著提高了數(shù)據(jù)處理的速度和吞吐量。 1. CMP在大數(shù)據(jù)處理中的應(yīng)用 在大數(shù)據(jù)處理中,CMP技術(shù)
    的頭像 發(fā)表于 12-17 09:27 ?1164次閱讀

    FPGA在數(shù)據(jù)處理中的應(yīng)用實例

    廣泛應(yīng)用于以太網(wǎng)、USB、PCI Express、SATA、HDMI等通信協(xié)議的處理。它們通過高速串行接口實現(xiàn)數(shù)據(jù)傳輸,并利用硬件加速技術(shù)進行協(xié)議解析和數(shù)據(jù)處理,從而提高系統(tǒng)性能。例如
    的頭像 發(fā)表于 10-25 09:21 ?1384次閱讀

    Kubernetes集群搭建容器云需要幾臺服務(wù)器?

    Kubernetes集群搭建容器云需要幾臺服務(wù)器?至少需要4臺服務(wù)器。搭建容器云所需的服務(wù)器數(shù)量以及具體的搭建步驟,會根據(jù)所選用的技術(shù)棧、業(yè)務(wù)規(guī)模、架構(gòu)設(shè)計以及安全需求等因素而有所不同。以下是一個基于Kubernetes集群的容
    的頭像 發(fā)表于 10-21 10:06 ?445次閱讀

    服務(wù)器數(shù)據(jù)恢復(fù)—SAN環(huán)境下LUN映射錯誤導(dǎo)致寫操作互斥失敗的數(shù)據(jù)恢復(fù)案例

    服務(wù)器數(shù)據(jù)恢復(fù)環(huán)境: SAN環(huán)境下一存儲設(shè)備中有一組由6塊硬盤組建的RAID6磁盤陣列,劃分若干LUN,MAP到不同業(yè)務(wù)的SOLARIS操作系統(tǒng)
    的頭像 發(fā)表于 09-26 16:31 ?485次閱讀

    多個網(wǎng)站放在同一臺服務(wù)器ip有什么影響?

    將多個網(wǎng)站放在同一臺服務(wù)器上,使用同一個IP地址,可能會有以下影響: 1、資源共享:多個網(wǎng)站共享同一臺服務(wù)器的資源,如CPU、內(nèi)存、存儲空間和帶寬。如果其中一個網(wǎng)站流量或資源消耗突然增加,可能會
    的頭像 發(fā)表于 09-12 11:15 ?1316次閱讀

    服務(wù)器數(shù)據(jù)恢復(fù)—意外斷電導(dǎo)致虛擬機虛擬磁盤損壞的數(shù)據(jù)恢復(fù)案例

    服務(wù)器數(shù)據(jù)恢復(fù)環(huán)境: 一臺服務(wù)器中有一組由4塊STAT硬盤通過RAID卡組建的RAID10陣列,上層是XenServer虛擬化平臺,虛擬機安裝Windows Server操作系統(tǒng),作
    的頭像 發(fā)表于 09-10 17:25 ?744次閱讀
    <b class='flag-5'>服務(wù)器</b><b class='flag-5'>數(shù)據(jù)</b>恢復(fù)—意外斷電導(dǎo)致虛擬機虛擬磁盤損壞的<b class='flag-5'>數(shù)據(jù)</b>恢復(fù)案例

    服務(wù)器數(shù)據(jù)恢復(fù)—不當(dāng)操作導(dǎo)致raid5陣列數(shù)據(jù)無法恢復(fù)的案例

    服務(wù)器數(shù)據(jù)恢復(fù)環(huán)境: 一臺服務(wù)器中有一組由4塊SCSI硬盤組建的raid5磁盤陣列,劃分了一個邏輯卷,操作系統(tǒng)為WINDOWS SERVER,作為SQL SERVER
    的頭像 發(fā)表于 08-28 13:39 ?603次閱讀

    服務(wù)器數(shù)據(jù)恢復(fù)—xfs文件系統(tǒng)服務(wù)器數(shù)據(jù)恢復(fù)案例

    某公司一臺服務(wù)器,連接了一存儲。該服務(wù)器安裝linux操作系統(tǒng),文件系統(tǒng)為xfs。 在運行過程中該
    的頭像 發(fā)表于 08-19 10:49 ?600次閱讀

    主機托管是多個用戶共享一臺服務(wù)器嗎?有什么優(yōu)勢

    主機托管并不是多個用戶共享一臺服務(wù)器。主機托管是一種服務(wù),客戶可以將自己的硬件服務(wù)器托管給服務(wù)商,并享受專業(yè)的
    的頭像 發(fā)表于 08-13 14:45 ?540次閱讀

    何在服務(wù)器上調(diào)試本地FPGA板卡

    該板卡,直接使用Recent Targets,之前的配置應(yīng)該保存在列表中。如下圖所示。 如下圖所示連接后,即可正常使用 Vivado。FPGA 器件可以使用 ILA 內(nèi)核進行編程和調(diào)試,就像在本地PC上操作一樣,同時獲得更強大的
    發(fā)表于 07-31 17:36

    服務(wù)器數(shù)據(jù)恢復(fù)—搬遷導(dǎo)致服務(wù)器無法識別raid的數(shù)據(jù)恢復(fù)案例

    某單位機房搬遷,將所有服務(wù)器和存儲搬遷到新機房并重新連接線路,啟動所有機器發(fā)現(xiàn)其中有一臺服務(wù)器無法識別RAID,提示未做初始化操作。 發(fā)生故障的這臺服務(wù)器安裝LINUX
    的頭像 發(fā)表于 07-25 16:34 ?821次閱讀