一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

異構(gòu)計算助拳,緩解參數(shù)服務(wù)器瓶頸

英特爾中國 ? 來源:英特爾中國 ? 作者:英特爾中國 ? 2022-07-10 10:53 ? 次閱讀

昨晚睡得好嗎?睡不好可以刷快手的《11 點睡吧》。這部當(dāng)代人睡眠困境的微綜藝,總曝光量達(dá)到 107 億,不但科普睡眠知識,更深度探討都市人的喜怒哀樂[1]。驚人的曝光量背后,是快手對用戶畫像數(shù)據(jù)的精準(zhǔn)分析,離不開強大技術(shù)支持下的推薦系統(tǒng),得以讓優(yōu)質(zhì)的內(nèi)容被更多喜歡它的人看到。

作為超 3 億日活、日均千萬級短視頻上傳、強調(diào)社區(qū)普惠的短視頻 APP,快手推薦系統(tǒng)在大規(guī)模復(fù)雜業(yè)務(wù)中面臨著巨大性能挑戰(zhàn)。想要化解算力瓶頸,異構(gòu)計算是一個重要選項,這種使用不同類型指令集和體系架構(gòu)的計算單元組成系統(tǒng)的計算方式,能夠針對不同任務(wù)選擇最優(yōu)的計算架構(gòu),從而充分揮各種計算機(jī)構(gòu)的優(yōu)勢,協(xié)同完成復(fù)雜的工作任務(wù)。

1

異構(gòu)計算助拳,緩解參數(shù)服務(wù)器瓶頸

快手作為短視頻內(nèi)容平臺,內(nèi)容生產(chǎn)、內(nèi)容理解、內(nèi)容分發(fā)、內(nèi)容消費、用戶互動這些環(huán)節(jié),構(gòu)成了大規(guī)模的復(fù)雜業(yè)務(wù),對算力產(chǎn)生更多元的需求。舉例來說:在推薦業(yè)務(wù)場景中,需要根據(jù)用戶畫像推薦感興趣的內(nèi)容,就要從海量信息中選擇與用戶特征相關(guān)的結(jié)果,再通過“排序”來劃分內(nèi)容的優(yōu)先級別。在這一過程中,參數(shù)服務(wù)器的作用非常重要,它負(fù)責(zé)存儲、處理海量數(shù)據(jù)特征以及排序模型參數(shù),保證任務(wù)高效、準(zhǔn)確地完成。

8a99da9c-fea9-11ec-ba43-dac502259ad0.png

快手推薦系統(tǒng)采用計算與存儲分離的架構(gòu)模式

快手的推薦系統(tǒng)為了應(yīng)對海量數(shù)據(jù)沖擊,在架構(gòu)上分離了計算與存儲。參數(shù)服務(wù)器屬于存儲型服務(wù),該服務(wù)要保存和實時更新上億規(guī)模的用戶畫像、數(shù)十億規(guī)模的短視頻特征、以及千億規(guī)模的排序模型參數(shù)。受限于容量和帶寬的參數(shù)服務(wù)器,還要支撐每秒數(shù)億次的 KV 請求,耗費大量 CPU 資源。

要解決此類瓶頸,最佳方案是使用不同計算設(shè)備處理不同負(fù)載??焓值腖aoFe NDP 近數(shù)據(jù)架構(gòu),在計算體系結(jié)構(gòu)上實現(xiàn)創(chuàng)新,使用英特爾 至強可擴(kuò)展處理器、英特爾Agilex FPGA和英特爾傲騰 持久內(nèi)存,借助軟硬一體化、領(lǐng)域?qū)S眉铀倨髟O(shè)計,從而做到網(wǎng)絡(luò)、存儲、計算三重加速,為各個業(yè)務(wù)系統(tǒng)提供低延遲、高并發(fā)、高吞吐、低總體擁有成本的基礎(chǔ)資源。

8ab88ca8-fea9-11ec-ba43-dac502259ad0.png

快手LaoFe NDP異構(gòu)計算架構(gòu)

2

持久內(nèi)存+FGPA 專用硬件,

確保三重加速創(chuàng)新

在網(wǎng)絡(luò)層面,LaoFe NDP 架構(gòu)將 CPU的網(wǎng)絡(luò)數(shù)據(jù)處理轉(zhuǎn)移到英特爾 Stratix 10 FPGA 上,同時基于該 FPGA 實現(xiàn)了“軟件定義遠(yuǎn)程直接內(nèi)存訪問”協(xié)議(SD-RDMA),大幅降低了請求延時。

在存儲層面,該架構(gòu)打造了支持 SSD、英特爾 傲騰 持久內(nèi)存、以及 DRAM 的 Key-Value 存儲引擎,將 CPU 層面的存儲操作也轉(zhuǎn)移到 FPGA 中,最大程度發(fā)揮 FPGA 的能力,相比 CPU 方案,將存儲引擎的吞吐能力提升 5 倍以上。該引擎還利用英特爾 傲騰 持久內(nèi)存的特性,讓基于異構(gòu)存儲的索引系統(tǒng)幾乎達(dá)到純 DRAM 相同的性能指標(biāo),成本降低 30%。同時相比之前小時級的故障恢復(fù)速度,異構(gòu)存儲的索引系統(tǒng)只需幾分鐘就能重新上線。

LaoFe NDP 的計算加速仰仗 FPGA 作為領(lǐng)域?qū)S锰幚恚梢愿行У夭⑿刑幚頂?shù)據(jù),提供更高效的內(nèi)存層次結(jié)構(gòu)與定制化的執(zhí)行單元,從而支持機(jī)器學(xué)習(xí)深度學(xué)習(xí)和大數(shù)據(jù)等場景。英特爾 FPGA 具備富于彈性的可編程硬件能力,延時低且可精確控制,單位算力功耗低、片上內(nèi)存大,適合于快手延時要求高、批處理比較小、并發(fā)性和重復(fù)性強的應(yīng)用場景。

8ac6f964-fea9-11ec-ba43-dac502259ad0.png

快手LaoFe NDP 架構(gòu)在英特爾軟硬件優(yōu)化下,最終實現(xiàn)了如下優(yōu)勢:

■系統(tǒng)吞吐顯著提升,延時顯著降低:參數(shù)服務(wù)器的吞吐性能提升了 5-6 倍,整體請求延時降低了 70%-80%,提供更好的用戶體驗。

■更好地控制 TCO:FPGA 的強大性能提供遠(yuǎn)超傳統(tǒng)方案的吞吐能力,僅需部署少量的服務(wù)器就能滿足特性的性能指標(biāo)要求,替代比可達(dá)到1:5,有效降低 TCO。

■降低性能抖動:基于CPU的軟件方案常因需要進(jìn)行高頻率更新而出現(xiàn)性能抖動,而通過FPGA來處理負(fù)載,能大幅減少性能抖動。

通過快手的實踐能夠看出,以異構(gòu)計算加速不同負(fù)載,能夠顯著提升在推薦等場景下的系統(tǒng)吞吐與延時表現(xiàn)。未來,英特爾還會和快手等合作伙伴一起,推進(jìn)面向未來數(shù)據(jù)中心的異構(gòu)參考架構(gòu),通過 CPU、IPU、XPU 的產(chǎn)品組合以及軟件堆棧,以及智能網(wǎng)絡(luò)結(jié)構(gòu),提供跨越整個數(shù)據(jù)管道的解決方案,高效挖掘海量數(shù)據(jù)中的智慧,讓用戶與用戶、用戶與內(nèi)容、用戶與商品可及時按需建立高效、有溫度的連接互動。

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 英特爾
    +關(guān)注

    關(guān)注

    61

    文章

    10141

    瀏覽量

    173604
  • 服務(wù)器
    +關(guān)注

    關(guān)注

    12

    文章

    9596

    瀏覽量

    86986
  • 異構(gòu)計算
    +關(guān)注

    關(guān)注

    2

    文章

    105

    瀏覽量

    16526

原文標(biāo)題:英特爾助力快手實現(xiàn)異構(gòu)計算加速,顯著提升性能,降低系統(tǒng)TCO

文章出處:【微信號:英特爾中國,微信公眾號:英特爾中國】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    邊緣計算服務(wù)器

    邊緣計算服務(wù)器是支撐邊緣計算模式落地的核心硬件設(shè)備,其定義及特性可歸納如下: 一、定義 邊緣計算服務(wù)器指部署在網(wǎng)絡(luò)邊緣側(cè)的專用
    的頭像 發(fā)表于 04-29 07:46 ?74次閱讀

    SoC集群服務(wù)器 與 ARM架構(gòu)陣列服務(wù)器 關(guān)系

    一、定義與定位 SoC集群服務(wù)器? 以系統(tǒng)級芯片(SoC)為核心算力單元,通過高速網(wǎng)絡(luò)將多節(jié)點互聯(lián)形成的分布式計算集群。每個SoC芯片集成CPU、GPU、NPU等多種處理單元,并支持多核異構(gòu)計算
    的頭像 發(fā)表于 04-24 07:49 ?100次閱讀
    SoC集群<b class='flag-5'>服務(wù)器</b> 與 ARM架構(gòu)陣列<b class='flag-5'>服務(wù)器</b> 關(guān)系

    RAKsmart智能算力架構(gòu):異構(gòu)計算+低時延網(wǎng)絡(luò)驅(qū)動企業(yè)AI訓(xùn)練范式升級

    在AI大模型參數(shù)量突破萬億、多模態(tài)應(yīng)用爆發(fā)的今天,企業(yè)AI訓(xùn)練正面臨算力效率與成本的雙重挑戰(zhàn)。RAKsmart推出的智能算力架構(gòu),以異構(gòu)計算資源池化與超低時延網(wǎng)絡(luò)為核心,重構(gòu)AI訓(xùn)練基礎(chǔ)設(shè)施,助力企業(yè)實現(xiàn)訓(xùn)練速度提升、硬件成本下降與算法迭代加速的三重突破。
    的頭像 發(fā)表于 04-17 09:29 ?164次閱讀

    DeepSeek企業(yè)級部署服務(wù)器資源計算 以raksmart裸機(jī)云服務(wù)器為例

    以RakSmart裸機(jī)云服務(wù)器為例,針對DeepSeek企業(yè)級部署的服務(wù)器資源計算指南,涵蓋GPU/CPU/內(nèi)存/存儲/網(wǎng)絡(luò)等核心維度的詳細(xì)計算方法與配置推薦,主機(jī)推薦小編為您整理發(fā)布
    的頭像 發(fā)表于 03-21 10:17 ?224次閱讀

    異構(gòu)計算的概念、核心、優(yōu)勢、挑戰(zhàn)及考慮因素

    異構(gòu)計算就像是一支由“多才多藝”處理組成的團(tuán)隊,每個成員都有自己的強項和責(zé)任。 ? 什么是異構(gòu)計算????? “異構(gòu)計算”指的是在同一個計算
    的頭像 發(fā)表于 01-13 11:43 ?742次閱讀

    【一文看懂】什么是異構(gòu)計算

    隨著人工智能、深度學(xué)習(xí)、大數(shù)據(jù)處理等技術(shù)的快速發(fā)展,計算需求的復(fù)雜性不斷提升。傳統(tǒng)的單一計算架構(gòu)已難以滿足高效處理復(fù)雜任務(wù)的要求,異構(gòu)計算因此應(yīng)運而生,成為現(xiàn)代計算領(lǐng)域的一個重要方向。
    的頭像 發(fā)表于 12-04 01:06 ?2311次閱讀
    【一文看懂】什么是<b class='flag-5'>異構(gòu)計算</b>?

    最強服務(wù)器CPU來了!AI性能直接翻倍

    以及AI服務(wù)器及AI數(shù)據(jù)中心場景的CPU產(chǎn)品。它不僅能支持廣泛的第三方GPU及AI加速,與它們組合形成強大的異構(gòu)計算平臺,還能在其中補足GPU或?qū)S眉铀?b class='flag-5'>器覆蓋不到或不足的地方,為更多
    的頭像 發(fā)表于 09-29 11:00 ?872次閱讀
    最強<b class='flag-5'>服務(wù)器</b>CPU來了!AI性能直接翻倍

    什么是云服務(wù)器

    服務(wù)器(Cloud Server),又稱云主機(jī)或彈性計算服務(wù)(Elastic Compute Service, ECS),是基于云計算技術(shù)提供的一種虛擬化
    的頭像 發(fā)表于 09-27 09:34 ?580次閱讀

    什么是AI服務(wù)器?AI服務(wù)器的優(yōu)勢是什么?

    AI服務(wù)器是一種專門為人工智能應(yīng)用設(shè)計的服務(wù)器,它采用異構(gòu)形式的硬件架構(gòu),通常搭載GPU、FPGA、ASIC等加速芯片,利用CPU與加速芯片的組合來滿足高吞吐量互聯(lián)的需求,為自然語言處理、計算
    的頭像 發(fā)表于 09-21 11:43 ?1646次閱讀

    智能邊緣服務(wù)器 --開啟計算新時代

    一、智能邊緣服務(wù)器概念 云尚通信技術(shù)(深圳)有限公司 智能邊緣服務(wù)器是一種新型的計算設(shè)備,它被部署在網(wǎng)絡(luò)邊緣,靠近數(shù)據(jù)源和終端用戶。與傳統(tǒng)服務(wù)器相比,其獨特之處在于能夠更快速地處理和響
    的頭像 發(fā)表于 08-13 11:01 ?534次閱讀
    智能邊緣<b class='flag-5'>服務(wù)器</b> --開啟<b class='flag-5'>計算</b>新時代

    AI云服務(wù)器:開啟智能計算新時代

    一、AI云服務(wù)器的定義與特點 AI云服務(wù)器的定義 AI云服務(wù)器是一種基于云計算技術(shù),專為處理人工智能相關(guān)工作負(fù)載而構(gòu)建的服務(wù)器。它集成了強大
    的頭像 發(fā)表于 08-09 16:08 ?1426次閱讀

    打造異構(gòu)計算新標(biāo)桿!國數(shù)集聯(lián)發(fā)布首款CXL混合資源池參考設(shè)計

    參考設(shè)計是首個支持異構(gòu)計算架構(gòu)的CXL硬件設(shè)備,標(biāo)志著CXL技術(shù)在數(shù)據(jù)中心領(lǐng)域迎來異構(gòu)計算新階段。 ? 國數(shù)集聯(lián)基于FPGA與自主研發(fā)的CXL協(xié)議IP的先進(jìn)特性,可實現(xiàn)CPU、GPU、DDR、SSD
    的頭像 發(fā)表于 08-06 14:19 ?512次閱讀
    打造<b class='flag-5'>異構(gòu)計算</b>新標(biāo)桿!國數(shù)集聯(lián)發(fā)布首款CXL混合資源池參考設(shè)計

    AvaotaA1全志T527開發(fā)板AMP異構(gòu)計算簡介

    Avaota SBC 的部分平臺內(nèi)具有小核心 CPU,與大核心一起組成了異構(gòu)計算的功能。 在異構(gòu)多處理系統(tǒng)中,主核心和輔助核心的存在旨在共同協(xié)作,以實現(xiàn)更高效的任務(wù)處理。這種協(xié)作需要系統(tǒng)采取一系列
    發(fā)表于 07-24 09:54

    異構(gòu)計算:解鎖算力潛能的新途徑

    在這個數(shù)據(jù)爆炸的時代,計算力是推動社會與科技創(chuàng)新的核心。從日常智能設(shè)備的流暢運行到超級計算機(jī)的尖端模擬,均依賴強大的計算能力。但面對多樣化的復(fù)雜計算任務(wù),單一處理
    的頭像 發(fā)表于 07-18 08:28 ?1.5w次閱讀
    <b class='flag-5'>異構(gòu)計算</b>:解鎖算力潛能的新途徑

    服務(wù)器和虛擬服務(wù)器的區(qū)別是什么

    。 定義 云服務(wù)器(Cloud Server)是一種基于云計算技術(shù)的虛擬服務(wù)器,它通過虛擬化技術(shù)將物理服務(wù)器的資源分割成多個獨立的虛擬服務(wù)器
    的頭像 發(fā)表于 07-02 09:48 ?1256次閱讀