一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

大促高并發(fā)系統(tǒng)性能優(yōu)化實(shí)戰(zhàn)--京東聯(lián)盟廣告推薦系統(tǒng)

京東云 ? 來源:jf_75140285 ? 作者:jf_75140285 ? 2024-08-14 10:41 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

當(dāng)一個推薦系統(tǒng)面臨高頻、瞬時、大幅的流量突變時,如何在維持穩(wěn)定性的同時,最小化推薦效果損失?

?

背景

618對京東來說是一場重要的營銷盛會,大促將為業(yè)務(wù)各個層面帶來爆發(fā)式增長。然而,超大規(guī)模的流量洪峰也對京東各系統(tǒng)提出了嚴(yán)峻考驗(yàn)。

京東聯(lián)盟是京東的聯(lián)盟營銷平臺,主要通過投放站外CPS廣告來推廣京東商品。聯(lián)盟合作伙伴生成鏈接并在其他網(wǎng)站或社交媒體平臺上推廣,用戶通過點(diǎn)擊這些鏈接在京東購物,合作伙伴則獲得銷售提成(傭金)。京東聯(lián)盟通過這種方式吸引流量,擴(kuò)大平臺的可見度和用戶接觸范圍,實(shí)現(xiàn)拉新促活等目標(biāo)。作為聯(lián)盟業(yè)務(wù)流量的主戰(zhàn)場,京東聯(lián)盟推薦系統(tǒng)在大促期間面臨著流量突變的巨大挑戰(zhàn)。由于業(yè)務(wù)本身及營銷活動和站外媒體引流推動的影響,大促期間推薦系統(tǒng)的流量呈現(xiàn)以下特點(diǎn):

1.營銷活動繁多且頻率不一:系統(tǒng)流量波動頻繁,難以預(yù)測。

2.營銷力度及效果差異顯著:冰點(diǎn)與爆點(diǎn)流量同時存在,流量分布極不均衡。

3.站外場景眾多:目前已達(dá)數(shù)百個,不同場景流量的變化節(jié)奏各不相同。

4.紅包活動具有秒殺特性:流量在急速拉升后斷崖式下跌。例如,某次活動中,流量表現(xiàn)如下:

wKgZoma8GU-AH_pqAACZPPym4sM432.png

圖中流量 QPS在19:59:57秒從3.7K開始增長,20:00:01秒達(dá)到峰值2.9W,隨后的1分鐘內(nèi)逐步回落。流量在4秒內(nèi)增長9倍,整個拉升和回降過程在1分鐘內(nèi)全部完成。

?

問題&挑戰(zhàn)

面對上述流量變化的挑戰(zhàn),聯(lián)盟推薦系統(tǒng)的備戰(zhàn)面臨以下重大障礙:

1.難以準(zhǔn)確預(yù)估流量變化:導(dǎo)致無法提前準(zhǔn)備充足的系統(tǒng)資源,系統(tǒng)有潛在的崩潰風(fēng)險。

2.不同場景推薦策略與模型差異大:難以實(shí)現(xiàn)統(tǒng)一控制,管理和優(yōu)化的復(fù)雜性升高。

3.流量瞬時大幅波動:需要系統(tǒng)具備秒級響應(yīng)和調(diào)控能力,技術(shù)實(shí)現(xiàn)難度增加。

?

方案設(shè)計(jì)

因此,在推薦系統(tǒng)領(lǐng)域中,為了有效應(yīng)對高頻、瞬時、大幅的流量突變,我們需要一種“自適應(yīng)”能力。這種能力應(yīng)具備以下特性:

1. 差異化控制不同場景鏈路

?場景識別與分級處理:系統(tǒng)應(yīng)能夠識別不同的業(yè)務(wù)場景和鏈路,對于不同重要性和緊急程度的場景進(jìn)行差異化處理。例如,核心業(yè)務(wù)鏈路和次要鏈路可以有不同的降級策略,以確保關(guān)鍵功能的優(yōu)先保障。

2. 自動化執(zhí)行,無需人工干預(yù)

?全自動化降級與恢復(fù):通過智能化的監(jiān)控和決策機(jī)制,系統(tǒng)能夠在檢測到流量異常時自動執(zhí)行降級操作,并在條件恢復(fù)正常后自動恢復(fù),無需人工干預(yù),從而減少響應(yīng)時間和人為錯誤。

3. 敏銳感知并隨流量變化進(jìn)行調(diào)整

?實(shí)時監(jiān)控與動態(tài)調(diào)整:系統(tǒng)應(yīng)具備實(shí)時監(jiān)控流量和性能指標(biāo)的能力,并根據(jù)流量變化動態(tài)調(diào)整降級策略。這種敏銳的感知能力能夠確保系統(tǒng)在流量突變時迅速做出反應(yīng),保持服務(wù)的穩(wěn)定性。

4. 流量洪峰過后自動恢復(fù)至完整推薦

?智能恢復(fù)機(jī)制:在流量洪峰過后,系統(tǒng)應(yīng)能夠自動檢測流量回落情況,并逐步恢復(fù)至完整的推薦服務(wù)。這個恢復(fù)過程應(yīng)是平滑且智能的,避免因過快恢復(fù)而引發(fā)新的性能問題。

5. 最小化推薦損失

?精準(zhǔn)降級與優(yōu)化推薦:降級策略應(yīng)盡可能精準(zhǔn),確保在降級過程中推薦質(zhì)量和用戶體驗(yàn)的損失最小化。通過優(yōu)化推薦算法和策略,確保在資源受限的情況下仍能提供高質(zhì)量的推薦服務(wù)。

?

方案實(shí)踐

為實(shí)現(xiàn)上述自適應(yīng)降級與恢復(fù)的能力目標(biāo),我們以如下思路進(jìn)行方案設(shè)計(jì)。首先,監(jiān)控不同場景流量的推薦耗時,根據(jù)性能變化將流量劃分為主力流量和降級流量。接著,根據(jù)各召回通路、粗排、精排和重排的業(yè)務(wù)貢獻(xiàn)及耗時,在總耗時限制下求得最優(yōu)組合,確定降級鏈路。然后,通過調(diào)用鏈動態(tài)生成模塊,生成實(shí)際的調(diào)用pipeline。最后,通過實(shí)時組織pipeline調(diào)用,完成整個降級推薦過程。

與此同時,在降級流量中,抽取小部分流量作為探測流量,檢測流量洪峰是否已過去,以便及時進(jìn)行降級恢復(fù)。以下是詳細(xì)的設(shè)計(jì)實(shí)現(xiàn):

1、實(shí)時高效性能感知

1.1、配置化超時閾值和守護(hù)協(xié)程

由于UMP統(tǒng)計(jì)數(shù)據(jù)對非0級黃金流程系統(tǒng)不開放秒級數(shù)據(jù)查詢權(quán)限,并且UMP數(shù)據(jù)可能因流量不均衡等原因與具體實(shí)例機(jī)器上的性能存在較大差距,故而采用以下方法:

?配置化超時閾值:為每個推薦場景和鏈路配置合理的超時閾值。

?守護(hù)協(xié)程實(shí)時統(tǒng)計(jì):在每個推薦服務(wù)實(shí)例上運(yùn)行守護(hù)協(xié)程,實(shí)時監(jiān)控請求的響應(yīng)時間,并統(tǒng)計(jì)超時率。

1.2、威爾遜置信區(qū)間算法修正超時率

為了避免在流量低谷時的統(tǒng)計(jì)誤差,引入威爾遜置信區(qū)間算法修正超時率。具體的Wilson修正公式如下:

wKgaoma8GVCAHLTYAABpjvJ8S-Y848.png

其中,P為當(dāng)前統(tǒng)計(jì)的秒級超時率,WilsonP為置信超時率,z = 1.96(95%的置信水平)。

2. 差別化場景控制

?分場景統(tǒng)計(jì)耗時數(shù)據(jù),配合各場景配置的耗時閾值,實(shí)現(xiàn)差別化控制。

3. 流量切分實(shí)現(xiàn)細(xì)粒度逐步降級

?根據(jù)超時比例設(shè)置降級流量比例:只對降級流量進(jìn)行降級,而非全部流量都降級。

?策略決策:參考KMFP用戶分層標(biāo)簽,對于不活躍和特征不豐富的用戶,直接降級。對于高活躍和高價值用戶,動態(tài)決策降級力度。

4. 動態(tài)線性規(guī)劃推薦鏈路

根據(jù)各召回通路、粗排、精排和重排的CTCVR貢獻(xiàn)值及其當(dāng)前耗時,進(jìn)行線性規(guī)劃,在耗時限制下求得業(yè)務(wù)貢獻(xiàn)最大化的最優(yōu)解。

?目標(biāo)函數(shù):最大化業(yè)務(wù)收益。

wKgZoma8GVGAJwLTAAAJomUAMKE658.png

?約束條件:各模塊的當(dāng)前耗時不得超過設(shè)定閾值。

wKgZoma8GVKAU5bmAAAJAk3GVsI011.png

wKgaoma8GVeAMM8dAAACIp9birs767.png

其中,E1i為各召回通路的業(yè)務(wù)收益,E2、E3、E4分別為粗排、精排和重排的業(yè)務(wù)收益;T1i為各召回通路的當(dāng)前耗時,T2、T3、T4分別為粗排、精排和重排的當(dāng)前耗時(各模塊的99耗時統(tǒng)計(jì)視情況配置為實(shí)時/近線方式,1~3秒);各W取值為0或1。問題即為求上述線性規(guī)劃下的最優(yōu)W組合,每當(dāng)超時率發(fā)生階躍變化時,重新計(jì)算最優(yōu)解。

5. 實(shí)時組織pipeline調(diào)用

在得出上述W組合之后,由調(diào)用鏈生成器生成實(shí)際的調(diào)用關(guān)系pipeline,再交由管道調(diào)度器來組織調(diào)度完成整個推薦過程。

6. 小流量探測,階梯式自動恢復(fù)

在降級狀態(tài)下,周期性地從降級流量中抽取一定的小流量進(jìn)行降級回彈測試,以監(jiān)控是否流量回落或系統(tǒng)自動擴(kuò)容。

?回彈測試不通過:繼續(xù)維持降級狀態(tài)。

?回彈測試通過:反向階梯式逐級擴(kuò)大回彈流量,直到全部降級流量都恢復(fù)至完全推薦。

7. 業(yè)務(wù)無關(guān)API,低成本移植

自適應(yīng)降級模塊設(shè)計(jì)了與具體業(yè)務(wù)無關(guān)的通用交互接口,包括收益與耗時數(shù)據(jù)輸入、超時閾值設(shè)置、降級標(biāo)志與降級組合查詢等,可低成本移植到其他業(yè)務(wù)系統(tǒng)中。

?

在上述基礎(chǔ)上,配合統(tǒng)一的限流防護(hù)和公司動態(tài)擴(kuò)縮容技術(shù),理論上聯(lián)盟推薦系統(tǒng)可以做到足夠的穩(wěn)定性和推薦效果保障。以下是京東聯(lián)盟自適應(yīng)降級&恢復(fù)推薦系統(tǒng)的整體架構(gòu)圖:

wKgZoma8GVmAf12oAAHv2P1NtdE248.png

大促效果

本方案大促期間的業(yè)務(wù)效果有:

1.大促期間流量損失減少90%以上,對比以往活動高峰時的主動降級,系統(tǒng)可秒級完成自適應(yīng)降級,結(jié)合serverless自動擴(kuò)容策略,在分鐘級別完成自動恢復(fù)。

2.聯(lián)盟推薦系統(tǒng)的大促備戰(zhàn)不再強(qiáng)依賴業(yè)務(wù)方評估峰值流量。

3.大促期間經(jīng)歷多次流量突變,均未依賴上游系統(tǒng)的降級保護(hù)。

4.大促期間零干預(yù),零事故。

?

以上就是京東聯(lián)盟廣告推薦系統(tǒng)在大促期間保障穩(wěn)定性和效果的相關(guān)工作,隨著廣告推薦業(yè)務(wù)進(jìn)入存量時代的深水區(qū),以及新推薦技術(shù)的不斷涌現(xiàn),我們要持續(xù)進(jìn)化推薦系統(tǒng),也歡迎大家一起交流學(xué)習(xí)。

審核編輯 黃宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    Redis集群部署與性能優(yōu)化實(shí)戰(zhàn)

    Redis作為高性能的內(nèi)存數(shù)據(jù)庫,在現(xiàn)代互聯(lián)網(wǎng)架構(gòu)中扮演著關(guān)鍵角色。作為運(yùn)維工程師,掌握Redis的部署、配置和優(yōu)化技能至關(guān)重要。本文將從實(shí)戰(zhàn)角度出發(fā),詳細(xì)介紹Redis集群的搭建、性能
    的頭像 發(fā)表于 07-08 17:56 ?225次閱讀

    Linux系統(tǒng)性能指南

    Linux服務(wù)器運(yùn)行了很多應(yīng)用,在負(fù)載下,服務(wù)器可能會出現(xiàn)性能瓶頸,例如CPU利用率過高、內(nèi)存不足、磁盤I/O瓶頸等,從而導(dǎo)致系統(tǒng)卡頓,服務(wù)無法正常運(yùn)行等問題。所以針對以上問題,可以通過調(diào)整內(nèi)核參數(shù)和
    的頭像 發(fā)表于 06-23 14:12 ?706次閱讀
    Linux<b class='flag-5'>系統(tǒng)性能</b>指南

    升降速曲線對直線電機(jī)系統(tǒng)性能影響的研究

    速曲線對直線電機(jī)系統(tǒng)性能影響的研究.pdf【免責(zé)聲明】本文系網(wǎng)絡(luò)轉(zhuǎn)載,版權(quán)歸原作者所有。本文所用視頻、圖片、文字如涉及作品版權(quán)問題,請第一時間告知,刪除內(nèi)容!
    發(fā)表于 06-17 08:48

    通信設(shè)備EMC整改:從測試到優(yōu)化系統(tǒng)性解決方案

    深圳南柯電子|通信設(shè)備EMC整改:從測試到優(yōu)化系統(tǒng)性解決方案
    的頭像 發(fā)表于 06-16 11:10 ?204次閱讀

    鴻蒙5開發(fā)寶藏案例分享---應(yīng)用并發(fā)設(shè)計(jì)

    ?** 鴻蒙并發(fā)編程實(shí)戰(zhàn)指南:解鎖ArkTS多線程黑科技** 嘿,開發(fā)者朋友們! 今天給大家扒一扒鴻蒙官方文檔里藏著的并發(fā)編程寶藏—— 100+實(shí)戰(zhàn)場景解決方案 !從金融理財?shù)接螒蜷_發(fā)
    發(fā)表于 06-12 16:19

    TurMass? 如何幫助解決 UWB 定位系統(tǒng)大規(guī)模終端標(biāo)簽并發(fā)通信沖突問題?

    在大容量定位終端數(shù)據(jù)并發(fā)場景中,現(xiàn)有通信技術(shù)因信號沖突、系統(tǒng)容量受限等問題,難以滿足需求。TurMass? 通信技術(shù)通過多信道設(shè)計(jì)、時隙劃分、定位與通信一體化等創(chuàng)新方案,有效解決了
    的頭像 發(fā)表于 03-17 14:38 ?411次閱讀
    TurMass? 如何幫助解決 UWB 定位<b class='flag-5'>系統(tǒng)</b>大規(guī)模終端標(biāo)簽<b class='flag-5'>高</b><b class='flag-5'>并發(fā)</b>通信沖突問題?

    如何優(yōu)化總線系統(tǒng)性能

    總線系統(tǒng)是計(jì)算機(jī)和其他電子設(shè)備中用于傳輸數(shù)據(jù)的關(guān)鍵組件。性能優(yōu)化可以提高數(shù)據(jù)傳輸速率、降低延遲,并增強(qiáng)系統(tǒng)的可靠性和擴(kuò)展性。 1. 理解總線系統(tǒng)
    的頭像 發(fā)表于 12-31 09:54 ?675次閱讀

    仿真系統(tǒng)性能優(yōu)化技巧

    在現(xiàn)代工業(yè)和科學(xué)研究中,仿真系統(tǒng)扮演著越來越重要的角色。它們不僅能夠幫助我們預(yù)測復(fù)雜系統(tǒng)的行為,還能在沒有實(shí)際物理原型的情況下進(jìn)行實(shí)驗(yàn)和測試。然而,隨著仿真模型的復(fù)雜度增加,性能優(yōu)化
    的頭像 發(fā)表于 12-19 14:47 ?2386次閱讀

    光波導(dǎo)系統(tǒng)中光柵幾何結(jié)構(gòu)的優(yōu)化

    快速物理光學(xué)軟件VirtualLab Fusion擁有分析光波導(dǎo)系統(tǒng)性能。這次我們在設(shè)計(jì)工作流程中處理一個密切相關(guān)的步驟: 在系統(tǒng)的耦合和擴(kuò)展區(qū)域中使用的光柵幾何結(jié)構(gòu)的優(yōu)化。 VirtualLab
    發(fā)表于 12-16 10:39

    PCIe延遲對系統(tǒng)性能的影響

    隨著技術(shù)的發(fā)展,計(jì)算機(jī)系統(tǒng)性能的要求越來越高。PCIe作為連接處理器、內(nèi)存、存儲和其他外圍設(shè)備的關(guān)鍵接口,其性能直接影響到整個系統(tǒng)的表現(xiàn)。PCIe延遲,作為衡量數(shù)據(jù)傳輸效率的重要指標(biāo)
    的頭像 發(fā)表于 11-26 15:14 ?2310次閱讀

    如何優(yōu)化DCS系統(tǒng)性能

    優(yōu)化DCS(分布式控制系統(tǒng)系統(tǒng)性能是確保工業(yè)自動化過程高效、穩(wěn)定運(yùn)行的關(guān)鍵。以下是一些具體的優(yōu)化措施: 一、硬件
    的頭像 發(fā)表于 11-13 09:19 ?1442次閱讀

    多通道負(fù)載測試和性能評估?

    多通道負(fù)載測試和性能評估是軟件質(zhì)量保證的重要組成部分,它們可以幫助我們發(fā)現(xiàn)和解決系統(tǒng)性能瓶頸,提高系統(tǒng)的可用性和穩(wěn)定性。 多通道負(fù)載測試是一種模擬多個用戶同時訪問
    發(fā)表于 11-11 16:44

    一文了解電商大系統(tǒng)可用保障思路-獻(xiàn)給技術(shù)伙伴們

    本文面向受眾可以是運(yùn)營、可以是產(chǎn)品、也可以是研發(fā)、測試人員,作者希望通過如下思路(知?dú)v史->清家底->明目標(biāo)->定戰(zhàn)略->做戰(zhàn)術(shù)->促成長)幫助大家能夠了解電商大系統(tǒng)可用保障,減少哪些高深莫測
    的頭像 發(fā)表于 08-22 15:04 ?534次閱讀
    一文了解電商大<b class='flag-5'>促</b><b class='flag-5'>系統(tǒng)</b>的<b class='flag-5'>高</b>可用保障思路-獻(xiàn)給技術(shù)伙伴們

    京粉智能推廣助手-LLM based Agent在聯(lián)盟廣告中的應(yīng)用與落地

    一、前言 擁有一個幫你躺著賺錢的助手,聽起來是不是有點(diǎn)心動?依托于京東聯(lián)盟廣告平臺,借助AIGC大語言模型出色的理解、推理、規(guī)劃能力,我們推出了京粉智能推廣助手機(jī)器人,幫助合作伙伴擁有自己的智能助理
    的頭像 發(fā)表于 08-12 14:33 ?927次閱讀
    京粉智能推廣助手-LLM based Agent在<b class='flag-5'>聯(lián)盟</b><b class='flag-5'>廣告</b>中的應(yīng)用與落地

    并發(fā)系統(tǒng)的藝術(shù):如何在流量洪峰中游刃有余

    前言 我們常說的三并發(fā)、可用、高性能,這些技術(shù)是構(gòu)建現(xiàn)代互聯(lián)網(wǎng)應(yīng)用程序所必需的。對于京東
    的頭像 發(fā)表于 08-05 13:43 ?514次閱讀
    <b class='flag-5'>高</b><b class='flag-5'>并發(fā)</b><b class='flag-5'>系統(tǒng)</b>的藝術(shù):如何在流量洪峰中游刃有余