一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

S公司的微服務(wù)“失敗”之旅

馬哥Linux運維 ? 來源:馬哥Linux運維 ? 2023-01-11 15:38 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

背景介紹

S公司是一家數(shù)據(jù)服務(wù)公司,有 20 000 多名客戶使用公司的軟件,公司使用 API 收集和清理客戶的數(shù)據(jù)。S 公司提供的產(chǎn)品如下圖所示。

7e649bb0-90e7-11ed-bfe3-dac502259ad0.png

7e794c9a-90e7-11ed-bfe3-dac502259ad0.png

微服務(wù)是當今主流的架構(gòu)模式之一。S 公司的系統(tǒng)進行了一次微服務(wù)改造,并取得了不錯的效果。

重構(gòu)后的規(guī)模:400 private repos;70 different services(workers)。

取得的收益:

visibility(可見性)。在微服務(wù)架構(gòu)中,非常方便對每個服務(wù)進行監(jiān)控(sysdig、htop、iftop 等)。

微服務(wù)大大降低了配置和構(gòu)建部署成本。

消除了在現(xiàn)有服務(wù)中附加不同功能的誘惑。

產(chǎn)生了很多對外依賴很少的服務(wù):僅僅需要從隊列里讀取和處理數(shù)據(jù),然后發(fā)送結(jié)果即可。非常適合小團隊協(xié)同工作。

定位問題變得容易??梢詫γ恳粋€ microworker 進行 Datadog 式的監(jiān)控,如下圖所示

7e9968e0-90e7-11ed-bfe3-dac502259ad0.png

比如,類似于內(nèi)存泄漏的問題,可以很容易將問題范圍縮小到 50~100 行代碼內(nèi)。

簡單地講,微服務(wù)是一種面向服務(wù)的軟件體系結(jié)構(gòu),其中服務(wù)端的應(yīng)用程序是通過組合許多單一用途、低占用空間的網(wǎng)絡(luò)服務(wù)而成的。其優(yōu)點是改進的模塊化減少了測試負擔,可以更好地進行功能組合,環(huán)境隔離和開發(fā)團隊具備自主權(quán)。經(jīng)常與之拿來對比的是單體架構(gòu),在單體架構(gòu)中,大量的功能存在于單個服務(wù)中,作為單個單元進行測試、部署和擴展。

另外,操作復雜度和負載都很高的產(chǎn)品一般都會選擇微服務(wù)架構(gòu),它使基礎(chǔ)結(jié)構(gòu)更加靈活、可擴展性強,并且更易于監(jiān)控。

但不幸的事情發(fā)生了,當重構(gòu)完成兩年以后,團隊沒有更快地交付,而是陷入了“爆炸性”的復雜性中,架構(gòu)的優(yōu)點變成了負擔。隨著速度的下降,失敗率激增,團隊也變得不堪重負。

系統(tǒng)處理流程概述

S公司的客戶數(shù)據(jù)基礎(chǔ)設(shè)施每秒可接收數(shù)十萬個事件,并將它們轉(zhuǎn)發(fā)給合作伙伴的 API,即服務(wù)端 destination。目前,有超過一百種類型的 destination,如 Google Analytics, Optimizely,或自定義 Webhook。

幾年前,架構(gòu)相對簡單,一個API 即可接收事件并將其轉(zhuǎn)發(fā)到分布式消息隊列。事件是由 Web 或移動應(yīng)用程序生成的 JSON 對象,其中包含有關(guān)用戶及其操作的信息。

一旦請求失敗,有時會嘗試在稍后的時間再次發(fā)送該事件。有些失敗可以安全重試,有些則不行。可重試錯誤是指那些 destination 不做任何更改就可以接受的錯誤,如 HTTP 500、速率限制和超時。不可重試錯誤是指可以確信 destination 永遠不會接受的請求,如具有無效憑證或缺少必需字段的請求。

此時,單個隊列既包含最新的事件,也包含跨越所有destination 的可能有多次重試的事件,這會導致“隊頭阻塞”。也就是說,在這種特殊情況下,如果一個 destination 變慢或下降,則重試將會導致隊列擁擠,從而導致所有 destination 的延遲。

假設(shè)destinationX 遇到了一個臨時問題,每個請求都由于超時而出錯?,F(xiàn)在,這不僅會創(chuàng)建大量尚未到達 destinationX 的積壓請求,而且還會將每個失敗事件放回隊列中進行重試,如下圖所示。雖然系統(tǒng)將自動伸縮以響應(yīng)增加的負載,但隊列深度的突然增加將超過系統(tǒng)的伸縮能力,從而導致最新事件的延遲。

7ea71e68-90e7-11ed-bfe3-dac502259ad0.png

為了解決“隊頭阻塞”問題,該團隊為每個 destination 都創(chuàng)建了單獨的服務(wù)和隊列。這個新的體系結(jié)構(gòu)包括一個額外的路由器進程,該進程接收入站事件并將事件的副本分發(fā)到每個選定的 destination 中,如下圖所示?,F(xiàn)在,如果一個 destination 出現(xiàn)問題,則只有它的隊列會阻塞,其他 destination 不會受到影響。這種微服務(wù)風格的體系結(jié)構(gòu)將 destination 彼此隔離,這在 destination 經(jīng)常發(fā)生問題時,至關(guān)重要。

7ede67f6-90e7-11ed-bfe3-dac502259ad0.png

產(chǎn)生的問題

共享庫多版本問題。隨后,系統(tǒng)又增加了 50 多個新的 destination,這就意味著有 50個新的 repo。為了減輕開發(fā)和維護這些代碼庫的負擔,團隊創(chuàng)建了共享庫,來處理公共轉(zhuǎn)換和功能(如 HTTP 請求處理)。然而,一個新的問題出現(xiàn)了。對這些共享庫的測試和部署更改會影響所有的 destination,此時必須測試和部署幾十個服務(wù)。在時間緊迫的情況下,工程師只會在單個目標的代碼庫中包含這些庫的更新版本。這樣一來,隨著時間的推移,這些共享庫的版本開始在不同的目標代碼庫中出現(xiàn)不同的分支版本,原本擁有的在每個目標代碼庫之間減少自定義的優(yōu)勢開始不復存在。最終,它們都使用了這些共享庫的不同版本。本可以構(gòu)建一些工具來自動進行更改,但此時,不僅開發(fā)人員的工作效率受到了影響,還遇到微服務(wù)架構(gòu)的其他問題。

負載模式問題。每個服務(wù)都有不同的負載模式,其中一些服務(wù)每天處理少量事件,而另一些服務(wù)每秒處理數(shù)千個事件。對于處理少量事件的 destination,當出現(xiàn)意外的負載峰值時,操作員將不得不手動擴展服務(wù),以滿足需求。

伸縮調(diào)優(yōu)問題。雖然確實實現(xiàn)了自動伸縮,但每個服務(wù)都有不同的 CPU 和內(nèi)存資源組合,使得自動伸縮配置的調(diào)優(yōu)更像是藝術(shù)而不是科學。destination 的數(shù)量繼續(xù)快速增加,團隊平均每個月增加三個 destination,這意味著有了更多的 repo、隊列和服務(wù)。

管理開銷。當服務(wù)個數(shù)超過 140 個時,對團隊來說管理所有服務(wù)是一筆巨大的開銷。團隊每天睡不好覺,最常見的場景就是線上工程師處理負載峰值。

退回到單體

最終,團隊決定拋棄這些微服務(wù)和repo,并重新將服務(wù)并到一起。然而,退回到單體服務(wù)非常困難。如果所有 destination 都有一個單獨的隊列,那么所有工程師都必須檢查每個隊列的工作,這會給 destination 服務(wù)增加一層復雜性。為了解決這個問題,系統(tǒng)新增了一種“離心機(Centrifuge)”組件,并將所有 destination 進行了合并,如下圖所示。

7eff0c9a-90e7-11ed-bfe3-dac502259ad0.png

同時,還需要將所有repo 進行合并。一旦所有 destination 的代碼存在于一個 repo 中,它們就可以合并為一個服務(wù)。這樣,開發(fā)人員的生產(chǎn)率大大提高了,不再需要部署 140 多個服務(wù)來改變一個共享庫,一個工程師在幾分鐘內(nèi)就可以部署這項服務(wù),這一變化也有利于運維。由于所有 destination 都位于一個服務(wù)中,因此很好地混合了 CPU 和內(nèi)存密集型 destination,這使得利用擴展服務(wù)來滿足需求變得非常容易。由于大型工作池可以吸收負載峰值,因此團隊不必再為處理少量負載的 destination 進行分頁。

一些犧牲

雖然已取得了巨大的改進,然而其中也有些“犧牲”。

故障隔離困難。由于所有東西都在一個單體中運行,如果一個 destination 中引入了導致服務(wù)崩潰的 bug,那么所有 destination 的服務(wù)都會崩潰。雖然已經(jīng)有全面的自動化測試,但是測試無法完全保障。后續(xù)演進的方向是設(shè)計一種更健壯的方法,以防止單個 destination導致整個服務(wù)癱瘓,同時仍將所有 destination 保持在一個單體中。

緩存(內(nèi)存中)效率變低。以前,由于每個 destination 都有一個服務(wù),低流量 destination只有少數(shù)進程,這意味著它們控制平面數(shù)據(jù)的內(nèi)存緩存將保持熱度。現(xiàn)在,由于緩存分散在3000 多個進程中,因此命中率大大降低。最后,考慮到實際的運營收益,接受了效率的損失。

更新一個依賴項的版本可能會破壞多個destination。雖然解決了之前多版本依賴的問題,但如果想使用庫的最新版本,則必須更新其他 destination。目前,通過全面的自動化測試套件,可以快速看到新老依賴版本的不同。

總結(jié)

引入微服務(wù)架構(gòu),并通過將destination 彼此隔離解決了管道中的性能問題。然而,當需要批量更新時,由于缺乏適當?shù)墓ぞ邅頊y試和部署微服務(wù),因此結(jié)果反而使開發(fā)人員的生產(chǎn)力迅速下降。

在進行架構(gòu)選擇時,并不存在絕對的好壞,是一個權(quán)衡的過程,需要從多個維度考慮。

新的架構(gòu)是否能帶來新的復雜性,帶來的復雜性是否能被充分評估,以及如何應(yīng)對,如上文提到的“共享多版本的問題”。

新架構(gòu)下系統(tǒng)的運維成本是否增加,如果增加能否接受,如上文提到的“負載模式問題”。

在“享受”新架構(gòu)帶來的好處的同時,能否真正掌控新架構(gòu),如上文提到的“伸縮調(diào)優(yōu)問題”。

新的架構(gòu)是否帶來管理開銷,成本能否接受,如上文提到的“管理開銷”問題。

架構(gòu)設(shè)計的誤區(qū)

盲目追求模式和原則的滿足。并不是說模式和原則不重要,但它們不應(yīng)該成為架構(gòu)設(shè)計追求的唯一目標。盲目追求不必要的模式和原則的滿足,往往會給系統(tǒng)帶來不必要的復雜性,使其難以理解。

追趕潮流。新的架構(gòu)形態(tài)層出不窮,令人眼花繚亂,學習到一種新的、“炫酷”的架構(gòu)設(shè)計很容易有直接拿來應(yīng)用的沖動。這樣做的后果往往是會與實際解決的問題脫節(jié),為系統(tǒng)帶來不必要的負擔,甚至根本沒有解決任何問題。

面面俱到,沒有重點。決定不要什么比要什么更難。你會看到當某些架構(gòu)設(shè)計文檔的模板時,高可用性、擴展性、可測試性……什么都想要,不做取舍。不同系統(tǒng)的側(cè)重點不同,這樣做的后果往往是顧此失彼,關(guān)鍵問題沒有得到解決。

忽視架構(gòu)腐化。架構(gòu)設(shè)計在整個軟件生命周期內(nèi),都需要守護及持續(xù)演進,否則架構(gòu)及整個系統(tǒng)都難以擺脫逐步惡化,直至消亡或重寫的命運。

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 應(yīng)用程序
    +關(guān)注

    關(guān)注

    38

    文章

    3337

    瀏覽量

    59038
  • 架構(gòu)設(shè)計
    +關(guān)注

    關(guān)注

    0

    文章

    33

    瀏覽量

    7116
  • 微服務(wù)
    +關(guān)注

    關(guān)注

    0

    文章

    145

    瀏覽量

    7744

原文標題:S 公司的微服務(wù)“失敗”之旅

文章出處:【微信號:magedu-Linux,微信公眾號:馬哥Linux運維】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    微服務(wù)器架構(gòu)幾種典型的基礎(chǔ)框架,你了解嗎?

    SpringCloud、Dubbo、Dropwizard、Akka等是常見微服務(wù)框架。SpringCloud基于SpringBoot,生態(tài)豐富;Dropwizard輕量且繼承SpringBoot優(yōu)點
    的頭像 發(fā)表于 03-04 11:05 ?435次閱讀

    NVIDIA 發(fā)布保障代理式 AI 應(yīng)用安全的 NIM 微服務(wù)

    NVIDIA NeMo Guardrails 包含全新 NVIDIA NIM 微服務(wù),能夠為各行業(yè)構(gòu)建 AI 的企業(yè)提高 AI 的準確性、安全性和可控性。 ? AI 智能體有望成為能夠完成各種任務(wù)
    發(fā)表于 01-17 16:29 ?161次閱讀

    微服務(wù)容器化部署好處多嗎?

    微服務(wù)容器化部署好處有很多,包括環(huán)境一致性、資源高效利用、快速部署與啟動、隔離性與安全性、版本控制與回滾以及持續(xù)集成與持續(xù)部署。這些優(yōu)勢助力應(yīng)用可靠穩(wěn)定運行,提升開發(fā)運維效率,是現(xiàn)代軟件架構(gòu)的優(yōu)質(zhì)選擇。UU云小編認為微服務(wù)容器化部署好處主要體現(xiàn)在以下幾個方面:
    的頭像 發(fā)表于 01-17 10:22 ?331次閱讀

    寶藏級微服務(wù)架構(gòu)工具合集

    寶藏級熱門微服務(wù)架構(gòu)工具包含Spring Boot、Eclipse Vert.X、Kubernetes、Tyk、RabbitMQ、Apache Kafka等。其中,Spring Boot簡化了微服務(wù)
    的頭像 發(fā)表于 12-21 16:33 ?617次閱讀

    NVIDIA NIM微服務(wù)登陸亞馬遜云科技

    經(jīng)過優(yōu)化的 NIM 微服務(wù)現(xiàn)可在 Amazon Bedrock Marketplace、SageMaker JumpStart 和 AWS Marketplace 上獲取,用于各種 NVIDIA 和生態(tài)系統(tǒng)模型。
    的頭像 發(fā)表于 12-06 13:33 ?755次閱讀

    k8s微服務(wù)架構(gòu)就是云原生嗎?兩者是什么關(guān)系

    k8s微服務(wù)架構(gòu)就是云原生嗎?K8s微服務(wù)架構(gòu)并不等同于云原生,但兩者之間存在密切的聯(lián)系。Kubernetes在云原生架構(gòu)中扮演著核心組件的角色,它簡化了容器化應(yīng)用程序的管理,提供了彈
    的頭像 發(fā)表于 11-25 09:39 ?528次閱讀

    全新NVIDIA NIM微服務(wù)實現(xiàn)突破性進展

    全新 NVIDIA NIM 微服務(wù)實現(xiàn)突破性進展,可助力氣象技術(shù)公司開發(fā)和部署 AI 模型,實現(xiàn)對降雪、結(jié)冰和冰雹的預測。
    的頭像 發(fā)表于 11-21 10:07 ?675次閱讀

    SSR與微服務(wù)架構(gòu)的結(jié)合應(yīng)用

    隨著互聯(lián)網(wǎng)技術(shù)的快速發(fā)展,前端技術(shù)棧不斷更新迭代,后端架構(gòu)也經(jīng)歷了從單體應(yīng)用到微服務(wù)的變革。在這個過程中,服務(wù)端渲染(SSR)作為一種提升頁面加載速度和SEO性能的技術(shù),與微服務(wù)架構(gòu)的結(jié)合應(yīng)用,為
    的頭像 發(fā)表于 11-18 11:34 ?835次閱讀

    微服務(wù)架構(gòu)與容器云的關(guān)系與區(qū)別

    微服務(wù)架構(gòu)與容器云密切相關(guān)又有所區(qū)別。微服務(wù)將大型應(yīng)用拆分為小型、獨立的服務(wù),而容器云基于容器技術(shù),為微服務(wù)提供構(gòu)建、發(fā)布和運行的平臺。區(qū)別在于,
    的頭像 發(fā)表于 10-21 17:28 ?552次閱讀

    入門級攻略:如何容器化部署微服務(wù)?

    第一步理解容器化基礎(chǔ),第二步創(chuàng)建Dockerfile,第三步構(gòu)建推送鏡像,第四步部署微服務(wù),第五步管理微服務(wù)、第六步優(yōu)化更新。容器化部署微服務(wù)是現(xiàn)代軟件開發(fā)中的一種高效方法,可提供良好的可移植性、可擴展性和管理性。容器化部署
    的頭像 發(fā)表于 10-09 10:08 ?398次閱讀

    Proxyless的多活流量和微服務(wù)治理

    1. 引言 1.1 項目的背景及意義 在當今的微服務(wù)架構(gòu)中,應(yīng)用程序通常被拆分成多個獨立的服務(wù),這些服務(wù)通過網(wǎng)絡(luò)進行通信。這種架構(gòu)的優(yōu)勢在于可以提高系統(tǒng)的可擴展性和靈活性,但也帶來了新的挑戰(zhàn),比如
    的頭像 發(fā)表于 08-28 16:54 ?2008次閱讀
    Proxyless的多活流量和<b class='flag-5'>微服務(wù)</b>治理

    NVIDIA NIM微服務(wù)帶來巨大優(yōu)勢

    服務(wù)通過熱門 AI 模型為數(shù)百萬開發(fā)者帶來高達 5 倍的 token 效率提升,使他們能夠立即訪問在 NVIDIA DGX Cloud 上運行的 NIM 微服務(wù)。
    的頭像 發(fā)表于 08-23 15:20 ?974次閱讀

    借助NVIDIA NIM微服務(wù)助力可口可樂公司擴展生成式AI內(nèi)容

    借助 NVIDIA NIM 微服務(wù) USD Search 和 USD Code,市場營銷領(lǐng)導者 WPP 幫助飲料公司在全球范圍內(nèi)加速創(chuàng)意活動的迭代。
    的頭像 發(fā)表于 08-13 16:16 ?884次閱讀

    采用OpenUSD和NVIDIA NIM微服務(wù)創(chuàng)建精準品牌視覺

    全球領(lǐng)先的創(chuàng)意和制作服務(wù)機構(gòu)率先采用 OpenUSD 和 NVIDIA NIM 微服務(wù)來創(chuàng)建精準的品牌視覺。
    的頭像 發(fā)表于 08-01 14:33 ?764次閱讀

    全新 NVIDIA NeMo Retriever微服務(wù)大幅提升LLM的準確性和吞吐量

    企業(yè)能夠通過提供檢索增強生成功能的生產(chǎn)就緒型 NVIDIA NIM 推理微服務(wù),充分挖掘業(yè)務(wù)數(shù)據(jù)的價值。這些微服務(wù)現(xiàn)已集成到 Cohesity、DataStax、NetApp 和 Snowflake 平臺中。
    的頭像 發(fā)表于 07-26 11:13 ?1292次閱讀
    全新 NVIDIA NeMo Retriever<b class='flag-5'>微服務(wù)</b>大幅提升LLM的準確性和吞吐量