作者:欒文飛 高階軟件工程師
一、背景介紹
Sermant是一個(gè)主打服務(wù)治理領(lǐng)域的Java Agent框架,在服務(wù)治理中難免會(huì)有針對(duì)業(yè)務(wù)流量進(jìn)行解析和處理的過(guò)程,此類服務(wù)治理能力將會(huì)對(duì)微服務(wù)的服務(wù)能力產(chǎn)生一定的性能影響,作為一個(gè)基于Java Agent技術(shù)做服務(wù)治理的框架,我們需要在保證服務(wù)治理能力生效的同時(shí),極小的影響微服務(wù)原有的服務(wù)性能。
雖然基于Java Agent的服務(wù)治理和基于SDK的服務(wù)治理在其原理上有所不同,但也避免不了微服務(wù)治理過(guò)程中產(chǎn)生對(duì)微服務(wù)原有性能的影響,基于Java Agent服務(wù)治理方式的相較于SDK的服務(wù)治理方式免去了侵入式的代碼開(kāi)發(fā),是一種運(yùn)行時(shí)技術(shù),所以還需要考慮更多方面性能優(yōu)化問(wèn)題,例如在啟動(dòng)時(shí)間,運(yùn)行時(shí)增強(qiáng)性能開(kāi)銷等,本文將以Sermant的SpringBoot 注冊(cè)插件的性能測(cè)試及優(yōu)化過(guò)程為例,分享在Java Agent場(chǎng)景如何進(jìn)行更好的性能測(cè)試優(yōu)化及在Java Agent下需要著重注意的性能陷阱。
SpringBoot 注冊(cè)插件為SpringBoot應(yīng)用提供服務(wù)注冊(cè)發(fā)現(xiàn)能力,可用于在不修改原有代碼的前提下快速?gòu)腅SB架構(gòu)演進(jìn)為微服務(wù)架構(gòu),在該插件中包含針對(duì)域名的替換能力,服務(wù)注冊(cè)發(fā)現(xiàn)能力,請(qǐng)求的超時(shí)重試等,為架構(gòu)的成功演進(jìn),原有架構(gòu)中基于域名的請(qǐng)求調(diào)用,將會(huì)被基于注冊(cè)信息的請(qǐng)求調(diào)用(通過(guò)該插件的服務(wù)注冊(cè)發(fā)現(xiàn)能力,獲取服務(wù)提供者注冊(cè)的信息)所取代,如下圖所示:

在域名處理的過(guò)程是必然會(huì)參與到調(diào)用過(guò)程中的,這是服務(wù)治理能力對(duì)業(yè)務(wù)性能影響的典型場(chǎng)景。
二、測(cè)試方案
眾所周知,Java Agent程序和被增強(qiáng)應(yīng)用運(yùn)行時(shí)同進(jìn)程,Java Agent程序最重要的是不能對(duì)被掛載的應(yīng)用產(chǎn)生異常影響,導(dǎo)致應(yīng)用不可用,所以Sermant在運(yùn)行時(shí)的處理性能及穩(wěn)定性等做多方面的測(cè)試考量。在針對(duì)微服務(wù)進(jìn)行測(cè)試的過(guò)程中,我們往往只需要關(guān)注該微服務(wù)的性能即可,通過(guò)壓力測(cè)試來(lái)檢驗(yàn)微服務(wù)的服務(wù)提供能力,由于服務(wù)治理能力并不直接提供服務(wù),我們更多地需要關(guān)注在開(kāi)啟服務(wù)治理能力時(shí),對(duì)微服務(wù)本身服務(wù)提供能力的影響,所以我們?cè)跍y(cè)試方案中需要進(jìn)行對(duì)比測(cè)試來(lái)評(píng)估服務(wù)治理能力的好壞。
本對(duì)照測(cè)試中,我們通過(guò)壓力測(cè)試讓系統(tǒng)達(dá)到極限場(chǎng)景(consumer端的CPU已經(jīng)到達(dá)瓶頸),來(lái)分析攜帶Sermant并啟用服務(wù)治理能力時(shí),對(duì)應(yīng)用原有服務(wù)提供能力的影響,此處采用兩種部署方案:
-
不攜帶Sermant,基于網(wǎng)關(guān)的場(chǎng)景,是架構(gòu)改造前的運(yùn)行模式
-
攜帶Sermant的場(chǎng)景,是遷移后的微服務(wù)架構(gòu)運(yùn)行模式

注:在這種對(duì)比測(cè)試中,基于Java Agent的服務(wù)治理只需要對(duì)攜帶Java Agent程序和不攜帶Java Agent程序的場(chǎng)景進(jìn)行對(duì)照測(cè)試即可,無(wú)需兩套代碼進(jìn)行對(duì)照測(cè)試。
由于Java Agent程序和被增強(qiáng)應(yīng)用處于統(tǒng)一進(jìn)程,資源共享,基于上述兩種部署方案進(jìn)行測(cè)試,以不攜帶Java Agent程序作為測(cè)試分析的對(duì)照組,就可以很清晰的看出引入Java Agent程序后產(chǎn)生的影響,并可根據(jù)對(duì)照結(jié)果進(jìn)行優(yōu)化,應(yīng)用于Sermant上,就可以很容易的分析出Sermant的服務(wù)治理能力對(duì)微服務(wù)本身服務(wù)提供能力帶來(lái)的影響。
三、性能分析
由于需要針對(duì)應(yīng)用發(fā)起的請(qǐng)求通過(guò)字節(jié)碼增量的方式做域名的替換,SpringBoot 注冊(cè)插件通過(guò)對(duì)HttpClient、Openfeign、Okhttp等http客戶端進(jìn)行了字節(jié)碼增強(qiáng),我們根據(jù)上一章節(jié)中的測(cè)試方案對(duì)該插件提供的服務(wù)治理能力進(jìn)行了測(cè)試,下面我們以HttpClien為例通過(guò)CPU火焰圖來(lái)講述如何在Java Agent場(chǎng)景下分析性能瓶頸:
在性能調(diào)優(yōu)過(guò)程中,我們可通過(guò)CPU火焰圖來(lái)分析性能瓶頸,火焰圖可以稱之為性能問(wèn)題分析的"X光",可以很一針見(jiàn)血的看出在程序運(yùn)行中哪些代碼片段產(chǎn)生了異常的CPU占用??梢詤⒖肌妒褂没鹧鎴D(FlameGraph)分析程序性能》進(jìn)行學(xué)習(xí),當(dāng)然,采集CPU火焰圖的方式很多,我們只需要學(xué)會(huì)如何看懂火焰圖即可。
分析步驟
1. 找到字節(jié)碼增強(qiáng)邏輯的CPU占用
在分析過(guò)程中,首先需要找到字節(jié)碼增強(qiáng)時(shí)選中的被增強(qiáng)方法(本文場(chǎng)景增強(qiáng)方法為InternalHttpClient::doExecute),字節(jié)碼增強(qiáng)需要被增強(qiáng)程序的原有方法調(diào)用觸發(fā),所以也可以很清晰的在CPU火焰圖中可以看到,Sermant實(shí)現(xiàn)的邏輯調(diào)用棧在被增強(qiáng)方法之上,在字節(jié)碼增強(qiáng)邏輯執(zhí)行結(jié)束后,被增強(qiáng)方法還會(huì)繼續(xù)執(zhí)行。

所以除被增強(qiáng)方法執(zhí)行的調(diào)用棧及CPU時(shí)間片占用外,皆為字節(jié)碼增強(qiáng)所引入邏輯,在性能優(yōu)化中需著重關(guān)注。
2. 分析異常占用
根據(jù)CPU火焰圖原理,找出字節(jié)碼增強(qiáng)部分,找出異常占用CPU時(shí)間片的調(diào)用棧,并進(jìn)行程序的優(yōu)化,如下圖所示紅框選擇部分,皆為字節(jié)碼增強(qiáng)中引入的邏輯,占用了非常多的CPU時(shí)間片,由于字節(jié)碼增強(qiáng)程序和被增強(qiáng)程序,這種異常的占用,將會(huì)嚴(yán)重影響原程序的性能,在針對(duì)Java Agent場(chǎng)景的優(yōu)化中可著重優(yōu)化。

通過(guò)上述步驟,我們可以一目了然的看到我們通過(guò)Java Agent程序引入的CPU額外占用,具體占用原因本文就不一一分析。
四、性能陷阱
基于上述兩個(gè)章節(jié)的測(cè)試和分析方法,在本文的最后,列舉出在Java Agent開(kāi)發(fā)過(guò)程中經(jīng)常會(huì)遇到的性能陷阱,這里也給出解決方式,可以在開(kāi)發(fā)中注意:
|減少反射使用
在字節(jié)碼增強(qiáng)開(kāi)發(fā)過(guò)程中,很多情況下,如果類加載器不同,針對(duì)被增強(qiáng)應(yīng)用的類和方法往往需要通過(guò)反射去獲取并使用,在我們的性能分析中,反射是一個(gè)CPU占用的巨大陷阱,在有些被BootstrapClassLoader加載的類增強(qiáng)時(shí),甚至反射占用了一個(gè)方法調(diào)用30%以上的CPU時(shí)間片。
下圖選中方法中,反射占用該方法調(diào)用中的大部分CPU時(shí)間片:

但是由于類加載器的限制,有些反射是必須要使用的,我們也可以通過(guò)一定的手段進(jìn)行優(yōu)化,比如緩存通過(guò)反射獲取的類和方法,在字節(jié)碼增強(qiáng)中,多次觸發(fā)增強(qiáng)邏輯時(shí)減少反射占用CPU時(shí)間片非常有效。

通過(guò)上述步驟優(yōu)化后,通過(guò)火焰圖來(lái)看,效果是非常顯著的:

|注意字節(jié)碼增強(qiáng)插樁選擇
在做字節(jié)碼增強(qiáng)時(shí)的增強(qiáng)點(diǎn)選擇很重要,字節(jié)碼增強(qiáng)添加Transformer后運(yùn)行時(shí)分為兩種情況:
-
transform:針對(duì)尚未被類加載器加載的類,如果添加Transformer,在類被加載時(shí)就會(huì)觸發(fā)字節(jié)碼的轉(zhuǎn)換.
-
retransform:針對(duì)已經(jīng)被類加載器加載的類,如果添加了Transformer,則需要被重新加載后再進(jìn)行字節(jié)碼的轉(zhuǎn)換。
Java中被BootstrapClassLoader加載的類,如果想要進(jìn)行字節(jié)碼增強(qiáng),就需要使用第二種字節(jié)碼轉(zhuǎn)換的方式,可想而知,如果重新加載類再進(jìn)行轉(zhuǎn)換必然沒(méi)有在類第一次加載時(shí)就進(jìn)行轉(zhuǎn)換的效率高。
除上述原因之外,在增強(qiáng)啟動(dòng)類加載器加載的類時(shí),由于雙親委派機(jī)制的限制(只能向上委托,不能向下委托),往往都是需要大量使用反射(用于調(diào)用其他類加載器加載的類)來(lái)實(shí)現(xiàn)增強(qiáng)邏輯。

上文中也講到,不加節(jié)制的使用反射將會(huì)通過(guò)Java Agent程序嚴(yán)重影響被增強(qiáng)應(yīng)用的性能,所以在開(kāi)發(fā)Java Agent時(shí),需要謹(jǐn)慎選擇增強(qiáng)的類,非必要不增強(qiáng)被啟動(dòng)類加載器加載的類。
上述兩點(diǎn)是在Java Agent開(kāi)發(fā)過(guò)程中最容易發(fā)生的向被增強(qiáng)應(yīng)用引入的性能陷阱,除此之外,Java Agent也是由Java所開(kāi)發(fā),在開(kāi)發(fā)過(guò)程中也需要注意不要引入常見(jiàn)的性能陷阱。
Sermant作為專注于服務(wù)治理領(lǐng)域的字節(jié)碼增強(qiáng)框架,致力于提供高性能、可擴(kuò)展、易接入的服務(wù)治理體驗(yàn),并會(huì)在每個(gè)版本中做好性能、功能、體驗(yàn)的看護(hù),廣泛歡迎大家的加入。
Sermant官網(wǎng):https://sermant.io
GitHub倉(cāng)庫(kù)地址:https://github.com/huaweicloud/Sermant
添加Sermant小二(微信號(hào):sermant-support)加入社區(qū)交流群
或掃碼加入Sermant社區(qū)交流群

原文標(biāo)題:技術(shù)速遞 | Java Agent場(chǎng)景性能測(cè)試分析優(yōu)化經(jīng)驗(yàn)分享
文章出處:【微信公眾號(hào):華為DevCloud】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
-
華為
+關(guān)注
關(guān)注
216文章
35216瀏覽量
255997
原文標(biāo)題:技術(shù)速遞 | Java Agent場(chǎng)景性能測(cè)試分析優(yōu)化經(jīng)驗(yàn)分享
文章出處:【微信號(hào):華為DevCloud,微信公眾號(hào):華為DevCloud】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
【「零基礎(chǔ)開(kāi)發(fā)AI Agent」閱讀體驗(yàn)】+Agent開(kāi)發(fā)平臺(tái)
光頻譜分析儀的技術(shù)原理和應(yīng)用場(chǎng)景
信號(hào)源分析儀的技術(shù)原理和應(yīng)用場(chǎng)景
《AI Agent 應(yīng)用與項(xiàng)目實(shí)戰(zhàn)》第1-2章閱讀心得——理解Agent框架與Coze平臺(tái)的應(yīng)用
混合信號(hào)分析儀的原理和應(yīng)用場(chǎng)景
測(cè)試接收機(jī)的技術(shù)原理和應(yīng)用場(chǎng)景
射頻分析儀的技術(shù)原理和應(yīng)用場(chǎng)景
無(wú)線連接測(cè)試儀的技術(shù)原理和應(yīng)用場(chǎng)景
OTA測(cè)試暗箱的技術(shù)原理和應(yīng)用場(chǎng)景
移動(dòng)終端測(cè)試儀的技術(shù)原理和應(yīng)用場(chǎng)景
信令測(cè)試儀器的技術(shù)原理和應(yīng)用場(chǎng)景
使用Arthas火焰圖工具的Java應(yīng)用性能分析和優(yōu)化經(jīng)驗(yàn)

評(píng)論