資料介紹
軟件簡(jiǎn)介
夜鶯(Nightingale)是一個(gè)企業(yè)級(jí)監(jiān)控解決方案。旨在滿足云原生時(shí)代企業(yè)級(jí)的監(jiān)控需求。Nightingale 在產(chǎn)品完成度、系統(tǒng)高可用、以及用戶體驗(yàn)方面,達(dá)到了企業(yè)級(jí)的要求,可滿足不同規(guī)模用戶的場(chǎng)景,小到幾臺(tái)服務(wù),大到數(shù)十萬都可以完美支撐。兼顧云原生和裸金屬,支持應(yīng)用監(jiān)控和系統(tǒng)監(jiān)控,插件機(jī)制靈活,插件豐富完善,具有高度的靈活性和可擴(kuò)展性。
Nightingale 在?Open-Falcon?的基礎(chǔ)上,結(jié)合滴滴內(nèi)部的最佳實(shí)踐,在性能、可維護(hù)性、易用性方面做了大量的改進(jìn),作為集團(tuán)統(tǒng)一的監(jiān)控解決方案,支撐了滴滴內(nèi)部數(shù)十億監(jiān)控指標(biāo),覆蓋了從系統(tǒng)、容器、到應(yīng)用等各層面的監(jiān)控需求,周活躍用戶數(shù)千。五年磨一劍,取之開源,回饋開源。
Nightingale 采用樹狀節(jié)點(diǎn)導(dǎo)航,我們稱之為對(duì)象樹。對(duì)象樹本質(zhì)上是一種對(duì)監(jiān)控對(duì)象的分組管理機(jī)制,方便查找和查看監(jiān)控對(duì)象,以及對(duì)監(jiān)控對(duì)象設(shè)置監(jiān)控策略等管理動(dòng)作。 一棵典型的樹可從上到下描述為組織架構(gòu)關(guān)系、產(chǎn)品服務(wù)模塊關(guān)系、機(jī)房和機(jī)器掛載關(guān)系,該導(dǎo)航樹可根據(jù)用戶需求自行靈活定制。
監(jiān)控策略應(yīng)用到某個(gè)節(jié)點(diǎn)后,該節(jié)點(diǎn)下的所有子節(jié)點(diǎn)掛載的所有的機(jī)器都會(huì)應(yīng)用這個(gè)策略,任何一臺(tái)機(jī)器觸發(fā)相關(guān)閾值都會(huì)產(chǎn)生告警。
監(jiān)控大盤的定制做了大幅易用性改進(jìn),支持了圖表閾值,支持了圖表分類,新增圖表和排序管理都是可見即所得的方式,巡檢大盤的定制從此不再是困難。
Nightingale 是在 Open-Falcon 的基礎(chǔ)上衍化發(fā)展而來,Open-Falcon 作為國內(nèi)使用最廣泛的監(jiān)控解決方案之一,為 Nightingale 的設(shè)計(jì)開發(fā)提供了大量的借鑒意義。
與 Open-Falcon 的不同點(diǎn)
- 告警引擎重構(gòu):Open-Falcon 的告警策略,在監(jiān)控?cái)?shù)據(jù)推送上來的同時(shí)會(huì)觸發(fā)策略判斷,這種「推」的模式優(yōu)勢(shì)是策略的判斷時(shí)效性非常高,但是不利于更高級(jí)的告警策略的支持和擴(kuò)展,比如多條件的組合報(bào)警就很難支持。Nightingale 轉(zhuǎn)為推拉結(jié)合模式,通過推模式保證大部分策略判斷的效率,通過拉模式支持了與條件告警和nodata告警。
- 引入了導(dǎo)航對(duì)象樹:將 Open-Falcon 采用的扁平 HostGroup,轉(zhuǎn)為 Nightingale 的導(dǎo)航對(duì)象樹,對(duì)象樹本質(zhì)上是一種對(duì)監(jiān)控對(duì)象的分組管理機(jī)制,方便查找和查看監(jiān)控對(duì)象,以及對(duì)監(jiān)控對(duì)象設(shè)置監(jiān)控策略等管理動(dòng)作。 同時(shí)在 Nightingale 中,去除了告警模板的概念,告警策略直接與樹節(jié)點(diǎn)綁定,簡(jiǎn)化設(shè)計(jì),大幅提升靈活度和易用性。
- 索引模塊升級(jí)換代:Open-Falcon 使用 MySQL 存儲(chǔ) metrics 的索引數(shù)據(jù),在擴(kuò)展性和靈活性上存在瓶頸。Nightingale 根據(jù)監(jiān)控需求,設(shè)計(jì)開發(fā)了全新的內(nèi)存索引模塊 index,查詢方式更多樣,查詢效率更高,避免了原來 MySQL 索引數(shù)據(jù)達(dá)到億級(jí)別時(shí)面臨的維護(hù)優(yōu)化工作。
- 時(shí)序數(shù)據(jù)庫優(yōu)化:在 Open-Falcon 存儲(chǔ)模塊 Graph 的基礎(chǔ)上,引入 Facebook 的 Gorilla 壓縮方案,近期幾個(gè)小時(shí)的數(shù)據(jù)采用內(nèi)存存儲(chǔ),大幅提升數(shù)據(jù)查詢效率,長期數(shù)據(jù)仍然使用 rrdtool 數(shù)據(jù)格式存儲(chǔ)在硬盤上。同時(shí)進(jìn)一步完善了時(shí)序數(shù)據(jù)庫的性能和穩(wěn)定性。
- 告警引擎高可用改進(jìn):告警引擎 judge 模塊通過心跳機(jī)制做到了故障自動(dòng)摘除,再也不用擔(dān)心單個(gè) judge 宕機(jī)導(dǎo)致部分策略失效,需要人工介入的問題,index 模塊也是采用類似方式保證可用性。
- 原生內(nèi)置日志監(jiān)控功能:Nightingale 客戶端原生內(nèi)置了日志匹配和指標(biāo)抽取能力,在 web 控制臺(tái)頁面上支持了日志匹配規(guī)則的配置,同時(shí)也支持讀取目標(biāo)機(jī)器特定目錄下的配置文件的方式,讓業(yè)務(wù)指標(biāo)監(jiān)控更為易用。
- 可運(yùn)維性增強(qiáng):將 portal (falcon-plus 中的 api)、uic、dashboard、hbs、alarm 合并為一個(gè)模塊:monapi,簡(jiǎn)化了系統(tǒng)整體部署難度,原來的部分模塊間調(diào)用變成進(jìn)程內(nèi)方法調(diào)用,性能更高。
- 配置文件中心化:配置文件做了易用性改造,抽取數(shù)據(jù)庫通用配置到 mysql.yml,抽取端口實(shí)例地址等關(guān)聯(lián)配置到 address.yml,大批配置在代碼里給了默認(rèn)值,使得配置文件更清晰,易于維護(hù)。
與 Open-Falcon 的相同點(diǎn)
- 數(shù)據(jù)模型沒有變化,仍然是 metric、endpoint、tags 的組織方式,agent 基本是可以復(fù)用的,Nightingale 中的 agent 叫 collector,融合了原來 Open-Falcon 的 agent 和 falcon-log-agent 的邏輯,各種監(jiān)控插件也都是可以復(fù)用的。
- 數(shù)據(jù)流向和整體處理邏輯是類似的,仍然使用靈活的推模型,分為數(shù)據(jù)存儲(chǔ)和告警判斷兩條鏈路。
Nightingale 架構(gòu)?
- collector即agent,可以采集機(jī)器常見指標(biāo),原生支持日志監(jiān)控,支持插件機(jī)制,支持業(yè)務(wù)通過接口直接上報(bào)數(shù)據(jù);
- transfer提供rpc接口接收collector上報(bào)的數(shù)據(jù),然后通過一致性哈希,將數(shù)據(jù)轉(zhuǎn)發(fā)給多臺(tái)tsdb和多臺(tái)judge;
- tsdb即open-falcon中的graph組件,用于存儲(chǔ)歷史數(shù)據(jù),支持配置為雙寫模式提升系統(tǒng)容災(zāi)能力,tsdb會(huì)把監(jiān)控?cái)?shù)據(jù)轉(zhuǎn)發(fā)一份給index建索引;
- index是內(nèi)存索引模塊,替換原來的mysql方案,在內(nèi)存里構(gòu)建索引,便于后續(xù)數(shù)據(jù)檢索,在檢索的靈活性和檢索性能方面大幅提升;
- judge是告警引擎,從monapi(portal)同步監(jiān)控策略,然后對(duì)接收到的數(shù)據(jù)做告警判斷,如滿足閾值,則生成告警事件推送到redis隊(duì)列;
- monapi(alarm)從redis隊(duì)列中讀取judge生成的事件,進(jìn)行二次處理,補(bǔ)充一些元信息,生成告警消息,重新推送回redis隊(duì)列;
- 各發(fā)送組件,比如mail-sender、sms-sender等,從redis讀取告警消息,發(fā)送告警,抽象出各類sender是為了后續(xù)定制方便;
- monapi集成了原來多個(gè)模塊的功能,提供接口給js調(diào)用,api前綴為/api/portal,數(shù)據(jù)查詢走transfer,去除了 open-falcon 中原來的query組件,api前綴為/api/transfer,索引查詢的api前綴/api/index,于是,在前端統(tǒng)一搭建nginx,即可通過不同location將請(qǐng)求轉(zhuǎn)發(fā)到不同后端;
- 數(shù)據(jù)庫仍然使用MySQL,主要存儲(chǔ)的內(nèi)容包括:用戶信息、團(tuán)隊(duì)信息、樹節(jié)點(diǎn)信息、告警策略、監(jiān)控大盤、屏蔽策略、采集策略、部分組件心跳信息等;
仍在進(jìn)行中的工作?
- 提供監(jiān)控指標(biāo)聚合組件,現(xiàn)在的架構(gòu)可以解決機(jī)器級(jí)、模塊級(jí)的監(jiān)控,但是集群維度的監(jiān)控指標(biāo),是需要聚合整個(gè)集群的所有模塊、機(jī)器的指標(biāo),做一些加和、求平均之類的操作,相關(guān)聚合組件,我們?cè)诰o鑼密鼓的開源過程中;
- 與k8s無縫集成的工作,也在進(jìn)行之中;
- 完善更多監(jiān)控插件,之前Open-Falcon社區(qū)里的很多插件都是可以直接用的,我們會(huì)盡量補(bǔ)充社區(qū)沒有的插件,并對(duì)社區(qū)已有的插件,進(jìn)行二次整理和維護(hù),讓Nightingale周邊更完善;
聯(lián)系我們?
- 我們的官網(wǎng)是?https://n9e.didiyun.com,相關(guān)文檔會(huì)首發(fā)于此。
- 您可以在?Github?上關(guān)注?Nightingale,歡迎您試用和參與社區(qū)。
- 您可以通過滴滴云的夜鶯鏡像,一鍵安裝和體驗(yàn)。
致謝和說明
- Open-Falcon?是小米運(yùn)維團(tuán)隊(duì)開源的企業(yè)級(jí)監(jiān)控解決方案,在國內(nèi)廣泛使用。
- Nightingale?采用 Apache-2.0 開源協(xié)議,Copyright ? 滴滴 2020。
- 工業(yè)物聯(lián)網(wǎng)數(shù)據(jù)采集及監(jiān)控解決方案
- Ansible企業(yè)級(jí)自動(dòng)化運(yùn)維探索的詳細(xì)資料說明 2次下載
- 基于對(duì)等監(jiān)控網(wǎng)絡(luò)實(shí)現(xiàn)云監(jiān)控系統(tǒng)解決方案 0次下載
- 基于RIASOA的企業(yè)級(jí)應(yīng)用系統(tǒng)研究崔楠 0次下載
- 基于企業(yè)級(jí)信息集成平臺(tái)的數(shù)據(jù)存儲(chǔ)備份系統(tǒng)的構(gòu)建_王永平 0次下載
- 企業(yè)級(jí)路由器和家用路由器的區(qū)別 29次下載
- All_Flash_FAS_閃存性能絕配_功能豐富的企業(yè)級(jí)存儲(chǔ) 0次下載
- 閃存加速與云就緒:企業(yè)級(jí)應(yīng)用對(duì)存儲(chǔ)提出的全新要求 0次下載
- 安全監(jiān)控系統(tǒng)解決方案 0次下載
- 箱式門禁監(jiān)控解決方案 0次下載
- 無線傳輸視頻監(jiān)控解決方案 198次下載
- 大型企業(yè)園區(qū)聯(lián)網(wǎng)監(jiān)控解決方案 30次下載
- 企業(yè)級(jí)證券信息系統(tǒng)平臺(tái)(ECSN)
- 基于Domino的企業(yè)級(jí)工作流引擎
- 基于Struts2企業(yè)級(jí)異常處理研究及擴(kuò)展
- Nightingale夜鶯監(jiān)控部署安裝和使用 3078次閱讀
- 企業(yè)級(jí)SSD性能和功耗模型 1841次閱讀
- 浪潮信息企業(yè)級(jí)SSD:如何在PCIe生態(tài)下,提升NAND信號(hào)質(zhì)量 1126次閱讀
- 詳解Zabbix分布式監(jiān)控平臺(tái)建設(shè) 888次閱讀
- 選擇AlmaLinux作為CentOS替代方案的一些原因 2345次閱讀
- 淺談企業(yè)級(jí)應(yīng)用的SLA對(duì)云服務(wù)的挑戰(zhàn) 1273次閱讀
- 基于FPGA的PSM實(shí)現(xiàn)解決企業(yè)級(jí)應(yīng)用的閃存問題 997次閱讀
- 技術(shù) | 傳感器性能如何支持狀態(tài)監(jiān)控解決方案? 2929次閱讀
- 憶芯科技利用Veloce 硬件加速仿真平臺(tái)進(jìn)行高速企業(yè)級(jí)固態(tài)硬盤存儲(chǔ)設(shè)計(jì) 1815次閱讀
- 解析SD-WAN技術(shù),企業(yè)級(jí)廣域網(wǎng)未來之秀! 1404次閱讀
- 基于ARM的無線視頻監(jiān)控系統(tǒng)的解決方案 2606次閱讀
- SLOC技術(shù)提供高清網(wǎng)絡(luò)安防監(jiān)控解決方案 2061次閱讀
- 常見企業(yè)級(jí)SSD故障電源可靠性分析詳解 3978次閱讀
- Micron用于PCIe插槽的2.5英寸企業(yè)級(jí)SSD解決方案 2592次閱讀
- 淺談車載視頻監(jiān)控系統(tǒng)解決方案發(fā)展 2885次閱讀
下載排行
本周
- 1人形機(jī)器人電機(jī)驅(qū)動(dòng)和傳感報(bào)告
- 4.27 MB | 9次下載 | 免費(fèi)
- 2Altium Designer元件庫
- 17.11 MB | 6次下載 | 免費(fèi)
- 324V2A開關(guān)電源PCB資料分享
- 0.23 MB | 4次下載 | 1 積分
- 4GD100PIX120C6SNA規(guī)格書
- 0.98 MB | 3次下載 | 免費(fèi)
- 5Multisim模擬電路仿真教程
- 1.93 MB | 1次下載 | 3 積分
- 6BK7258英文規(guī)格書
- 1.67 MB | 1次下載 | 免費(fèi)
- 7RA4L1硬件手冊(cè)
- 21.89 MB | 1次下載 | 免費(fèi)
- 8RA4L1_SENSOR-V1原理圖
- 754.36 KB | 1次下載 | 免費(fèi)
本月
- 1晶體三極管的電流放大作用詳細(xì)說明
- 0.77 MB | 32次下載 | 2 積分
- 2雙極型三極管放大電路的三種基本組態(tài)的學(xué)習(xí)課件免費(fèi)下載
- 4.03 MB | 25次下載 | 1 積分
- 3AIWA HS-J303 MKⅡ維修手冊(cè)
- 22.47 MB | 24次下載 | 10 積分
- 4九陽豆?jié){機(jī)高清原理圖
- 2.47 MB | 23次下載 | 1 積分
- 5多級(jí)放大電路的學(xué)習(xí)課件免費(fèi)下載
- 1.81 MB | 21次下載 | 2 積分
- 6AIWA HS-J202/HS-J202M/HS-J800維修手冊(cè)
- 13.60 MB | 16次下載 | 10 積分
- 7東芝彩色電視機(jī)29SF6C維修說明書
- 4.86 MB | 9次下載 | 1 積分
- 8人形機(jī)器人電機(jī)驅(qū)動(dòng)和傳感報(bào)告
- 4.27 MB | 9次下載 | 免費(fèi)
總榜
- 1matlab軟件下載入口
- 未知 | 935127次下載 | 10 積分
- 2開源硬件-PMP21529.1-4 開關(guān)降壓/升壓雙向直流/直流轉(zhuǎn)換器 PCB layout 設(shè)計(jì)
- 1.48MB | 420063次下載 | 10 積分
- 3Altium DXP2002下載入口
- 未知 | 233089次下載 | 10 積分
- 4電路仿真軟件multisim 10.0免費(fèi)下載
- 340992 | 191382次下載 | 10 積分
- 5十天學(xué)會(huì)AVR單片機(jī)與C語言視頻教程 下載
- 158M | 183338次下載 | 10 積分
- 6labview8.5下載
- 未知 | 81586次下載 | 10 積分
- 7Keil工具M(jìn)DK-Arm免費(fèi)下載
- 0.02 MB | 73814次下載 | 10 積分
- 8LabVIEW 8.6下載
- 未知 | 65988次下載 | 10 積分
評(píng)論