一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

使用NetQ實現(xiàn)全網(wǎng)可觀察性排除網(wǎng)絡故障

星星科技指導員 ? 來源:NVIDIA ? 作者:Michael Kashin ? 2022-04-17 10:25 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

EVPN已成為現(xiàn)代數(shù)據(jù)中心架構的標準解決方案。對于終端用戶來說,受益于基于BGP的控制平面所具有的穩(wěn)定性,EVPN提供了擴展其廣播域的靈活性。但這些增加的益處是以提高配置的復雜性為代價的。

當前所面對的不再是相對固定、簡單,可以通過維護人員直觀分析來發(fā)現(xiàn)錯誤的網(wǎng)絡配置。真正的生產性EVPN配置可能包括多個深度嵌套結構,而且隨網(wǎng)絡中的租戶數(shù)量成比例增長。

EVPN配置復雜性可以且必須通過適當?shù)淖詣踊鉀Q方案予以解決,這可以減少人為出錯的可能性,而NVIDIA Cumulus Linux正是解決該問題的合適解決方案。但僅有自動化還不夠,錯誤仍然可以通過數(shù)據(jù)源引入系統(tǒng),例如配置管理數(shù)據(jù)庫(CMDB)的人為錯誤。

可觀察性的重要性

這就是為什么對于任何具有合理復雜程度的基礎設施,用戶應該有辦法來采集各類日志、指標,并且調試、輸出、匯總、關聯(lián)和處理這些信息,從而嘗試推斷系統(tǒng)的內部狀態(tài)。實現(xiàn)這一點的能力通常被稱為系統(tǒng)的“可觀察性”,而且隨著底層基礎設施復雜性的增加,它正變得日益重要。在CNCF云原生環(huán)境 中,“可觀察性和分析”部分不斷增長的項目數(shù)量已證明了這一全行業(yè)趨勢。對此,NVIDIA也持同樣的觀點。

poYBAGJberaAJ0rLAADZzd8xRh8409.png

圖 1 數(shù)據(jù)中心演進

通過NetQ實現(xiàn)的全網(wǎng)可觀察性

長期以來,整個網(wǎng)絡的可觀察性僅限于拓撲視圖——有些圖包括從物理鏈接到L2,L3接口再到控制平面協(xié)議等不同層次的細節(jié)。但這些代表高層次意圖的圖只有在有人維護時才能保證準確。它們永遠無法反映每個設備中所包含的網(wǎng)絡的實際狀態(tài)。NetQ在設計上解決了這些問題并為整個網(wǎng)絡的運行狀態(tài)提供了一個統(tǒng)一的觀察窗口。

一方面,NetQ從其遠程代理處收集和匯總多項指標,這些代理可能運行在網(wǎng)絡交換機、通用計算服務器等任何位置。這些指標包括但不限于:接口統(tǒng)計和利用率、LLDP、MAC、ARP/ND和IP路由表、BGP、MLAG和OSPF的控制面狀態(tài),以及用于幫助診斷任一數(shù)據(jù)平面丟包的故障快照(What Just Happened)事件。

另一方面,NetQ使用這些指標來推斷網(wǎng)絡的內部狀態(tài)并作出針對協(xié)議的診斷。這些檢查包括從簡單的MTU和鏈路狀態(tài)一致性到BGP和EVPN狀態(tài)驗證再到端到端連接性測試。

故障排除演示

在這篇文章中,將演示如何使用NetQ來排除一些使用以下拓撲結構的常見配置錯誤。葉節(jié)點被配置為MLAG對,并且該結構內部正在運行帶有對稱IRB的EVPN和基于PIM的BUM復制 。

pYYBAGJbereAEVLbAADJpTIgeMY040.png

圖 2 NVIDIA 空氣中的拓撲

環(huán)境設置

該測試拓撲結構可以在名為NVIDIA Air的云基礎設施模擬平臺上啟動。如要了解更多信息,請參閱《NVIDIA Air用戶指南》。

1、選擇創(chuàng)建模擬、演示市場和使用NetQ的網(wǎng)絡故障排除選項卡。

在接下來的部分中,將討論各種故障排除情景,并展示NetQ如何幫助確定問題的來源。

情景1:服務器01無法與服務器02通信

第一個問題很簡單:兩臺服務器都連接到同一對葉節(jié)點交換機上,因此需要檢查的地方僅限于以下幾個方面:

所有服務器鏈接的L1和Bond接口配置

peerlink的MLAG狀態(tài)和配置

vlan 10和vlan 20的L3和VRR接口配置

通過NetQ,只需點擊幾下就可以完成所有這些檢查。

1、在模擬頁面,選擇啟動NetQ,輸入用戶名和密碼

2、在工作臺標題中,選擇驗證并創(chuàng)建一個新的MLAG驗證。

poYBAGJberiAUYTRAACgjYzzLkI801.png

圖 3 情景 1 結果

當驗證完成后,NetQ發(fā)現(xiàn)雙宿設備有四個錯誤。對于每一個出現(xiàn)錯誤的檢查,用戶都可以查看更詳細的信息并了解NetQ認為的錯誤是什么。

pYYBAGJberiAP0UWAADV9rGGj0g820.png

圖 4 場景# 1 詳細信息

在本情景中,NetQ清楚地指向接口bond1的VLAN配置,現(xiàn)在可以通過登錄和比較兩臺葉節(jié)點交換機上的配置來進行快速驗證和糾正。

用戶可按照實驗指導來依次解決問題。

第二個情景涉及VXLAN EVPN結構上的VLAN內通信。這種故障的常用故障排除流程可能涉及以下步驟:

1、確認所有BGP會話都已建立,并且所有對等層的EVPN地址族都已啟用。

2、確認所有四個葉節(jié)點交換機上的VLAN至VNI映射是一致的。

3、確保導出和導入所需的Type-2路由使用同一組路由目標。

4、檢查BGP是否被配置為發(fā)布所有已配置的VNI。

必須在所有葉節(jié)點交換機上比較這些數(shù)值。下面將展示用NetQ檢查上述信息有多么簡單。

1、在主工作臺標題選擇選項卡并打開EVPN會話選項卡。

2、在全屏視圖中打開此選項卡,查看所有會話屏幕(圖5)。

情景2:服務器01無法與服務器04通信

poYBAGJbermAfnM5AAEx2HzVOIU629.png

圖 5 場景# 2 詳細信息

現(xiàn)在可以在屏幕上看到所有的相關值,這些值以表格的形式呈現(xiàn)并且可以進行排序及過濾以縮小搜索范圍。在該情景中,很容易發(fā)現(xiàn)葉節(jié)點01/02和葉節(jié)點03/04之間Vlan10的VNI映射差異。

用戶可按照實驗指導依次解決問題。

情景3:服務器01無法與服務器05通信

最后一個情景涉及VXLAN EVPN的VLAN間對稱路由。這次,需要驗證的內容有所增加,包括以下額外步驟:

每個VRF的BGP配置和會話狀態(tài)

EVPN 5型路由在葉節(jié)點交換機之間的傳播

檢查L3 VNI的配置是否一致以及每個MLAG對是否有唯一的Router MAC

L3 VNI到VRF在所有交換機上的映射

通過NetQ EVPN驗證功能,所有這些假設都可以在幾秒鐘內得到驗證。

1、在主工作臺標題中選擇驗證并創(chuàng)建一個新的按需EVPN驗證。幾秒鐘后,用戶即可看到結果(圖6)

poYBAGJberqAGQUBAAClzuIlf2s179.png

圖 6 情景# 3 結果

通過點擊VRF一致性警告,用戶可以清楚地看到錯誤位置。解決問題的時間縮短到幾秒鐘,管理員現(xiàn)在可以繼續(xù)糾正葉節(jié)點03/04上的VNI至VRF映射。

pYYBAGJberuARagmAACxAkqRBLI404.png

圖 7 場景# 3 詳細信息

請查看實驗室指南,了解解決這個問題所需的具體指令。

總結

在這篇文章中,展示了NetQ根據(jù)管理設備采集的各種指標來分析和推斷網(wǎng)絡狀態(tài)的能力。以上三個情景展示了如何利用NetQ的驗證和協(xié)議專用選項卡將根本原因分析的時長從幾分鐘或幾小時縮短到幾秒鐘。這些驗證可以按需求運行,也可以定期運行,甚至可以在過去的數(shù)據(jù)上運行,這是因為所有日志都存儲在一個時間序列數(shù)據(jù)庫中。

NetQ的能力遠遠超出了這篇文章中所展示和討論的內容,并且其功能還包含設備庫存、軟件生命周期管理、基于閾值的警報以及與第三方平臺(如Slack、PagerDuty和Grafana)的集成。NetQ將繼續(xù)擴展并增加更多的功能和第三方集成,在未來為用戶創(chuàng)造更多價值。

關于作者

Michael Kashin 是 NVIDIA 網(wǎng)絡組的解決方案架構師,專注于數(shù)據(jù)中心、自動化和可觀測性。他對軟件開發(fā)、網(wǎng)絡和云本地技術有著濃厚的興趣,并熱衷于利用自己的知識和專長幫助客戶解決業(yè)務問題。在 2021 年加入 NVIDIA 之前, Michael 曾為多家技術供應商工作,幫助他們的客戶構建云并開發(fā)基礎設施管理軟件。

審核編輯:郭婷

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • NVIDIA
    +關注

    關注

    14

    文章

    5284

    瀏覽量

    106128
  • 服務器
    +關注

    關注

    13

    文章

    9759

    瀏覽量

    87655
  • 數(shù)據(jù)中心

    關注

    16

    文章

    5190

    瀏覽量

    73380
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    RS-485網(wǎng)絡故障查找與排除

    RS-485網(wǎng)絡故障查找與排除盡管更加現(xiàn)代化的替代技術日益增多,但RS-485技術仍然在無數(shù)的通信網(wǎng)絡中保持著中流砥柱的地位。以下是檢查常見故障和建立比較麻煩的RS-485
    發(fā)表于 02-26 15:37

    集中式網(wǎng)絡故障診斷

    集中式網(wǎng)絡故障診斷
    發(fā)表于 08-08 14:22

    使用Percepio的Tracealyzer和DevAlert實現(xiàn)FreeRTOS的可觀察!

    時間線、事件日志、CPU負載圖、內存使用情況、任務依賴關系和許多其他有用的可視化結果。這些功能有助于實現(xiàn)可觀察。您可以在FreeRTOS應用程序的深層追蹤任務以及內核API調用。下圖是在筆記本電腦上運行
    發(fā)表于 05-18 13:41

    巧用Ping和Traceroute命令排除網(wǎng)絡故障

    在分析Ping 和Traceroute 命令工作原理和影響因素的基礎上,詳細介紹了使用Ping 和Traceroute 命令檢查網(wǎng)絡連接、查看信息路徑從而排除網(wǎng)絡故障的方法和技巧。p
    發(fā)表于 08-11 08:25 ?35次下載

    局域網(wǎng)網(wǎng)絡故障排除策略

    局域網(wǎng)網(wǎng)絡故障排除策略 【簡 介】當我們組建好了一個小型網(wǎng)吧后,為了使網(wǎng)吧運轉正常,網(wǎng)絡維護就顯得很重要了。由于網(wǎng)絡協(xié)議和網(wǎng)絡設備的復雜
    發(fā)表于 08-01 10:53 ?489次閱讀

    筆記本網(wǎng)絡故障排除

    電子發(fā)燒友為您提供了筆記本網(wǎng)絡故障排除,幫助你解決 筆記本 出現(xiàn)網(wǎng)絡故障時對您的干擾,希望對您有所幫助!
    發(fā)表于 07-11 16:11 ?195次下載
    筆記本<b class='flag-5'>網(wǎng)絡故障</b><b class='flag-5'>排除</b>

    朗訊ATM網(wǎng)絡故障案例分析

    朗訊ATM網(wǎng)絡故障案例分析
    發(fā)表于 09-05 09:22 ?3次下載

    智能網(wǎng)絡故障管理系統(tǒng)

    當前網(wǎng)絡故障管理系統(tǒng)正朝著自動化智能化的方向發(fā)展。為了提高傳統(tǒng)網(wǎng)絡故障管理系統(tǒng)的智能化水平,基于專家系統(tǒng)規(guī)則引擎Jess和SNMP協(xié)議,設計了一個智能網(wǎng)絡故障管理系統(tǒng)。該系統(tǒng)可實時監(jiān)控被管網(wǎng)絡
    發(fā)表于 11-11 15:47 ?4次下載
    智能<b class='flag-5'>網(wǎng)絡故障</b>管理系統(tǒng)

    16個網(wǎng)絡工程師常用的網(wǎng)絡故障排除工具

    網(wǎng)絡故障排除對于網(wǎng)絡技術專家和網(wǎng)絡工程師是頗具挑戰(zhàn)的工作。每當添加新的設備或網(wǎng)絡發(fā)生變更時,新的問題就會出現(xiàn),而且很難確定問題出在哪里。每一
    的頭像 發(fā)表于 08-25 11:37 ?1.1w次閱讀

    NVIDIA NetQ使網(wǎng)絡工作流程更易于故障排除和自動化

    NVIDIA NetQ 是一種高度可擴展的現(xiàn)代網(wǎng)絡操作工具,為 NVIDIA Spectrum Ethernet 平臺提供可操作的可見性。它將高級遙測技術與用戶界面相結合,使網(wǎng)絡工作流程更易于
    的頭像 發(fā)表于 06-15 10:44 ?1652次閱讀

    網(wǎng)絡故障排查思路和處理方法

    網(wǎng)絡故障是最容易出現(xiàn)的,且難以解決的問題。本文提供的網(wǎng)絡故障排查思路和處理方法,可解決日常工作中大部分網(wǎng)絡問題。
    發(fā)表于 10-31 09:14 ?1.1w次閱讀

    虹科分享 | NetFlow數(shù)據(jù)能夠為網(wǎng)絡故障排除提供什么? | 網(wǎng)絡流量監(jiān)控

    虹科分享NetFlow數(shù)據(jù)能夠為網(wǎng)絡故障排除提供什么?NetFlow是網(wǎng)絡設備中標準化的功能,用于收集流量測量值并將其導出到另一個系統(tǒng)進行分析。對該流數(shù)據(jù)的分析通知網(wǎng)絡管理器
    的頭像 發(fā)表于 04-20 09:26 ?892次閱讀
    虹科分享 | NetFlow數(shù)據(jù)能夠為<b class='flag-5'>網(wǎng)絡故障</b><b class='flag-5'>排除</b>提供什么? | <b class='flag-5'>網(wǎng)絡</b>流量監(jiān)控

    RJ45網(wǎng)絡故障排除技巧 RJ45網(wǎng)線的長度對信號影響

    RJ45網(wǎng)絡故障排除技巧 在網(wǎng)絡故障排除中,RJ45網(wǎng)線是連接設備的關鍵部分。了解RJ45網(wǎng)線的特性和可能的問題可以幫助我們更有效地解決網(wǎng)絡
    的頭像 發(fā)表于 12-17 15:31 ?1675次閱讀

    網(wǎng)絡故障排除基本指南

    本文提供了一份關于網(wǎng)絡故障排除的全面指南,涵蓋了故障排除的基本步驟和技巧,強調了獲得全面可見性的重要。通過詳細的分析和實際案例,您將學習如
    的頭像 發(fā)表于 01-14 17:49 ?718次閱讀
    <b class='flag-5'>網(wǎng)絡故障</b><b class='flag-5'>排除</b>基本指南

    光通信網(wǎng)絡故障排除技巧

    光通信網(wǎng)絡以其高速、大容量和抗干擾在現(xiàn)代通信系統(tǒng)中占據(jù)著舉足輕重的地位。然而,隨著網(wǎng)絡規(guī)模的擴大和復雜的增加,故障
    的頭像 發(fā)表于 01-23 09:42 ?743次閱讀