網絡收斂時間測試技術介紹_第1頁
網絡收斂時間測試技術介紹_第2頁
網絡收斂時間測試技術介紹_第3頁
網絡收斂時間測試技術介紹_第4頁
網絡收斂時間測試技術介紹_第5頁
已閱讀5頁,還剩2頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、最新網絡收斂時間測試技術介紹2010-10-3摘要介紹了實現網絡快速收斂的相關協議以及引起收斂的原因,IXIA正在申請專利的集成在IxNetwork產品中TrueView網絡收斂時間測試技術和傳統(tǒng)技術的差異。1  引言收斂(Convergence)描述了網絡從故障恢復以及網絡變更的方式?,F代網絡通過提供冗余或備用路徑來應對預期的網絡故障。故障倒換是指網絡自動檢測服務中斷和調整并切換到備用路徑的過程。重路由的信息流重新歸并到無故障路徑某點時,傳輸網絡即發(fā)生了收斂。與之相反,故障倒回則是指修復服務中斷后網絡恢復至初始鏈路的過程。圖1描述了一個“客戶端”計算機請求從“服務器”獲得信息所經過

2、的大型網絡的很小部分。這些信息正常情況下由路由器R1,R2,主鏈接和路由器R3轉發(fā)。想像一下,如果主鏈接可能因物理切斷,路由器R3故障,網絡過載或其他原因而中斷的情況。路由器R2將首先發(fā)送連接中斷通知,由于和“客戶端”沒有其他連接,連接中斷將會反饋到路由器R1。路由器R1查找到“客戶端”的備用路徑,并找到通過路由器R4,R6,備用鏈接和路由器R3連接的路徑。網絡信息流在下面這條路徑上轉發(fā)。路徑收斂于路由器R3,首次服務中斷到路由器R3重新恢復全部流量轉發(fā)之間的間隔時間就是收斂時間。圖1  故障恢復過程示意圖從技術上而言,所有受影響路由從主路徑切換到備用路徑后網絡路由收斂才會視為完成。

3、2  網絡收斂時間測試方案2.1  實現快速收斂的協議介紹在OSI模型的第2層,如果出現鏈接故障或網絡變更,STP,RSTP,MSTP和LDP/RSVP-TE等交換協議便會提供流量重定向機制。如果出現鏈接或網絡故障,第3層的RIP,OSPF,ISIS和BGP等路由協議有能力重路由IP流量。這些傳統(tǒng)技術需要數秒方可完成,實際時間取決于其所處理網絡的規(guī)模和復雜性。下一代網絡要求快得多的恢復時間,以滿足其高可用性要求。為實現快速故障倒換時間,眾多擴展協議和新協議已被使用。這些協議包括:(1)平滑無中斷重啟:路由器向鄰近路由器發(fā)送其正在重啟路由過程的消息,并要求鄰近路由器在其重啟期

4、間繼續(xù)轉發(fā)數據包。(2)虛擬路由器冗余協議(VRRP):定義并宣告一個“虛擬的”路由器為網關,兩個或更多路由器為該網關提供服務。(3)MPLS快速重路由:本地網絡保護恢復機制。每條LSP均受備用路徑保護。此機制滿足實時應用要求,可以達到SONET環(huán)路不到50ms的恢復時間。(4)雙向轉發(fā)檢測:一種簡單、高速的HELLO協議,可提供低開銷、短期(低至1ms)的路徑故障檢測。(5)OAM/CFM鏈接:提供以太網鏈接和服務故障檢測和隔離。CFM可以完成低至10ms的服務中斷檢測的時間。(6)協議計時器設置:網絡通常使用路由協議的相對低速的HELLO機制,在硬件沒有發(fā)送求助信號時檢測故障。許多計時器均

5、可以調低以減少反應時間。服務提供商在服務等級協議(SLA)中向企業(yè)客戶保證其服務的可靠性級別,通常為99.999%。這聽起來毫無價值,但99.999%可靠性保證意味著一年中斷累計時間超過5min。此項極富挑戰(zhàn)性的要求導致網絡服務提供商實施多項功能,最大限度地縮短故障時間,加快收斂時間。受故障倒換影響的不僅僅是路由協議。路由器還需要轉發(fā)大量流量,同時執(zhí)行服務質量(QoS)和其他策略。信息服務器和負載均衡設備必須對付丟棄的包文和連接的沖擊。因此,收斂測試必須在網絡流量模仿用戶真實負載的環(huán)境中進行。2.2  網絡中斷的原因網絡連接中斷的原因有很多,從明顯的電源故障或線路切斷到設備配置錯誤,

6、或軟件錯誤和升級導致的故障。以下的討論旨在調查不同網絡堆棧等級造成或發(fā)生的故障。(1)第1層物理層中斷導致物理層網絡中斷的故障范例包括:斷電。即使是短暫的停電也會導致故障發(fā)生。線路切斷。瞬時故障可視為線路切斷所致。設備故障??赡苁请娫垂收希瑩p壞的內存,CPU插件故障或接口插件故障所致。SONET網絡包括此類故障的內置保護部件,但以太網沒有此類內置保護部件。雖然物理網絡連接擁有許多可行的選擇,但以太網將作為下一代網絡選擇的要素顯而易見。無論以太網鏈接使用的是銅線還是光纖,物理層設備(PHY)的管理界面只提供最低的鏈接故障可見度。至于網絡接口方面,鏈接要么接上,要么沒有接上。有效監(jiān)測鏈接狀況必須用

7、到如OAM鏈接等更高級別的協議。(2)第2層數據連接層中斷交換機是第2層最常見的設備。導致第2層故障的原因可歸類如下:容量。MAC地址數目達到容量極限。環(huán)境。環(huán)境過熱可導致設備無法正常運行。硬件/軟件故障。如果沒有妥善規(guī)劃并測試,IT網絡操作人員移動、添加和更改軟、硬件均會誘導硬件或軟件故障。事件。認證問題(例如802.1x)、互操作性或配置錯誤。故障發(fā)生的方式各種各樣,包括流量泛濫或突降、流量受損、連接中斷、高延時以及低性能、導致性能下降的間歇性流量突降、網絡連接受限。數據鏈接層使用的大多數協議均沒有提供連接故障檢測機制。舉例來說,ARP協議被用于映射主機MAC地址到第3層IP地址,但是如果

8、ARP失效,便沒有任何恢復機制了。有幾種協議可解決第2層的故障,其中包括生成樹,鏈接OAM,服務OAM,MPLS/RSVP-TE和BFD。STP,RSTP和MSTP等以太網生成樹協議用于為交換網絡提供冗余。這要求網絡管理員仔細配置,以取得最佳性能,但仍然不會迅速收斂。目前,有許多新協議正在加以標準化,以實現50ms或用時更少的收斂時間。目前,可用的快速故障檢測和恢復的協議包括第2層(鏈接OAM,服務OAM,RSVP-TE快速重路由)和第3層(OSPF快速發(fā)送HELLO,雙向轉發(fā)檢測BFD,虛擬路由器冗余協議VRRP)。這些協議旨在檢測故障,但通常需要與其他路由協議搭配使用,才能完成故障恢復。(

9、3)第3層網絡層中斷路由器是第3層最常見的設備,盡管許多其他設備也擁有路由功能。導致第3層故障的問題可劃分為以下類別:容量。超出ARP或IP轉發(fā)地址表的大小。環(huán)境。導致CPU過熱或電源故障的溫度問題可導致運行中斷。硬/軟件故障。IT網絡操作人員移動、添加和更改軟、硬件會誘導硬件或軟件故障。事件。鏈接中斷等網絡故障會誘發(fā)其他問題,如配置錯誤備份或過濾/重新分配路由問題。故障發(fā)生的方式各種各樣,包括導致間歇性連接或受影響網絡連接中斷的路由問題、導致連接中斷的鄰接中斷、導致服務退化的路由拍打。在網絡層,互聯網協議(IP)是主導技術。IP取決于第1層和第2層是否“正常”運行。IP本身無連接,也就是說,

10、它不存在端對端連接的概念。每個路由器均擁有路由/轉發(fā)地址表,并依據此表以及數據包內的IP地址確定其接受的數據包將發(fā)往何處。路由/轉發(fā)信息由一種或多種路由協議提供(如RIP,OSPF,ISIS和BGP)。網絡發(fā)生故障時,距離故障最近的路由器上運行的路由協議將會發(fā)出故障通知,并通知其他路由器。這會導致流量重路由至備用路徑(如果可用的話)。發(fā)現有故障存在需要時間。舉例來說,如果路由器上的OSPF停止運行,它的鄰近路由器需要花費4次“HELLO”時間,典型是40s才能意識到鄰近路由器停止了運行。數秒中斷恢復時間對于純數據網絡是可以接受的,但依照現在的標準衡量則太長了。雖然計時器可以調整,但它們仍無法達

11、到所要求的低于100ms時間的標準。即使及時通知中斷發(fā)生的地點(取決于中斷實際發(fā)生的地點以及網絡內擁有的跳數),傳播網絡變化仍需要時間。在這段時間內,流量會被轉發(fā)至所謂的“黑洞”。當路由器試圖傳輸在路由/轉發(fā)地址表中不存在條目的數據包時,數據包會被丟棄。2.3  收斂時間測試收斂時間會直接影響用戶對質量的體驗。服務中斷會很快被注意到,尤其是服務中斷重復出現時。消費者在選擇服務提供商時擁有相當大的自由度;他們會在數據包丟失時更換服務提供商。測量服務中斷發(fā)生之時到服務完全恢復之間的收斂時間是衡量服務提供商工作的關鍵指標。幾秒鐘的收斂時間可使用秒表進行測量。數百毫秒的收斂時間可使用容易操作

12、的技術進行測量。新協議要求關注特別關注細節(jié)。(1)收斂時間測試的傳統(tǒng)方法最常用的確定收斂時間測試方法如圖2所示。圖2  傳統(tǒng)的收斂時間測量方法被測試系統(tǒng)(SUT)由位于“云”下的一個或多個路由器組成。這些路由器被假定配置為“主鏈接”不可用時會立即使用“備用連接”。三個測試端口用于測試SUT。測試時,數據會以恒定速率進行傳輸,同時統(tǒng)計測試端口2和測試端口3接收的數據包數量。在無故障狀態(tài)下,流量會從測試端口1流向測試端口2。模擬的線路斷開地點位于測試端口2。SUT會及時通知線路斷開故障,流量會被重路由至測試端口3。轉換期間丟失的數據包數量可用于測量收斂時間。舉例來說,如果測試端口1的固定

13、傳輸速率為每秒1,000幀,丟失的數據包數量為2,500,則收斂時間為2.5s。此類測試很容易編程;它僅需要其運行的時間超過預計的收斂時間即可。此種測量方法非常簡單,圖3詳細說明了此類測量方法的理想流量速率。這有可能是最簡單的網絡范例,即僅需要撤消并重新宣告一條路由即可。圖3  簡單的收斂特性(2)收斂時間測試的更好方法在許多路由不得不從測試端口2轉移到測試端口3的情況下,實際流量切換會逐步完成(見圖4)。圖4  更實際的收斂特性當每條路由切換完成后,該路由對應的流量便開始出現在“備用鏈接”上。直到最后一條路由完成轉換后,收斂方才算完成。某些時段一些流量變化明顯,在較大規(guī)模

14、的網絡內,這些流量可能對應承擔大部分網絡流量傳輸的一條路由。很顯然,測試端口1發(fā)送的測試流量必須使用SUT支持的所有地址范圍。為說明收斂逐步完成的特性,必須采用一些采樣方法。最常用的兩種方法有:高速采樣。測試端口2的接收速率必須盡可能快的測量,直到其達到傳輸速率為止。測量速率通常由計算機控制,測量的精度由測試應用程序決定,通常為510ms。捕獲緩沖區(qū)。測試端口2接收的數據捕獲放在緩沖區(qū)內。時間戳記數據會再次進行后置處理,以顯示不斷變化的接收速率。此法可揭示眾多詳細信息,但卻受捕獲緩沖區(qū)大小的限制。實際上,此法與高速采樣法的精度通常相同。除有限的分辨率和精度之外,上述方法均未能準確與導致故障轉移

15、的事件相互關聯。(3)IXIA的TrueView收斂測試技術需要更先進的技術來關聯鏈接中斷或鄰近設備故障等事件發(fā)生的時間。下面以更復雜的范例來說明此項要求(見圖5)。圖5  復雜收斂測試案例提供商出口邊緣路由器(PE路由器)會發(fā)送測試端口2故障通知。該路由器會刪除測試端口2后面的仿真網絡路由地址表項目,并向鄰近路由器發(fā)送撤消消息。每個路由器會依次向其鄰近路由器發(fā)送撤消消息,直至消息到達入口PE路由器為止。該路由器會將流量切換到底下的備用路徑。為準確測量最初事件到流量恢復之間的收斂時間,IXIA開發(fā)出一項叫做TrueView收斂的技術(正在申請專利),與IXIA網絡基礎設施旗艦測試應用

16、程序IxNetwork完美結合后,TrueView擁有業(yè)內最全面的收斂測試功能。為理解TrueView的工作方式,弄清入口PE路由器在收到鄰近路由器發(fā)送的撤消消息時執(zhí)行的過程至關重要。如圖6所示,入口PE路由器收到鄰近路由器發(fā)送的一系列“路由撤消”消息。每條撤消消息處理之后,一條新的路由通知會被發(fā)送至底層鄰近的P鄰居路由器,對應該路由的流量會被立即轉發(fā)。這表明,故障倒換并非單點事件,而是漸進的過程。圖6  路由收斂過程圖7詳細說明了測試端口1和測試端口2在收斂時間測量期間的接收流量速率。獨特的TrueView測量方法是CP/DP收斂時間。它清晰地說明了SUT完全收斂所需的時間,收斂始

17、于啟動收斂的事件(tEvent,本例為連接中斷),終于測試端口3通過備用連接上接收指定流量速率(接收閾值)。表1對此和其他關鍵的收斂時間指標作了詳細說明。圖7  TrueView運行表1  TrueView測量方法TrueView使用快速檢測接收速率,并與事件時間戳(測試端口3接收最后一個數據包和測試端口2接收第一個數據包之時)協作,進行高精度測量。所有TrueView測量方法均可精確到1ms之內。如前所述,路由器需要在收斂期間同時處理大量的撤消和通告。路由器使用復雜的算法來處理這些操作。舉例來說,如果路由器的算法設計偏向/8網絡,非常重要的則只是測量這些路由的收斂時間。TrueView旨在提供這些測量方法。除了提供對在測試端口2和測試端口3接收到的匯聚流量進行收斂時間測量之外,TrueView還提供了單條路由或任意路由組的相同信息。TrueView可用于驗證首選路由范圍獲得優(yōu)先處理,從而獲得更低的收斂時間。TrueView具備的強大

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論