


版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、資料編碼資料編碼s s 系列交換機系列交換機istackistack 堆疊技術(shù)白皮書堆疊技術(shù)白皮書文檔版本文檔版本發(fā)布日期發(fā)布日期v2.02019-08-20華為技術(shù)有限公司華為技術(shù)有限公司istack 堆疊技術(shù)白皮版權(quán)所有版權(quán)所有 華為技術(shù)有限公司 華為技術(shù)有限公司 2015 2015。 保留一切權(quán)利。保留一切權(quán)利。非經(jīng)本公司書面許可,任何單位和個人不得擅自摘抄、復(fù)制本文檔內(nèi)容的部分或全部,并不得以任何形式傳播。商標(biāo)聲明商標(biāo)聲明和其他華為商標(biāo)均為華為技術(shù)有限公司的商標(biāo)。本文檔提及的其他所有商標(biāo)或注冊商標(biāo),由各自的所有人擁有。注意注意您購買的產(chǎn)品、服務(wù)或特性等應(yīng)受華為公司商業(yè)合同和條款的約束,
2、本文檔中描述的全部或部分產(chǎn)品、服務(wù)或特性可能不在您的購買或使用范圍之內(nèi)。除非合同另有約定,華為公司對本文檔內(nèi)容不做任何明示或默示的聲明或保證。由于產(chǎn)品版本升級或其他原因,本文檔內(nèi)容會不定期進行更新。除非另有約定,本文檔僅作為使用指導(dǎo),本文檔中的所有陳述、信息和建議不構(gòu)成任何明示或暗示的擔(dān)保。華為技術(shù)有限公司地址:網(wǎng)址:深圳市龍崗區(qū)坂田華為總部辦公樓郵編:518129http:/客戶服務(wù)郵箱:客戶服務(wù)電話4008302118客戶服務(wù)傳真:0755-285601112019-8-20華為機密,未經(jīng)許可不得擴散第 2 頁, 共 25 頁istack 堆疊技術(shù)白皮ista
3、ck堆疊技術(shù)白皮書關(guān)鍵詞:istack、堆疊、拓撲收集、角色選舉、高可靠性、冗余備份摘要: istack是一種將多臺設(shè)備堆疊起來, 虛擬成一臺設(shè)備來管理和使用的技術(shù)。 本文將介紹istack是如何將這些設(shè)備堆疊起來的,以及在網(wǎng)絡(luò)中的主要應(yīng)用。縮略語:縮略語istack英文全名intelligent stack中文解釋智能彈性架構(gòu)2019-8-20華為機密,未經(jīng)許可不得擴散第 3 頁, 共 25 頁istack 堆疊技術(shù)白皮目 錄1概述.61.1產(chǎn)生背景.61.2技術(shù)優(yōu)點.6istack 的技術(shù)實現(xiàn).72.1基本概念.72.2堆疊的建立.82.2.1堆疊的物理連接.92.2.2角色選舉.102.
4、2.3拓撲收集.112.2.4穩(wěn)定運行.112.3堆疊管理.112.4堆疊維護.122.4.1成員設(shè)備加入.122.4.2成員設(shè)備退出.132.4.3拓撲更新.132.5成員設(shè)備智能升級.132.6堆疊合并.132.7堆疊分裂與多主檢測.142.7.1堆疊分裂.142.7.2多主檢測.162.7.3mad 沖突處理和故障恢復(fù).18istack 報文轉(zhuǎn)發(fā)原理.19典型組網(wǎng)應(yīng)用.224.1簡化網(wǎng)絡(luò)管理和運營.224.2擴容提升系統(tǒng)接入能力.234.3跨越空間使用 istack.244.4電口堆疊降低成本.242342019-8-20華為機密,未經(jīng)許可不得擴散第 4 頁, 共 25 頁istack
5、堆疊技術(shù)白皮圖表索引圖 1 istack 虛擬設(shè)備.6圖 2 盒式設(shè)備堆疊虛擬化圖.8圖 3 堆疊建立流程圖.9圖 4 堆疊的物理連接示意圖.10圖 5 堆疊合并示意圖.14圖 6 原主備設(shè)備被分裂到同一個堆疊系統(tǒng)中.15圖 7 原主備設(shè)備被分裂到不同的堆疊系統(tǒng)中.16圖 8 通過中間設(shè)備的直連檢測方式.17圖 9 堆疊成員交換機 full-mesh 方式直連.17圖 10 代理檢測方式.18圖 11 堆疊分裂及沖突處理.19圖 12 成員設(shè)備內(nèi)單播轉(zhuǎn)發(fā).20圖 13 跨設(shè)備單播轉(zhuǎn)發(fā).21圖 14 廣播報文轉(zhuǎn)發(fā).22圖 15 簡化網(wǎng)絡(luò)管理和運營.23圖 16 擴容提升系統(tǒng)接入能力.24圖 17
6、 跨越空間使用 istack 組網(wǎng)圖.24圖 18 使用電口堆疊.252019-8-20華為機密,未經(jīng)許可不得擴散第 5 頁, 共 25 頁istack 堆疊技術(shù)白皮1概述1.1產(chǎn)生背景網(wǎng)絡(luò)中主要存在兩種形態(tài)的通信設(shè)備:盒式設(shè)備和框式設(shè)備。通常盒式設(shè)備部署在網(wǎng)絡(luò)接入層或?qū)煽啃砸蟛桓叩膮R聚層, 盒式單機設(shè)備對端口和帶寬擴容不夠靈活, 擴容增加新的盒式設(shè)備會改變原組網(wǎng)結(jié)構(gòu), 但它的優(yōu)勢也比較明顯,投資成本相對較低??蚴皆O(shè)備一般部署在網(wǎng)絡(luò)核心層或匯聚層,具有高可靠性、高性能、高端口密度、可擴展性強的優(yōu)點,由于投入成本較高,它不太適合部署在靠近用戶側(cè)的邊緣網(wǎng)絡(luò)。針對盒式設(shè)備與框式設(shè)備的特點, 一種
7、結(jié)合了兩種設(shè)備優(yōu)點的istack堆疊技術(shù)應(yīng)運而生。 istack堆疊就是將多臺設(shè)備通過專用堆疊口或業(yè)務(wù)口連接起來形成一臺虛擬的邏輯設(shè)備,用戶對這臺虛擬設(shè)備進行管理,來實現(xiàn)對堆疊中的所有設(shè)備的管理。 這種虛擬設(shè)備既具有盒式設(shè)備的低成本優(yōu)點,又具有框式設(shè)備的擴展性強以及高可靠性優(yōu)點。如圖1所示。華為設(shè)備支持兩種模式的istack堆疊,通過堆疊卡上專用堆疊口進行堆疊的模式叫堆疊卡堆疊,它的主要優(yōu)勢無需配置,直接連接專用堆疊口就能實現(xiàn)istack功能; 另外一種是通過業(yè)務(wù)口堆疊的模式叫業(yè)務(wù)口堆疊,它的主要優(yōu)勢不需要專用堆疊卡,支持長距離堆疊。圖 1 istack 虛擬設(shè)備1.2技術(shù)優(yōu)點istack堆疊
8、具有以下主要優(yōu)點:簡化配置和管理。堆疊形成后,多臺物理設(shè)備虛擬成為一臺邏輯設(shè)備,2019-8-20華為機密,未經(jīng)許可不得擴散第 6 頁, 共 25 頁istack 堆疊技術(shù)白皮用戶通過任何一臺成員設(shè)備登錄堆疊系統(tǒng),多臺設(shè)備對管理員只呈現(xiàn)一個ip登陸地址,對堆疊系統(tǒng)所有成員設(shè)備進行統(tǒng)一配置和管理。簡化網(wǎng)絡(luò)運營。istack網(wǎng)絡(luò)中的多臺設(shè)備形成堆疊,虛擬成單一的邏輯設(shè)備,簡化后的網(wǎng)絡(luò)不再需要使用xstp/erps/rrpp/sep環(huán)網(wǎng)協(xié)議、vrrp等協(xié)議保證網(wǎng)絡(luò)冗余備份,簡化了網(wǎng)絡(luò)配置,同時依靠跨設(shè)備的鏈路聚合,實現(xiàn)快速收斂,提高可靠性。高可靠性。堆疊系統(tǒng)多臺成員設(shè)備之間冗余備份;堆疊支持跨設(shè)備的
9、鏈路聚合功能, 實現(xiàn)跨設(shè)備的鏈路冗余備份。這樣多設(shè)備多鏈路冗余備份,即使部分端口或設(shè)備出現(xiàn)故障,也不會導(dǎo)致跨設(shè)備聚合鏈路完全失效,保證業(yè)務(wù)從正常成員設(shè)備的聚合成員端口轉(zhuǎn)發(fā)。強大的網(wǎng)絡(luò)擴展能力。通過增加成員設(shè)備,可以輕松自如的擴展堆疊系統(tǒng)的端口數(shù)、帶寬和處理能力。靈活的堆疊模式。istack支持堆疊卡堆疊和業(yè)務(wù)口堆疊。堆疊卡堆疊部署和操作簡單,無需對成員設(shè)備配置,使用專用的堆疊線纜連接就能堆疊成功。 業(yè)務(wù)口堆疊可根據(jù)業(yè)務(wù)實際帶寬,靈活選擇堆疊物理口的數(shù)量,支持長距離堆疊。業(yè)務(wù)口堆疊不僅支持光口堆疊,而且支持標(biāo)準(zhǔn)的以太網(wǎng)rj45電口堆疊,電口堆疊使用標(biāo)準(zhǔn)網(wǎng)線連接會使成本更低。降低投資成本。網(wǎng)絡(luò)部署
10、初期,接入用戶數(shù)少需要的接入設(shè)備也較少,隨著業(yè)務(wù)發(fā)展,需要增加端口數(shù)目和帶寬,采用istack技術(shù)很容易擴展接入能力,不但不會改變前期的網(wǎng)絡(luò)規(guī)劃,而且會降低首次投入成本。2istack 的技術(shù)實現(xiàn)2.1基本概念istack堆疊中所有的單臺設(shè)備稱為成員設(shè)備, 成員設(shè)備按照功能不同,分為三種角色:master設(shè)備:成員設(shè)備的一種,它負責(zé)管理整個堆疊。一個堆疊中同一時刻只能有一臺成員設(shè)備成為master設(shè)備。standby設(shè)備:成員設(shè)備的一種,standby設(shè)備是master設(shè)備的備設(shè)備。當(dāng)master設(shè)備故障時,standby設(shè)備會接替原master設(shè)備的所有業(yè)務(wù)。堆疊中只有一臺standby設(shè)備
11、。slave設(shè)備:成員設(shè)備的一種,slave設(shè)備主要用于業(yè)務(wù)轉(zhuǎn)發(fā),它數(shù)量越多,堆疊系統(tǒng)的轉(zhuǎn)發(fā)能力越強。堆疊中除了master設(shè)備和standby設(shè)備,其它設(shè)備都是slave設(shè)備。2019-8-20華為機密,未經(jīng)許可不得擴散第 7 頁, 共 25 頁istack 堆疊技術(shù)白皮圖 2 盒式設(shè)備堆疊虛擬化圖如圖2所示,盒式設(shè)備堆疊后形成的虛擬設(shè)備相當(dāng)于一臺框式分布式設(shè)備, 堆疊中的master相當(dāng)于虛擬設(shè)備的主用主控板,standby設(shè)備相當(dāng)于備用主控板,slave1和slave2充當(dāng)接口板的角色。master和standby除了充當(dāng)主用主控和備用主控功能外,它們同樣都有業(yè)務(wù)口,同時承擔(dān)業(yè)務(wù)板的轉(zhuǎn)發(fā)
12、功能。2.2堆疊的建立堆疊建立的過程包括以下四個階段: 物理連接:根據(jù)網(wǎng)絡(luò)需求,選擇適當(dāng)?shù)倪B接方式和連接拓撲,組建堆疊網(wǎng)絡(luò)。 角色選舉:成員設(shè)備之間相互發(fā)送堆疊競爭報文,并根據(jù)選舉原則,選出堆疊系統(tǒng)master、 standby及slave設(shè)備。 角色選舉階段處于electing (競爭)狀態(tài)。 拓撲收集:master設(shè)備收集所有成員設(shè)備的拓撲信息,向所有成員設(shè)備分配堆疊id。拓撲收集階段處于collecting(收集)狀態(tài)。 穩(wěn)定運行: master設(shè)備將整個堆疊系統(tǒng)的拓撲信息同步給所有成員設(shè)備,成員設(shè)備同步master設(shè)備的系統(tǒng)軟件和配置文件,之后進入穩(wěn)定運行狀態(tài)。穩(wěn)定運行階段處于runn
13、ing(運行)狀態(tài)。如圖3所示,介紹了堆疊建立的主要過程,在完成物理連接之后,后續(xù)堆疊建立過程主要分三個階段:角色選舉、拓撲收集、穩(wěn)定運行,下面章節(jié)對各階段過程作了詳細介紹。2019-8-20華為機密,未經(jīng)許可不得擴散第 8 頁, 共 25 頁istack 堆疊技術(shù)白皮圖 3 堆疊建立流程圖2.2.1 堆疊的物理連接istack要正常工作, 需要先將成員設(shè)備物理連接起來。堆疊口是一種邏輯接口, 設(shè)備上用于堆疊連接的物理端口稱為堆疊物理端口。堆疊卡堆疊無需通過配置指定堆疊物理口,堆疊卡上的端口是專用堆疊物理口。業(yè)務(wù)口堆疊需要將業(yè)務(wù)口配置成堆疊物理端口并加入到堆疊口。一個堆疊口可能對應(yīng)一個堆疊物理
14、端口,也可能由多個堆疊物理端口聚合形成(稱為聚合堆疊口)以達到鏈路備份的效果。一臺設(shè)備上只有兩個堆疊口,分別編號為stack-port0和stack-port1。為了描述方便,有時也將堆疊口stack-port0和stack-port1分別稱為左口和右口。堆疊物理端口之間可以使用專用堆疊線纜、光纖或標(biāo)準(zhǔn)網(wǎng)線連接。專用堆疊線纜不需要配置, 組建堆疊系統(tǒng)非常簡單;光纖可以將距離很遠的物理設(shè)備連接成為一個虛擬設(shè)備;標(biāo)準(zhǔn)網(wǎng)線連接以太電口進行堆疊,百米以內(nèi)可正常組網(wǎng),使得組建堆疊更加靈活。2019-8-20華為機密,未經(jīng)許可不得擴散第 9 頁, 共 25 頁istack 堆疊技術(shù)白皮圖 4 堆疊的物理連
15、接示意圖堆疊物理端口的連接拓撲有兩種:鏈形連接:使用堆疊電纜將一臺設(shè)備的左口(右口)和另一臺設(shè)備的右口(左口)連接起來,依次類推,第一臺設(shè)備的右口(左口)和最后一臺設(shè)備的左口(右口)沒有連接堆疊電纜。這種連接方式稱為鏈形連接,如圖4所示。鏈形拓撲優(yōu)勢是首尾不需要有物理連接,適合長距離堆疊。它的劣勢是當(dāng)鏈形鏈路中出現(xiàn)一條鏈路故障時,會引起堆疊分裂。環(huán)形連接:將鏈形連接第一臺設(shè)備的右口(左口)和最后一臺設(shè)備的左口(右口)連接起來,這種連接方式稱為環(huán)形連接,如圖 4所示。環(huán)形連接比鏈形連接更可靠,當(dāng)環(huán)形鏈路中出現(xiàn)一條鏈路故障時,堆疊系統(tǒng)仍能夠保持正常工作,并且數(shù)據(jù)能夠按照最短路徑轉(zhuǎn)發(fā),提高堆疊鏈路帶
16、寬利用率。2.2.2 角色選舉堆疊系統(tǒng)由多臺堆疊成員設(shè)備組成, 每臺成員設(shè)備具有一個確定的角色,即master、 standby及slave三種不同角色,確定成員設(shè)備角色的過程稱為角色選舉。角色選舉會在拓撲發(fā)生變化的情況下產(chǎn)生,比如:堆疊建立、新設(shè)備加入、堆疊分裂或者兩個堆疊合并。角色選舉規(guī)則如下(從第一條開始判斷,如果參與選舉的成員有多個最優(yōu),則繼續(xù)判斷下一條,直到找到唯一的最優(yōu)成員,才停止選舉,此最優(yōu)成員即為堆疊的master設(shè)備):系統(tǒng)運行時間長的優(yōu)先;成員優(yōu)先級大的優(yōu)先;成員橋mac小的優(yōu)先。master設(shè)備選舉完成后,master設(shè)備會收集所有成員設(shè)備的拓撲信息,根據(jù)拓撲信息計算出堆
17、疊轉(zhuǎn)發(fā)表項和破環(huán)點信息下發(fā)給堆疊中的所有成員設(shè)備, 并向所有成員設(shè)備分配堆疊id。之后進行standby設(shè)備的選舉,作為master設(shè)備的備2019-8-20華為機密,未經(jīng)許可不得擴散第 10 頁, 共 25 頁istack 堆疊技術(shù)白皮份設(shè)備。除master設(shè)備外,最先完成設(shè)備啟動的設(shè)備優(yōu)先被選為備份設(shè)備。當(dāng)除master設(shè)備外其它設(shè)備同時完成啟動時,備設(shè)備的選舉規(guī)則如下(依次從第一條開始判斷,直至找到最優(yōu)的設(shè)備才停止比較):堆疊優(yōu)先級最高的設(shè)備成為備設(shè)備;堆疊優(yōu)先級相同時,mac地址最小的成為備設(shè)備。除master設(shè)備和standby設(shè)備之外,剩下的其他成員設(shè)備作為slave設(shè)備加入堆疊。
18、2.2.3 拓撲收集堆疊中的每臺設(shè)備都是通過和自己直接相鄰的其它成員設(shè)備之間交互hello協(xié)商報文來收集鄰居設(shè)備連接關(guān)系。hello報文會攜帶拓撲信息,包括堆疊口連接關(guān)系、成員設(shè)備編號、成員設(shè)備優(yōu)先級、成員設(shè)備mac、運行狀態(tài)等內(nèi)容。master設(shè)備選舉完成后, 成員設(shè)備會向master設(shè)備主動發(fā)送本機收集到的拓撲信息, 上報本機的基本信息及在堆疊中的位置,master設(shè)備會收集到所有成員設(shè)備的拓撲信息, 根據(jù)拓撲信息計算出堆疊轉(zhuǎn)發(fā)表項和破環(huán)點信息下發(fā)給堆疊中的所有成員設(shè)備,并向所有成員設(shè)備分配堆疊id。2.2.4 穩(wěn)定運行角色選舉、 拓撲收集完成之后, 所有成員設(shè)備會自動同步主設(shè)備的系統(tǒng)軟件
19、和配置文件。堆疊具有自動加載系統(tǒng)軟件的功能, 待組成堆疊的成員設(shè)備不需要具有相同軟件版本, 只需要版本間兼容即可。當(dāng)備設(shè)備或從設(shè)備與主設(shè)備的軟件版本不兼容時, 備設(shè)備或從設(shè)備會自動從主設(shè)備下載系統(tǒng)軟件, 然后使用新系統(tǒng)軟件重啟,并重新加入堆疊。堆疊具有配置文件同步機制, 備設(shè)備或從設(shè)備會將主設(shè)備的配置文件同步到本設(shè)備,配置文件只在當(dāng)前主設(shè)備上執(zhí)行,其它成員設(shè)備保持同步備份,以保證堆疊中的多臺設(shè)備能夠像一臺設(shè)備一樣在網(wǎng)絡(luò)中工作, 并且在主設(shè)備出現(xiàn)故障之后,standby設(shè)備接替原先master設(shè)備所有的業(yè)務(wù),使得網(wǎng)絡(luò)仍能夠正常運行。2.3堆疊管理 堆疊系統(tǒng)的登錄堆疊系統(tǒng)登陸包括本地登陸和遠程登陸
20、。通過console串口登陸稱為本地登陸,可以任意選擇一個成員設(shè)備的console口進行登陸。通過telnet、ssh等三層方式登陸設(shè)備稱為遠程登錄, 可以任意選擇一個成員設(shè)備的管理網(wǎng)口或其他三層業(yè)務(wù)接口登錄, 只要保證到堆疊系統(tǒng)的路由可達即可,堆疊系統(tǒng)中多臺設(shè)備的管2019-8-20華為機密,未經(jīng)許可不得擴散第 11 頁, 共 25 頁istack 堆疊技術(shù)白皮理只需對網(wǎng)管人員呈現(xiàn)一個ip登陸地址。 管理員不管通過哪一臺成員設(shè)備登錄到堆疊系統(tǒng), 實際登錄的都是主設(shè)備,主設(shè)備負責(zé)將用戶的配置下發(fā)給其他成員設(shè)備,統(tǒng)一管理堆疊系統(tǒng)中所有成員設(shè)備的資源。 文件系統(tǒng)的訪問文件系統(tǒng)的訪問包括對存儲器中文
21、件和目錄的創(chuàng)建、 刪除、修改以及文件內(nèi)容的顯示等。堆疊系統(tǒng)使用成員編號(member id)來標(biāo)志和管理成員設(shè)備,堆疊中所有設(shè)備的成員編號都是唯一的。成員編號被引入到端口編號中,接口編號的第一維就表示該接口所在設(shè)備的成員編號, 便于用戶配置和識別成員設(shè)備上的接口。 對于單臺沒有運行堆疊的設(shè)備, 接口編號采用: 槽位號/子卡號/端口號 (槽位號統(tǒng)一取值為0)。設(shè)備加入堆疊后,接口編號采用:堆疊 id/子卡號/端口號。如:設(shè)備沒有運行堆疊時,某個接口的編號為gigabitethernet0/0/1;當(dāng)該設(shè)備加入堆疊后,如果堆疊id為2,則該接口的編號將變?yōu)間igabitethernet2/0/1。
22、成員編號還被引入到文件系統(tǒng)管理中, 例如路徑slot2#flash:/cfg.zip表示在成員設(shè)備(成員編號為2)上的flash的根目錄下有一個名稱為cfg.zip的文件。2.4堆疊維護堆疊維護的主要功能是監(jiān)控成員設(shè)備的加入和退出,并隨時收集新的拓撲,維護現(xiàn)有拓撲。2.4.1 成員設(shè)備加入成員設(shè)備加入是指向已經(jīng)穩(wěn)定運行的堆疊系統(tǒng)添加一臺新的設(shè)備。 在堆疊維護過程中, 繼續(xù)進行拓撲收集工作,當(dāng)發(fā)現(xiàn)有新的成員設(shè)備加入時會根據(jù)新加入設(shè)備的狀態(tài)采取不同的處理:新加入的設(shè)備本身未形成堆疊(比如,新加入的設(shè)備配置了堆疊功能,之后斷電,再使用堆疊電纜連接到已有堆疊,上電重啟),則該設(shè)備會被選為slave。加
23、入的設(shè)備本身已經(jīng)形成了堆疊 (比如,新加入的設(shè)備配置了堆疊功能,之后使用堆疊電纜連接到已有堆疊) , 此時相當(dāng)于兩個堆疊合并 (merge) 。在這種情況下,兩個堆疊會進行堆疊競選,競選失敗的一方所有堆疊成員設(shè)備需要重啟,然后全部作為slave設(shè)備加入競選獲勝的一方。如果成員設(shè)備加入成功, 對堆疊系統(tǒng)來說, 相當(dāng)于框式設(shè)備增加一塊接口板。成員設(shè)備加入可能原因有:人為增加堆疊系統(tǒng)中的成員;故障恢復(fù),當(dāng)設(shè)備故障或鏈路故障恢復(fù)時,恢復(fù)的設(shè)備會重新加入堆疊。2019-8-20華為機密,未經(jīng)許可不得擴散第 12 頁, 共 25 頁istack 堆疊技術(shù)白皮2.4.2 成員設(shè)備退出成員設(shè)備退出指成員設(shè)備從
24、堆疊系統(tǒng)中離開。在堆疊維護過程中, 通過以下兩種方式來判斷成員設(shè)備是否離開:正常情況下, 直接相鄰的成員設(shè)備之間會定期交換hello報文。 如果持續(xù)多個周期未收到直接鄰居的hello報文, 則認為該成員設(shè)備已經(jīng)退出堆疊系統(tǒng),堆疊會將該成員設(shè)備從拓撲中隔離出來。如果發(fā)現(xiàn)堆疊口down,則擁有該堆疊口的成員設(shè)備會立即通知主設(shè)備,主設(shè)備立即重新計算當(dāng)前拓撲,而不用等到hello報文超時再處理。如果退出的是master設(shè)備,則堆疊系統(tǒng)的standby設(shè)備會接管原有master的所有功能;如果退出的是standby設(shè)備,則系統(tǒng)僅僅相當(dāng)于失去一個備用主控板以及此板上的接口等物理資源,主設(shè)備會從slave設(shè)
25、備中選取一個設(shè)備,重新指定為standby備設(shè)備;如果退出的是slave設(shè)備,則系統(tǒng)相當(dāng)于失去一塊接口板物理資源。單臺設(shè)備離開堆疊后會回到獨立運行狀態(tài), 相連的多臺設(shè)備退出堆疊后會形成獨立的兩個堆疊,這種情況稱為堆疊分裂。成員設(shè)備退出可能原因有:人為改變拓撲,取走成員設(shè)備;成員設(shè)備故障;鏈接故障。2.4.3 拓撲更新單純的拓撲變化指設(shè)備的拓撲由環(huán)形鏈接變?yōu)殒溞捂溄樱?或者由鏈形鏈接變?yōu)榄h(huán)形鏈接。例如對于環(huán)形鏈接的設(shè)備,當(dāng)鏈路發(fā)生故障時可能變?yōu)殒溞捂溄?;又比如在增加設(shè)備時,對于原有的環(huán)形鏈接, 需要先將原有的環(huán)形鏈接變?yōu)殒溞捂溄?,才能接入新的設(shè)備。對于單純的拓撲變化,istack的成員構(gòu)成以及m
26、aster均不會發(fā)生變化, 僅僅會在必要時自動改變轉(zhuǎn)發(fā)的路徑,不會影響設(shè)備的正常使用。2.5成員設(shè)備智能升級istack具有自動加載功能。在堆疊建立時或新成員設(shè)備加入堆疊時,standby/slave設(shè)備或新加入的成員設(shè)備會與主設(shè)備的軟件版本進行比較,并不需要新加入的成員設(shè)備與主設(shè)備具有相同軟件版本,只需要版本兼容即可,如果不兼容,則自動從master設(shè)備下載系統(tǒng)啟動文件,然后使用新的啟動文件重啟,重新加入堆疊。2.6堆疊合并堆疊合并 (merge) 是指穩(wěn)定運行的兩個堆疊系統(tǒng)合并成一個新的堆疊系統(tǒng)。2019-8-20華為機密,未經(jīng)許可不得擴散第 13 頁, 共 25 頁istack 堆疊技術(shù)
27、白皮如圖5所示,兩個堆疊系統(tǒng)的主設(shè)備通過競爭,選舉出一個更優(yōu)的作為新堆疊系統(tǒng)的設(shè)備。競爭成功的主設(shè)備所在的堆疊系統(tǒng)將保持原有主備從角色和配置不變,業(yè)務(wù)也不會受到影響;而另外一個堆疊系統(tǒng)的所有成員設(shè)備將重新啟動,以slave的角色加入到新堆疊系統(tǒng),其堆疊id將由新主設(shè)備重新分配,并將同步新主設(shè)備的配置文件和系統(tǒng)軟件, 該堆疊系統(tǒng)的原有業(yè)務(wù)也將中斷,所以在通常情況下, 不建議用此種方法堆疊。堆疊合并通常出現(xiàn)在堆疊鏈路或設(shè)備故障導(dǎo)致堆疊分裂,鏈路或設(shè)備故障恢復(fù)后,分裂的堆疊系統(tǒng)重新合并。堆疊系統(tǒng)合并流程與堆疊成員加入流程類似,具體可參見堆疊成員加入。堆疊合并時主設(shè)備的選舉規(guī)則為: 比較運行時間, 運
28、行時間較早的堆疊系統(tǒng)競爭為主; 如果兩個堆疊系統(tǒng)的運行時間一樣, 其主設(shè)備的選舉規(guī)則與堆疊建立時一樣。圖 5 堆疊合并示意圖2.7堆疊分裂與多主檢測2.7.1 堆疊分裂堆疊分裂是指穩(wěn)定運行的堆疊系統(tǒng)中帶電移出部分成員設(shè)備, 或者堆疊線纜多點故障導(dǎo)致一個堆疊系統(tǒng)變成多個堆疊系統(tǒng)。 堆疊系統(tǒng)分裂之后需要做多主檢測及沖突處理,保證業(yè)務(wù)繼續(xù)穩(wěn)定運行。根據(jù)原堆疊系統(tǒng)master和standby設(shè)備分裂后所處位置的不同,堆疊分裂可分為以下兩類:第一種情況在堆疊分裂后,原master和standby設(shè)備被分裂到同一個堆疊系統(tǒng)中,原master設(shè)備會重新計算堆疊拓撲,將移出的成員設(shè)備的拓撲信息刪除,2019-
29、8-20華為機密,未經(jīng)許可不得擴散第 14 頁, 共 25 頁istack 堆疊技術(shù)白皮并將新的拓撲信息同步給其他成員設(shè)備; 而移出的成員設(shè)備檢測到堆疊協(xié)議報文超時,將自行復(fù)位,重新進行選舉。如圖6所示, 堆疊系統(tǒng)分裂后, 原master設(shè)備switcha刪除switchd和switche的拓撲信息,并將新的拓撲信息同步給switchb和switchc;switchd和switche重啟后,重新進行堆疊建立。圖 6 原主備設(shè)備被分裂到同一個堆疊系統(tǒng)中第二種情況在堆疊分裂后,原master和standby設(shè)備被分裂到不同的堆疊系統(tǒng)中,原master設(shè)備所在堆疊系統(tǒng)重新指定standby設(shè)備,重新
30、計算拓撲信息并同步給其他成員設(shè)備;原standby設(shè)備所在堆疊系統(tǒng)將發(fā)生備升主,原standby設(shè)備升級為master設(shè)備, 重新計算堆疊拓撲并同步到其他成員設(shè)備,并指定新的備設(shè)備。如圖7所示,堆疊系統(tǒng)分裂后,原master設(shè)備switcha指定switchd作為新的standby設(shè)備, 重新計算拓撲信息, 并將新的拓撲信息同步給switchd和switche;原standby設(shè)備switchb升級為master設(shè)備, 重新計算堆疊拓撲并同步給switchc,并指定switchc作為新的standby設(shè)備。2019-8-20華為機密,未經(jīng)許可不得擴散第 15 頁, 共 25 頁istack 堆
31、疊技術(shù)白皮圖 7 原主備設(shè)備被分裂到不同的堆疊系統(tǒng)中2.7.2 多主檢測由于堆疊系統(tǒng)中所有成員設(shè)備都使用同一個ip地址和mac地址(堆疊系統(tǒng)mac),一個堆疊分裂后,可能產(chǎn)生多個具有相同ip地址和mac地址的堆疊系統(tǒng)。為防止堆疊分裂后,產(chǎn)生多個具有相同ip地址和mac地址的堆疊系統(tǒng),引起網(wǎng)絡(luò)故障, 必須進行ip地址和mac地址的沖突檢查,然后關(guān)閉優(yōu)先級較低的沖突端口,保證業(yè)務(wù)正常轉(zhuǎn)發(fā)。多主檢測mad(multi-active detection),是一種檢測和處理堆疊分裂的協(xié)議。鏈路故障導(dǎo)致堆疊系統(tǒng)分裂后,mad可以實現(xiàn)堆疊分裂的檢測、沖突處理和故障恢復(fù), 降低堆疊分裂對業(yè)務(wù)的影響。如果配置了
32、mad功能的堆疊系統(tǒng)分裂,檢測到存在多主,則根據(jù)接收到的mad報文中所攜帶的信息判斷本機為主設(shè)備還是備份設(shè)備,關(guān)閉判斷為備設(shè)備除保留接口(如業(yè)務(wù)堆疊口和console口)外的所有接口。mad檢測方式有兩種: 直連檢測方式和代理檢測方式。在同一個堆疊系統(tǒng)中,兩種檢測方式互斥,不可以同時配置。直連檢測方式直連檢測方式是指堆疊成員設(shè)備間通過普通線纜直連的專用鏈路進行多主檢測。在直連檢測方式中,堆疊系統(tǒng)正常運行時,不發(fā)送mad報文;堆疊系統(tǒng)分裂后,分裂后的兩臺設(shè)備以1s為周期通過檢測鏈路發(fā)送mad報文以進行多主沖突處理。直連檢測的連接方式包括通過中間設(shè)備直連和堆疊成員交換機full-mesh方2019
33、-8-20華為機密,未經(jīng)許可不得擴散第 16 頁, 共 25 頁istack 堆疊技術(shù)白皮式直連。如圖8所示,通過中間設(shè)備直連,堆疊系統(tǒng)的所有成員交換機之間至少有一條檢測鏈路與中間設(shè)備相連。如圖9所示,full-mesh方式直連,堆疊系統(tǒng)的各成員交換機之間通過檢測鏈路建立full-mesh全連接,即每兩臺成員交換機之間至少有一條檢測鏈路。圖 8 通過中間設(shè)備的直連檢測方式圖 9 堆疊成員交換機 full-mesh 方式直連通過中間設(shè)備直連可以實現(xiàn)通過中間設(shè)備縮短堆疊成員交換機之間的檢測鏈路長度,適用于成員交換機相距較遠的場景。與通過中間設(shè)備直連相比,full-mesh方式直連可以避免由中間設(shè)備
34、故障導(dǎo)致的mad檢測失敗, 但是每兩臺成員交換機之間都建立全連接會占用較多的接口, 所以該方式適用于成員交換機數(shù)目較少的場景。代理檢測方式如圖10所示, 代理檢測方式是在堆疊系統(tǒng)eth-trunk聚合口上啟用代理檢測,在代理設(shè)備上啟用mad檢測功能。此種檢測方式要求堆疊系統(tǒng)中的所有成員設(shè)備都與代理設(shè)備連接,并將這些鏈路加入同一個eth-trunk內(nèi)。通常堆疊系統(tǒng)與其2019-8-20華為機密,未經(jīng)許可不得擴散第 17 頁, 共 25 頁istack 堆疊技術(shù)白皮他設(shè)備采用eth-trunk互聯(lián)保證可靠性,與直連檢測方式相比, 代理檢測方式無需占用額外的接口,eth-trunk接口可同時運行ma
35、d代理檢測和其他業(yè)務(wù)。在代理檢測方式中,堆疊系統(tǒng)正常運行時,堆疊成員交換機以30s為周期通過檢測鏈路發(fā)送mad報文。 堆疊成員交換機對在正常工作狀態(tài)下收到的mad報文不做任何處理;堆疊分裂后,分裂后的兩臺設(shè)備以1s為周期通過檢測鏈路發(fā)送mad報文以進行多主沖突處理。圖 10 代理檢測方式2.7.3 mad 沖突處理和故障恢復(fù)mad沖突處理堆疊分裂后,mad沖突處理機制會使分裂后的堆疊系統(tǒng)處于detect狀態(tài)或recovery狀態(tài)。 detect狀態(tài)表示堆疊正常工作狀態(tài),recovery狀態(tài)表示堆疊禁用狀態(tài)。mad沖突處理機制如下:mad分裂檢測機制會檢測到網(wǎng)絡(luò)中存在多個處于detect狀態(tài)的堆
36、疊系統(tǒng), 這些堆疊系統(tǒng)之間相互競爭,競爭成功的堆疊系統(tǒng)保持detect狀態(tài), 競爭失敗的堆疊系統(tǒng)會轉(zhuǎn)入recovery狀態(tài); 并且在recovery狀態(tài)堆疊系統(tǒng)的所有成員設(shè)備上,關(guān)閉除保留端口以外的其它所有物理端口,以保證該堆疊系統(tǒng)不再轉(zhuǎn)發(fā)業(yè)務(wù)報文。如圖11所示,istack堆疊系統(tǒng)由于兩條堆疊鏈路故障,使得系統(tǒng)分裂成istack1和istack2,istack2在沖突處理中競爭失敗,從原來detect狀態(tài)切換到recovery狀態(tài),關(guān)閉上下行業(yè)務(wù)端口,原來istack2業(yè)務(wù)后續(xù)都切換到istack1上進行轉(zhuǎn)發(fā)。2019-8-20華為機密,未經(jīng)許可不得擴散第 18 頁, 共 25 頁istac
37、k 堆疊技術(shù)白皮圖 11 堆疊分裂及沖突處理mad故障恢復(fù)通過修復(fù)故障鏈路, 分裂后的堆疊系統(tǒng)重新合并為一個堆疊系統(tǒng)。重新合并的方式有以下兩種:第一種: 堆疊鏈路修復(fù)后, 處于recovery狀態(tài)的堆疊系統(tǒng)重新啟動, 與detect狀態(tài)的堆疊系統(tǒng)合并,同時將被關(guān)閉的業(yè)務(wù)端口恢復(fù)up,整個堆疊系統(tǒng)恢復(fù)。第二種是: 如果故障鏈路修復(fù)前,承載業(yè)務(wù)的detect狀態(tài)的堆疊系統(tǒng)也出現(xiàn)了故障。此時,可以先將detect狀態(tài)的堆疊系統(tǒng)從網(wǎng)絡(luò)中移除,再通過命令行啟用recovery狀態(tài)的堆疊系統(tǒng), 接替原來的業(yè)務(wù),然后再修復(fù)原detect狀態(tài)堆疊系統(tǒng)的故障及鏈路故障。故障修復(fù)后,重新合并堆疊系統(tǒng)。3istac
38、k 報文轉(zhuǎn)發(fā)原理istack采用分布式轉(zhuǎn)發(fā)技術(shù)實現(xiàn)報文的l2/l3層轉(zhuǎn)發(fā),最大限度的發(fā)揮了每個成員的處理能力。堆疊系統(tǒng)中的每個成員設(shè)備都有完整的l2/l3層轉(zhuǎn)發(fā)能力,每個成員設(shè)備在業(yè)務(wù)轉(zhuǎn)發(fā)時相當(dāng)于框式設(shè)備的接口板,可以學(xué)習(xí)到整網(wǎng)的mac表或fib三層轉(zhuǎn)發(fā)表, 當(dāng)它收到待轉(zhuǎn)發(fā)的l2/l3層報文時, 可以通過查詢本機的l2/l3層轉(zhuǎn)發(fā)表得到報文的出接口,然后將報文從正確的出接口發(fā)送出去,這個出接口可以在本機上也可以在其它成員設(shè)備上, 并且將報文從本機送到另外一個成員設(shè)備是一個純粹內(nèi)部的轉(zhuǎn)發(fā)行為, 類似框式分布式設(shè)備通過內(nèi)部fabric交換網(wǎng)進行板間報文轉(zhuǎn)發(fā),對外界是完全是不可見的,即對于l3報文來
39、說,不管它在堆疊系2019-8-20華為機密,未經(jīng)許可不得擴散第 19 頁, 共 25 頁istack 堆疊技術(shù)白皮統(tǒng)內(nèi)部穿過了多少成員設(shè)備,在跳數(shù)上只增加1,即表現(xiàn)為只經(jīng)過了一個網(wǎng)絡(luò)設(shè)備。在堆疊系統(tǒng)內(nèi)部轉(zhuǎn)發(fā)時, 報文頭部會攜帶目的設(shè)備編號,經(jīng)過中間成員設(shè)備時,根據(jù)報文中目的設(shè)備編號,選擇合適出端口向下一個成員設(shè)備轉(zhuǎn)發(fā),直到報文到達目的成員設(shè)備。鏈形堆疊轉(zhuǎn)發(fā)路徑是確定的,轉(zhuǎn)發(fā)相對比較簡單。而環(huán)形堆疊跨設(shè)備報文轉(zhuǎn)發(fā)是根據(jù)最短路徑來轉(zhuǎn)發(fā)的, 當(dāng)堆疊系統(tǒng)成員設(shè)備加入/退出或鏈路狀態(tài)改變時,系統(tǒng)都會重新計算拓撲,成員設(shè)備根據(jù)拓撲中的位置,以自己為根,計算轉(zhuǎn)發(fā)路徑和破環(huán)點,采用最短路徑轉(zhuǎn)發(fā)。環(huán)形堆疊跨設(shè)
40、備的單播業(yè)務(wù)流轉(zhuǎn)發(fā), 在源設(shè)備上選擇最接近目的設(shè)備一側(cè)堆疊口作為出端口,即源設(shè)備和目的設(shè)備經(jīng)過的中間設(shè)備跳數(shù)最少,這條轉(zhuǎn)發(fā)路徑最短。環(huán)形堆疊的廣播報文(包括未知單播報文和組播報文)轉(zhuǎn)發(fā),考慮避免廣播報文成環(huán)及轉(zhuǎn)發(fā)路徑最短原則, 在距離源設(shè)備跳數(shù)最遠的兩臺設(shè)備中間設(shè)置破環(huán)點。如圖12所示,轉(zhuǎn)發(fā)報文的入接口和出接口在同一臺成員設(shè)備上。當(dāng)slave1收到報文后,查找本地轉(zhuǎn)發(fā)表,發(fā)現(xiàn)出接口就在本機上,則slave1直接將報文從這個出接口發(fā)送出去。圖 12 成員設(shè)備內(nèi)單播轉(zhuǎn)發(fā)如圖13所示,轉(zhuǎn)發(fā)報文的入接口和出接口在不同的成員設(shè)備上。當(dāng)slave3收到報文后,查找本地轉(zhuǎn)發(fā)表,發(fā)現(xiàn)是到standby下use
41、r2用戶的報文,slave3按照最短路徑計算,到standby方向在slave3本地選擇0號堆疊出端口,則按照圖中綠色箭頭方向,將報文轉(zhuǎn)發(fā)給中間成員設(shè)備master, master選擇0號堆疊出端2019-8-20華為機密,未經(jīng)許可不得擴散第 20 頁, 共 25 頁istack 堆疊技術(shù)白皮口,繼續(xù)轉(zhuǎn)發(fā)給standby,standby查表發(fā)現(xiàn)是本設(shè)備用戶,通過出接口將報文轉(zhuǎn)發(fā)給user2用戶。同理,當(dāng)slave3收到slave2下user3用戶的報文,到slave2方向的slave3選擇本地出端口為1號堆疊口,則按照圖中紫色箭頭方向?qū)笪霓D(zhuǎn)發(fā)到slave2,slave2通過出接口將報文轉(zhuǎn)發(fā)給user3用戶。圖 13 跨設(shè)備單播轉(zhuǎn)發(fā)圖14描述的是ist
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 三農(nóng)村合作社合作模式優(yōu)化方案
- 防撞護欄安裝施工方案
- 轉(zhuǎn)換層模板施工方案
- 不銹鋼雨棚施工方案
- 綦江酒店鋁單板施工方案
- 龍泉塑石假山制作施工方案
- 路面瀝青工程施工方案
- 臨床急性化膿性扁桃體炎和傳染性單核細胞增多癥鑒別診斷、相同點及區(qū)別
- 杭州扣盤式腳手架施工方案
- 桐梓科學(xué)開展松樹育苗和病蟲害防治工作的實踐及成果分析
- 閘調(diào)器介紹講解
- 唐僧團隊之如何打造團隊
- 畢業(yè)設(shè)計外文文獻-Spring Boot
- 六年級下冊《生命.生態(tài).安全》全冊教案(表格式)
- DB32/T 4444-2023 單位消防安全管理規(guī)范-高清版
- 《讓孩子成才的秘密》寂靜法師
- 水下作業(yè)工程監(jiān)理實施細則(工程通用版范本)
- 小學(xué)科學(xué)教育探究一研討教學(xué)法
- GB 14930.1-2022食品安全國家標(biāo)準(zhǔn)洗滌劑
- YY/T 0972-2016有源植入醫(yī)療器械植入式心律調(diào)節(jié)設(shè)備用四極連接器系統(tǒng)尺寸和試驗要求
- 衛(wèi)生院處方點評記錄表
評論
0/150
提交評論