IT服務(wù)器運維 | 服務(wù)器網(wǎng)卡Team聚合技術(shù)
2020-04-20 20:50 作者:admin
IT服務(wù)器運維 | 服務(wù)器網(wǎng)卡Team聚合技術(shù)
數(shù)據(jù)中心服務(wù)器接入大量采用了服務(wù)器網(wǎng)卡(Team)技術(shù)。Team技術(shù)不完全屬于網(wǎng)絡(luò)系統(tǒng),也不完全屬于主機系統(tǒng)負責(zé),而是介于兩者的中間地帶,因此極易出現(xiàn)問題。最常見的錯誤就是服務(wù)器端選擇了交換機相關(guān)的team模式,但交換機端網(wǎng)絡(luò)人員卻沒有做任何設(shè)置。在一定條件觸發(fā)下,會引起交換機報主機物理地址flapping錯誤,繼而導(dǎo)致整個交換機CPU利用率居高不下。本文通過對兩種常見服務(wù)器網(wǎng)卡的Team技術(shù)原理的探討,分析了各種Team模式的實現(xiàn)方式和配置方式。
IT系統(tǒng)運維人員熟練掌握這些知識和技巧后,可根據(jù)自身系統(tǒng)的需要,選擇合適的Team模式,有效避免后期的運行風(fēng)險。數(shù)據(jù)中心對可用性要求極高。為保證業(yè)務(wù)系統(tǒng)
高可用性和連續(xù)性,從網(wǎng)絡(luò)層面講,整個通道的網(wǎng)絡(luò)設(shè)備和通信線路,全部是
冗余設(shè)計:
即從客戶機到服務(wù)器之間的網(wǎng)絡(luò)通道,任一物理設(shè)備宕機,或任一通信線路中斷,都不會影響到業(yè)務(wù)的連續(xù)。 然而,服務(wù)器和客戶機,特別是服務(wù)器單線路接入網(wǎng)絡(luò)時,存在以下
單點故障:
·
接入物理設(shè)備(通常是交換機)宕機;
·
接入設(shè)備的網(wǎng)口損壞;
·
使用的網(wǎng)線損壞;
·
服務(wù)器、客戶機的網(wǎng)卡故障。
解決這種單點故障只能使用服務(wù)器網(wǎng)卡組(Team)技術(shù)。本質(zhì)上說,網(wǎng)卡team技術(shù)是將同一主機上的兩塊或兩塊以上的網(wǎng)卡,通過軟件控制,虛擬出一個邏輯網(wǎng)卡。實際工作時多塊網(wǎng)卡可以是一主一備模式,或者是
雙活模式。這種技術(shù)的初衷是為了解決服務(wù)器的帶寬瓶頸,隨著近年來千兆和萬兆級的服務(wù)器網(wǎng)卡的出現(xiàn),服務(wù)器帶寬瓶頸得以緩解。因而現(xiàn)在實施服務(wù)器網(wǎng)卡組,主要是為服務(wù)器網(wǎng)絡(luò)接入提供冗余,提高服務(wù)器可用性。這種技術(shù)的出現(xiàn)很好地解決了行業(yè)數(shù)據(jù)中心服務(wù)器接入的單點故障問題,因此在行業(yè)內(nèi)被大量使用。目前市場上流行的可以實施網(wǎng)卡組技術(shù)的網(wǎng)卡有intel和broadcom服務(wù)器網(wǎng)卡,本文也將重點介紹intel和broadcom服務(wù)器網(wǎng)卡組技術(shù)。
網(wǎng)卡組技術(shù)架構(gòu)
網(wǎng)卡組技術(shù)的實質(zhì)是對多個物理網(wǎng)絡(luò)接口進行統(tǒng)一管理,將多個物理接口虛擬成一個邏輯網(wǎng)絡(luò)接口。具體到服務(wù)器網(wǎng)卡上,可以看作將多塊網(wǎng)卡虛擬為一塊邏輯網(wǎng)卡。從屬性上看,虛擬邏輯網(wǎng)卡和物理網(wǎng)卡無任何不同,也有自己的物理地址和網(wǎng)絡(luò)地址。服務(wù)器使用邏輯網(wǎng)卡與外部的主機通信。外部主機只能看到服務(wù)器的邏輯網(wǎng)卡,至于服務(wù)器具體的物理網(wǎng)卡個數(shù)、物理地址等細節(jié),外部主機是不清楚的。
網(wǎng)卡組邏輯結(jié)構(gòu)如圖1所示
無論是intel還是broadcom,一般都是在原有網(wǎng)卡驅(qū)動程序基礎(chǔ)上,增加一個網(wǎng)卡組驅(qū)動程序,由該驅(qū)動程序完成網(wǎng)卡組功能。網(wǎng)絡(luò)協(xié)議直接訪問網(wǎng)卡組驅(qū)動程序,網(wǎng)卡組驅(qū)動程序負責(zé)完成負載均衡等功能。一般地,網(wǎng)卡組驅(qū)動負責(zé)對組成網(wǎng)卡組的各個物理網(wǎng)卡進行管理,例如,活動探測,流量探測等,并根據(jù)實際情況,實現(xiàn)
負載均衡和網(wǎng)卡容錯功能。
總結(jié)
下面是一些關(guān)于網(wǎng)卡組技術(shù)的總結(jié),可以幫助讀者更深刻地理解網(wǎng)卡組的實現(xiàn)技術(shù)。
1、網(wǎng)卡組技術(shù)是提高終端(不僅僅是服務(wù)器)接入網(wǎng)絡(luò)帶寬和可用性的一種技術(shù)。因此,它只涉及終端和網(wǎng)絡(luò)接入設(shè)備(交換機、HUB和路由器),參與的雙方必須直接連接,中間不能跨接其他設(shè)備。關(guān)于網(wǎng)卡組,目前都是各廠商自行實現(xiàn),尚無統(tǒng)一的國際標(biāo)準。
2、提高帶寬是通過多塊網(wǎng)卡的
負載均衡手段,所有的交換機相關(guān)網(wǎng)卡組模式(靜態(tài)或動態(tài))、ALB和RLB,都提供負載均衡模式。負載均衡參與者必須是同一局域網(wǎng)的設(shè)備,即,客戶端與服務(wù)器必須是同一IP網(wǎng)段,且處于同一廣播域。
3、負載均衡不是基于單個數(shù)據(jù)包的,而是基于客戶端或網(wǎng)絡(luò)應(yīng)用的。也就是說,某個網(wǎng)絡(luò)應(yīng)用的所有數(shù)據(jù)流,自始至終,只使用組中的某一特定網(wǎng)卡,除非該網(wǎng)卡故障而發(fā)生切換;另外,由于發(fā)送和接收數(shù)據(jù)均衡由不同的設(shè)備實現(xiàn),因此同一網(wǎng)絡(luò)應(yīng)用的收、發(fā)數(shù)據(jù)流可能會經(jīng)過不同的網(wǎng)卡。
4、HUB屬于物理層設(shè)備,處于同一沖突域,不能增加接入帶寬;路由器屬于網(wǎng)絡(luò)層設(shè)備,HUB和路由器都不能象交換機那樣處理設(shè)備物理地址,因此,網(wǎng)卡組技術(shù)不能在HUB或路由器上實現(xiàn)。
5、無論AFT、SFT、ALB還是其他交換機無關(guān)網(wǎng)卡組技術(shù),在交換機轉(zhuǎn)發(fā)表中,組中每塊網(wǎng)卡的物理地址都正常出現(xiàn),需要調(diào)整時,由網(wǎng)卡組驅(qū)動程序控制網(wǎng)卡發(fā)送特定的數(shù)據(jù)包,改變交換機中的MAC表,以實現(xiàn)冗余互備?;谶@個原理,雖然intel網(wǎng)卡支持的AFT,ALB等模式要求接入同一臺交換機,但經(jīng)過測試(在組中只有兩塊網(wǎng)卡的情況下,多塊網(wǎng)卡的情況未測試)在分接兩臺不同的交換機時,效果基本上是相同的。
6、Intel的技術(shù)資料說明,在做SFT模式時,啟用STP協(xié)議,但網(wǎng)卡連接接口應(yīng)啟用STP速端口(portfast),其余模式的網(wǎng)卡組也應(yīng)該如此。其給出的理由是啟用STP協(xié)議的交換機端口狀態(tài)轉(zhuǎn)變時候大約有40秒的延遲,會增加網(wǎng)卡切換時的時間,增加網(wǎng)絡(luò)應(yīng)用中斷的時間。
事實上,無論何種模式,只要在STP協(xié)議穩(wěn)定后,參與網(wǎng)卡組的交換機全部處于正常轉(zhuǎn)發(fā)狀態(tài),此時如果僅僅是發(fā)生網(wǎng)卡故障,故障網(wǎng)卡上的數(shù)據(jù)流切換到正常網(wǎng)卡上,只要交換機上的端口物理狀態(tài)沒有改變,STP協(xié)議也不會發(fā)生狀態(tài)轉(zhuǎn)換,整個切換時間取決于交換機中轉(zhuǎn)發(fā)表的修改時間。
7、關(guān)于交換機相關(guān)網(wǎng)卡組模式。這種模式實際上是一種“分流、互備”方式,配置時選擇余地大,技術(shù)成熟,唯一的缺點是,所有與交換機相關(guān)的網(wǎng)卡組模式,不能跨接交換機,必須接入同一臺交換機上,即,這種模式只能提供帶寬擴展和網(wǎng)卡容錯,無法提供交換機容錯。
在可用性要求較高的場合,交換機容錯是必須的。如何解決這個問題呢?最理想的方式是借助
交換機堆疊技術(shù)。就CISCO交換機來說,兩臺堆疊的交換機邏輯上可以看做是一臺交換機。但配置FEC或GEC時,要求成員接口必須位于同一臺物理交換機上。CISCO 3750在堆疊時沒有這個限制,即,兩臺3750交換機堆疊后,可以將不同物理交換機上的交換機端口捆綁在一起。網(wǎng)卡組技術(shù)結(jié)合CISCO 3750堆疊技術(shù),就可以采用交換機相關(guān)模式,同時提供交換機容錯功能。
以上內(nèi)容由北京艾銻無限科技發(fā)展有限公司整理