上網(wǎng)速度緩慢、數(shù)據(jù)嚴重丟包故障現(xiàn)象十分常見,造成該故障的原因也是十分繁多,這種類型的網(wǎng)絡故障排查解決起來自然也比較麻煩;為了幫助大家多積累這方面的排查經(jīng)驗,本文現(xiàn)在就從實戰(zhàn)角度出發(fā),來向大家貢獻一則網(wǎng)絡管理維護技巧,由網(wǎng)絡線纜連接不當引發(fā)的網(wǎng)絡通道堵塞故障的排查過程,希望這些內(nèi)容能讓大家得到啟發(fā)!
故障現(xiàn)象
筆者所在單位的局域網(wǎng)是由一個中心機房的工作子網(wǎng)和各個樓層的工作子網(wǎng)組成,中心機房的工作子網(wǎng)中有包括Web服務器在內(nèi)的各個應用系統(tǒng)服務器以及核心路由交換機,各個樓層的工作子網(wǎng)全部通過千兆光纖線路與中心機房的核心交換機保持連接,局域網(wǎng)中的所有終端電腦全部通過超5類雙絞線實現(xiàn)與各個樓層交換機的百兆網(wǎng)絡互聯(lián)。為了抑制廣播風暴現(xiàn)象以及網(wǎng)絡病毒的瘋狂傳播,網(wǎng)絡管理員采用VLAN技術(shù)將整個局域網(wǎng)劃分成了不同的虛擬工作子網(wǎng),所有虛擬工作子網(wǎng)全部通過中心機房的核心路由交換機實現(xiàn)不同虛擬工作子網(wǎng)之間的路由。
平時,整個局域網(wǎng)中的所有終端電腦都能正常上網(wǎng),并且上網(wǎng)速度也非常理想??墒牵罱@幾天,網(wǎng)絡管理員不斷接到來自五樓不同用戶的電話報修故障,聲稱它們的終端電腦上網(wǎng)訪問速度突然變慢,從網(wǎng)上下載信息時一點也沒有以往一氣呵成的感覺了,現(xiàn)在的下載速度就象蝸牛一樣爬行,經(jīng)常要訪問的站點也打不開了,電子郵件也不能正常收發(fā)了。接到故障求援之后,網(wǎng)絡管理員立即從自己的終端電腦出發(fā),使用ping命令測試五樓樓層接入交換機的IP地址,結(jié)果發(fā)現(xiàn)這項測試操作延遲現(xiàn)象十分嚴重,而且數(shù)據(jù)丟包率達到了驚人的16%左右,這在一個規(guī)模不大的局域網(wǎng)網(wǎng)絡中來說是不應該的。既然故障現(xiàn)象發(fā)生了,網(wǎng)絡管理員立即采取措施,進行了以下排查操作。
故障排查
考慮到最近一段時間,整個局域網(wǎng)網(wǎng)絡曾經(jīng)發(fā)生過網(wǎng)絡病毒瘋狂肆虐的現(xiàn)象,為此網(wǎng)絡管理員首先將故障排查對象鎖定在網(wǎng)絡病毒身上;因為一旦局域網(wǎng)中真的存在許多網(wǎng)絡病毒,并且這些病毒同時爆發(fā)的話,那么對應網(wǎng)絡中的有限出口帶寬資源可能會被大量占用,那么終端電腦上網(wǎng)速度自然會受到明顯影響。為了判斷網(wǎng)絡病毒是否是上述故障現(xiàn)象的禍首,網(wǎng)絡管理員立即趕到五樓樓層交換機現(xiàn)場,將自己隨身攜帶的筆記本電腦通過Console控制線纜連接到該樓層交換機上,然后在筆記本電腦中運行Sniff程序進行數(shù)據(jù)抓包分析;結(jié)果網(wǎng)絡管理員發(fā)現(xiàn),這個樓層的虛擬工作子網(wǎng)內(nèi)當前上線的終端電腦數(shù)量只有二三十臺,而對應工作子網(wǎng)內(nèi)的數(shù)據(jù)包流量也不是很大;在這種情形下,網(wǎng)絡管理員嘗試通過該樓層的交換機進行上網(wǎng)訪問時,發(fā)現(xiàn)網(wǎng)頁內(nèi)容仍然無法訪問,電子郵件收發(fā)也無法進行,看來造成這種故障現(xiàn)象的因素不是網(wǎng)絡病毒。
在排除網(wǎng)絡病毒因素后,網(wǎng)絡管理員又對這個樓層的交換機設備進行了仔細觀察,發(fā)現(xiàn)連接到該交換機的終端電腦數(shù)量比較多,而且對應交換機的型號屬于低端產(chǎn)品,它的自身運行性能也是一般。正常情況下,這種低端的樓層交換機持續(xù)運行的時間比較長的話,很有可能出現(xiàn)系統(tǒng)緩存溢出錯誤等,或者交換機內(nèi)部的性能元件發(fā)生老化現(xiàn)象,這些現(xiàn)象都會影響交換機的運行穩(wěn)定性。對于這樣的“軟”故障現(xiàn)象,往往都能通過重新啟動的方法來解決,依照這樣的思路,網(wǎng)絡管理員立即重新啟動了一下五樓樓層交換機系統(tǒng),沒有多長時間,該交換機就啟動穩(wěn)定了。原以為這次努力能夠解決問題,可是當網(wǎng)絡管理員再次從自己的筆記本電腦中訪問目標站點頁面中的內(nèi)容時,發(fā)現(xiàn)網(wǎng)絡訪問速度仍然非常緩慢,顯然網(wǎng)絡通道仍然處于堵塞狀態(tài)。
既然故障現(xiàn)象與網(wǎng)絡病毒以及樓層交換機自身運行狀態(tài)沒有關(guān)系,那么究竟是什么因素造成了這種故障現(xiàn)象呢?經(jīng)過仔細思索,網(wǎng)絡管理員突然聯(lián)想到了網(wǎng)絡環(huán)路因素,因為局域網(wǎng)中一旦存在網(wǎng)絡環(huán)路現(xiàn)象的話,同樣能夠產(chǎn)生廣播風暴現(xiàn)象,從而可能會堵塞網(wǎng)絡傳輸通道,那么局域網(wǎng)中究竟存在不存在網(wǎng)絡環(huán)路現(xiàn)象呢?正常情況下,如果五樓工作子網(wǎng)中存在網(wǎng)絡環(huán)路現(xiàn)象的話,那么對應樓層的交換機上的所有信號燈狀態(tài)都應該處于不停閃爍狀態(tài)。基于這樣的分析,網(wǎng)絡管理員立即對樓層交換機控制面板上的信號燈狀態(tài)進行了觀察,結(jié)果發(fā)現(xiàn)這些交換端口信號燈果然存在閃爍過于頻繁的嫌疑;于是,網(wǎng)絡管理員立即斷開樓層交換機與對應樓層的光纖收發(fā)器之間的連接線路,通過普通的網(wǎng)絡線纜將自己的筆記本電腦連接到對應樓層的光纖收發(fā)器網(wǎng)絡端口上,滿以為這次可能能夠解決問題,可是網(wǎng)絡管理員再次在筆記本電腦中訪問目標站點頁面時,網(wǎng)頁內(nèi)容竟然還是無法打開,之前出現(xiàn)的故障現(xiàn)象仍然存在,很明顯這樣的故障現(xiàn)象與樓層交換機沒有任何關(guān)系!
在確認上面的故障現(xiàn)象與樓層交換機沒有任何關(guān)系之后,網(wǎng)絡管理員又將故障排查的范圍縮小到光纖連接跳線、光收發(fā)器、中心機房的核心交換機上了,因為只有這些位置的設備或線纜沒有檢查了。由于除了五樓之外的其他樓層交換機同樣也是連接到中心機房的核心交換機上的,仔細觀察其他樓層用戶的上網(wǎng)狀態(tài)時,發(fā)現(xiàn)它們都是正常的,所以從這一點來看,網(wǎng)絡管理員估計中心機房的核心交換機自身工作狀態(tài)是正常的。那有沒有可能是連接五樓樓層交換機的核心交換機端口存在問題,導致五樓用戶不能正常通過核心交換機訪問網(wǎng)絡呢?聯(lián)想到這一點,網(wǎng)絡管理員立即以系統(tǒng)管理員權(quán)限登錄進入核心交換機后臺,進入連接五樓的交換端口視圖配置界面,使用“display interface”命令查看該交換端口的狀態(tài)信息時,沒有發(fā)現(xiàn)有什么異?,F(xiàn)象,同時該交換端口的工作狀態(tài)也處于“up”狀態(tài)。后來,網(wǎng)絡管理員擔心連接五樓交換機的光纖收發(fā)器以及光纖跳線接頭存在問題,于是又不厭其煩地采用手工方法對光纖連接跳線線頭進行了衛(wèi)生清潔工作,同時又替換了光纖收發(fā)器設備,可即使這樣努力,故障排查工作還是一點沒有進展。
故障解決
在萬般無奈之下,網(wǎng)絡管理員只好趕到中心機房,來到核心交換機現(xiàn)場,仔細觀察核心交換機的物理連接時,終于弄清楚了故障產(chǎn)生的根源。我們知道,普通的光纖收發(fā)器設備通常只有一對光口以及一個普通的以太網(wǎng)端口,其中光口是專門用來連接光纖跳線的,以太網(wǎng)端口可以連接終端電腦進行網(wǎng)絡訪問測試;可是,中心機房使用的光纖收發(fā)器設備卻與眾不同,它同時擁有兩個普通的以太網(wǎng)端口,它的作用與一只包含兩個交換端口的微型交換機相當。正常情況下,我們只會同時用到一個以太網(wǎng)端口和連接光纖跳線的光口,另外一個以太網(wǎng)端口平時不怎么用到;可是網(wǎng)絡管理員在這里卻看到,連接核心路由交換機的光纖收發(fā)器,同時使用了兩個普通的以太網(wǎng)端口,分別沿著這兩個以太網(wǎng)端口的連接線纜進行查詢時,網(wǎng)絡管理員發(fā)現(xiàn)它們竟然同時連接到核心交換機設備上了,只是它們連接到核心交換機不同的Vlan接口上罷了。由于各個樓層的Vlan全部設置在核心路由交換機上,各個樓層Vlan相互之間的訪問路由也配置在該設備上,當連接五樓的光纖收發(fā)器上的兩個普通以太網(wǎng)端口同時連接到核心路由交換機上時,對應光纖收發(fā)器與核心路由交換機之間無形之中就形成了網(wǎng)絡環(huán)路現(xiàn)象,結(jié)果造成對應光纖收發(fā)器的連接端口被大量的數(shù)據(jù)包堵塞,從而影響了五樓用戶的上網(wǎng)訪問速度。
找到了故障產(chǎn)生的“罪槐禍首”后,網(wǎng)絡管理員立即從連接五樓的光纖收發(fā)器上拔下了多余的網(wǎng)絡連接線纜,再次使用筆記本電腦從五樓網(wǎng)段進行目標網(wǎng)站的訪問時,發(fā)現(xiàn)網(wǎng)絡訪問速度已經(jīng)恢復到正常狀態(tài),同時發(fā)現(xiàn)收發(fā)電子郵件等操作也恢復了正常,這說明五樓的網(wǎng)絡故障現(xiàn)象已經(jīng)徹底消失了。
原因探究
上面的故障現(xiàn)象雖然已經(jīng)被成功解決了,但是讓網(wǎng)絡管理員感到疑惑不解的是,為什么光纖收發(fā)器上的兩個普通以太網(wǎng)接口會同時連接有網(wǎng)絡線纜?網(wǎng)絡管理員經(jīng)過仔細觀察看到。在中心機房的接線柜內(nèi)同時安裝了來自其他樓層的十幾個光纖收發(fā)器設備,其中某個光纖收發(fā)器設備由于發(fā)生了硬件質(zhì)量問題被暫時從接線柜內(nèi)移走了,不過對應設備的電源連接線纜以及網(wǎng)絡連接線纜仍然還放置在接線柜內(nèi);網(wǎng)絡管理員詢問中心機房的其他工作人員時得知,前幾天另外一個工作人員在對大樓網(wǎng)絡設備正常巡檢時,看來保留下來的網(wǎng)絡線纜時,以為是該網(wǎng)絡線纜由于接觸不牢靠從設備上滑落下來了,于是下意識地將它連接到來自五樓的光纖收發(fā)器設備上了,這樣一則奇怪的網(wǎng)絡故障現(xiàn)象就在不經(jīng)意間發(fā)生了。
從這則故障的產(chǎn)生過程來看,筆者認為平時遭遇到的許多網(wǎng)絡故障現(xiàn)象,都是由于網(wǎng)絡管理員自己在工作過程中粗心大意引起的。所以,為了保證局域網(wǎng)網(wǎng)絡能夠始終穩(wěn)定地運行,我們除了在安裝、組建的時候,要嚴格遵守網(wǎng)絡布線標準外,還需要在平時加強對網(wǎng)絡工作環(huán)境的維護,千萬不能圖一時的操作便利而輕易留下故障隱患。
【推薦閱讀】
◆網(wǎng)管軟件專區(qū)
◆成功網(wǎng)管員必備素質(zhì)軟件篇
◆網(wǎng)管基礎知識:如何關(guān)閉無線路由器的信號發(fā)射
◆合格的網(wǎng)管員必備的個人能力和技術(shù)知識
◆IT運維管理專區(qū)
本文來自互聯(lián)網(wǎng),僅供參考