當前位置:工程項目OA系統(tǒng) > 領域應用 > 辦公管理系統(tǒng) > 設備管理系統(tǒng)
服務器管理經(jīng)驗:IIS故障問題分析及解決方案
前幾個月有臺重要的Web服務器(Windows Server2003 + IIS6.0)出現(xiàn)客戶端無法訪問Web服務器上的站點,錯誤信息提示為"頁面無法顯示"的情況。登錄服務器檢查后發(fā)現(xiàn)IIS并未停止運行,各服務也正常處理,但就是無法訪問站點上的頁面(包括靜態(tài)頁面)。這種問題其實以前也經(jīng)常發(fā)生,基本上處理方法都是通過重啟Web服務器來解決,至于為什么要這樣處理,并沒有具體的論斷和依據(jù),多半是憑借個人的經(jīng)驗所致,所以這種解決方法只能緩解下投訴壓力,沒有從根本上解決問題。
那么,我們現(xiàn)在就來針對這個問題深入探討下,找出問題的根本,爭取做到治標治本。
首先,肯定是分析問題服務器上的IIS日志,我發(fā)現(xiàn)在站點無法訪問的那段時間, httperr日志中記錄了大量的"Connections_Refused"錯誤
這個問題是在默認情況下,如果可用的非分頁緩沖池內(nèi)存不足 20MB,Http.sys 服務將停止接收新連接,就會出現(xiàn)上述問題。這也就解釋了為什么重啟IIS沒用,只能通過重啟Web服務器釋放內(nèi)存資源來解決。
網(wǎng)上也有微軟官方的解決方案:
1. 進入注冊表,找到如下項:
HKEY_LOCAL_MACHINESYSTEMCurrentControlSetServicesHTTPParameters ;
2. 新建Dword值,輸入名稱 "EnableAggressiveMemoryUsage";
3. 修改值為1;
4. 重啟 HTTP 服務:
在DOS下分別執(zhí)行
net stop http /y
iisreset /restart
我按照上述說明進行了配置,但有沒有效果無法考證,只能先觀察這臺服務器后續(xù)的運行情況。這種處理方法比之前重啟Web服務器更進了一步,至少比之前盲目的重啟重啟重啟,更明確的知道了引起問題的原因,離真相更近了一步。那么問題發(fā)生的真正原因呢?究竟是什么導致的非分頁緩沖池內(nèi)存會持續(xù)增大到少于20M的呢?
要分析這個問題,首先得了解下Windows系統(tǒng)中的核心內(nèi)存概念:核心內(nèi)存是Windows分配給系統(tǒng)內(nèi)核或驅(qū)動所需的內(nèi)存空間,分頁內(nèi)存是虛擬內(nèi)存,也就是這一部分內(nèi)存可以置換到硬盤中,但是,非分頁內(nèi)存是不能置換到硬盤的,只能保存在物理內(nèi)存中,常用于一些軟件或是系統(tǒng)的驅(qū)動程序使用。如果未分頁內(nèi)存無限增大,到達一個閥值,就會造成系統(tǒng)問題。在32位的Windows上,這個閥值最高不能超過256MB,否則操作系統(tǒng)會變得非常不穩(wěn)定。
打開自己系統(tǒng)的任務管理器,在"性能"項中,可以看到:
如上圖所示,這就是我本機當前時刻所使用的分頁和未分頁內(nèi)存數(shù),這個數(shù)字很正常。
我們再來看下最近這臺有問題的機器連續(xù)2天,2次出現(xiàn)故障時的內(nèi)存使用數(shù),未分頁內(nèi)存已經(jīng)不知不覺暴漲到230多M了
好了,廢話不多說,這個時候就需要用到Poolmon這個核心內(nèi)存泄漏檢測工具了。通過這個工具,我們來看看Web服務器上到底是哪些軟件或者程序造成內(nèi)存泄露,從而導致未分頁內(nèi)存數(shù)不足的。Poolmon是類似于Dos 的命令行執(zhí)行程序,基本上完成檢測的操作我們只需要2個指令: P-排序標簽列表通過分頁,非分頁,混合等3種模式;B-對標簽排序最大字節(jié)使用情況。如下圖所示:顯示的就是操作系統(tǒng)中所有占用非分頁內(nèi)存項,并按字節(jié)大小降序排列。我們找出排在前面,并且字節(jié)數(shù)不斷增加的tag項,根據(jù)Tag來定位進程和驅(qū)動文件。比如我們想看下目前占用90M非分頁內(nèi)存的Thre項,在Dos中輸入:
findstr /s /m /l "Thre" c:windowssystem32drivers*.sys
我們看到是系統(tǒng)驅(qū)動和殺毒驅(qū)動占用了Thre。這臺機器上次中過毒,所以后來下了瑞星和360衛(wèi)士來排毒。瑞星是出了名的耗未分頁內(nèi)存大戶,360衛(wèi)士本身也已經(jīng)被病毒感染,所以我基本鎖定了這2款軟件,先卸載,然后重啟服務器,重新下載360衛(wèi)士和360殺毒再次排毒之后觀察服務器運行情況和內(nèi)存消耗情況。從上次重啟到目前為止,運行十多天,未分頁內(nèi)存總消耗保持在50M以內(nèi),雖有小許增長,但還算正常。到此,根據(jù)上面的分析, 我們就可以定位出導致IIS故障的真正問題所在了。這種問題,很大部分是因為殺毒軟件程序或者一些系統(tǒng)驅(qū)動導致的。
這里說的很大部分原因是因為殺毒軟件程序或者一些系統(tǒng)驅(qū)動導致的非分頁內(nèi)存不足,是因為非分頁內(nèi)存一般是內(nèi)核程序或驅(qū)動程序在請求。這種資源非常寶貴,如果程序處理不當?shù)脑?,也會導致上述情況,比如一個Socket只接受連接,但因為某些原因沒有讀取數(shù)據(jù),然后客戶端連接上之后一直發(fā)送數(shù)據(jù),在這種極端的情況下未分頁內(nèi)存也很快就會被占滿。
【推薦閱讀】
◆設備管理系統(tǒng)運維管理專區(qū)
◆管理人員如何過網(wǎng)絡拓撲圖實現(xiàn)查詢
◆中小型數(shù)據(jù)安全和管理安全應對之策
◆企業(yè)設備管理系統(tǒng)運維管理軟件趨勢
◆設備管理軟件軟件專區(qū)
本文來自互聯(lián)網(wǎng),僅供參考- 1設備管理系統(tǒng)app
- 2虛擬網(wǎng)絡設備的優(yōu)缺點何在?
- 3調(diào)查:2013年十大最熱IT職業(yè)
- 4IT事故能真正實現(xiàn)防患于未然嗎?
- 5系統(tǒng)管理員如何面對分工專業(yè)化
- 6設備臺帳管理是做些什么?
- 7改變IT行業(yè)的十大技術趨勢
- 8IT運維管理發(fā)展之路回顧
- 9IT運維管理安全五大錯誤解析
- 10云虛擬化存儲和網(wǎng)絡有哪些表現(xiàn)
- 11回顧2012年設備管理系統(tǒng)安全圈發(fā)生的那些事兒
- 122013年服務器虛擬化趨勢預測
- 13BYOD成本的秘密:企業(yè)真能實現(xiàn)成本節(jié)約嗎?
- 14IT運維管理平臺行業(yè)標準
- 15數(shù)據(jù)中心電源管理:細節(jié)是關鍵
- 16未來數(shù)據(jù)中心和云計算的十二大趨勢
- 17停車場管理系統(tǒng)設備包括哪些?
- 18設備臺賬管理軟件需求分析
- 19如何加強設備管理系統(tǒng)的實用性?
- 20云計算時代的IT運維走向何方?
- 21運維人員須時刻謹記的十條安全法則
- 22智能設備管理系統(tǒng)的作用有哪些?
- 23IT部門應該關注大數(shù)據(jù)
- 24如何構(gòu)建數(shù)據(jù)中心安全管理體系
- 25頂級CIO必不可犯的八大IT失誤
- 26數(shù)據(jù)中心運維管理十大黃金經(jīng)驗
- 27如何提高IT運維人員工作效率
- 28設備管理系統(tǒng)維護經(jīng)驗:如何設計不易破解的密碼
- 29企業(yè)網(wǎng)絡帶寬管理的八個技巧
- 30IT運維管理人員必須掌握的IT能源管理技術
成都公司:成都市成華區(qū)建設南路160號1層9號
重慶公司:重慶市江北區(qū)紅旗河溝華創(chuàng)商務大廈18樓