當前位置:工程項目OA系統(tǒng) > OA系統(tǒng)企業(yè)版 > 相關軟件 > 上網(wǎng)行為管理軟件
兩招解決IT運維日志管理難題
長久以來,日志管理都是上網(wǎng)行為運維工程師不可回避的工作,它不但可以跟蹤上網(wǎng)行為基礎設施活動,更是回答故障是否發(fā)生、如何發(fā)生、何時發(fā)生、在何處發(fā)生的最佳答案。但不斷增加的設備與網(wǎng)絡行為產(chǎn)生了令人難以控制的海量日志,告警信息更是成百上千,而僅憑人工進行管理,幾乎成了一件不可能完成的任務。
日志監(jiān)控也有“狼來了”
考慮到日志管理本身所具有的功效,收集日志數(shù)據(jù)及進行分析,通常被認為是上網(wǎng)行為運維最具常態(tài)的工作之一,更是防禍于未然的有效手段。但這種常態(tài)任務一旦超出工作負荷,不但在“量”上面無法完成,還很有可能在“質(zhì)”上影響上網(wǎng)行為運維管理的有效性。
趙蒙,某市信息網(wǎng)絡中心的運維工程師,雖說頭頂著上網(wǎng)行為光環(huán),但他卻備受日志監(jiān)控的煎熬,過著“苦行僧”一般的生活。網(wǎng)絡中心不但要負責電子政務數(shù)十個業(yè)務系統(tǒng)的運維保障,還兼管其他委辦局業(yè)務系統(tǒng)監(jiān)控的工作,不論白班或是夜班值守的同事,所有人都有一項工作必不可少,這就是“檢查日志、評估和處理告警事件”。為了提高工作效率,在大家群策群力之下,許多針對操作系統(tǒng)或者是數(shù)據(jù)庫日志系統(tǒng)的自動處理腳本被一一開發(fā)出來。但這并沒有讓運維監(jiān)控壓力得到緩解,網(wǎng)絡設備、服務器、網(wǎng)絡流量,甚至數(shù)據(jù)庫的警告信息,成千條日志信息堆積在一起更本沒法判斷問題的根源在哪里?在這種情形下,趙蒙漸漸疲態(tài)化,放棄了努力,每次在巡檢表格上胡亂填上幾筆,草草了事。
針對上網(wǎng)行為運維管理人員這種常態(tài)化的工作方式,泛普軟件認為:“管理人員如果每天只能按部就班的面對每一臺服務器、網(wǎng)絡設備,逐個去檢查它們的狀況,或者從幾千條日志中找到有價值的內(nèi)容,確實需要耐心、細心和責任心。但由于工作量巨大,很多時候人們開始習慣“狼來了”的心態(tài)。此時,如果沒有對某條告警日志背后的隱患徹底查驗,看似正常的業(yè)務系統(tǒng)則可能由此轟然倒塌。但是,借助泛普軟件智能化的運維平臺,則可以實現(xiàn)自動處理海量日志、主動挖掘故障線索,不喊“狼來了”,即使“狼”真的來了也不懼怕。“
“兩招”化解日志管理難題
日志用來記錄用戶操作、系統(tǒng)運行狀態(tài),是一個運維系統(tǒng)中重要的核心部分,它直接關系到系統(tǒng)出現(xiàn)問題時定位的速度。對日志的觀察和分析,能提前發(fā)現(xiàn)系統(tǒng)可能的風險,避免線上事故的發(fā)生。為了幫助趙蒙早日摘掉“日志控”的帽子,泛普軟件運維管理專家傳授他“兩招”最實用的方法,這就是日志管理中的“廣度、深度”。
第一招:用“廣度”拒絕漏網(wǎng)之魚
日志范圍夠不夠廣,是拒絕漏網(wǎng)之魚,走出成功的第一步。為此,趙蒙可以借助泛普BTIM 上網(wǎng)行為綜合管理平臺,將網(wǎng)絡、安全、機房、桌面、服務器、數(shù)據(jù)庫、中間件、應用、業(yè)務等各個方面監(jiān)控起來,對所有設備的性能、各類數(shù)據(jù)流進行自動采集。隨后,他可以使用批量告警設置功能,進而屏蔽差異項,在縮短告警規(guī)則設置時間的同時,從上百條告警規(guī)則中解脫出來,只維護十分之一的告警規(guī)則,大幅降低了告警規(guī)則維護的復雜度。
第二招:用“深度”追擊故障根源
日志管理不能是孤立的,否則它在主動運維方式中就沒有任何意義。為此,泛普BTIM包含了強大的信息關聯(lián)展示、分析能力,管理人員可以在業(yè)務管理上綜合不同領域的業(yè)務相關“關鍵參數(shù)”,判斷具體故障性質(zhì)、位置,直接調(diào)用各個管理組件定位故障點。一旦發(fā)現(xiàn)危險事件,TFS管理系統(tǒng)將可以依據(jù)業(yè)務實際流量路徑,按照分析需要,逐層擴大數(shù)據(jù)采集的深度和廣度,層層深入,直達故障根源。
事件監(jiān)控、日志分析,這些上網(wǎng)行為運維管理中的“自動化”,談起來容易,真正實現(xiàn)卻并不簡單。實際上,整個上網(wǎng)行為基礎架構,有很多不同的組成部分構成,有很多不同的信息,而自動化也是上網(wǎng)行為運維管理逐步發(fā)展演進的過程。從趙蒙帶領大家編寫自動處理腳步,到對整個上網(wǎng)行為管理作業(yè)流的自動控制,這些技術上的改變都是在追求著:實現(xiàn)智能化的運維,解放人力!
在本案例中,看似只在日志管理上前進了一小步,但恰恰反映出運維體系向著成熟邁出了一大步,擺脫這種低水平的循環(huán),將使得上網(wǎng)行為 運營更加高效,讓時間變得更有價值。以趙蒙為代表的運維工程師們,從此更可以不再千篇一律,“狼來了”的故事也不再有人提起。
【推薦閱讀】
◆上網(wǎng)行為運維管理專區(qū)
◆上網(wǎng)行為運維管理者如何在DT時代玩轉(zhuǎn)數(shù)據(jù)分析
◆如何完成遠程排除網(wǎng)絡故障
◆孫永杰:本土軟件企業(yè)的對手不是“老外”
◆網(wǎng)管軟件專區(qū)
本文來自互聯(lián)網(wǎng),僅供參考- 1CIO如何應對2013大數(shù)據(jù)元年
- 2CIO必知:IT省錢那些招兒
- 3交換機VLAN兩種匯聚方式詳解
- 4IT運維管理如何迎接云時代的到來?
- 5IT運維管理經(jīng)驗之基礎搭建架構的弊端
- 6企業(yè)如何應對BYOD的10大副作用?
- 7上網(wǎng)行為管理系統(tǒng)的標準功能
- 8IT運維管理經(jīng)驗:用兩臺電腦來提升效率
- 9網(wǎng)絡管理維護技巧:如何會讓IP地址永不沖突
- 10網(wǎng)管軟件選擇四大要素
- 11SDN距離實際應用還有多遠?
- 12網(wǎng)管經(jīng)驗實例:交換機頻繁掉線的分析與解決
- 13網(wǎng)管員必知:常用電腦密碼破解
- 14網(wǎng)絡管理十大注意事項
- 15孫永杰:本土軟件企業(yè)的對手不是”老外“
- 16網(wǎng)絡管理維護經(jīng)驗:操作系統(tǒng)慢的原因
- 17大數(shù)據(jù):如何讓信息安全從被動走向主動
- 18怎樣才算是一個合格的IT運維工程師
- 192013年IT招聘市場10大趨勢 整體樂觀
- 20IT運維管理經(jīng)驗:VLAN的配置管理與維護
- 21網(wǎng)絡安全管理經(jīng)驗:常見病毒手工清除方法
- 22如何確保IT系統(tǒng)管理員在五年后有飯碗
- 23IT系統(tǒng)管理的終極規(guī)章化
- 24網(wǎng)絡分段的優(yōu)缺點及挑戰(zhàn)
- 25IT管理系統(tǒng)運維秘訣:如何提高個人知識與經(jīng)驗積累
- 26產(chǎn)品與方案
- 27網(wǎng)絡管理維護技巧:通過系統(tǒng)權限法來清理木馬
- 28企業(yè)網(wǎng)絡管理技巧:五步管好局域網(wǎng)帶寬管理
- 29如何應對大數(shù)據(jù)洪流
- 30Nest遭黑客破解 物聯(lián)網(wǎng)安全問題堪憂
成都公司:成都市成華區(qū)建設南路160號1層9號
重慶公司:重慶市江北區(qū)紅旗河溝華創(chuàng)商務大廈18樓