當(dāng)前位置:工程項(xiàng)目OA系統(tǒng) > OA系統(tǒng)企業(yè)版 > 相關(guān)軟件 > 上網(wǎng)行為管理軟件
網(wǎng)絡(luò)管理經(jīng)驗(yàn)分享:大型網(wǎng)站的運(yùn)維管理
首先明確一下,全文所講的”運(yùn)維“是指:大型網(wǎng)站運(yùn)維,與其它運(yùn)維的區(qū)別還是蠻大的;然后我們再對大型網(wǎng)站與小型網(wǎng)站進(jìn)行范圍定義,此定義主要從運(yùn)維復(fù)雜性角度考慮,如網(wǎng)站規(guī)范、知名度、服務(wù)器量級、pv量等考慮,其它因素不是重點(diǎn);因此,我們先定義服務(wù)器規(guī)模大于1000臺(tái),pv每天至少上億(至少國內(nèi)排名前10),如sina、baidu、QQ,51.com等等;其它小型網(wǎng)站可能沒有真正意義上的運(yùn)維工程師,這與網(wǎng)站規(guī)范不夠和成本因素有關(guān),更多的是集合網(wǎng)絡(luò)、系統(tǒng)、開發(fā)工作于一身的“復(fù)合性人才”,就如有些公司把一些合同采購都納入了運(yùn)維職責(zé)范圍,還有如IDC網(wǎng)絡(luò)規(guī)劃也納入運(yùn)維職責(zé)。所以,非常重要一定需要明白:運(yùn)維對其它關(guān)聯(lián)工種必須非常了解熟悉:網(wǎng)絡(luò)、系統(tǒng)、系統(tǒng)開發(fā)、存儲(chǔ),安全,DB等;我在這里所講的運(yùn)維工程師就是指專職運(yùn)維工程師。
我們再來說說一般產(chǎn)品的“出生”流程:
1、首先公司管理層給出指導(dǎo)思想,PM定位市場需求(或copy成熟應(yīng)用)進(jìn)行調(diào)研、分析、最終給出詳細(xì)設(shè)計(jì)。
2、架構(gòu)師根據(jù)產(chǎn)品設(shè)計(jì)的需求,如pv大小預(yù)估、服務(wù)器規(guī)模、應(yīng)用架構(gòu)等因素完成網(wǎng)絡(luò)規(guī)劃,架構(gòu)設(shè)計(jì)等(基本上對網(wǎng)絡(luò)變動(dòng)不大,除非大項(xiàng)目)
3、開發(fā)工程師將設(shè)計(jì)code實(shí)現(xiàn)出來、測試工程師對應(yīng)用進(jìn)行測試。
4、好,到運(yùn)維工程師出馬了,首先明確一點(diǎn)不是說前三步就與運(yùn)維工作無關(guān)了,恰恰相反,前三步與運(yùn)維關(guān)系很大:應(yīng)用的前期架構(gòu)設(shè)計(jì)、軟/硬件資源評估申請采購、應(yīng)用設(shè)計(jì)性能隱患及評估、IDC、服務(wù)性能安全調(diào)優(yōu)、服務(wù)器系統(tǒng)級優(yōu)化(與特定應(yīng)用有關(guān))等都需運(yùn)維全程參與,并主導(dǎo)整個(gè)應(yīng)用上線項(xiàng)目;運(yùn)維工程師負(fù)責(zé)產(chǎn)品服務(wù)器上架準(zhǔn)備工作,服務(wù)器系統(tǒng)安裝、網(wǎng)絡(luò)、IP、通用工具集安裝。運(yùn)維工程師還需要對上線的應(yīng)用系統(tǒng)架構(gòu)是否合理、是否具備可擴(kuò)展性、及安全隱患等因素負(fù)責(zé),并負(fù)責(zé)最后將產(chǎn)品(程序)、網(wǎng)絡(luò)、系統(tǒng)三者進(jìn)行拼接并最優(yōu)化的組合在一起,最終完成產(chǎn)品上線提供用戶使用,并周而復(fù)使:需求->開發(fā)(升級)->測試->上線(性能、安全問題等之前預(yù)估外的問題隨之慢慢就全出來了)在這里提一點(diǎn):網(wǎng)站開發(fā)模式與傳統(tǒng)軟件開發(fā)完全不一樣,網(wǎng)站一天開發(fā)上線1~5個(gè)升級版本是家常便飯,用戶體驗(yàn)為王嘛,如果某個(gè)線上問題像M$需要1年解決,用戶早跑光了;應(yīng)用上線后,運(yùn)維工作才剛開始,具體工作可能包括:升級版本上線工作、服務(wù)監(jiān)控、應(yīng)用狀態(tài)統(tǒng)計(jì)、日常服務(wù)狀態(tài)巡檢、突發(fā)故障處理、服務(wù)日常變更調(diào)整、集群管理、服務(wù)性能評估優(yōu)化、數(shù)據(jù)庫管理優(yōu)化、隨著應(yīng)用PV增減進(jìn)行應(yīng)用架構(gòu)的伸縮、安全、運(yùn)維開發(fā)工作:
a、盡量將日常機(jī)械性手工工作通過工具實(shí)現(xiàn)(如服務(wù)監(jiān)控、應(yīng)用狀態(tài)統(tǒng)計(jì)、服務(wù)上線等等),提高效率。
b、解決現(xiàn)實(shí)中服務(wù)存在的問題,如高可靠性、可擴(kuò)展性問題等。
c、大規(guī)模集群管理工具的開發(fā),如1萬臺(tái)機(jī)器如何在1分鐘內(nèi)完成密碼修改、或運(yùn)行指定任務(wù)?2000臺(tái)服務(wù)器如何快速安裝操作系統(tǒng)?各分布式IDC、存儲(chǔ)集群中數(shù)PT級的數(shù)據(jù)如何快速的存儲(chǔ)、共享、分析?等一系列挑戰(zhàn)都需運(yùn)維工程師的努力。
在此說明一下其它配合工種情況,在整個(gè)項(xiàng)目中,前端應(yīng)用對于網(wǎng)絡(luò)/系統(tǒng)工程師來說是黑匣子,同時(shí)開發(fā)工程師職責(zé)只是負(fù)責(zé)完成應(yīng)用的功能性開發(fā),并對應(yīng)用本身性能、安全性等應(yīng)用本身負(fù)責(zé),它不負(fù)責(zé)或關(guān)心網(wǎng)絡(luò)/系統(tǒng)架構(gòu)方面事宜,當(dāng)然軟/硬件采購人員等事業(yè)部其它同事也不會(huì)關(guān)心這些問題,各司其職,但項(xiàng)目的核心是運(yùn)維工程師~!所有其它部門的橋梁。
上面說了很多,我想大家應(yīng)該對運(yùn)維有一些概念了,在此打個(gè)比方吧,如果我們是一輛高速行駛在高速公路上的汽車,那運(yùn)維工程師就是司機(jī)兼維修工,這個(gè)司機(jī)不簡單,有時(shí)需要在高速行駛過程中換輪胎、并根據(jù)道路情況換檔位、當(dāng)汽車速度越來越快,汽車本身不能滿足高速度時(shí)對汽車性能調(diào)優(yōu)或零件升級、高速行進(jìn)中解決汽車故障及性能問題、時(shí)刻關(guān)注前方安全問題,并先知先覺的采取規(guī)避手段。這就是運(yùn)維工作~!
最后說一下運(yùn)維工程師的職責(zé):”確保線上穩(wěn)定“,看似簡單,但實(shí)屬不容易,運(yùn)維工程師必須在諸多不利因素中進(jìn)行權(quán)衡:新產(chǎn)品模式對現(xiàn)有架構(gòu)及技術(shù)的沖擊、產(chǎn)品高頻度的升級帶來的線上BUG隱患、運(yùn)維自動(dòng)化管理承度不高導(dǎo)致的人為失誤、上網(wǎng)行為行業(yè)追求的高效率導(dǎo)致流程執(zhí)行上的缺失、用戶增漲帶來的性能及架構(gòu)上的壓力、上網(wǎng)行為行業(yè)寬松的技術(shù)管理文化、創(chuàng)新風(fēng)險(xiǎn)、互聯(lián)網(wǎng)安全性問題等因素,都會(huì)是網(wǎng)站穩(wěn)定的大敵,運(yùn)維工程師必須把控好這最后一關(guān),需具體高度的責(zé)任感、原則性及協(xié)調(diào)能力,如果能做到各因素的最佳平衡,那就是一名優(yōu)秀的運(yùn)維工程師了。
另外在此聊點(diǎn)題外話,我在這里看到有很多人要sina、QQ、baidu,51.com等聊自已的運(yùn)維方面的經(jīng)驗(yàn),其實(shí)這對于它們有點(diǎn)免為其難:
a、各公司自已網(wǎng)絡(luò)架構(gòu)、規(guī)模、或多或少還算是公司的核心秘密,要保密,另外,對于大家所熟知的通用軟件、架構(gòu),由于很多公司會(huì)根據(jù)自已實(shí)際業(yè)務(wù)需要,同時(shí)因?yàn)樵嫘阅堋踩?、已知bug、功能等原因,進(jìn)行過二次開發(fā)(如apache,php,mysql),操作系統(tǒng)內(nèi)核也會(huì)根據(jù)不同業(yè)務(wù)類型進(jìn)行定制的,如某些應(yīng)用屬于運(yùn)算型、某些是高IO型、或大存儲(chǔ)大內(nèi)存型。根據(jù)這些特點(diǎn)進(jìn)行內(nèi)核優(yōu)化定制,如sina就在memcache上進(jìn)行過二次開發(fā),搞出了一個(gè)MemcacheDB,具體做得如何我們不談,但開源了,是值得稱贊的,國內(nèi)公司對于開源基本上是索取,沒有貢獻(xiàn);另外,服務(wù)器也不是大家所熟知的型號,根據(jù)業(yè)務(wù)特點(diǎn),大部份都是找DELL/HP/ibm進(jìn)行過定制;另外,在分布式儲(chǔ)存方面都有自已解決方案,要不就是使用現(xiàn)成開源hadoop等解決方案,或自已開發(fā)。但90%都是借鑒googleGFS的思想:分布式存儲(chǔ)、計(jì)算、大表。
b、各公司業(yè)務(wù)方向不一樣,會(huì)導(dǎo)致運(yùn)維模式或方法都不一樣,如51.com和baidu運(yùn)維肯定區(qū)別很大,因?yàn)樗麄儤I(yè)務(wù)模式?jīng)Q定了其架構(gòu)、服務(wù)器量級、IDC分布、網(wǎng)絡(luò)結(jié)構(gòu)、通用技術(shù)都會(huì)不一樣,主打新聞門戶的sina與主打sns的51.com運(yùn)維模式差異就非常大,甚至職責(zé)都不大一樣;但有一點(diǎn),通用技術(shù)及大致架構(gòu)上都大同小異,大家不要太神化,更多的公司只是玩壘積木的游戲罷了,沒什么技術(shù)含量。
c、如上面所講,目前大型網(wǎng)站運(yùn)維還處于幼年時(shí)期理念和經(jīng)驗(yàn)都比較零散,沒有成熟的知識體系,可能具體什么是運(yùn)維,大家都要先思索一番,或壓根沒想過,真正討論也只是運(yùn)維工作的冰山一角,局限于具體技術(shù)細(xì)節(jié),或某某著名網(wǎng)站大的框架,真正運(yùn)維體系化東西沒有,這也許是目前網(wǎng)上運(yùn)維相關(guān)資料比較少的原故吧?;蛘咭彩菄鴥?nèi)運(yùn)維人員比較難招,比較牛的運(yùn)維工程師比較少見的原因之一吧。
本文來自互聯(lián)網(wǎng),僅供參考- 1店鋪管理軟件
- 2工廠管理軟件
- 3服裝庫存管理軟件
- 4銷售管理軟件
- 5電腦銷售管理軟件
- 6預(yù)算管理軟件
- 7人員管理軟件
- 8檔案管理軟件
- 9公司管理軟件
- 10企業(yè)管理軟件
- 11中小企業(yè)管理軟件
- 12日程管理軟件
- 1上網(wǎng)行為管理系統(tǒng)入門:網(wǎng)絡(luò)傳輸中的數(shù)據(jù)封裝
- 2企業(yè)如何應(yīng)對BYOD的10大副作用?
- 3如何選擇數(shù)據(jù)中心基礎(chǔ)架構(gòu)管理工具?
- 4IT運(yùn)維管理經(jīng)驗(yàn)之基礎(chǔ)搭建架構(gòu)的弊端
- 5IT運(yùn)維管理經(jīng)驗(yàn) - IT運(yùn)維管理員三大法則
- 6云時(shí)代:企業(yè)須重新思考IT控制權(quán)
- 7IT運(yùn)維一體化管理的內(nèi)涵如何把握?
- 8上網(wǎng)行為管理系統(tǒng)的標(biāo)準(zhǔn)功能
- 9有線網(wǎng)絡(luò)即將被上網(wǎng)行為管理系統(tǒng)終結(jié)?
- 10新手必備 IT管理員需要了解的十方面
- 11企業(yè)BYOD管理的七條建議
- 12單?;蚨嗄9饫w如何選擇?
- 13上網(wǎng)行為管理系統(tǒng)
- 14兩招解決IT運(yùn)維日志管理難題
- 15IT運(yùn)維管理維護(hù)技巧:門戶網(wǎng)站如何運(yùn)維
- 16軟件業(yè)2013十大預(yù)言
- 17IT運(yùn)維管理經(jīng)驗(yàn):如何防止黑客入侵之攻擊
- 18大數(shù)據(jù):如何讓信息安全從被動(dòng)走向主動(dòng)
- 19CIO關(guān)注的2013年五大IT趨勢
- 20IP網(wǎng)絡(luò)安全管理的主要問題總結(jié)
- 21服務(wù)IT運(yùn)維管理,泛普軟件拓展業(yè)務(wù)價(jià)值
- 22IT安全必須引入風(fēng)險(xiǎn)管理的四大理由
- 23光纖與同軸線纜區(qū)別何在?
- 24CIO如何應(yīng)對2013大數(shù)據(jù)元年
- 25網(wǎng)絡(luò)安全管理體系與功能模型
- 26移動(dòng)時(shí)代企業(yè)應(yīng)用帶寬如何管理
- 27IT運(yùn)維管理經(jīng)驗(yàn)分享:Hadoop管理員最佳實(shí)踐
- 28IT運(yùn)維管理經(jīng)驗(yàn):VLAN的配置管理與維護(hù)
- 29網(wǎng)管員必知:常用電腦密碼破解
- 30網(wǎng)絡(luò)安全管理系統(tǒng)評估
成都公司:成都市成華區(qū)建設(shè)南路160號1層9號
重慶公司:重慶市江北區(qū)紅旗河溝華創(chuàng)商務(wù)大廈18樓