監(jiān)理公司管理系統(tǒng) | 工程企業(yè)管理系統(tǒng) | OA系統(tǒng) | ERP系統(tǒng) | 造價咨詢管理系統(tǒng) | 工程設(shè)計管理系統(tǒng) | 簽約案例 | 購買價格 | 在線試用 | 手機APP | 產(chǎn)品資料
X 關(guān)閉

廢墟上的IT故事 CIO談災(zāi)備規(guī)則與演練

申請免費試用、咨詢電話:400-8352-114

來源:泛普軟件

企業(yè)對于災(zāi)備的認識究竟有多少?看法各不相同:災(zāi)備這種事情,就像買保險,絕大多數(shù)都是買個心理安慰,發(fā)生意外的概率太小了;對于數(shù)據(jù)災(zāi)備,還是有必要的,但對于系統(tǒng)災(zāi)備,那簡直就是浪費成本;IT這東西,更新?lián)Q代太快了,要做災(zāi)備得充分考慮投資回報……

不難看出企業(yè)真正認識到災(zāi)備意義的少之又少,絕大多數(shù)企業(yè)認為災(zāi)備的投資是一個浪費,再加上災(zāi)備的成本較高,很多企業(yè)還是停留在數(shù)據(jù)災(zāi)備層次上。沒有充分衡量災(zāi)備的價值,了解災(zāi)備對于企業(yè)生產(chǎn)經(jīng)營的意義。但經(jīng)過“5.12”地震后,身處災(zāi)區(qū)的企業(yè)卻對災(zāi)備有了更加深刻的認識。

地震后僅用了15天,東方汽輪機廠就恢復(fù)了生產(chǎn),這不得不稱得上是一個奇跡。在這奇跡背后,支撐東方汽輪機廠迅速投入生產(chǎn)的是IT災(zāi)備系統(tǒng)。原來,早在“十五”期間,東汽就意識到災(zāi)備的重要性,從那時起就開始了災(zāi)備工作。據(jù)東方汽輪機廠計算機處處長夏開渝介紹,在災(zāi)備工作開始前期大家并沒有認識到災(zāi)備的重要性,很不理解這樣的工作。很多人都不認同企業(yè)做災(zāi)備,認為投入大、周期長,還不如用這些錢來投入到生產(chǎn),獲得更大的收益。把這些錢花到災(zāi)備上,卻什么收益也看不到。整個災(zāi)備方案論證了很長時間。但是在夏開渝的努力下,災(zāi)備工作得以進行。東汽首先從數(shù)據(jù)災(zāi)備開始,逐步過渡到系統(tǒng)災(zāi)備,直到2007年底東汽完成了異地數(shù)據(jù)災(zāi)備、系統(tǒng)災(zāi)備。

東汽的主信息中心在漢旺,而另一個用來備份的信息中心在德陽,兩地相距幾十公里。兩個信息中心的數(shù)據(jù)相互備份,但是數(shù)據(jù)的備份并非實時,而是每天夜里零點自動做增量備份,每周做全備份。對于重要的ERP數(shù)據(jù),每天備份,同時做增量備份,一周做一次全備份,數(shù)據(jù)保留時間為一年。對于非關(guān)鍵數(shù)據(jù)3天做一次增量備份,兩周做一次全備份。

而德陽機房中心的備份僅局限于數(shù)據(jù)備份,東汽只在漢旺機房內(nèi)對關(guān)鍵核心服務(wù)器做了雙機熱備。夏開渝對企業(yè)級服務(wù)器以及PC及服務(wù)器分別用不同的軟件做了系統(tǒng)備份。就在地震過去整整一個星期后,東汽進入了抗震救災(zāi)的第二階段,將工作重點從救人轉(zhuǎn)向清理廢墟、搶救設(shè)備和生產(chǎn)恢復(fù)。

據(jù)夏開渝回憶:“我們漢旺中心的系統(tǒng)都損壞了,當時中心ERP服務(wù)器的機柜倒掉了,核心兩臺服務(wù)器也遭受了一定程度的破壞,但經(jīng)過修復(fù)發(fā)現(xiàn)仍然可用。這對于我們來說是一個天大的好消息?!币驗?,不僅這4臺企業(yè)級服務(wù)器價格昂貴,更重要的是他們只是在漢旺進行了備份,并沒有在德陽備份。如果這4臺服務(wù)器出了問題,要恢復(fù)原來的信息系統(tǒng),就必須重新采購新機器、安裝軟件,程序繁瑣,時間周期會很長。

5月18日,夏開渝帶領(lǐng)自己的手下就把機房中心的設(shè)備全部搶救出來,并在19日將這些救出來的設(shè)備運抵東汽德陽信息中心。此時,夏開渝對短期內(nèi)迅速將信息系統(tǒng)恢復(fù)到震前水平已有了一定的把握。夏開渝還清晰地記得,首先自己從硬件恢復(fù)工作開始,此期間IBM給予他們很大的幫助,第一時間內(nèi)無償提供了急需的硬件。僅用了3天就把磁盤陣列等硬件設(shè)施恢復(fù)好,之后又用了兩天的時間恢復(fù)系統(tǒng)和數(shù)據(jù),最后一天對所有的系統(tǒng)進行了全面測試。就這樣,東汽僅用了約一個星期的時間就把系統(tǒng)恢復(fù)到了生產(chǎn)前的狀況。

截至5月25日,東汽erp系統(tǒng)、PLM、CAPP、質(zhì)量管理平臺、人力資源系統(tǒng)以及財務(wù)系統(tǒng)等全面恢復(fù)應(yīng)用。

同樣面對突然而來的地震,華西證券的后臺交易系統(tǒng)卻能正常運行,除了現(xiàn)場交易系統(tǒng)的損壞。華西證券早在2005年7月就開始建立災(zāi)備系統(tǒng),并在2006年7月份對原有災(zāi)備中心進行了擴建。

目前,華西證券在深圳擁有一個異地災(zāi)備中心,而在成都總部擁有同城異地災(zāi)備中心,一主一備。在此次地震前,華西證券也經(jīng)常采取一些應(yīng)急演練,來應(yīng)對各種突發(fā)事件。據(jù)華西證券技術(shù)部總經(jīng)理李均介紹:“為了確保業(yè)務(wù)的連續(xù)性,我們經(jīng)常會過一段時間就把所有系統(tǒng)全部關(guān)閉,然后自動切換到異地備用系統(tǒng)進行演練。經(jīng)過多次演練,整個切換過程需要10〜15分鐘時間,業(yè)務(wù)仍舊順利運轉(zhuǎn)。”

在地震后的十幾分鐘內(nèi),通訊線路還未中斷,李均迅速徹查了手機炒股、電話委托等非現(xiàn)場交易,在確保非現(xiàn)場交易一切正常后,李均又開始向公司領(lǐng)導(dǎo)匯報情況。為了確保業(yè)務(wù)的連續(xù)性,華西證券每個營業(yè)部至少都有3套通訊線路與總部聯(lián)通。這其中有聯(lián)通線路、電信線路以及衛(wèi)星線路。正是由于這樣的準備工作,使得華西證券即使現(xiàn)場交易因為地震受阻,人們也能通過網(wǎng)上交易以及手機交易來實現(xiàn)。從而確保華西證券從地震發(fā)生至今,整個交易持續(xù)運轉(zhuǎn)。

地震后的東方汽輪機廠能夠在短短15天內(nèi)就恢復(fù)生產(chǎn),系統(tǒng)很快運轉(zhuǎn),與其良好的災(zāi)備系統(tǒng)有著直接的關(guān)系。但是經(jīng)過此次地震后,夏開渝以及公司的領(lǐng)導(dǎo)也發(fā)現(xiàn)了東汽災(zāi)備的不足之處,同時對于災(zāi)備也有了新的認識。

過去東汽的應(yīng)用系統(tǒng)數(shù)據(jù)庫的服務(wù)器分散度較大,所有服務(wù)器都是單應(yīng)用運行,經(jīng)過這次地震后,夏開渝認為要把多個數(shù)據(jù)庫服務(wù)器做成一個集群。夏經(jīng)理這樣解釋道:“這樣做的好處不僅在平日災(zāi)備的時候可以有效提高速度,另一方面使得災(zāi)備的準確性大大提高。地震前的備份,經(jīng)常會出現(xiàn)一些地方備份不到,給我們?yōu)暮蠡謴?fù)工作帶來了一定的困難。”過去東汽的災(zāi)備有很多人為的因素,需要人工確定哪些地方需要做災(zāi)備,哪些地方不需要。經(jīng)過此次事件,東汽要把所有服務(wù)器共享一個磁盤陣列,由過去的10T擴大到30T。

之前東汽在漢旺的總廠區(qū)已經(jīng)無法投入生產(chǎn),未來東汽會在德陽重新建立一個新廠區(qū),并且在德陽做一個同城異地的系統(tǒng)備份。夏開渝介紹道:“德陽新廠區(qū)和原來德陽的舊廠區(qū)距離僅有20公里,我們會把現(xiàn)有廠區(qū)的信息中心作為新廠區(qū)的災(zāi)備中心。不僅備份數(shù)據(jù),更加強調(diào)系統(tǒng)的備份。”

東汽未來IT工作的重點是完善整個災(zāi)備系統(tǒng)。對于德陽同城異地的災(zāi)備方案,夏開渝也表示了擔心:“兩個廠區(qū)相距僅20多公里,對于普通的火災(zāi)、斷電問題可以很好解決,倘若再次面臨這樣嚴重的地震,這種災(zāi)備是遠遠不夠的?!睂Υ耍瑬|汽首先會在德陽建立災(zāi)備中心,其次會考慮在異地構(gòu)建一個大型的系統(tǒng)級災(zāi)備中心。

夏開渝反復(fù)強調(diào):“災(zāi)備對于一個企業(yè)來說至關(guān)重要,雖然說系統(tǒng)壞了可以重建,數(shù)據(jù)沒有了就是致命的損失。但是經(jīng)過此次地震,讓我更明白系統(tǒng)災(zāi)備的重要性?!毕到y(tǒng)災(zāi)備對于東汽震后快速恢復(fù)生產(chǎn)至關(guān)重要,雖然企業(yè)有了數(shù)據(jù),但是如果沒有系統(tǒng)備份,要想短時間內(nèi)恢復(fù)生產(chǎn),根本不可能?!皩τ谖覀冎圃煨偷钠髽I(yè)來說,ERP的數(shù)據(jù)至關(guān)重要,但是ERP的系統(tǒng)備份更不可少,因為ERP的使用從最初到現(xiàn)在會不斷升級,這期間有一個周期?!毕拈_渝感慨萬分地談道??磥?,數(shù)據(jù)備份只是第一步,企業(yè)要想快速恢復(fù)“元氣”更需要系統(tǒng)備份。

此外,企業(yè)的災(zāi)備還應(yīng)考慮到異構(gòu)系統(tǒng)災(zāi)備問題。例如,企業(yè)平日使用的服務(wù)器很可能與災(zāi)備中心的服務(wù)器不同,尤其是異地災(zāi)備中心。那么,當企業(yè)的系統(tǒng)切換到災(zāi)備中心時,經(jīng)常會發(fā)現(xiàn)系統(tǒng)一時間運轉(zhuǎn)不了。這時,企業(yè)一定要統(tǒng)一平臺,做好災(zāi)備規(guī)劃。

過去,雖然每家證券公司都會做一個災(zāi)備中心,但是經(jīng)過地震后,監(jiān)管機關(guān)更明確要求所有證券公司必須有兩個災(zāi)備中心,一個同城災(zāi)備中心,一個異地災(zāi)備中心。作為一個高度依賴IT的行業(yè),經(jīng)過地震對災(zāi)備更有了深刻的認識。談到這一點,李均說:“過去我們的災(zāi)備中心只具有主信息中心70%的能力,在性能上會與主信息中心有一定差距,未來我們會加大對基礎(chǔ)設(shè)施的投入,提高同城災(zāi)備與異地災(zāi)備的成本。更加注重災(zāi)備的高可用性?!?/P>

同樣在管理上,對于異地災(zāi)備,CIO要面臨管理的挑戰(zhàn)。李均談到:“CIO需要面臨管理半徑多長的問題,同時外包又會有信心安全的風險,這是一個不小的挑戰(zhàn)?!币驗楫惖貫?zāi)備,CIO并不能隨時掌控所有信息,及時處理各種問題。同時CIO還需要確保災(zāi)備系統(tǒng)能夠在第一時間啟用。對于平日的演練、設(shè)備保養(yǎng)、系統(tǒng)運行管理等工作如何來做,需要CIO在工作上費一番功夫。(cioinsight)

發(fā)布:2007-04-27 15:51    編輯:泛普軟件 · xiaona    [打印此頁]    [關(guān)閉]
相關(guān)文章:

泛普泛普博客其他應(yīng)用

泛普OA商務(wù)合同 泛普OA需求調(diào)研 泛普OA實施方案 泛普OA項目啟動 泛普網(wǎng)絡(luò)硬件配置 泛普OA部署安裝 泛普流程模板表單 OA系統(tǒng)二次開發(fā) 泛普常見問題解決 泛普OA操作手冊 泛普軟件項目驗收 泛普培訓(xùn)推廣上線 泛普OA售后服務(wù) 泛普新聞 泛普期刊 泛普博客