監(jiān)理公司管理系統(tǒng) | 工程企業(yè)管理系統(tǒng) | OA系統(tǒng) | ERP系統(tǒng) | 造價咨詢管理系統(tǒng) | 工程設(shè)計管理系統(tǒng) | 簽約案例 | 購買價格 | 在線試用 | 手機APP | 產(chǎn)品資料
X 關(guān)閉

改造“緊急斷電”按鈕

申請免費試用、咨詢電話:400-8352-114

文章來源:泛普軟件

從何處改造

目前很多用戶都在關(guān)心數(shù)據(jù)中心的改造,有人認(rèn)為應(yīng)該增加數(shù)據(jù)中心的容量,也有人說要增加冗余,還有人認(rèn)為應(yīng)該提高整體的效率和電力機械等基礎(chǔ)設(shè)施的可靠性。以上每條建議都是很不錯的建議,但是不能混淆它們之間的順序。

如果在現(xiàn)有設(shè)施中增加處理容量,那么對數(shù)據(jù)中心的員工來說是一大挑戰(zhàn)。如果硬件設(shè)施不變,只增加軟件和網(wǎng)絡(luò)的話,電力和基礎(chǔ)設(shè)施的更新速度就會跟不上步伐。一般公認(rèn)的數(shù)據(jù)中心的故障如操作故障、電力和機械單點故障、設(shè)計缺陷、建筑缺陷是導(dǎo)致數(shù)據(jù)中心癱瘓的主要原因。

隨著數(shù)據(jù)中心的重新部署和擴張,未來5年這種狀況還將進一步惡化。Gartner的分析員Rakesh Kumar說,未來5年中,全球1000多家機構(gòu)中70%的數(shù)據(jù)中心都不得不大刀闊斧地改善其內(nèi)部的設(shè)施。

“這些是典型的老式數(shù)據(jù)中心,最初的供電設(shè)計規(guī)格僅為100到150瓦/平方英尺。目前數(shù)據(jù)中心設(shè)計規(guī)格一般為300到400瓦/平方英尺。到2011年,這一數(shù)字將增加到600瓦/平方英尺?!盞umar還說,“也就是說,目前大部分的數(shù)據(jù)中心在新一代的高密度電器中都將難以勝任,因此CIO們不得不重新部署他們的選址戰(zhàn)略,建立一個新的或者是尋找更大的數(shù)據(jù)中心集中供應(yīng)能源。”

IT硬件所需的空間壓力帶來的是電力和空調(diào)冷卻、基礎(chǔ)設(shè)施超負(fù)荷、設(shè)計標(biāo)準(zhǔn)和空間分配等的需求猛增。公司“后屋”一般是用來放置支持高密度計算所需要的電力和冷卻設(shè)施。一般來說,這個空間比計算機房都大。電力和機械設(shè)施區(qū)域比活地板間隔的250瓦/平方英尺的計算機房大約400%。

相比而言,技術(shù)設(shè)施配備的變化則很小,一來是因為基礎(chǔ)設(shè)施只占總資產(chǎn)市場的很少一部分,再則是因為其獲得的財政收入也只占很少份額。在美國,數(shù)據(jù)中心僅占不足0.1%的建筑資產(chǎn)。有些是人為管理的建筑,有些則無人管理。實際上很多設(shè)備都是全自動化管理。

另外,對數(shù)據(jù)中心來說,年度設(shè)備損耗包括基礎(chǔ)設(shè)施損耗,僅為IT預(yù)算的0.5%。大公司更是這樣,操作和維護電力和機械設(shè)施的費用不足整體預(yù)算的0.001%,這個數(shù)據(jù)簡直是微不足道。如此小的支出肯定不會引起高層的注意。

一般來說,數(shù)據(jù)中心都是整棟大樓中很小的一個區(qū)域,這掩蓋了其操作風(fēng)險和使用消耗的真實面貌。例如,一家跨國藥業(yè)公司最近將1000平方英尺的高密度服務(wù)器室遷至50000平方英尺的大辦公樓里。整棟樓的支出賬單增加了一倍,并在過去9個月中一直維持這個水平。

EPO問題

首先來討論最低成本、低風(fēng)險、高收益的改造方案,這就是改進數(shù)據(jù)中心電力系統(tǒng)利用的關(guān)鍵:緊急斷電開關(guān)(EPO,Emergency Power Off)。

這些看似無傷大雅的開關(guān)一般都安裝在數(shù)據(jù)中心的出口處。一旦按下,所有電源都將被關(guān)閉,并且只有通過人工才能恢復(fù),有些甚至只能通過專業(yè)電力人士恢復(fù)。EPO導(dǎo)致的損失包括關(guān)閉了緊急呼救線路,妨礙了國際貿(mào)易、公司賬戶、藥學(xué)研究實驗過程和空運等所有工作。

事實上,每種工業(yè)都經(jīng)歷過EPO帶給它們的損失。

有些EPO故障屬于接線故障、地下電纜故障拉動開關(guān)的誤操作、漏水和維護不良等,但大部分是人為性質(zhì)——錯誤地按下了EPO開關(guān)所造成的。很多案例中都是員工誤以為這個出口處的按鈕是用來消除安全鎖磁場的。

在最近的一次案例中,EPO則是被故意按的:一個系統(tǒng)管理員關(guān)閉了控制整個加利福尼亞電柵格的數(shù)據(jù)中心。

每年,美國有數(shù)以百計的數(shù)據(jù)中心事故報告。這些數(shù)據(jù)中心無一不是當(dāng)初投資數(shù)百萬美元,以期電力系統(tǒng)達到耐受性及實用性。事實上,任何把電力系統(tǒng)建筑在活地板的業(yè)主如IT、網(wǎng)絡(luò)和電信公司等都存在這樣的風(fēng)險。

根據(jù)美國《電力法案》第645.10和645.11條款,EPO是必需安裝的。這些條款要求每間計算機室都必需在每一個出口配備EPO系統(tǒng),用來能夠切斷活地板下的電源,還要切斷活地板上的空調(diào)電源。根據(jù)法案,這個關(guān)閉機制由一個或兩個相連的按鈕組成,一個切斷電源,一個切斷空調(diào)。

但事實上,EPO按鈕往往被安置在出口與其他按鈕相同的地方,如火災(zāi)緊急疏散按鈕、電燈開關(guān)、安全門卡讀卡器、滅火器、火警儀表、電話、對講機甚至出口的開門按鈕旁。

如此混亂的排放很容易導(dǎo)致數(shù)據(jù)中心管理員僅僅是想開燈或者呼叫保安的時候誤按了EPO按鈕。

哪怕是輕輕一按EPO按鈕也會完全切斷數(shù)據(jù)中心的電源,然后需要動用所有員工的努力恢復(fù)所有電器。這至少需要半個小時的時間——然而誰都知道,僅僅不到一秒的斷電也許就會造成硬件系統(tǒng)、數(shù)據(jù)庫甚至整個公司利益都難以挽回的巨大損失。

很有可能這一小小的失誤就是讓電力損失很大的原因。這樣的斷電情形同安全性失效、發(fā)電機失效和斷電器失效一樣,都是導(dǎo)致斷電的原因,但是卻從沒有同上述失效一樣得到正確對待。正是因為EPO按鈕是故意按下去的,不管有意也好,失誤也罷,它們統(tǒng)統(tǒng)被認(rèn)定為事故而不是失效行為。

改造EPO裝置

有個辦法可以讓數(shù)據(jù)中心的緊急斷電按鈕的危害減少。早在十年以前,很多數(shù)據(jù)中心就簽署了這樣的協(xié)議,那就是數(shù)據(jù)中心的每個出口僅需幾個小時和幾百美元就可以搞定——對于一個現(xiàn)代化數(shù)據(jù)中心來說,能夠消除風(fēng)險,這筆花費真是很少。

有一種EPO的裝置可以避免誤操作。這種裝置上面有很明顯的標(biāo)志“緊急斷電按鈕”,就是為了區(qū)別數(shù)據(jù)中心入口處的其他設(shè)備。EPO上有鍵入的鎖蓋,鑰匙是插在上面的。打開盒子必須費一番心思,但當(dāng)真有突發(fā)事件時,這個鎖卻不會成為障礙。

在外蓋下是一個電池供電的微型開關(guān),其警示聲音為90分貝,一旦安全警報響起就會促使第二個人提起微型開關(guān)。在距EPO開關(guān)約幾英尺附近可設(shè)置電話。

另外,EPO還需要設(shè)置一個能夠操作和維護的自動防護裝置系統(tǒng)。也就是說當(dāng)主干線在供電的時候這個裝置能夠進行維修。很多人害怕更換EPO附近一個燒壞的燈泡,就是怕不小心碰到EPO開關(guān)造成整個數(shù)據(jù)中心斷電。

其他設(shè)計方案還包括安裝一個需要用鑰匙打開的兩鍵的鎖式按鈕。還有人建議應(yīng)該在EPO外蓋上同時安裝一個可旋轉(zhuǎn)的攝像頭防止心懷不滿的員工故意板動EPO按鈕。

最終可以認(rèn)為,在EPO按鈕上加注標(biāo)志,注明“EPO(緊急斷電開關(guān))”。它可以切斷室內(nèi)所有電器的電源。僅用于特殊情況求生?!皩τ诜怯⒄Z母語的員工來說,使用雙語語言標(biāo)識更好?!盞umar說。

30年以前,法案制定官員要求安裝EPO是因為考慮到,電源安裝在活地板下有火災(zāi)的隱患。數(shù)據(jù)中心有很多斷路器,如果某人不小心觸電,很難辨別到底是哪個電源的問題。如今的法案降低了EPO對活地板和裝有地面斷路器的電力裝置系統(tǒng)的火/煙檢測系統(tǒng)的要求。

實際案例中,EPO能夠挽救人類生命的案例尚無記載。加拿大有意將此EPO要求從電力法案中剔除。不過像其他基建類法案一樣,一旦建立,便很難再剔除。(丁小魚編譯)

鏈接

錯誤EPO是致命要害

初步的統(tǒng)計資料顯示,大多數(shù)數(shù)據(jù)中心將在未來的5年內(nèi)由于錯誤的EPO導(dǎo)致發(fā)生宕機。

緊急斷電系統(tǒng)經(jīng)常被稱為數(shù)據(jù)中心致命的點。對于數(shù)據(jù)中心的管理人員來說,最可怕的噩夢就是發(fā)生EPO時的跳閘,無論其是人工的還是自動的。立即切斷給計算機的供電對于硬件和應(yīng)用軟件極其有害。對于配備了最好的設(shè)備和最高冗余水平的數(shù)據(jù)中心來說,只要設(shè)備被啟動,整個中心就會在約1秒鐘之內(nèi)停止運轉(zhuǎn)。盡管這對數(shù)據(jù)中心的沖擊很大,但由于國家電氣和火災(zāi)法規(guī)的規(guī)定,在大部分情況下還是不可或缺的。

在多數(shù)情況下,錯誤EPO的解決辦法非常簡單,因此由此產(chǎn)生的對數(shù)據(jù)中心的沖擊是可以避免的。不幸的是,很多數(shù)據(jù)中心操作人員不了解這些系統(tǒng)是如何工作的,對故障和自動跳閘也不敏感?,F(xiàn)在部分業(yè)內(nèi)數(shù)據(jù)顯示,數(shù)據(jù)中心大概每5年經(jīng)歷一次故障性跳閘。對于任何希望達到 99.999% 可用性(5個9)的數(shù)據(jù)中心,一次EPO錯誤就會使實現(xiàn)這一目標(biāo)的所有希望付之一炬,盡管保持的無錯誤記錄是那樣地完美。(ccw- 2008年02月25日第06期 34)

發(fā)布:2007-04-22 09:21    編輯:泛普軟件 · xiaona    [打印此頁]    [關(guān)閉]
相關(guān)文章:
西安OA系統(tǒng)
聯(lián)系方式

成都公司:成都市成華區(qū)建設(shè)南路160號1層9號

重慶公司:重慶市江北區(qū)紅旗河溝華創(chuàng)商務(wù)大廈18樓

咨詢:400-8352-114

加微信,免費獲取試用系統(tǒng)

QQ在線咨詢

泛普西安OA快博其他應(yīng)用

西安OA軟件 西安OA新聞動態(tài) 西安OA信息化 西安OA快博 西安OA行業(yè)資訊 西安軟件開發(fā)公司 西安門禁系統(tǒng) 西安物業(yè)管理軟件 西安倉庫管理軟件 西安餐飲管理軟件 西安網(wǎng)站建設(shè)公司