當(dāng)前位置:工程項目OA系統(tǒng) > 泛普各地 > 湖南OA系統(tǒng) > 長沙OA系統(tǒng) > 長沙OA軟件行業(yè)資訊
解決Hyper-V高可用集群服務(wù)和網(wǎng)絡(luò)問題
這個系列包含四個部分,主要討論如何提高Hyper-V高可用集群的性能。第一部分闡述了固件、驅(qū)動、補丁和更新對虛擬主機集群穩(wěn)定性的影響;第二、第三部分,我給出了在解決Hyper-V集群故障時的一些個人經(jīng)驗,這些經(jīng)驗有助于提高虛擬集群的穩(wěn)定性。這里,在第四部分,我討論一些復(fù)雜的網(wǎng)絡(luò)問題并解釋何時、怎樣結(jié)束Hyper-V高可用集群服務(wù)。
Hyper-V網(wǎng)絡(luò)問題1:虛擬機重啟后,IP地址重復(fù)或者自動尋找私有IP(APIPA)
這個問題發(fā)生在Hyper-V集群節(jié)點突發(fā)性丟失私有/公共網(wǎng)絡(luò)或者FC鏈路之后,同時,該問題還會觸發(fā)虛擬機在其他的主機上重新啟動。當(dāng)看到很多的虛擬機都在試圖尋找一個替代主機時,我發(fā)現(xiàn)那簡直是一團糟。
在很多情況下,虛擬機將會試圖在存活的節(jié)點上重新啟動,然后遷移到另外一個節(jié)點直到虛擬機再次重啟。其結(jié)果是,如果虛擬機運行Windows 2003或XP,該虛擬機就會重新啟動并報告“網(wǎng)絡(luò)上的IP地址重復(fù)”;如果是Windows 2008或Vista,就會獲得一個APIPA地址……除了網(wǎng)絡(luò)問題,所有其他的虛擬機功能應(yīng)該工作正常。遺憾的是,”修復(fù)”或者”禁用-再啟動”虛擬機網(wǎng)卡沒有什么效果。手工啟動幾次受影響的虛擬機則可以搞定。
有個小技巧:作為一種更快的方式,可以打開Hyper-V Manager,雙擊虛擬機,然后選擇“關(guān)機”。系統(tǒng)將會關(guān)閉,不過虛擬機會立即重啟,因為它是高可用集群的一部分。
這個問題是因為在不恰當(dāng)?shù)臅r間、不正確的完成集群中虛擬機配置而導(dǎo)致。根據(jù)我的觀察,當(dāng)集成的組件沒有匹配安裝在主機上的Hyper-V版本時,這種情況就會出現(xiàn)。
因此,假如你的環(huán)境中包含Windows 2008 SP2的Hyper-V主機和具有Hyper-V的集成組件的虛擬機,在集成組件升級后,這些問題就會發(fā)生。不過,假如這些問題在你升級集成組件之前發(fā)生,那就相對簡單,手工重啟受到影響的虛擬機就應(yīng)該可以解決問題。
Hyper-V網(wǎng)絡(luò)問題2:關(guān)機之后還可以ping通虛擬機
很多情況下,就像我們剛才所提到的,重啟可以解決虛擬機的網(wǎng)絡(luò)問題。同樣,當(dāng)Hyper-V集群主機出現(xiàn)不可預(yù)料的故障、虛擬機被迫在其他的節(jié)點上重啟,我曾見過系統(tǒng)完全重啟,同時報告它們都可以正常的ping通。
但是,如果再深入檢查就會發(fā)現(xiàn),除了能夠ping通,無法通過其他的遠程管理進程(例如,遠程桌面協(xié)議(RDP),eventvwr,全局名稱協(xié)議等等)訪問虛擬機。也無法從虛擬機ping出去。更奇怪的是,就算你完全關(guān)閉了虛擬機,還是可以ping通它。
為了解決這個問題,請使用Failover Cluster Manager或者SCVMM關(guān)閉虛擬機集群。在Hyper-V manager中關(guān)閉虛擬機集群會引起集群重啟虛擬機的高可用性回應(yīng)。
當(dāng)你目睹Failover Cluster Manager顯示虛擬機已經(jīng)關(guān)掉卻還能ping通的時候,你會很詫異。根據(jù)我的經(jīng)驗,這種情形是由于為虛擬機配置了傳統(tǒng)的網(wǎng)絡(luò)適配器引起。
要修復(fù)這個問題會有一點棘手,需要使用Failover Cluster Manager和Hyper-V Manager,以下是操作步驟:
1. 當(dāng)遇到集群中節(jié)點失效時,很可能有必要在每個節(jié)點上重啟Hyper-V Management Service以刷新真正的虛擬機狀態(tài),同時使用Hyper-V Manager工具。
然后,在Failover Cluster Manager中,右鍵單擊受影響的虛擬機的“配置”,再選擇“關(guān)閉”。
2. 關(guān)閉之后,通過Hyper-V Manager遠程ping該虛擬機檢查其狀態(tài)。你會發(fā)現(xiàn),它在Hyper-V Manager中的狀態(tài)是關(guān)閉的,但是可以ping通。
3. 使用Failover Cluster Manager將該虛擬機移動到集群中其他的節(jié)點上,然后執(zhí)行第2步。請注意,當(dāng)每個虛擬機都移動完成之后,它們在Hyper-V Manager中的狀態(tài)將會改變?yōu)椤斑\行”,盡管它們在Failover Cluster Manager中的狀態(tài)依然是關(guān)閉的。
4. 要解決這個問題,在Hyper-V Manager中右鍵單擊虛擬機,然后選擇“Turn Off”。這個時候,虛擬機的狀態(tài)會顯示為關(guān)閉,同時也無法再ping通。
5. 重啟虛擬機。它就會恢復(fù)到全功能狀態(tài)。
要消除這個問題,需要限制虛擬機使用傳統(tǒng)的網(wǎng)絡(luò)適配器,它通過主機分區(qū)路由流量。
結(jié)束Hyper-V高可用集群服務(wù)
有時,對一個響應(yīng)遲鈍的虛擬集群節(jié)點而言,我感到自己真拿它沒辦法。無論是驅(qū)動問題,卷影復(fù)制服務(wù)(Volume Shadow Copy Service)垮掉或者其他未知的問題,在很多情況下,我不得不拿出“錘子”將節(jié)點上的高可用集群服務(wù)“殺掉”。當(dāng)節(jié)點上有多個處于未知狀態(tài)的虛擬機負(fù)載時,“殺掉”該服務(wù)需要勇氣,但對于集群的整體穩(wěn)定性來說,很有必要。
不過,在采取這種極端的操作之前,了解其后果非常重要。當(dāng)你“殺掉”高可用集群服務(wù)時,該服務(wù)會為集群中的剩余節(jié)點創(chuàng)建一個高可用的回應(yīng)。故障節(jié)點上的虛擬機會被重新分布到其他的節(jié)點并重啟,就像剛剛經(jīng)歷一次斷電。根據(jù)我們的經(jīng)驗,F(xiàn)ailover Cluster Manager現(xiàn)在將會派上用場,將會重啟故障節(jié)點。在將虛擬機移動回去之前,請仔細(xì)檢查事件記錄和其他的監(jiān)控記錄。
再次重申,在“殺掉”高可用集群服務(wù)之前,你應(yīng)該搞清楚每個選項。
舉幾個例子,比如,Hyper-V已經(jīng)完全無法對外界的集群管理工具做出響應(yīng)。集群工具的管理功能——比如cluster.exe命令或者任何圖形化用戶接口(GUI)形式的管理工具(比如,F(xiàn)ailover Cluster Manager, SCVMM, Hyper-V Manager等) ——已經(jīng)無法使用或者不能響應(yīng)。盡管如此,一些虛擬機的正常運行,而另外一些則不是。
如果出現(xiàn)這種情況,在你“殺掉”高可用集群服務(wù)之前,你應(yīng)該檢查以下項目:
使用cluster.exe命令查詢受影響的節(jié)點。對GUI中不響應(yīng)的節(jié)點來說,要查詢虛擬機的狀態(tài),這個工具可能仍然只具備有限的功能。從查詢的反饋中,有問題的虛擬機集群資源會引導(dǎo)你找到真正的原因。 使用某個產(chǎn)品,比如Pskill或者Taskkill。在《Hyper-V虛擬機配置文件,虛擬機狀態(tài)有關(guān)的集群問題》這篇文章中,我描述了如何找到某個特定虛擬機的VMWP.exe進程并殺死它。如果能夠從cluster.exe命令的輸出中找到虛擬機卡殼的任何信息,那將有助于終結(jié)一個有問題的虛擬機而不是“殺掉“高可用集群服務(wù)。 試著從一次崩潰中保存虛擬機的工作負(fù)載。你可能無法訪問集群主機,但是你可以通過RDP或者其他的遠程管理進程訪問客戶端OS。從高可用集群中手動關(guān)閉虛擬機只會使該虛擬機從別的地方再重新啟動,因此,聰明的做法是,關(guān)閉應(yīng)用程序,看上去就像經(jīng)歷了一次硬關(guān)機?! 栴}總會遇到,你可能不得不殺掉高可用集群服務(wù)從而重新獲得控制權(quán)。我曾經(jīng)成功的使用Pskill和Taskkill殺掉了高可用集群服務(wù)。
Taskkill /s CLUSTERNODENAME /IM clussvc.exe
PsKill \CLUSTERNODENAME clussvc.exe
(請注意:“殺掉“高可用集群服務(wù)之后,以前遇到的一些問題可能會重現(xiàn):比如IP地址重復(fù),或者APIPA,虛擬機重啟之后或者關(guān)閉之后仍然可以ping通。)
這個系列雖然列出了很多Hyper-V集群的問題,可是,我依然認(rèn)為虛擬主機集群的優(yōu)勢遠大于其弊端。這些問題并不是經(jīng)常出現(xiàn),但它們一旦發(fā)生,總會讓人發(fā)瘋和抓狂。
最后,這些問題指出了Hyper-V以及其他的虛擬化產(chǎn)品的發(fā)展時期不可避免的困境。隨著更多的用戶采用虛擬化技術(shù)、更廣泛的利用虛擬化技術(shù),會出現(xiàn)更多的問題——比如,在這個系列中提到的這些問題。
- 1數(shù)模高標(biāo)混合矩陣在會議中心的應(yīng)用
- 2自動精簡配置面臨的三大挑戰(zhàn)
- 3災(zāi)備計劃通過VMware解決裸機恢復(fù)問題
- 4芯片生產(chǎn)從平面到立體
- 5云存儲:機遇下暗藏挑戰(zhàn)
- 6湖南長沙锃嘉科學(xué)儀器有限公司招聘OA辦公軟件管理員
- 7網(wǎng)絡(luò)監(jiān)控傳輸方式
- 8什么是下一代商業(yè)智能?
- 9協(xié)同OA提供目錄結(jié)構(gòu)式的組織架構(gòu)管理功能
- 10電子簽名23問
- 11云存儲取得成功的三個關(guān)鍵因素
- 122011年統(tǒng)一通信十大趨勢
- 13云計算 讓分離之憂不再
- 14如何在云環(huán)境中平衡工作負(fù)載
- 15詳解云存儲中的虛擬化技術(shù)構(gòu)成及應(yīng)用
- 16什么是統(tǒng)一存儲?
- 17無線視頻監(jiān)控的優(yōu)點與應(yīng)用
- 18基于業(yè)務(wù)解析的第五代計算機語言
- 19無線局域網(wǎng)協(xié)議802.11b
- 20長沙OA軟件的信息門戶的應(yīng)用需求
- 21電子簽名與認(rèn)證:網(wǎng)商應(yīng)用知多少?
- 22無線Mesh:讓視頻監(jiān)控更輕松
- 23RSA:Qakbot傳播像蠕蟲,攻擊像木馬
- 24vSphere、Hyper-V與XenServer 你選哪個?
- 25CPU與GPU融合之勢難擋
- 26OA辦公軟件系統(tǒng)未來的成功點在哪里?
- 27物流企業(yè)如何構(gòu)建BI系統(tǒng)模式?
- 28生物識別技術(shù)加強身份安全管理
- 29計世獨家:打好旅游信息化三大戰(zhàn)役
- 30監(jiān)控攝像機的定焦和變焦鏡頭
成都公司:成都市成華區(qū)建設(shè)南路160號1層9號
重慶公司:重慶市江北區(qū)紅旗河溝華創(chuàng)商務(wù)大廈18樓