機房斷電緊急應對方法
(文/湯隆)
機房長時間斷電,可造成系統數據的丟失或者出錯,而且在再次通電時,還可能造成系統的恢復延長,耽誤整個數據機房的正常運作。目前有不少數據中心供電系統的管理軟件,通過管理軟件對供電系統進行智能化管理,往往可以減少維護的工作量。還要有專業的IT人士及時分析故障原因,針對機房斷電突發狀況必須籌備緊急預案。說到底,選擇一家放心、質量有保障的機房建設公司是至關重要,讓專業的人做專業的事!
機房突然斷電的處理方法有一般分兩種:
1、如果機房中配置了UPS,市電斷電后,那么UPS就會啟動電池放電,通過UPS逆變器給后端設備提供不間斷電。如果斷電很長的話,那么在電池放完電前可啟動前端的發電機給后端設備供電。這種配置了UPS的機房,后端設備可以不間斷供電。
2、如果機房中沒有配置UPS,市電斷電后,那么就只能啟動機房配置的發電機,通過ATS切換來給后端設備供電。這種沒有配置UPS的機房,停電后只能中間斷下電,之后再通過發電機供電。
應急措施:
第一條:機房意外停電后,首先確定停電的范圍以及受影響的設備范圍。
第二條:確認停電的范圍為本單位或本機房,應立即聯系后勤相關部門電話匯報。估算電力可能恢復的時間,并通知直接上級。
第三條:如果確認停電的時間在1個小時內,可以在UPS正常供電的時間內,等到電力恢復。如果不能確認在2個小時內恢復供電,需及時到達現場。做好各設備的電源停電準備。在UPS供電達1.5個小時后,嚴格按操作手冊停掉存儲和各應用服務器的電源,最后停核心交換機和路由器。等待電力恢復,電力恢復供電后轉第七條執行。如果確認停電的范圍僅在于本機房電源故障,立即匯報給機房電源維護負責人。
第四條:機房維護負責人將掉電的電源柜總空開和分空開的狀態處于下電狀態。并向直接領導匯報,馬上聯系相關廠家,如有可能請廠家立即到現場支持。
第五條:將掉電的所有的設備電源狀態處于下電狀態,以防止電源柜加電對設備的沖擊。
第六條:等各廠家和相關的人員到齊后,商議設備恢復時因注意的事項,并形成相關文檔。
第七條:電力室恢復供電后,先不要急于給電源柜加電,等待10—20 分鐘后,再開始給電源柜加電,以防止供電不穩或再次掉電。
第八條:供電正常后,確定設備處于下電狀態后,打開電力柜的總控開。
第九條:根據設備加電順序,啟動分項空開。
第十條:設備加電順序,網絡交換類設備正常后再給磁盤陣列柜加電,存儲狀態。檢查正常后,啟動主機(以上各設備務必按操作手冊的啟動順序上電)。
第十一條:設備啟動正常后,開始啟動數據庫。
第十二條:數據庫啟動正常后,開始啟動中間件服務器。
第十三條:中間件服務器正常后,啟動應用程序。
第十四條:機房設備進行全面點檢,確認所有設備運行和服務正常。