機(jī)房運(yùn)維方案及巡檢
1.1 定期巡檢
每年巡檢4次/年,1次/季度
1.2、巡檢地點(diǎn)
計算機(jī)機(jī)房、精密空調(diào)、UPS
1.3、巡檢目的
進(jìn)行機(jī)房檢查,對機(jī)房設(shè)備及供電系統(tǒng)、UPS系統(tǒng)、精密空調(diào)系統(tǒng)、錄像系統(tǒng)等設(shè)備進(jìn)行檢查,及時發(fā)現(xiàn)設(shè)備隱患,排除故障。
1.4、巡檢要求
1.4. 1.巡檢期間,進(jìn)行狀態(tài)檢查,若發(fā)現(xiàn)問題,如計算機(jī)機(jī)房物理環(huán)境異常、精密空調(diào)異常、UPS及配電系統(tǒng)異常等,應(yīng)按照應(yīng)急預(yù)案及操作流程進(jìn)行處理。
(1)電源、UPS:檢查機(jī)房供電狀況,UPS工作情況、指示狀態(tài)。檢查UPS蓄電池使用狀態(tài),確保蓄電池?zé)o松動。并使用溫度槍進(jìn)行檢測物理溫度。確保配電柜及UPS、蓄電池?zé)o溫度過高現(xiàn)象。
(2)機(jī)房環(huán)境:檢查機(jī)房衛(wèi)生狀況及物理環(huán)境。
(3)機(jī)房溫度:檢查溫濕度,將溫濕度控制在一定范圍內(nèi)。溫度:22℃±5℃,濕度 ≤60%.
(4)機(jī)房空調(diào):空調(diào)運(yùn)行狀態(tài)、空調(diào)內(nèi)部有無漏水現(xiàn)象、空調(diào)噪音、空調(diào)風(fēng)量等。
(5)機(jī)房照明:機(jī)房照明系統(tǒng)是否正常,有無異常狀況。
(6)機(jī)房PDU:PDU市電或UPS是否正常,使用溫度槍進(jìn)行檢測外部物理溫度。
(7)機(jī)房整體:檢查機(jī)房其余設(shè)備運(yùn)行狀態(tài),有無報警及指示燈異常狀態(tài)。
1.4. 2.如果故障按恢復(fù)規(guī)程無法有效恢復(fù),特別是當(dāng)發(fā)生機(jī)房環(huán)境(動力、空調(diào))故障、關(guān)鍵的設(shè)備、網(wǎng)絡(luò)、系統(tǒng)、服務(wù)如無法及時恢復(fù)時,應(yīng)立即通知甲方相關(guān),由相關(guān)協(xié)調(diào)資源進(jìn)行故障處理。
1.4.3.故障處理過程必須在機(jī)房日常巡檢表的備注欄中詳細(xì)記錄,以備查閱。
1.5、計算機(jī)機(jī)房現(xiàn)場管理要求
1.除工作人員外,其他工作人員進(jìn)出機(jī)房,需簽字后方可進(jìn)入,同時計算機(jī)機(jī)房人員要在現(xiàn)場,檢查監(jiān)督其人員工作,避免其他人員未經(jīng)擅自接觸機(jī)房物理設(shè)備。
2.機(jī)房的機(jī)柜、線纜、設(shè)備等的標(biāo)簽管理;
3.機(jī)房環(huán)境清理。
1.6每次檢查內(nèi)容列表
2、現(xiàn)場故障維修
每次巡檢過程中,如有發(fā)現(xiàn)設(shè)備及環(huán)境系統(tǒng)有故障狀態(tài),需進(jìn)行記錄并恢復(fù)故障狀態(tài)。如不能立即恢復(fù)故障狀態(tài),則需進(jìn)行應(yīng)急預(yù)案處理。具體如下:
2.1 環(huán)境故障:衛(wèi)生、溫濕度、照明。(四級故障)
2.2 交換機(jī)故障:交換機(jī)蜂鳴,交換機(jī)啟動不正常,指示燈異常。(三級故障)
2.3 空調(diào)故障:空調(diào)壓縮機(jī)故障、空調(diào)冷凝水故障、空調(diào)漏水故障、空調(diào)制冷故障、空調(diào)加濕器故障等。(二級故障
2.4 UPS故障:UPS逆變故障、UPS旁路、UPS蓄電池溫度、UPS蓄電池外觀鼓包現(xiàn)象、UPS蜂鳴報警等(一級故障)
2.5 配電柜故障:配電柜內(nèi)溫度過高、配電柜打火現(xiàn)象等。(一級故障)
在解決故障時,更大限度做好故障恢復(fù)的文檔,力爭恢復(fù)到故障點(diǎn)前的業(yè)務(wù)狀態(tài)。對于“系統(tǒng)癱瘓,業(yè)務(wù)系統(tǒng)不能運(yùn)轉(zhuǎn)”的故障級別,如果不能于30分鐘內(nèi)解決故障,應(yīng)立即提出應(yīng)急方案,確保業(yè)務(wù)系統(tǒng)的運(yùn)行。故障解決后24小時內(nèi),提交故障處理報告。說明故障種類、故障原因、故障解決中使用的方法及故障損失等情況。故障類型、級別及相應(yīng)標(biāo)準(zhǔn)列表:
3、后臺故障維修
后臺故障狀態(tài)維修,需要在甲方允許的情況下,對設(shè)備進(jìn)行維護(hù)及維修。
3.1 質(zhì)保期內(nèi)的設(shè)備由我方查找故障原因并填寫故障申請單,交由甲方進(jìn)行協(xié)調(diào)處理,并協(xié)助甲方進(jìn)行故障排除及維修。如需聯(lián)系廠商,則由我方負(fù)責(zé)。
3.2 三級及四級故障狀態(tài),我方可自行進(jìn)行維護(hù)和維修的設(shè)備,報由甲方同意后,我方自行進(jìn)行設(shè)備維修,更換零配件部件等,并將維修記錄保存文檔交由甲方及我方雙方管理。
3.3 質(zhì)保期外的設(shè)備出現(xiàn)故障,則由我方統(tǒng)一進(jìn)行維修,費(fèi)用由我方負(fù)責(zé)。并將維修記錄報由甲方確認(rèn)并存檔。
3.4設(shè)備更換
對于無法修復(fù)的設(shè)備,在合同有效期內(nèi),經(jīng)甲方審核,由乙方負(fù)責(zé)整體更換同型號或類似型號的產(chǎn)品,無法維修的設(shè)備交由甲方。更換單個備品備件費(fèi)用大于等于500元時,報甲方審核同意,備品備件費(fèi)用由甲方承擔(dān); 更換單個備品備件小于500元時,備品備件費(fèi)用由乙方承擔(dān),質(zhì)保期內(nèi)由供貨商(廠商)進(jìn)行更換的除外。
4、資產(chǎn)管理
4.1對硬件設(shè)備型號、數(shù)量、版本等信息統(tǒng)計記錄
4.2對軟件產(chǎn)品型號、版本和補(bǔ)丁等信息統(tǒng)計記錄
4.3 對機(jī)房設(shè)施設(shè)備連接統(tǒng)計記錄
4.4 對綜合布線系統(tǒng)結(jié)構(gòu)圖的繪制
4.5 對機(jī)房更換設(shè)備連接統(tǒng)計記錄
4.6每月向甲方上報低值易耗品記錄,包括倉庫存儲情況、耗材使用情況。
4.7 機(jī)房更新及更換設(shè)備的統(tǒng)計
4.8 機(jī)房維護(hù)設(shè)備及備品備件的管理及記錄
5、應(yīng)急處理
隨著網(wǎng)絡(luò)信息化建設(shè)的不斷深入,加強(qiáng)機(jī)房各類設(shè)備、系統(tǒng)以及信息與網(wǎng)絡(luò)安全等方面應(yīng)對突發(fā)事件的處理能力將是我們目前面臨的一項重要任務(wù)。為確保系統(tǒng)及機(jī)房安全與穩(wěn)定,以保證正常運(yùn)行為宗旨,按照“預(yù)防為主,積極處置”的原則,本著建立一個有效處置突發(fā)事件,建立統(tǒng)一指揮、職責(zé)明確運(yùn)轉(zhuǎn)有序、反應(yīng)迅速處置有力的機(jī)房安全體系的目標(biāo),將正在發(fā)生或已發(fā)生事故的損害程度減輕到更低,確保員工安全,特制定本應(yīng)急處置預(yù)案。
本預(yù)案共分為應(yīng)用系統(tǒng)故障應(yīng)急流程和機(jī)房突發(fā)事件應(yīng)急流程
系統(tǒng)故障應(yīng)急流程
一、系統(tǒng)故障應(yīng)急流程說明
1、故障發(fā)生
系統(tǒng)運(yùn)維服務(wù)小組可從以下途徑得知故障的發(fā)生:
1.1、運(yùn)維服務(wù)中心通過網(wǎng)管告警發(fā)現(xiàn)故障
1.2、維護(hù)站點(diǎn)通過維護(hù)巡檢發(fā)現(xiàn)故障
1.3、用戶發(fā)現(xiàn)故障,報給呼叫中心
1.4、駐場工程師發(fā)現(xiàn)故障
2、報障受理
監(jiān)控系統(tǒng)運(yùn)維服務(wù)小組得知系統(tǒng)故障發(fā)生后,立即響應(yīng),并向報障人或單位詳細(xì)了解系統(tǒng)故障情況。
3、信息研判
運(yùn)維服務(wù)小組根據(jù)了解到的系統(tǒng)故障情況進(jìn)行分析判斷,以確定采用一般故障處理流程還是立即啟動系統(tǒng)突發(fā)故障應(yīng)急處理預(yù)案。
4、預(yù)案啟動
如需啟動應(yīng)急預(yù)案,則立刻通知系統(tǒng)突發(fā)故障應(yīng)急小組,由小組啟動應(yīng)急預(yù)案,對系統(tǒng)突發(fā)故障應(yīng)急事件進(jìn)行充分管控處理。
5、資源確認(rèn)
系統(tǒng)突發(fā)故障應(yīng)急預(yù)案啟動后,首先是根據(jù)現(xiàn)場突發(fā)故障實(shí)際狀況、緊急程度、技術(shù)難度、備品備件等情況對相關(guān)資源(主要是參與人員)依據(jù)經(jīng)驗進(jìn)行調(diào)度和確認(rèn),主要有以下資源:
我公司技術(shù)支持人員;
相關(guān)廠家技術(shù)支持人員;
我公司聘請的技術(shù)專家
6、預(yù)案執(zhí)行
按照既定的預(yù)案進(jìn)行突發(fā)故障搶修,如遇到問題及時向系統(tǒng)突發(fā)故障應(yīng)急小組匯報。
7、預(yù)案終止
預(yù)案的終止時間由故障現(xiàn)場技術(shù)人員根據(jù)現(xiàn)場的實(shí)際進(jìn)展情況,在與用戶單位有關(guān)部門協(xié)調(diào)后報系統(tǒng)突發(fā)故障應(yīng)急小組決定。
8、結(jié)果上報
預(yù)案中止后,相關(guān)預(yù)案參與人員將整個事件過程中的經(jīng)驗和教訓(xùn),修改、完善事件應(yīng)急預(yù)案。然后集中上報至系統(tǒng)突發(fā)故障應(yīng)急小組。
二、 系統(tǒng)故障應(yīng)急處理流程圖