業務連續性計畫檢查清單
中斷或災難往往會在您最意想不到的時候發生。事實上, 80% 的資料中心管理員 過去三年內曾發生過系統中斷。無論是網路攻擊、勒索軟體感染、人為失誤或自然災害,長時間的停機都可能對貴組織的營運造成嚴重影響。
將完善的業務連續性計畫(BCP)納入風險管理策略,可讓您在發生中斷時維持或迅速恢復關鍵功能。 BCP 不僅能保護企業基礎設施,更可作為應變事件時的行動綱要。
本文列出了業務連續性計畫檢查清單的關鍵要素。請繼續閱讀,了解您應採取的最佳行動方案,以將影響降至最低並成功恢復營運。
為何您需要制定業務連續性計畫
業務連續性計畫(BCP)旨在釐定組織在遭遇非預期中斷時,如何持續提供產品與服務。BCP 是一套詳盡的策略,有助於在維持生產環境運作的同時,減輕災難對日常營運活動的影響。
一份完善的 BCP 應涵蓋所有可能危及員工、資源及營運的潛在威脅,無論是停電、惡意軟體感染或天然災害。 這點尤為重要,因為所有這些事件都可能導致系統停機,進而造成財務損失、聲譽受損或永久停業。
業務連續性計畫的主要目的在於確保應急準備就緒,使您的應變團隊能夠在干擾情境發生前、期間及之後,有條不紊地完成必要步驟。缺乏此檢查清單的公司將難以維持正常的業務流程,並面臨資料、系統或客戶流失的風險,且往往造成無法挽回的損失。
7 步驟業務連續性計畫
這份 7 步驟檢查清單可協助您建立優先事項的整體框架,您可據此制定一套專為貴組織量身打造的業務連續性計畫。您可將所有在危機期間維持業務運作所需的程序納入其中。請注意,具體細節會因公司規模、產業類別及威脅類型等不同因素而異。
標準的業務連續性計畫通常包含以下步驟:
讓我們仔細檢視這些步驟,以了解它們為何是任何業務連續性計畫(BCP)檢查清單中的重要環節。
1. 成立災難應變小組
制定業務連續性計畫的第一步,是組建一支負責在緊急情況下維持公司運作的團隊。業務連續性計畫(BCP)團隊應包含來自各日常營運部門的成員,並應指定一名經理負責主導業務連續性規劃工作。
在確定關鍵的 BCP 人員時,您需要列出一份對貴組織構成最大威脅的災難清單,以便招募合適的人選。 不同類型的緊急狀況,例如資訊系統故障、停電或設施損毀,都需要具備特定知識與專業技能的員工,才能妥善且迅速地處理。
建立一個表格來記錄應變團隊成員的必要資訊,以便在必要時能輕鬆聯繫他們。 您的表格可包含姓名、職位、應變團隊角色及聯絡資訊。請務必為團隊中的每個角色指派至少一名備選人員,如此一來,若主要負責人無法履行職責,即可避免應變流程陷入瓶頸。
2. 識別關鍵業務服務
業務連續性計畫的主要目的之一,是協助您辨識對組織運作至關重要的流程、設備及資源。這些正是您應以此為基礎建構業務連續性計畫的重要基礎設施功能與服務。
這些關鍵服務與基礎設施要素極可能包括:
- 電力系統與發電機
- 電信設備——廣域網路(WAN)、區域網路(LAN)、電話、電腦
- 資訊科技系統與伺服器
- 建設基礎設施與設施
- 專業設備或業務關鍵物資
一旦發生中斷,盡快恢復這些要素至關重要,以便恢復營運並保護您的資產。
3. 進行風險評估與業務影響分析
在確定關鍵業務服務後,您應進行 風險影響評估 以發現與關鍵系統、活動及資源相關的弱點。風險評估旨在估算各項威脅發生的機率,並反映災難發生的可能性。
該 業務影響分析 (BIA),通常與風險評估同步進行,可讓您評估風險對業務營運造成的影響之關鍵性與嚴重程度。業務影響分析(BIA)的主要目標,是分析若風險成真時您將面臨的財務與營運成本。它有助於您釐清,當關鍵業務功能出現退化、中斷或完全停擺時,重要流程及相關依賴關係(例如客戶與合作夥伴)的容忍程度。
以下是一份簡化表格,您可以將其作為範本,開始起草自己的分析報告:
| 業務流程 | 影響類別 | 嚴重程度 | 最大可容忍停機時間 (MTD) | 預估費用 | 依賴項 |
請注意,擁有多個位置的組織必須針對每個位置分別進行風險評估與業務影響分析。若這些位置地理位置相距甚遠,所面臨的挑戰與風險可能有所不同。完善的業務連續性計畫也應考量不同位置之間的關聯性與相互依賴關係。
4. 制定還原計畫
完成上述步驟後,現在是時候制定一份以災後還原營運為核心的還原計畫了。 業務連續性與災難還原 兩者密不可分,尤其是因為災難還原(DR)計畫是業務連續性計畫中不可或缺的一部分。如需更詳細的災難還原範本,請下載我們的免費白皮書 災難還原手冊與範本.
災難還原計畫概述了您需要執行的技術步驟,以便盡快恢復核心服務。請注意,還原計畫不僅限於資料,還應涵蓋機器、工作負載及流程。
您的還原計畫可採用以下策略(但不限於):
- 替代業務流程——例如,在系統備份正常運作之前,針對機械化或自動化流程採取手動替代方案
- 用以恢復業務運作的備用或替代地點
- 站點層級的網路與伺服器故障移轉
- 業務關鍵資料的異地備份還原
- "熱備用"或備用資源,可在主要元件發生故障時立即投入運作
以下影片說明如何使用災難還原 NAKIVO Backup & Replication.
5. 設定還原目標並指定災難還原站點
還原時間目標(RTO)決定了企業在流程或服務恢復之前,能夠合理承受的 IT 系統停機時間長度。還原點目標(RPO)則定義了企業能夠承受的資料損失程度。RTO 和 RPO 都是任何業務連續性計畫中的重要指標。
指定一個用於網路/資料故障移轉的災難還原(DR)站點至關重要,因為當主要生產站點離線時,它能立即提供替代方案。 此外,這有助於確保您的還原目標得以達成。
位於不同位置的災難還原設施,將作為虛擬機器(VM)等資源的"熱備援"副本。若發生導致生產網路癱瘓的全站故障,流量可 已切換至災難復原位置. 這些"熱備援"虛擬機器本質上已成為生產環境工作負載,能有效恢復業務運作並確保業務連續性。
您可以使用進階的第三方資料保護解決方案,將生產環境虛擬機器複製到異地災難還原位置,並將複製間隔設定為符合您的 RPO 要求。複製的虛擬機器是原始機器的精確副本,在執行災難還原計畫時,可於自動故障移轉過程中加以運用。
6. 確保所有對業務至關重要的工作負載均受到保護
透過妥善保護企業關鍵資料,可大幅減輕災難造成的影響。遵循"3-2-1 法則"來確保備份的韌性:至少建立 3 份備份,分散儲存於 2 種不同的儲存媒體上,並將其中至少 1 份存放在異地。
執行 企業資料備份 遵循 3-2-1 備份方法論,以實現盡可能最短的 RPO 和 RTO。這也能確保影響生產網路的災難,不會同時波及您的備份資料。
7. 測試並更新您的業務連續性計畫
一旦業務連續性計畫完成,就必須進行嚴格的測試。最佳做法是對員工進行培訓,確保他們完全理解各自的角色與職責。若不定期進行培訓與演練,便無法確保應急準備就緒。更重要的是,透過進行完整的模擬演練,您可以找出並修正計畫中的弱點。
務必執行所有程序,以模擬實際災難情境的流程。此類測試最好每季進行一次,因為關鍵團隊成員會因此持續熟悉流程。此外,基礎設施、環境、協議、工作負載及/或人力配置的變更,都可能為計畫帶來複雜性。這些潛在的障礙往往只有在完整演練的過程中才會被發現。
模擬演練應由獨立觀察員監督,並記錄所有漏洞。 每次演練結束後應進行檢討會議,隨後可起草報告,記錄所發現的弱點及建議的更新方案。該報告以及更新後的業務連續性計畫,應與所有團隊成員分享。
業務連續性計畫檢查清單
以下是一份簡化的業務連續性計畫(BCP)檢查清單,可協助您逐步完成必要步驟,以確保做好應急準備。
成立災難應變小組
- 指派 BCP 資深經理
- 成立業務連續性委員會
- 選擇應變小組成員
- 界定職責與責任
- 為每位團隊成員選定備選代表
- 在所有成員之間建立清晰的溝通管道
識別關鍵業務服務
- 繪製所有電力系統圖
- 識別電信設備
- 識別 IT 系統與伺服器
- 辨識設施與專用設備
- 識別服務之間的相互依賴關係
- 查詢緊急服務
進行風險評估與業務影響分析
- 識別威脅與弱點
- 確立風險承受能力
- 確定關鍵業務流程
- 計算每項服務的最大可容忍停機時間
- 分析對財務、法律、監管及客戶的影響
- 識別關鍵業務功能之間的相互依存關係
制定還原計畫
- 制定您的業務連續性計畫 (COOP)
- 自動化流程的手動替代方案草案
- 為站點層級的網路與伺服器故障移轉做好準備
- 測試關鍵資料的異地備份還原
- 確保備用資源隨時可用
設定還原目標並指定災難還原站點
- 指定備用地點以恢復業務運作
- 設定還原點目標 (RPO)
- 設定還原時間目標 (RTO)
- 管理災難還原流程
保護對業務至關重要的資料
- 對業務關鍵資料進行備份
- 將資料儲存於本地及異地儲存裝置中
- 儲存空間隔離的備份
- 為特定備份啟用不可變性
測試並更新您的業務連續性計畫
- 進行年度、半年期及季度測試
- 每年進行完整的業務連續性計畫(BCP)模擬演練
- 建立稽核流程
- 找出弱點並更新計畫
- 培訓您的員工
結論
業務連續性計畫檢查清單對於確保在遭遇中斷事件後,於恢復受影響的工作負載期間,服務仍能順利運作至關重要。未能制定業務連續性計畫(BCP)的組織,將面臨長時間停機及資料遺失的風險,這可能造成無法彌補的財務損失與聲譽損害。
本檢查清單提供了一套有效的業務連續性計畫框架,有助於您即使在最嚴峻的狀況下也能穩健應對。請務必注意,若缺乏像 NAKIVO Backup & Replication. NAKIVO 解決方案包含執行備份與還原流程、自動化災難還原工作流程,以及進行無中斷測試所需的所有工具,以確保您的還原目標得以達成。