事業継続計画チェックリスト
予期せぬ事態や災害は、いつ起こってもおかしくないものです。実際、 データセンター管理者の80% 過去3年間にシステム停止を経験した企業は少なくありません。サイバー攻撃、ランサムウェア感染、人的ミス、自然災害など、その原因を問わず、長期間のダウンタイムは組織の業務に深刻な悪影響を及ぼす可能性があります。
リスク管理戦略の一環として堅牢な事業継続計画(BCP)を策定しておけば、障害発生時にも重要な機能を維持、あるいは迅速に復旧させることができます。 また、BCPは企業のインフラを保護するだけでなく、インシデントに適切に対応するための指針としても機能します。
本記事では、事業継続計画(BCP)チェックリストの必須要素を解説します。影響を最小限に抑え、円滑に業務を再開するために取るべき最善の対策を、ぜひご一読ください。
事業継続計画が必要な理由
事業継続計画(BCP)とは、予期せぬ障害が発生した際にも、組織が製品やサービスの提供を継続する方法を定めたものです。BCPは、生産環境を維持しつつ、災害が日常業務に与える影響を軽減するための詳細な戦略です。
包括的なBCPでは、停電、マルウェア感染、自然災害など、従業員、リソース、業務を脅かす可能性のあるあらゆる潜在的な脅威に対処する必要があります。 これらすべての事象はダウンタイムを引き起こす可能性があり、ひいては金銭的損失、評判の低下、あるいは事業の永久的な閉鎖につながるため、これは特に重要です。
事業継続計画の主な目的は、対応チームが混乱事態の発生前、発生中、発生後に必要な手順を体系的に完了できるようにすることで、緊急事態への備えを確保することです。このチェックリストを持たない企業は、通常の業務プロセスを維持するのに苦労し、データ、システム、または顧客を失うリスクに直面することになり、その損失はしばしば取り返しのつかないものとなります。
7つのステップからなる事業継続計画
この7つのステップからなるチェックリストは、優先順位の全体的な枠組みを策定するのに役立ち、それを基に、貴社に合わせた事業継続計画を作成することができます。危機発生時に事業運営を維持するために必要なすべての手順を盛り込むことができます。なお、具体的な内容は、企業の規模、業種、脅威の種類など、さまざまな要因によって企業ごとに異なることに留意してください。
標準的な事業継続計画には、通常、以下のステップが含まれます:
- 災害対応チームを編成する
- 重要なビジネスサービスを特定する
- リスク評価および事業影響度分析を実施する
- 復旧計画を策定する
- 復旧目標を設定し、災害復旧拠点を指定する
- ビジネスに不可欠なすべてのワークロードが確実に保護されるようにする
- 事業継続計画の検証と更新
これらの各ステップを詳しく見ていき、なぜそれらがあらゆるBCPチェックリストにおいて重要な要素であるのかを理解しましょう。
1. 災害対応チームを編成する
事業継続計画(BCP)を策定する最初のステップは、緊急時に会社の業務を継続させる責任を担うチームを結成することです。BCPチームには、日常業務に関わる各部門のメンバーを含めるべきであり、事業継続計画の策定を主導する責任者を指名する必要があります。
主要なBCP担当者を特定する際には、組織にとって最大の脅威となる災害の包括的なリストを作成し、適切な人材を確保できるようにする必要があります。 ITシステムの障害、停電、施設の損傷など、さまざまな種類の緊急事態には、それらを適切かつ迅速に対処するための特定の知識と専門性を持つスタッフが必要です。
必要に応じて迅速に連絡が取れるよう、対応チームメンバーに関する必要な情報を記録するための表を作成してください。 表には、氏名、役職、対応チームでの役割、連絡先などを記載するとよいでしょう。チーム内の各役割について、少なくとも1人の代理者を指定しておくことを忘れないでください。これにより、主要な担当者が職務を遂行できなくなった場合でも、業務の停滞を防ぐことができます。
2. 不可欠なビジネスサービスを特定する
事業継続計画(BCP)の主な目的の一つは、組織の機能維持に不可欠なプロセス、設備、およびリソースを特定することです。これらは、BCPの基盤となるべき重要なインフラ機能およびサービスです。
こうした主要なサービスやインフラ要素には、主に以下のものが含まれます:
- 電力システムおよび発電機
- 通信機器 – WAN、LAN、電話、コンピュータ
- ITシステムおよびサーバー
- インフラおよび施設の整備
- 特殊な機器や業務に不可欠な備品
業務を再開し、資産を保護するためには、障害が発生した場合は、これらの要素をできるだけ早く復旧させることが極めて重要です。
3. リスク評価および事業影響度分析の実施
主要なビジネスサービスを特定したら、次に リスク影響評価 重要なシステム、活動、およびリソースに関連する脆弱性を特定するためです。リスク評価では、各脅威の発生確率を推定し、災害が発生する可能性を反映します。
The ビジネス影響分析(BIA)通常、リスク評価と並行して実施されるBIA(事業影響度分析)により、事業運営への影響の重要度と深刻度を評価することができます。BIAの主な目的は、リスクが現実化した場合に発生する財務的および業務上のコストを分析することです。これにより、主要な業務機能が低下、中断、または完全に停止した場合に、顧客やパートナーといった重要なプロセスや依存関係の許容レベルを判断するのに役立ちます。
以下に、独自の分析の草案作成のテンプレートとして利用できる簡略化された表を示します:
| 業務プロセス | 影響のカテゴリー | 深刻度 | 最大許容ダウンタイム(MTD) | 費用の見積もり | 依存関係 |
複数の拠点を持つ組織は、各拠点ごとに個別のリスク評価とBIAを実施する必要があることに留意してください。これらの拠点が地理的に離れている場合、直面する課題やリスクは異なる可能性があります。堅牢な事業継続計画では、異なる拠点間の関係性や相互依存性も考慮に入れる必要があります。
4. 復旧計画を策定する
これまでの手順が完了したら、次は災害発生後の業務復旧を軸とした復旧計画を作成する段階です。 事業継続と災害復旧 これらは密接に関連しており、とりわけ災害復旧(DR)計画は事業継続計画の不可欠な要素であるためです。より詳細な災害復旧テンプレートについては、当社の無料ホワイトペーパーをダウンロードしてください 災害復旧ハンドブックとテンプレート.
災害復旧(DR)計画では、コアサービスをできるだけ早く復旧させるために必要な技術的な手順が示されています。復旧計画はデータだけでなく、マシン、ワークロード、プロセスも対象とする必要があるため、その範囲はデータに限定されない点に留意してください。
復旧計画では、とりわけ以下のような戦略を活用することができます:
- 代替業務手順 – 例えば、システムが復旧するまでの間、機械化または自動化されたプロセスに対して手動で対応する措置
- 事業運営を再開するための第2の拠点または代替拠点
- サイトレベルのネットワークおよびサーバーのフェイルオーバー
- 業務上重要なデータのオフサイトバックアップの復元
- "ホットスペア"またはスタンバイリソース。プライマリコンポーネントに障害が発生した際に、直ちに稼働させることができる
以下の動画では、以下の方法を使用して完全な災害復旧を行う手順について解説しています NAKIVO Backup & Replication.
5. 復旧目標を設定し、災害復旧拠点を指定する
復旧時間目標(RTO)とは、プロセスやサービスが復旧するまでに、企業が合理的に許容できるITシステムのダウンタイムの長さを指します。復旧時点目標(RPO)とは、企業が許容できるデータ損失の範囲を定義するものです。RTOとRPOはいずれも、あらゆる事業継続計画において重要な指標となります。
ネットワークやデータのフェイルオーバー用にディザスタリカバリ(DR)サイトを指定することは、プライマリの稼働サイトがオフラインになった場合に即座に代替手段を提供できるため、極めて重要です。 さらに、これにより復旧目標の達成を確実にすることができます。
地理的に異なる場所に位置するDR施設は、仮想マシン(VM)などのリソースの"ウォームスタンバイ"コピーとして機能します。サイト全体の障害により本番ネットワークがダウンした場合でも、トラフィックを DRサイトへフェイルオーバーした。"ウォームスタンバイ"VMは実質的に本番環境のワークロードとなり、業務を迅速に復旧させ、ビジネス継続性を効率的に確保します。
サードパーティ製の高度なデータ保護ソリューションを活用すれば、本番環境のVMをオフサイトのDR拠点にレプリケートし、RPOに合わせてレプリケーション間隔を設定できます。レプリカVMは元のマシンの完全なコピーであり、災害復旧計画を実施する際の自動フェイルオーバープロセスで使用できます。
6. ビジネスに不可欠なすべてのワークロードが確実に保護されるようにする
事業に不可欠なデータを適切に保護することで、災害による影響を大幅に軽減することができます。"3-2-1のルール"を適用して、バックアップの耐障害性を高めましょう。具体的には、2種類の異なるストレージメディアに最低3つのバックアップを作成し、そのうち少なくとも1つは社外に保管します。
実行 ビジネスデータのバックアップ "3-2-1"バックアップ手法を採用することで、可能な限り短いRPO(復旧時点目標)とRTO(復旧時間目標)を実現します。これにより、本番ネットワークに影響を与えたのと同じ災害が、バックアップデータにまで波及することを防ぐことができます。
7. 事業継続計画の検証と更新
事業継続計画(BCP)が完成したら、厳格なテストを実施する必要があります。その最善の方法は、従業員が各自の役割と責任を完全に理解できるよう、研修を行うことです。定期的な研修や訓練を行わなければ、緊急事態への備えを確実なものにすることはできません。さらに重要なのは、本格的なシミュレーションを行うことで、計画内の弱点を特定し、改善できる点です。
実際の災害シナリオの流れを再現できるよう、すべての手順を確実に実行してください。主要なチームメンバーがプロセスに慣れ親しんでいる状態を維持するため、こうしたテストは四半期ごとに実施するのが最適です。さらに、インフラ、環境、プロトコル、業務負荷、および/または人員構成の変更は、計画に複雑さを生じさせる可能性があります。こうした潜在的な問題点は、多くの場合、完全なリハーサルを通じてのみ発見されます。
シミュレーションは、すべての脆弱性を記録できる独立した観察者が立ち会い、監視する必要があります。 各リハーサル終了後には事後検討会を行い、そこで指摘された弱点と提案された更新内容を記録した報告書を作成します。報告書および更新された事業継続計画は、すべてのチームメンバーと共有する必要があります。
事業継続計画チェックリスト
以下は、緊急事態への備えを確実にするために必要な手順を確認できる、簡略化されたBCPチェックリストです。
災害対応チームを編成する
- BCP担当シニアマネージャーを任命する
- 事業継続委員会を設置する
- 対応チームのメンバーを選定する
- 役割と責任を明確にする
- 各チームメンバーの代理人を指名してください
- メンバー全員の間で明確なコミュニケーションを確立する
重要なビジネスサービスを特定する
- すべての電力システムを整理する
- 通信機器を特定する
- ITシステムおよびサーバーを特定する
- 施設および専用機器を特定する
- サービス間の相互依存関係を特定する
- 緊急サービスを確認する
リスク評価および事業影響度分析を実施する
- 脅威と脆弱性を特定する
- リスク許容度を定める
- 重要な業務プロセスを特定する
- 各サービスについて、許容可能な最大ダウンタイムを算出する
- 財務、法務、規制、および顧客への影響を分析する
- 重要な業務機能間の相互依存関係を特定する
復旧計画を策定する
- 事業継続計画(COOP)を作成する
- 自動化プロセスのためのマニュアルによる回避策案
- サイトレベルのネットワークおよびサーバーのフェイルオーバーに備える
- 重要データのオフサイトバックアップの復元テスト
- 予備リソースが利用可能であることを確認する
復旧目標を設定し、災害復旧拠点を指定する
- 事業運営を再開するための代替拠点を指定する
- リカバリポイント目標(RPO)を設定する
- 復旧時間目標(RTO)を設定する
- 災害復旧プロセスの管理
業務上重要なデータを保護する
- 業務上重要なデータのバックアップを実行する
- データをオンサイトおよびオフサイトのストレージデバイスに保存する
- エアギャップ方式のバックアップを保管する
- 特定のバックアップに対して不変性を有効にする
事業継続計画の検証と更新
- 年次、半期、四半期ごとのテストを実施する
- 毎年、BCPシミュレーションを全面的に実施する
- 監査プロセスを構築する
- 脆弱性を特定し、計画を更新する
- 従業員を教育する
結論
事業継続計画(BCP)のチェックリストは、障害発生後に影響を受けたワークロードを復旧させつつ、サービスを円滑に維持するために不可欠です。BCPを策定していない組織は、大規模なダウンタイムやデータ損失に見舞われるリスクがあり、その結果、取り返しのつかない財務的・評判上の損害を被る可能性があります。
このチェックリストは、最悪のシナリオにも耐えうる効果的な事業継続計画の枠組みを提供します。BCPは、次のような高度なデータ保護ソリューションなしでは完成しないことを念頭に置いてください。 NAKIVO Backup & ReplicationNAKIVOのソリューションには、バックアップおよび復旧プロセスの実行、DRワークフローの自動化、そして復旧目標の達成を確実にするための業務に支障をきたさないDRテストの実施に必要なすべてのツールが含まれています。