RTOとRPO:災害復旧における主な違いを理解する

組織は、データを保護し、災害発生時の事業継続を確保するために、バックアップへの依存度を高めています。しかし、推定によると、 企業の72%以上 多くの企業が、リカバリポイント目標(RPO)やリカバリ時間目標(RTO)に関連するIT復旧の期待値を満たせていません。

効率的な復旧計画を策定するためには、RTOとRPOを完全に理解し、その違いを把握することが不可欠です。本記事では、信頼性の高い災害復旧戦略を立てるために、これら2つのパラメータについて知っておくべきことをすべて解説します。 災害発生後、データ損失を最小限に抑え、できるだけ早く通常の業務を再開するために、より厳格なRPOとRTOを達成する方法について、ぜひ読み進めてください。

RTOとは何ですか?

復旧時間目標(RTO)とは、障害発生後に組織が許容できるダウンタイムの最大時間を指します。言い換えれば、RTOとは、災害の発生から影響を受けた重要なワークロードが復旧するまでの期間のことです。

RTOの算出は、一般的に以下の要因に依存します。 災害復旧計画、利用可能なリソース、および予算。ITインフラが利用できない間、障害の原因を特定し、問題を解決するために必要な措置を講じるにはある程度の時間が必要です。しかし、本番環境の問題が解決されるまでの間も、重要なシステムやワークロードにアクセスでき、利用可能な状態を維持できるよう、災害復旧の手順を整備しておく必要があります。RTOとは、障害発生から、バックアップやレプリカワークロードを通じてシステムが利用可能になるまでの時間を指します。

RPOとは何ですか?

リカバリポイント目標(RPO)とは、災害発生時に組織が重大な影響を受けずに耐えられる、最大データ損失量を指します。この指標は、前回のバックアップまたはレプリケーション処理から経過した時間(時間または分)で測定されます。この指標を活用して、障害発生後のデータ損失を最小限に抑えるために、どのくらいの頻度でデータのバックアップやレプリカを作成すべきかを判断します。

理想的な状況では、バックアップまたはレプリケーションのジョブは、元のマシンが障害を起こす直前に完了します。しかし、現実にはこのようなケースは稀であるため、最後の正常なバックアップが作成された時点と、元のマシンが障害を起こす時点との間に時間差が生じます。この間、VMは処理を実行しデータを保存し続けており、そのデータの大部分は失われることになります。

ディザスタリカバリにおけるRTOとRPOとは

データ保護の最終的な目標は明確です。それは、万が一の事態が発生しても重要なデータが失われないことを確実にし、稼働時間や可用性に関する組織のSLAを確実に満たせるようにすることです。 しかし、仮想環境におけるすべての変更を災害復旧(DR)サイトにリアルタイムでミラーリングするには、多大なコストがかかります。そのため、障害発生時には一部のデータが失われ、ITサービスが中断することを受け入れなければなりません。したがって、あなたの課題は、そうした損失と中断を最小限に抑えることです。

RPOとRTOの概念を、簡単な図で説明しましょう:

rpo and rto in disaster recovery

この図は、よくあるシナリオを示しています。仮想マシンが何らかの理由でクラッシュした場合です。黄色の線はRPO(復旧時点目標)を表しており、これは最後のバックアップから障害発生までの時間を示しています。オレンジ色の線はRTO(復旧時間目標)であり、仮想マシンを復旧させるのに必要な時間を表しています。

RTOとRPOの違い

RTOとRPOの算出方法を理解するには、両者の違いと、DRプロセスにおけるそれぞれの役割を確認する必要があります。

評価

  • RTO 主に、災害発生時に事業運営が再開されるまでの期間に焦点を当てています。考慮すべき点は以下の通りです:
    • 組織ごとに事情が異なるため、自組織のニーズと優先順位を把握してください。
    • 組織の存続に不可欠なサービスやアプリケーションのうち、どのアプリケーションが最も重要であるかを検討するとともに、これらのアプリケーションが障害を起こした場合にどのような影響が生じる可能性があるかについても検討してください。
    • ダウンタイムによる損失を最小限に抑え、災害復旧を確実に成功させるために、各システム/アプリケーションを復旧させる順序を決定する。
  • RPO これは、ダウンタイム中にどの程度のデータが失われても、組織の収益に深刻な打撃を与えないかという点に重点を置いています。考慮すべき点は以下の通りです:
    • バックアップやレプリケーションの頻度を特定し、最新のVMバックアップから実際の災害発生までの間に、どの程度のデータが失われる可能性があるかを把握してください。
    • 各ワークロードの種類ごとに、組織が許容できるデータ損失の規模を検討してください。

費用

RTOとRPOの主な違いは、前者が事業構造のあらゆる側面とDRプロセス全体を考慮するのに対し、後者は事業継続におけるデータやアプリケーションの重要性のみに焦点を当てている点にあります。したがって、迅速な復旧を確保するためにRTOの目標値を達成することは、困難かつ多額の費用を要する作業となる可能性があります。同様に、RPOを短く設定すると、バックアップの頻度を増やし、追加の復旧ポイントを作成する必要が生じるため、ストレージコストが増加する可能性があります。

自動化

  • ~として RPO データとシステムのデータ損失に対する耐性を重視する場合は、頻繁にデータのバックアップを行うことをお勧めします。最近のバックアップソリューションの多くは、自動バックアップを実行できるようになっています VMのバックアップつまり、RPOの目標を効率的に達成できるよう、最小限の手間でバックアップ戦略を最適化できるということです。
  • 達成 RTO これは、DR発生時に復旧が必要なすべての業務プロセスとシステムコンポーネントを考慮に入れる必要があるため、管理がより複雑なプロセスとなります。とはいえ、RTO目標を確実に達成するためには、DRプロセス全体を最初から最後まで自動化し、一元的に管理することが推奨されます。

計算の容易さ

  • その RPO この指標は、回復プロセスの一側面である"データ"のみを対象としているため、算出が容易です。
  • RTO 組織のあらゆる側面、すなわちデータやサービスの重要性、ダウンタイムによるコスト、災害復旧(DR)活動への投資などを考慮に入れます。RTOを算出する際には、ワークロードやアプリケーションの種類ごとに復旧プロセスが異なる可能性があるため、それらを十分に考慮する必要があります。また、想定されるビジネスリスクや脅威を洗い出し、事業運営を再開するための手順を定めた事業継続計画(BCP)に基づいてRTOを算出することが推奨されます。

を定義するには RTO 貴社のさまざまなワークロードに適用可能なものについて、次の質問に答えてください:

特定のアプリケーション、システム、または機器がダウンしても、組織の中核業務に重大な影響を及ぼさないのは、どのくらいの期間まででしょうか?

さまざまなマシンについてこの質問に答えた後、その予想される結果が現在のビジネスニーズを満たせるかどうかを検討してください。もし満たせない場合は、バックアップと DR戦略 バックアップデータを可能な限り最新の状態に保つために。

NAKIVOを活用してRPOとRTOを短縮する方法

NAKIVO Backup & Replication これにより、仮想マシンや物理マシンのバックアップをより頻繁に作成できるようになり、RPOが改善されます。目標値を超えない間隔で定期的なバックアップをスケジュールするだけで済みます。

また、このソリューションは、VMの即時復旧機能によりRTOの短縮にも役立ちます。 VMware vSphere 向けのレプリケーション機能、Microsoft Hyper-V、およびAmazon EC2。ネットワーク監視サービスを統合し、VMが利用不能になった直後に復旧プロセスを起動します。また、重要なVMのオフサイトレプリカ(完全なコピー)を作成することも可能です。元のVMに障害が発生した場合、レプリカが自動的に起動します。レプリカの維持に予算を超えるリソースが必要な場合は、 インスタントVM起動機能 バックアップから。

最短のRTOを実現するには、 NAKIVO Backup & Replication は、 Site Recoveryのオーケストレーション機能. さまざまな環境におけるVMのフェイルオーバーとフェイルバックを完全に自動化 DRシナリオ また、業務に支障をきたさない形でテストを実施し、想定された時間枠内での復旧を確実にする。

試してみてください NAKIVO Backup & Replication

試してみてください NAKIVO Backup & Replication

無料トライアルをご利用いただき、本ソリューションのデータ保護機能をすべてお試しください。15日間無料です。機能や容量の制限は一切ありません。クレジットカードも不要です。

People also read