VMware 災害復旧のベストプラクティス
ディザスタリカバリとは、障害発生後にインフラストラクチャの構成要素を復旧させるための一連の措置を含むプロセスです。さらに、DRは災害によって引き起こされる可能性のある悪影響を最小限に抑え、事業継続を確保することを目的としています。想定される災害の種類に備えるため、企業は通常、事業継続計画の一部としてディザスタリカバリ計画を作成します。
仮想マシンは、災害発生時にリスクにさらされるコンポーネントです。そのため、災害復旧計画を策定し、災害に備える必要があります。本ブログ記事では、VMware仮想環境における災害復旧(DR)のベストプラクティスについて解説します。
災害復旧計画を策定する
A 災害復旧計画 災害復旧計画(DR計画)とは、災害発生時に担当者が実行すべき一連の措置として、災害復旧プロセスを記述した体系的な文書である。さらに、この文書では、計画を発動するために必要な基準も定められている。災害の原因となるのは、自然災害だけでなく人為的な要因も含まれる。 DR計画には、災害の種類や予期せぬインシデントに応じた様々な復旧シナリオを含める必要があります。例えば、DR計画では、ランサムウェア攻撃、停電、ハードウェア障害、地震、台風などの発生時にどのような対応を取るべきかを記述することができます。DR計画は分類することが可能です。例えば、第1章ではネットワークの復旧について説明し、第2章ではデータセンターの復旧に焦点を当て、第3章ではVMの復旧について説明するといった構成が考えられます。
復旧サイトの準備
ディザスタリカバリサイトとは、本番運用に使用されるプライマリサイトが機能しなくなった際に、企業がインフラストラクチャやワークロードを復旧させるために利用できる場所のことです。ディザスタリカバリサイトには、ホット、ウォーム、コールドの3種類があります。
- ホットサイト これは、設定済みのESXiサーバー、ストレージ、VMレプリカ、およびユーザーデータを備えた、完全に機能するDRサイトです。災害発生後にプライマリサイトが障害に陥った場合、ホットサイトは直ちに利用可能な状態になっています。ホットサイトの導入にはコストがかかりますが、可能な限り迅速な復旧を実現します。
- 予備サイト ネットワーク機器、ゲートウェイサーバー、ESXiホスト、ストレージなどの機器は含まれていますが、仮想マシン(VM)やユーザーデータは含まれていない場合があります。この場合、仮想マシンはバックアップから復旧させる必要があり、ユーザーデータもコピーする必要があるかもしれません。災害復旧の過程で追加の機器やソフトウェアをインストールすることが可能なため、ウォームサイトの利用は、中程度のコストを要する妥協案ではありますが、手頃な復旧時間を実現するソリューションです。
- コールドサイト 基本的なインフラのみを備えたDRサイトです。災害が発生した場合、サーバーの設定、ストレージの展開、VMの復旧が必要となり、バックアップからユーザーデータを抽出しなければならない場合もあります。この種のDRサイトを利用する場合、VMやワークロードの復旧にはより多くの労力がかかります。この復旧プロセスには時間がかかりますが、コールドサイトは他のサイトタイプと比較してコストが最も低く抑えられます。
バックアップとレプリカを自動的に作成する
VMのバックアップとレプリカは、VMware vSphere仮想環境における災害復旧の最も重要な要素です。バックアップにはVMデータのコピーが含まれ、これは安全な場所に保存されます。バックアップされたデータは圧縮される場合があり、復元には時間がかかります。VMレプリカとは、ソースVMと完全に同一のコピーであり、 ESXiホスト、必要な時にすぐに開始できる状態で、以下の期間に使用されます フェイルオーバー. 仮想マシンのバックアップを頻繁に手動で行うことは避けてください。災害が発生した際、重要な変更が見落とされたり失われたりする恐れがあります。スケジュールを設定することで、仮想マシンのバックアップやレプリカを自動的に作成できる、適切なホストレベルの仮想マシンデータ保護ソフトウェアを活用してください。
VMwareのクラスタリング機能を使用する
VMwareは提供しています 特徴量のクラスタリング たとえば、分散リソーススケジューラ(DRS)クラスタ、高可用性(HA)クラスタ、およびフォールトトレランス(HAクラスタ内のVMで利用可能)などです。HAクラスタはVMのダウンタイムを最小限に抑えるのに役立ち、フォールトトレランス(FT)はハードウェア障害が発生した場合でもVMのダウンタイムを回避できるようにします。 クラスタリング機能は、バックアップやレプリケーションの代わりにはならない点にご注意ください。フォールト・トレランスを備えた高可用性と、レプリケーションを伴うバックアップは、互いに補完し合うものです。重要な点は、HAやFTでは、データの破損、VM内のファイルの削除、ソフトウェア更新の失敗、その他のソフトウェア障害などに対してはデータを保護できないということです。
適切なVM復旧順序を使用する
仮想マシンは、適切な順序で復旧する必要があります。互いに依存関係にある異なるアプリケーションを実行する複数の仮想マシンがあると仮定してください。典型的な例としては、Active Directory ドメイン コントローラーを実行する仮想マシン、データベース サーバーを実行する仮想マシン、および Web サーバーを実行する仮想マシンが挙げられます。これらの仮想マシンは、以下の順序で起動する必要があります:
- ドメインコントローラーが動作するVMを最初に起動する必要があります。
- データベースサーバーを搭載したVMは、ドメインコントローラーを搭載したVMが実行されているときに起動します。これは、データベースサーバーがユーザー認証のためにドメインコントローラーを使用するためです。
- この場合、Webサーバーを搭載したVMは、データベースサーバーを搭載したVMが稼働しているときに起動します。これは、Webサーバーが正常に動作するためにデータベースを使用するためです。
MS Exchange メールサーバーが動作する仮想マシンがある場合、ユーザー認証のために MS Exchange は Active Directory と連携しているため、その仮想マシンはドメイン コントローラーが動作する仮想マシンよりも後に起動する必要があります。
適切なVMネットワーク構成を使用する
本番サイトと災害復旧サイトでは、VMの接続に異なるネットワークが使用される場合があります。VMの仮想ネットワークアダプタは、仮想スイッチ(vSwitch)のポートに接続されています。 ポートグループは、ネットワーク名と適切なアドレスを持つ異なるネットワークを表します。VMをDRサイトに復旧させた際、そのVMが本番サイトのネットワーク(DRサイトのVMで使用されているネットワークとは異なる)に接続するように設定されている場合、VMのネットワーク接続を確立することはできません。この場合、DRサイトでVMを復旧させる際には、VMのネットワーク設定を変更することを忘れないでください。
仮想マシンのストレージを準備する
DRサイトで使用されるストレージには、VMを保存するための十分な空き容量が確保されている必要があります。これが第一かつ最も重要な要件です。 また、ストレージは十分なパフォーマンスを提供する必要があります。そうしないと、VM上で実行されるビジネスクリティカルなサービスに遅延が生じる可能性があります。NAS(ネットワーク接続ストレージ)やSAN(ストレージエリアネットワーク)などのネットワークベースのストレージを使用する場合、ネットワーク速度は処理に耐えられる十分な速度でなければなりません。DRサイトのストレージネットワークは、他のネットワークから分離された専用ネットワークでなければなりません。
復旧計画を定期的に確認してください
災害復旧計画は、紙の上では立派に見えても、事前にテストを行わなければ、いざ災害が発生した際に役に立たない可能性があります。したがって、災害復旧計画は定期的にテストを行うようにしてください。テストを行うことで、その計画が実際に機能するか、また RTO そして RPO 要件を満たせるかどうかを確認できます。また、テストを行うことでDR計画の欠点を発見し、それらを修正するための調整を行うことも可能になります。
vSphere仮想環境を確実に復旧できるよう、DR計画を定期的にテストしてください。インフラストラクチャは時間の経過とともに変化する可能性があり、変更が発生した後では、以前は機能していたDR計画でも、もはや適切な要件を満たさなくなる場合があります。 たとえば、VMが追加されたり、IPアドレスが変更されたり、アプリケーションが別のVMに移行されたりする場合があります。定期的なテストを行うことで、インフラストラクチャの変更後にDR計画を効率的な状態に維持するために、計画のどの部分を更新すべきかを特定できます。
最適なサイト復旧ソリューションを見つける
DR計画を策定したら、自社のニーズに最も適したサイト復旧ソリューションを探してください。VMware vSphereを使用する場合、ソリューションはホストレベルのVMバックアップ/レプリケーション、バックアップからの高速復元、VMレプリカへのフェイルオーバー、VM全体の復旧、および個々のオブジェクトの復旧に対応している必要があります。適切な機能を備えたソリューションを選択し、DR計画の定期的なテストと更新が可能になるようにしてください。
NAKIVO Backup & Replication VMwareの災害復旧
NAKIVO Backup & Replication は、VMware VMを保護できる、高速で信頼性が高く、手頃な価格のVMデータ保護ソリューションです。この製品は、ホストレベルのVMバックアップおよびレプリケーション、個別のオブジェクト復元、インスタントVM復元、VMレプリカへのフェイルオーバーなど、多岐にわたる機能を提供します。VMware vStorage API for Data Protectionを採用しているため、VMにエージェントをインストールする必要はありません。さらに、 NAKIVO Backup & Replication 新しいSite Recovery機能が搭載されており、VMware VMだけでなく、サイト全体の災害復旧を実行できます。
サイトリカバリの概要
サイト復旧 これは、災害発生時にあるサイトから別のサイトへVMを復旧させるのに役立つ強力な機能です。また、サイト間の計画的なVM移行にも利用できます。自動化された復旧ワークフローを構築し、計画的なフェイルオーバーや緊急時のフェイルオーバー、さらにはテスト目的で実行することができます。
Site Recovery の機能
Site Recovery を使用すると、VM の災害復旧プロセスを自動化およびオーケストレーションできます。この機能には、災害復旧計画に従ってサイト復旧ワークフロー(ジョブ)に組み込むことができる一連のアクションと条件が含まれています。これらのアクションは以下の通りです:
- フェイルオーバー仮想マシン。 VMレプリカへのフェイルオーバーを行うことができます(フェイルオーバーを実行する前に、VMレプリカを作成しておく必要があります)。
- フェイルバック仮想マシンDRサイトに保存されているVMレプリカから、本番サイトに保存されているソースVMへワークロードを移行することができます。
- 仮想マシンを起動する. 1台または複数のVMを起動できます。
- 仮想マシンを停止する. 1台または複数のVMを停止できます。
- ジョブを実行する. 作成したジョブ(バックアップ、レプリケーション、Flash VM Boot など)を実行できます。 NAKIVO Backup & Replication 例。
- 作業を中止する. ジョブの実行を停止することができます。
- スクリプトを実行する. インスタンスが実行されているマシン上でスクリプトを実行できます NAKIVO Backup & Replication、リモートのWindowsマシン、リモートのLinuxマシン、VMware VM、Hyper-V VM、またはEC2インスタンス上で。
- リポジトリを添付する. バックアップリポジトリを関連付けることができます。
- リポジトリを切り離すすでに接続済みのバックアップリポジトリを解除できます。
- メールを送信する. 適切な処理が完了した後、例えばVMのフェイルオーバーが正常に完了した場合などに、メールを送信することができます。
- 待って. 次のアクションに進む前に、指定された時間待つことができます。
- 状態を確認する. 次のアクションに進む前に、以下の条件を確認できます:リソースが存在するか、リソースが実行中か、IPアドレスまたはホスト名に接続できるか。
記載されているアクションを柔軟に活用することで、さまざまなユースケースやシナリオに合わせたサイト復旧ジョブを作成できます。"ジョブを実行"ボタンをクリックすると、定義された順序ですべてのアクションが自動的に開始されます。サイト復旧ジョブは本番環境およびテスト環境で手動で実行できますが、スケジュールされたタスクとして自動的に実行するように設定した場合、テストモードで実行されます。
サイトリカバリのメリット
Site Recoveryは、強力かつ便利で直感的な機能です。この機能により、VMware vSphere仮想環境における災害復旧が簡素化されるだけでなく、 事業継続.
Site Recoveryのメリットをまとめると:
- これにより、災害復旧戦略の枠組みの中で、複雑なサイト復旧計画を実施することが可能になります。
- 災害復旧プロセスを自動化します。
- 災害復旧にかかる時間を短縮します。(その結果、ダウンタイムやサービスの中断が減り、コストを削減できます。)
- サイト復旧ジョブを自動的にテストすることで、サイト復旧計画が最新の状態であるか、またRPOとRTOを満たせるかどうかを確認できます。
- サイト復旧は単独の機能ではなく、強力かつ汎用性の高いVMデータ保護ソリューションに組み込まれており、単一の管理画面から一元的に管理することができます。
- 手頃な価格設定となっています。すでに適切なライセンスをお持ちの場合は、Site Recovery を使用するために別途ライセンスを購入する必要はありません。 NAKIVO Backup & Replication 版。
結論
VMware vSphere 仮想環境のディザスタリカバリは、事業継続性を確保する上で重要なプロセスです。VMware のディザスタリカバリに関するベストプラクティスには、ディザスタリカバリ計画の策定に加え、VM のフェイルオーバーに必要な VM レプリカの自動作成が含まれます。vSphere のクラスタリング機能に加え、VM のバックアップおよびレプリケーション機能を利用することが推奨されます。 VMの復旧順序を定義し、災害復旧サイト(ネットワークおよびストレージコンポーネントを含む)を準備し、災害復旧計画を定期的にテストすることを確実に行い、ホストレベルのVMバックアップ、レプリケーション、および復旧をサポートする適切なデータ保護ソリューションを使用してください。
NAKIVO Backup & Replication は、VMware仮想マシンをサポートする汎用VMデータ保護ソリューションです。Site Recoveryは、に搭載された強力な新機能です。 NAKIVO Backup & Replication バージョン8.0以降。Site Recoveryでは、自動化されたサイト復旧ジョブを作成することで、災害復旧計画を実行できます。この便利な機能により、災害復旧プロセスの調整と自動化、VMデータの迅速な復旧、そして高水準のデータ保護を実現できます。
ダウンロード NAKIVO Backup & Replication Site Recovery を利用して、VMware vSphere 環境で本製品をお試しください。