VMware vSphere Replication のベストプラクティス

仮想マシンのレプリケーション(VMレプリケーション)は、原因を問わず障害やダウンタイムが発生した際、復旧時間を短縮し、システムの可用性を確保するための最良のデータ保護手法の一つであり続けています。 災害発生時にはVMレプリカを即座に起動できるため、数秒以内にVMを復旧させ、重要な業務を継続することが可能です。

VMレプリケーションソフトウェアの実行中に発生しうる問題(アプリケーションの障害やエラー、データの損失、リソースの過剰消費など)を回避するため、効率的かつ信頼性の高いVMデータ保護戦略の一環として、本記事で紹介するVMware vSphereレプリケーションのベストプラクティスに従ってください。

NAKIVO for VMware レプリケーション

NAKIVO for VMware レプリケーション

オンサイトまたはオフサイトでのVMware vSphere仮想マシンの効率的なレプリケーション。インシデントに対する耐障害性を高める、瞬時の自動フェイルオーバー。高可用性と短いRTOを実現。

vSphere Replication とは何か、その仕組み

VMware vSphereのレプリケーションとは、VMware vSphere仮想マシンの完全なコピーを、ESXiホストやクラスターなどの任意の場所に作成するプロセスです。この仮想マシンのコピーは"VMレプリカ"と呼ばれ、電源オフの状態に維持され、ソースVMの最新の変更内容や状態を反映するために、定期的に、あるいは継続的に(継続的レプリケーション)更新されます。

注: VMware vSphereにおけるレプリケーションは、VMwareのバックアップと混同されがちですが、これらの仮想マシン(VM)データ保護手法はそれぞれ異なる目的を持っており、互いに代替するものではなく、補完し合うべきものです(当社のブログ記事をご覧ください VMのバックアップとVMのレプリケーション).

VMwareデータレプリケーションのベストプラクティス10選

以下のベストプラクティスに従い、VMware vSphereのレプリケーションや、その他の環境における仮想マシンのレプリケーションに活用してください。

1. ミッションクリティカルなワークロードを特定し、優先順位をつける。

ダウンタイムや災害発生時に、どの仮想マシンやアプリケーションデータが最も高い保護レベルと最速の復旧を必要とするかを特定してください。 すべてをレプリケートする必要はなく、また、すべてを同じ時間枠内で復旧させる必要もありません。

例えば、オンラインストアは継続的な運用を維持し、顧客との直接的な注文や購入取引を可能にしています。Webサーバーに障害が発生した場合、顧客へのWebサイトのダウンタイムの影響を最小限に抑えるためには、Webサイト、在庫、CRMを最優先かつ可能な限り迅速に復旧させることが極めて重要ですが、バックオフィスアプリケーションは後回しにしても構いません。

2. データ保護計画の概要をまとめる。

"計画を立てないことは、失敗を計画することである"。事業継続の要件、ミッションクリティカルなワークロード、優先順位、個々のデータ保護手法、VMのバックアップ/レプリケーションジョブの頻度と所要時間、必要なリソース(データストレージ容量、ネットワーク帯域幅、VMのバックアップ/レプリケーションウィンドウなど)を考慮して、データ保護活動を計画してください。

また、データ保護計画には、担当者の役割、専用のハードウェアおよびソフトウェアコンポーネント、災害復旧シナリオも必ず盛り込むようにしてください。

3. 適切なVMのバックアップおよびレプリケーション比率を設定する。

VMのバックアップとVMのレプリケーションは一見同じように見えますが、目的が異なり、互いに代替し合うことはできません。VMのバックアップは、その種類を問わず、VMデータの長期的な保存を目的としています。一方、VMのレプリケーションは、VMの迅速な復旧、つまりVMの高可用性を実現するためのものです。

仮想マシンのレプリケーションはデータ保護計画の重要な要素であり、組織のニーズと予算に合わせて、定期的なVMバックアップとVMレプリケーションを効率的に組み合わせる必要があります。

4. VMデータ複製シーケンスについて、測定可能な基準を確立する。

どのVMレプリケーションソリューションを選択すべきかを判断する際、測定可能な基準を設定しておくと役立つでしょう。VMware vSphereにおける高可用性のためのレプリケーションに関しては、主に以下の2つの点を考慮する必要があります:

  • スピード。 VMデータの復旧には、どの程度のスピードが求められますか?VMレプリカは元のVMの完全なコピーですが、例えばDBMSを再マウントして復旧させるなど、アクセスできるようになるまでに多少の時間がかかる場合があります。
  • 耐障害性 これは、1つ以上のコンポーネントに障害が発生した場合でも、システムが良好なパフォーマンスを維持できる能力のことです。災害が発生した場合でもVMデータを利用可能にするために、システムがどの程度の耐障害性を確保すべきか検討してください。耐障害性を確保するために仮想マシンのレプリケーションをどの程度の頻度で実施するか決定する際は、ハードウェアやネットワークの容量も考慮に入れてください。

事業継続方針に基づき、障害発生地点に対する復旧地点の最適な距離、すなわち 復旧時点目標 (RPO)これは、データ損失を最小限に抑えることと、追加リソースにかかるコストとのトレードオフです。企業によっては、RPOが24時間、7日、あるいは1ヶ月である場合もあれば、わずか10秒でなければならない場合もあります。

5. フェイルオーバーおよびフェイルバックのロードマップを作成する。

本番環境のVMがダウンした場合でも、サービスやアプリケーションの稼働を最小限の混乱で維持するためには、事前にフェイルオーバーおよびフェイルバックの手順を策定しておく必要があります。さまざまな予期せぬ事態が発生した際に従うべき、本番環境VMのフェイルオーバーおよびフェイルバックの対応シナリオを策定してください。

導入されているデータ保護システムに応じて、予期せぬシャットダウンおよび計画的なシャットダウンの両方において、フェイルオーバーおよびフェイルバックの手順は手動または自動のいずれかとなります。

6. VMレプリカの検証を有効にする。

VMレプリカが正常に動作することを確認するために、定期的に検証を行うことは推奨されるベストプラクティスです。これにより、予期せぬトラブルを防ぐことができます。VMレプリカが破損したり、データが損なわれたりしている可能性があるからです。 不具合の原因が何であれ、VMレプリカを定期的に検証し、そのスケジュールを計画に組み込んでください。

サードパーティ製のVMware vSphereレプリケーションソリューションを使用する場合は、VMレプリカの自動検証機能が利用可能な場合、その機能を有効にすることをお勧めします。これにより、すべてのVMレプリカの整合性が自動的に検証されます。

7. アプリケーションを意識したレプリカを作成する。

最新のデータ保護ソリューションでは、アプリケーション対応の特別なレプリケーションモードが提供されており、Microsoft Active Directory、Microsoft SQL Server、Microsoft SharePoint、Microsoft Exchange Server、Oracle Database などのアプリケーション向けに、アプリケーション対応の仮想マシン(VM)レプリカを作成することができます。これは、 VSS 執筆陣。

"アプリケーション認識型"、つまりアプリケーション一貫性のあるVMレプリケーションモードとは、レプリケーションの過程で、スナップショットを作成する前に、メモリ内のデータと保留中のI/O操作がディスクにフラッシュされることを意味します。その結果、VMレプリカには一貫性のあるデータが含まれるため、データを失うことなくアプリケーションをスムーズに復旧させることができます。

8. 復旧ツールを中心に自動化を構築する。

復旧ツールを活用した自動化体制を構築しておけば、災害発生時にVMを迅速に復旧させる必要が生じた際、不必要な遅延を防ぐことができます。自動スクリプトが適切に管理されていることを確認してください。一方、最新の高度なデータ保護ソリューションには、統合された自動化機能が備わっています。

9. 従業員の定着およびローテーションに関する方針を定める。

このポリシーでは、VMレプリカの作成頻度とその保持期間を定義します。VMレプリケーションの変更データは、レプリケーション変更データベースに継続的に追加されます。定期的に削除を行わないと、利用可能なディスク容量をすべて消費するまで、データベースは急激に肥大化してしまいます。この削除間隔を"レプリケーション削除遅延"と呼びます。デフォルトのレプリケーション削除遅延はデータ保護ソフトウェアで設定されており、1日から数日の範囲で設定可能です。

保持およびローテーションポリシーを設定する際は、レプリケーション削除遅延を考慮してください。 パージ遅延期間より古い変更は、レプリケーション変更データベースから削除されます。レプリケーション変更データベースのバックアップ頻度は、レプリケーションパージ遅延期間よりも頻繁に行うようにしてください。そうしないと、一部の変更が失われる可能性があります。

10. 適切なVMレプリケーションおよびDRソリューションを選択する。

仮想マシンのレプリケーションを定期的に実行する必要がある場合は、自社のITインフラストラクチャの具体的なニーズや組織の予算に合った適切なソリューションを選択する必要があります。

現在市場で入手可能なVMware vSphereレプリケーション製品を比較する際は、機能性とパフォーマンスの両方の観点から、各製品の具体的な機能を検討する必要があります。 たとえば、同期型VMレプリケーション(継続的レプリケーション)を採用している製品もあれば、半同期型や非同期型のVMレプリケーションを実行する製品もあります。トランザクション型アプリケーションのフェイルオーバーには、同期型のVMwareデータレプリケーションの方が適しているように見えますが、低速なネットワーク環境での完全同期は、パフォーマンスを著しく低下させる可能性があります。対照的に、非同期型のVMwareレプリケーションは、このような状況でもパフォーマンスへの影響がほとんどありません。 一方、プライマリサーバーに障害が発生した場合、非同期VMレプリケーションではコミット済みのデータが失われる可能性があります。

また、VMのレプリケーションおよび復元操作には大容量のハードウェアが必要となる場合があるため、その速度も考慮すべき点です。

仮想マシンをオフサイトやクラウドにリモートレプリケーションすることで、データセンター全体に災害が発生した場合でもデータを安全に保つことができますが、インフラストラクチャのネットワークに必要な帯域幅を確保していることを確認してください。

NAKIVO による VMware vSphere Replication

NAKIVO Backup & Replication には、あなたの VMwareのレプリケーション、および Hyper-V レプリケーション さらには AWS EC2インスタンスのレプリケーション シンプルかつ高速です。NAKIVOのソリューションは、増分レプリケーション向けにVMwareの変更ブロック追跡(Changed Block Tracking)に対応しており、柔軟な保持期間設定を提供します。また、VMware APIと直接連携し、ホストレベルでのVMwareデータレプリケーションを実現します。

How does replication work in VMware vSphere with NAKIVO data protection?

NAKIVOで作成したVMwareレプリカは、VMのフェイルオーバーや、プライマリサイトにおける複雑な完全復旧シナリオに活用できます。

1年間の無料データ保護: NAKIVO Backup & Replication

1年間の無料データ保護: NAKIVO Backup & Replication

2分で導入でき、仮想環境、クラウド、物理環境、SaaSのデータを保護します。バックアップ、レプリケーション、即時復旧のオプションをご用意しています。

People also read