フェイルオーバーとは? クラスタリングとレプリケーションの活用事例

VMの可用性は、事業継続を確保するために不可欠です。ビジネス上およびミッションクリティカルなVM上で稼働しているサービスが利用できなくなると、企業は収益の損失や顧客の信頼を失う恐れがあります。障害発生後すぐにVMの可用性を回復させるには、適切なフェイルオーバー手法を採用する必要があります。

VMのレプリカへのフェイルオーバーは、通常のワークフローへの影響を最小限に抑えながらデータと業務を復旧させるための、災害復旧の一環となり得ます。VMのフェイルオーバープロセスについては、組織の事業継続および災害復旧(BCDR). それでは、VMのフェイルオーバーの種類とユースケースについて、さらに詳しく見ていきましょう。

NAKIVOで可用性を確保

NAKIVOで可用性を確保

仮想インフラストラクチャにおけるサービス可用性の厳しい要件を満たします。堅牢なDRオーケストレーションおよび自動化機能により、稼働率の目標を達成します。

フェイルオーバーとは何ですか?

フェイルオーバーとは、プライマリシステムの障害発生後、セカンダリシステム(場合によってはセカンダリサイト)上で仮想マシン(VM)を再開するプロセスを指します。セカンダリシステムには、業務を継続するために必要なすべてのデータが含まれています。ここでいう"システム"とは、サーバー、データベース、仮想マシンなどを指します。

仮想環境では、主に以下の2つのフェイルオーバー手法が一般的です:

フェイルオーバーは、バックアップからの復旧に比べてワークロードの復旧にかかる時間が短いため、その結果、より短い復旧時間目標(RTO)。しかし、 VMのレプリケーション あるいは、クラスタリングを行っても、作成の必要性がなくなるわけではありません VMのバックアップバックアップ(通常は圧縮されたもの)は、古い復旧ポイントからデータを復元する必要がある場合に役立ちます。

レプリケーションベースの災害復旧に関する、VMフェイルオーバーの基本用語について確認しておきましょう。

フェイルオーバー用語集

  • 失敗: システムのダウンを引き起こす、システム障害、停電、ネットワーク障害、ランサムウェア攻撃などに起因するハードウェアまたはソフトウェアの問題。
  • 一次システム: 本番環境で稼働中のシステム。
  • 二次系: プライマリシステムのコピーを定期的に更新する冗長化されたスタンバイシステムです。セカンダリシステムは、オンプレミスまたは遠隔地に設置することができます。
  • 複製: VMのフェイルオーバーに備えるための重要なプロセスです。レプリケーションとは、特定の時点におけるプライマリVMの完全なコピー、つまりレプリカを作成することです。
  • VMのフェイルバック: フェイルバックとは、インシデントが解決された後、レプリカVMからプライマリシステムに戻すプロセスのことです。

フェイルオーバーの種類

フェイルオーバーには3つの種類があります:

  • A 計画的なフェイルオーバー これは、あるシステムやサイトから別のシステムやサイトへのワークロードの定期的な移行に使用されます。主な用途としては、プライマリシステムのメンテナンス、本番サイトでの電気工事、想定される災害シナリオなどが挙げられます。例えば、竜巻に関する気象警報が発令された場合、可用性を確保するために計画的なフェイルオーバーが必要になることがあります。
  • ある 予期せぬフェイルオーバー これは、予期せぬ障害が発生し、重要なVMやプライマリサイト全体がオフラインになった場合に実行されるフェイルオーバーです。障害の原因としては、自然災害、事故(停電)、マルウェア攻撃、その他のインシデントなどが挙げられます。計画外のフェイルオーバーに備えて、ホストとレプリカはあらかじめ準備しておく必要があります。
  • A フェイルオーバーのテストその名の通り、これはテスト目的で使用されます。テストシナリオには、予期せぬフェイルオーバーの状況をシミュレートし、
    • セットをご覧いただけます RTOs そして RPOs
    • すべてが正常に動作しており、必要な時にはスムーズに稼働します
    • 災害復旧に携わるすべてのスタッフが、各自の役割と責任を理解している

フェイルオーバーの手順

VMのフェイルオーバー時には、ワークフローを確実に再開させるために、フェイルオーバーの手順とVMの起動順序が極めて重要です。これらは、組織の 災害復旧計画。この順序は、異なるVM上で実行される各サービス間の依存関係を反映したものである必要があります。

例えば、VM上で実行される一部のサービスやアプリケーションの認証には、別のVM上で実行されているActive Directoryが使用されている場合があります。データベースサーバーが1台目のVMで、アプリケーションサーバーが2台目のVMで、Webサーバーが3台目のVMで実行されているといった構成が考えられます。

Active Directoryサーバーが動作するVMを最初に起動する必要があります。その後、認証にActive Directoryを使用するサービスが動作するVMを起動できます。 アプリケーションサーバーはデータベースに接続するため、データベースサーバーが搭載されたVMは、アプリケーションサーバーが搭載されたVMよりも先に起動する必要があります。データベースサーバーとアプリケーションサーバーが搭載されたVMの起動が完了したら、Webサーバーが搭載されたVMを起動できます。

主なフェイルオーバーソリューション

仮想環境で主に利用されるソリューションは以下の通りです:

  • フェイルオーバー・クラスタリング
  • VMレプリカを使用したフェイルオーバー

それぞれについて考えてみましょう。

解決策 1. フェイルオーバー・クラスタリング

フェイルオーバー クラスターとは、1 つのノードがダウンしたり利用できなくなったりした場合に、ワークロードを引き継ぐように構成された、少なくとも 2 台のサーバーまたはノードのグループのことです。クラスタリングは、最も重要でビジネスに不可欠な仮想マシン(VM)に利用できる、エンタープライズクラスの自動化ソリューションです。Microsoft Hyper-V では、 フェイルオーバー・クラスター 複数のHyper-Vホストで構成されています。VMwareにおけるこれに相当するものは 高可用性クラスタ、これはESXiホストで構成されています。

以下の最初の図では、両方のホスト(別名 ノード) が正常に動作していることを確認します。VMはホスト上で実行されており、VMファイルは両方のホストからアクセス可能な共有ストレージ上に配置されています。

Before VM failover - all components of the cluster work fine

ホストの1つがダウンすると、(オフラインになったノード上で実行されていた)VMへの接続の所有権は、まだオンラインの状態にある別のノードに移行されます。これがフェイルオーバーのプロセスです。高可用性を確保しているVMについては、再起動が必要になる場合があります。

VM failover - VMs are migrating to the second host within a cluster after failure of the first host

フェイルオーバー・クラスタリングの要件

フェイルオーバー クラスターを構築するには、以下の要件を満たす必要があります:

  • 共有ストレージ ホストとは、低遅延の専用高速ネットワークで接続されています。複数のホストがストレージ上のデータに同時にアクセスできるようにするため、クラスタ型ファイルシステムを使用する必要があります。
  • 仮想マシンが実行されているホストは、同一のハードウェア、あるいは少なくとも同一ファミリーのハードウェアである必要があります。フェイルオーバー時にホスト間で仮想マシンを移行した後も正常に動作させるためには、互換性を確保するために、プロセッサが同一の命令セットをサポートしている必要があります。
  • 低遅延の高速冗長ネットワーク。複数の独立したクラスタネットワークを用意する必要があります。つまり、クラスタごとに、ストレージ、管理、VMの移行、ホスト間の相互接続など、それぞれ異なるネットワークを用意しなければなりません。

ユースケース

フェイルオーバークラスタは、サーバー障害から仮想マシン(VM)を復旧させるために使用され、重要なVMに対して高可用性を提供します。クラスタ内のホスト(ノードと呼ばれる)のいずれかが障害を起こした場合、そのホスト上で実行されていたVMは、正常な他のホストへ移行(フェイルオーバー)します。設定によっては、障害が解消された後、フェイルオーバーされたVMを、障害発生前に実行されていた元のホストへ戻すことができます。

メリット

フェイルオーバー・クラスタには、強力な保護機能を提供する利点があります:

  • フェイルオーバー・クラスターは、VMの自動フェイルオーバー機能を提供します。障害が発生したVMを他のホスト上で手動で起動する必要はありません。
  • フェイルオーバー時には、データ損失はほぼゼロです。ダウンタイムは通常、VM、オペレーティングシステム(OS)、およびVM上で実行されているソフトウェアの読み込みにかかる時間に限定されます。
  • その Fault Tolerance 機能 その中に含まれている VMware High Availability クラスターにより、ダウンタイムやデータ損失のないVMのフェイルオーバーが保証されます。

デメリット

フェイルオーバー・クラスタでは、以下の事態を防ぐことはできません:

  • 仮想マシン(VM)のソフトウェア障害。ソフトウェアのバグやウイルスにより、仮想マシン内でシステムがクラッシュすることがあります。
  • 仮想マシン内のファイルが誤って削除された。
  • 共有ストレージの障害。共有ストレージに障害が発生すると、クラスタは停止します。共有ストレージはクラスタの重要な構成要素であり、クラスタ内の仮想マシン(VM)に属する仮想ディスクは、この共有ストレージ上に保存されています。
  • 物理的なサイト全体が利用できなくなる災害。

フェイルオーバー クラスターの詳細については、 VMwareクラスタリングの完全ガイド.

解決策 2. VM レプリカを使用したフェイルオーバー

VMレプリカを利用したVMのフェイルオーバーは、専用のアプリケーションによって実行できます。このアプリケーションは、VMをレプリケートし、管理者の指示に応じてレプリカを起動します。データ保護ソフトウェアに加え、ソースVMに障害が発生した際にVMレプリカを実行できるよう、事前に準備されたESXiまたはHyper-Vホスト(環境に応じて)が必要です。

下の図では、ネットワークを介して相互に接続された2台のホストが示されています。 VMは各ホストのディスクを使用しています。ソースVMは最初のホスト上で実行されており、特定の時点におけるソースVMの完全なコピーであるVMレプリカは、2番目のホスト上に電源オフ状態で配置されています。

Powered off VM replicas are residing on the second host while the source VMs are running on the first host

あるホストがダウンすると、そのホスト上で実行されていたVMもアクセスできなくなります。その後、別のホストにあるVMのレプリカが、管理者によって起動されます。

VM failover - the VM replicas are powered on after a failure of the first host on which the source VMs were running

VMレプリケーションの要件

VMレプリケーションの基本的な要件は、2台以上のホストとレプリケーションソリューションです。1台目のホスト上で実行されているソースVMが、2台目のホストにレプリケートされます。VMのレプリカは2台目のホスト上に配置されます。

ユースケース

ハードウェアまたはソフトウェアの障害が発生した場合、VMレプリカを使用したフェイルオーバーを利用できます。ESXiやHyper-Vホストの障害は、ハードウェア障害の一例です。ソフトウェア障害の例としては、更新プログラムの失敗、ソフトウェアのバグ、ウイルス攻撃、またはユーザーによるファイルの誤削除などが挙げられます。

メリット

VMのレプリカへのフェイルオーバーの主な利点は、リモートサイトへのフェイルオーバーが可能であることです。VMレプリカの作成時には、ソースVMからコピーされたデータを、ネットワーク接続(帯域幅に制限がある場合でも)を介してリモートサイトに転送することができます。リモートサイトは、近隣のオフィスにある場合もあれば、地球の反対側にある場合もあります。また、VMレプリカはプライマリ本番サイト内に配置することも可能です。

デメリット

VMレプリカを使用したフェイルオーバーのデメリット一覧:

  • 障害が発生してから、2台目のホストでレプリカが起動するまで、わずかなダウンタイムが生じます。
  • フェイルオーバーは手動で開始する必要があります。
  • 予期せぬフェイルオーバーが発生した場合、前回のレプリケーション以降に書き込まれたデータが失われる可能性があります。VMのレプリケーションは、多くの場合、リアルタイム(同期)処理ではありません。これは、同期レプリケーションがリソースに多大な負荷をかけるためです。レプリケーションは通常、選択した設定に応じて、一定の間隔で行われます。
  • 別のサイトへのフェイルオーバー時には、VMのネットワーク設定を変更する必要がある(ことが多い)。リモートサイトのVMネットワークは、プライマリサイトのネットワークとは異なる場合がある。そのため、IPアドレスも異なる可能性があり、フェイルオーバー時には他のネットワーク設定とともに確認・変更を行う必要がある。

クラスタリングとレプリケーションベースのVMフェイルオーバーの比較

クラスタリングによるフェイルオーバー レプリカを使用したフェイルオーバー
目的 高可用性 災害復旧
~に対する保護 ハードウェアの故障のみ ハードウェアおよびソフトウェアの障害
管理 自動的に開始されます 手動で起動
ダウンタイムの期間(RTO) フェイルオーバーが高速化されるため、VMのダウンタイムが短縮されます(RTOが短縮されます) フェイルオーバーに時間がかかるため、VMのダウンタイムが長くなります
要件 その他の要件 要件の削減
ソリューション価格 クラスタリングソリューションは通常、コストが高くなります レプリケーションソリューションはコスト効率に優れています
データの紛失(RPO) データ損失がほぼゼロ(極めて低い RPO) データの損失はレプリケーションの頻度によって異なります

VMのフェイルオーバーにおけるクラスタとレプリカの併用

クラスタとレプリカのフェイルオーバーソリューションは、互いに代替手段と見なされることもありますが、実際には互いを補完し合う形で活用することも可能です。ここでは、両方のフェイルオーバーソリューションを併用することで、サーバーレベルおよびサイトレベルの障害からVMを保護できる具体的な例をいくつか見ていきましょう。

  • 例 1: クラスタ内で実行中のVMを、リモートサイトにあるホストにレプリケートすることができます。さらに、あるクラスタ内で実行中のVMを別のクラスタにレプリケートすることも可能です。したがって、ホストに障害が発生しても、フェイルオーバークラスタによってそれらのVMは稼働し続けます。サイト全体で障害が発生した場合は、リモートサイトに保存されているVMのレプリカにフェイルオーバーすることができます。
  • 例 2: ウイルスによって一部の仮想マシン(VM)内のファイルが破損することがあります。フェイルオーバークラスターでは、このような障害を防ぐことはできません。しかし、複数のリカバリポイントを持つVMのレプリカがあれば、各VMを、ファイルが破損または削除される前の時点に復元することができます。

NAKIVOソリューションを活用した、VMware仮想マシンのレプリカへの自動フェイルオーバー

NAKIVO Backup & Replication クラスタ内で実行されている仮想マシンを保護し、仮想マシンのレプリケーション、レプリカへのフェイルオーバー、および複雑な DR シーケンス。レプリケーションの送信元および送信先として、クラスタだけでなく、スタンドアロンのESXiまたはHyper-Vホストもサポートされています。このソリューションは、VMをレプリケートできるように、VMが存在するホストを自動的に追跡します。フェイルオーバーやロードバランシングが発生した後、VMはクラスタ内の別のホストへ移行することがあるため(クラスタは通常、ロードバランシングと組み合わせて構成されます)、これは有用です。 そのため、クラスタからVMをレプリケートするために使用するソフトウェアは、VMが存在するホストを追跡できる必要があります。

NAKIVOソリューションは、フェイルオーバー時にVMのネットワーク設定を自動的に変更できます。単に Network Mapping そして Re-IP レプリケーションまたはフェイルオーバージョブを設定する際の機能。

例を見てみましょう。 仮想マシンの自動フェイルオーバー (ネットワークマッピングおよびRe-IP対応) NAKIVO Backup & Replication. まずはVMのレプリカを作成します。

VMのフェイルオーバーに必要なレプリケーションの設定

"ジョブ"ダッシュボードで、[ ] をクリックします Create > VMware vSphere replication job VMwareの仮想環境をご利用の場合。なお、Microsoft Hyper-Vの仮想マシンやAmazon EC2インスタンスについても、同様の方法でレプリケーションジョブを作成できます。

Creating a new VMware vSphere replication job to get ready for VM failover

レプリケーション・ジョブ・ウィザードが起動します。

  1. レプリケートする仮想マシンを選択します。この例では、 Server2019 VM上で実行されている Windows Server 2019 ゲストOSとして、複製されます。クリック Next.Selecting a source VM to replicate – this VM will be used for VM failover
  1. VMレプリカを実行する宛先ホストを選択してください(10.10.10.90 (当社の場合)。VMファイルの配置先として、選択したホストにマウントされているデータストアを選択します。クリック Next.Selecting a destination host and datastore for a VM replica
  1. 設定できます Network Mapping そして Re-IP レプリケーション・ジョブまたはフェイルオーバー・ジョブを設定する際のオプション。この手順では、 Network Mapping そして Re-IP フェイルオーバージョブの設定時に後で設定されます。したがって、この手順はひとまずスキップして、単に Next.VM Network configuration for the VM replica
  1. Re-IP この手順では、VMフェイルオーバージョブの設定中に設定方法について説明します。クリック Next.Re-IP settings can be configured during a VM replication job
  1. スケジュール設定を選択してください。クリック Next 終わったら。Scheduling settings for a replication job
  1. 保存期間の設定を行ってください。なお、以下の設定を行うことができます。 祖父・父・息子 このステップでの保持ポリシー。クリック Next.Retention settings – how many recovery points must be preserved
  1. レプリケーションジョブのオプションを選択し、[クリック] をクリックします Finish または Finish & Run ボタンをクリックします。レプリカの作成が完了するまでお待ちください。Configuring VM replication job options

VMのフェイルオーバー設定

VMのレプリカが作成されたので、このレプリカに対してVMのフェイルオーバーを実行できます。

ダッシュボードのホーム画面で、[クリック] Recover> VMware Full Recovery (VM replica failover). その New Failover Job Wizard 開きます。

Starting VM failover to replica

  1. 左ペインで、フェイルオーバーに使用するVMレプリカを選択します。この手順では、 Server2019-replica、作成されたばかりのものが選択されています。右側のペインで、リカバリポイントを選択します。ソリューションでは、デフォルトで最新のリカバリポイントが選択されています。[クリック] Next.Selecting the VM replicas and recovery points to perform VM failover
  1. Network Mapping これにより、VMが接続されているネットワークを変更できます。ソースと宛先のESXiホストでは、仮想スイッチの設定が異なる可能性があります。VMレプリカはソースVMの完全なコピーであるため、ソースVMが接続されている仮想ネットワークはVMレプリカにも引き継がれます。

    通常、VMレプリカのネットワーク設定を確認し、手動でネットワークを変更する必要があります。 NAKIVO Backup & Replication ソースネットワークを宛先ネットワークに自動的にマッピングできます。レプリケーションまたはフェイルオーバージョブを設定する際に、ネットワークマッピングを設定するだけで済みます。

    • 有効にするには Network Mapping、チェックボックスを選択してください。以前にネットワークマッピングルールを作成している場合は、[ Add existing mappingネットワークマッピングルールがない場合は、[クリック] Create new mapping.Configuration of Network Mapping while configuring a VM failover job
    • 新しいネットワークマッピングルールを作成するには、送信元ネットワークと宛先ネットワークを選択します。送信元ネットワークとは、送信元VMが接続されているネットワークのことです。宛先(ターゲット)ネットワークとは、VMのレプリカを接続するネットワークのことです。

      注: その VMネットワーク 名前はIPアドレスやネットワークアドレスとは異なります。

      クリック Save ネットワークマッピングルールを保存し、次にクリックします Next 設定を続行するには。Creating a network mapping rule

    1. その Re-IP 機能 これにより、VMレプリカのIP設定を変更できます。静的IPアドレスの設定に使用できます。 Enable Re-IP このオプションを有効にする場合はチェックボックスをオンにし、Re-IPルールを作成するか、既存のルールを追加してください。クリック Create new rule 以前にルールが作成されていない場合、ポップアップメニューが表示されます。
    • 変更が必要なソースVMの設定は、IPアドレスとネットワークマスクです。
    • ターゲット設定とは、フェイルオーバーが発生した際にVMレプリカに適用される設定のことです。この例では、 [*] 文字は最後の8ビットをカバーします。 [*] は、1 から 254 までの任意の数字を表します。たとえば、送信元 IP アドレスが 10.10.10.1、10.10.10.96、および 10.10.10.222 である場合、宛先アドレスはそれぞれ 192.168.10.1、192.168.10.96、および 192.168.10.222 となります。 IPアドレスの最後のオクテットは保持されます。

      クリック Save Re-IPルールを保存して、次に進みます。

      Creating a Re-IP rule for VM failover

      Re-IPルールを追加すると、画面は次のようになります:The Re-IP rule has been added

      次に、Re-IPルールを適用するVMを選択します。この例のフェイルオーバージョブにはVMレプリカが1つしか含まれていないため、そのチェックボックスを1つ選択します。

      次に、各VMの認証情報を選択します。[クリック] Manage credentials > Add credentials 新しい認証情報を追加します。追加された認証情報は、ドロップダウンリストから選択できます。

      注: 認証情報は、以下の目的で必要です NAKIVO Backup & Replication VM内のオペレーティングシステムのネットワーク設定にアクセスし、その設定を変更するスクリプトを適用します。 VMware Tools VMware vSphere 仮想マシンには VMware vSphere Integration Services を、Microsoft Hyper-V 仮想マシンには Hyper-V Integration Services をインストールする必要があります。

      これらの設定をすべて完了したら、[クリック] をクリックします。 Next.Selecting credentials for the VM to which the Re-IP rules must be applied during VM failover

    1. それでは、VMフェイルオーバージョブのオプションを設定します。以下の項目を選択できます。 Power off source VMs チェックボックス。ソースVMとレプリカVMの両方が同じネットワークを使用している場合、または同じIPアドレスを持っている場合、IPアドレスの競合を防ぐのに役立つことがあります。すべてのオプションの設定が完了したら、[クリック] Finish & Run.VM failover job options
      VMのフェイルオーバー処理が完了するまでお待ちください。A VM Failover job has been completed successfully
      これで、VMのレプリカが正常に実行されていることを確認できます。次の場所に移動してください Configuration > Inventory そして、 Refresh All ボタンをクリックします。ページを更新すると、 Server2019-replica VMはすでにターゲットのESXiホスト上で実行されています。また、このページから認証情報、ネットワークマッピングルール、およびRe-IPルールを管理することもできます( Inventory (ページ)。Checking the failed over VM in the inventory

    結論

    VMのフェイルオーバーは、多数の仮想マシンが存在する災害復旧シナリオや、運用継続性と高可用性を確保するために単一のVMを復旧させる場合などに有用です。ただし、より信頼性が高く効率的なデータ保護を実現するためには、いかなる災害復旧計画も、堅固なバックアップ戦略と組み合わせる必要があることを理解しておくことが重要です。

    以下の利用を検討してください NAKIVO Backup & Replication""は、高速かつ信頼性が高く、手頃な価格のVM保護ソリューションであり、フェイルオーバーからレプリカへの移行という手法を用いてVMを保護します。また、このソリューションは、一元化されたWebインターフェースから、仮想環境、物理環境、クラウド環境、およびSaaS環境向けのバックアップときめ細かな復旧機能もサポートしています。

    試してみてください NAKIVO Backup & Replication

    試してみてください NAKIVO Backup & Replication

    無料トライアルをご利用いただき、本ソリューションのデータ保護機能をすべてお試しください。15日間無料です。機能や容量の制限は一切ありません。クレジットカードも不要です。

People also read