VMware 災難還原最佳實踐

災難還原是一套旨在於系統發生故障後,還原基礎架構各組件的措施流程。此外,災難還原的目標在於將災難可能造成的負面影響降至最低,並確保業務連續性。為了因應各種可能發生的災難類型,企業通常會制定一份災難還原計畫,該計畫應作為業務連續性計畫的一部分。

虛擬機器是災難發生時面臨風險的組件;正因如此,您應透過制定災難還原計畫來為災難做好準備。這篇部落格文章將探討 VMware 虛擬環境中災難還原 (DR) 的最佳實踐。

透過 NAKIVO 確保系統可用性

透過 NAKIVO 確保系統可用性

滿足虛擬基礎架構中對服務可用性的嚴格需求。透過強大的災難復原編排與自動化特點,達成正常運作時間目標。

制定災難還原計畫

A 災難還原計畫 是一份結構化的文件,用以描述災難還原流程,即在災難發生時由相關人員執行的一系列行動。此外,該文件還規定了啟動該計畫所需的觸發條件。無論是自然災害還是人為因素,都可能引發災難。 災難還原計畫應涵蓋針對不同災難類型及突發事件的各種還原情境。例如,災難還原計畫可說明在遭遇勒索軟體攻擊、停電、硬體故障、地震、颱風等情況時應採取的措施。災難還原計畫可進行分類:例如,第一章節可闡述網路還原,第二章節可著重於資料中心還原,而第三章節則說明虛擬機器還原等。

準備您的站點還原站點

災難還原站點是指當用於生產的主站點發生故障時,企業可用以還原基礎架構和工作負載的場所。災難還原站點可分為熱備援、溫備援或冷備援三種類型。

  • 一個熱門網站 這是一個功能性完備的災難還原站點,配備了已設定好的 ESXi 伺服器、儲存裝置、虛擬機器複本以及使用者資料。若主站點在災難發生後發生故障,熱備援站點可立即投入使用。雖然部署熱備援站點的成本較高,但能提供最快的還原速度。
  • 備援站點 其中包含部分設備,例如網路設備、閘道伺服器、ESXi 主機以及儲存裝置,但可能不包含虛擬機器和使用者資料。在此情況下,應從備份中還原虛擬機器,使用者資料也可能需要進行複製。在災難還原過程中,可安裝額外的設備和軟體,因此使用備援站點是一種折衷方案,雖需中等成本,但能提供可接受的復原時間。
  • 備援站點 這是一個僅具備基礎基礎設施的災難還原站點。當災難發生時,必須配置伺服器、部署儲存設備、還原虛擬機器,並可能需要從備份中提取使用者資料。使用此類災難還原站點時,還原虛擬機器和工作負載所需的努力較多。雖然此還原過程耗時較長,但相較於其他站點類型,冷站點的成本最低。

自動建立備份與複本

虛擬機器 (VM) 備份與複本是 VMware vSphere 虛擬環境中災難還原最重要的組成部分。備份包含虛擬機器資料的副本,並儲存於安全地點。備份資料可進行壓縮,且還原過程需要時間。虛擬機器複本則是來源虛擬機器的完全相同副本,存放於 ESXi 主機,可在需要時隨時啟動,並於 故障移轉請避免過於頻繁地手動備份虛擬機器,因為一旦發生災難,某些重要的變更可能會被忽略而遺失。請善用合適的主機層級虛擬機器資料保護軟體,透過設定排程來自動建立虛擬機器備份與虛擬機器複本。

使用 VMware 叢集特點

VMware 提供 聚類特點 例如分散式資源排程器 (DRS) 叢集、高可用性 (HA) 叢集,以及容錯 (僅適用於 HA 叢集中的虛擬機器)。HA 叢集有助於將虛擬機器的停機時間降至最低,而容錯 (FT) 則能在硬體故障時避免虛擬機器停機。 請注意,叢集特點無法取代備份與複製。具備故障容錯功能的高可用性,以及透過複製進行的備份,兩者是相輔相成的。重點在於,HA 和 FT 無法防止資料損毀、虛擬機器內部的檔案刪除、軟體更新失敗或其他軟體故障等情況。

使用適當的虛擬機器還原順序

虛擬機器應依照適當的順序進行復原。假設您擁有多台運行不同應用程式且彼此存在依賴關係的虛擬機器。典型的例子包括:一台運行 Active Directory 網域控制器的虛擬機器、一台運行資料庫伺服器的虛擬機器,以及一台運行網頁伺服器的虛擬機器。這些虛擬機器必須依照以下順序啟動:

  1. 應先啟動配備網域控制器的虛擬機器。
  2. 當搭載網域控制器的虛擬機器正在運行時,搭載資料庫伺服器的虛擬機器也會隨之啟動,因為資料庫伺服器會使用網域控制器進行使用者驗證。
  3. 當資料庫伺服器虛擬機器正在運行時,搭載網頁伺服器的虛擬機器也會隨之啟動,因為在此情況下,網頁伺服器需要使用該資料庫才能正常運作。

如果您有一台安裝了 Microsoft Exchange 郵件伺服器的虛擬機器,該虛擬機器必須在安裝了網域控制器的虛擬機器啟動之後才啟動,因為 Microsoft Exchange 會與 Active Directory 整合以進行使用者驗證。

使用適當的虛擬機器網路設定

生產環境與災難還原站點可能使用不同的網路來連接虛擬機器。虛擬機器的虛擬網路介面卡會連接到虛擬交換器(vSwitch)的埠上。 埠組透過網路名稱和對應的位址來代表不同的網路。若您將虛擬機器復原至災難復原站點,但該虛擬機器的設定是連線至生產站點的網路(與災難復原站點上虛擬機器所使用的網路不同),則無法建立虛擬機器的網路連線。在此情況下,請務必在災難復原站點復原虛擬機器時,記得變更虛擬機器的網路設定。

準備您的虛擬機器儲存空間

用於災難復原站點的儲存裝置必須具備足夠的可用空間,以存放虛擬機器。這是首要且最關鍵的需求。 儲存設備還必須具備足夠的效能;否則,在虛擬機器上運行的業務關鍵服務可能會出現延遲。若使用 NAS(網路附加儲存裝置)或 SAN(儲存區域網路)等網路型儲存設備,網路速度必須足夠快以應對需求。災難復原站點的儲存網路必須是與其他網路隔離的專用網路。

定期測試您的還原計畫

災難還原計畫在紙面上或許看起來很完善,但若未事先進行測試,一旦發生災難時可能毫無用處。因此,請務必定期測試您的災難還原計畫。透過測試,您可以確認災難還原計畫是否可行,以及 RTO 以及 RPO 能夠滿足。測試還能讓您發現災難復原計畫的缺點,從而進行調整以加以修正。

請定期測試您的災難復原計畫,以確保 vSphere 虛擬環境能夠恢復。基礎架構可能會隨時間而改變,一旦發生變更,原本尚可運作的災難復原計畫可能就不再符合相關需求。 例如,可能新增了某些虛擬機器、IP 位址可能已變更,或是應用程式從一台虛擬機器遷移至另一台等。透過定期測試,您便能發現基礎架構變更後計畫中哪些部分需要更新,以確保災難復原計畫維持在有效運作的狀態。

尋找合適的站點還原解決方案

在制定完災難復原計畫後,請尋找最符合您需求的站點還原解決方案。若使用 VMware vSphere,該解決方案應支援主機層級的虛擬機器備份/複製、從備份快速還原、故障移轉至虛擬機器副本、整個虛擬機器的還原以及個別物件的還原。請盡量選擇具備適當功能性的合適解決方案,以便定期測試與更新災難復原計畫。

NAKIVO Backup & Replication 適用於 VMware 災難還原

NAKIVO Backup & Replication 是一款快速、可靠且經濟實惠的虛擬機器資料保護解決方案,可為您的 VMware 虛擬機器提供保護。除了眾多功能外,本產品還能執行主機層級的虛擬機器備份與複製、單一物件還原、虛擬機器快速還原,以及故障移轉至虛擬機器複本。由於採用 VMware vStorage API for Data Protection,因此無需在虛擬機器上安裝任何代理程式。此外, NAKIVO Backup & Replication 新增了"站點還原"功能性,透過此功能性,您可以對包含(不僅限於)VMware 虛擬機的整個站點執行災難還原。

站點還原概覽

站點還原 這是一項強大的特點,可在發生災難時協助您將虛擬機器從一個站點還原至另一個站點。此特點亦可用於站點間的預定虛擬機器遷移。您可以建立自動化還原工作流程,並在預定或緊急故障移轉時執行這些流程,亦可用於測試目的。

站點還原特點

"站點還原"特點可讓您自動化並編排虛擬機器災難還原流程。此特點包含一系列動作與條件,您可以根據自身的災難還原計畫,將其組合成站點還原工作流程(工作)。這些動作包括:

  • 故障移轉虛擬機器。 您可以將系統切換至虛擬機器副本(執行故障移轉操作前,必須先建立該虛擬機器副本)。
  • 故障恢復虛擬機器. 您可以將儲存於災難復原站點的虛擬機器複本中的工作負載,轉移回儲存於生產站點的原始虛擬機器。
  • 啟動虛擬機器. 您可以啟動一個或多個虛擬機器。
  • 停止虛擬機器. 您可以停止一個或多個虛擬機器。
  • 執行工作. 您可以執行在您的系統上創建的備份、複製、Flash VM 開機等工作 NAKIVO Backup & Replication 例如。
  • 暫停工作. 您可以停止正在執行的工作。
  • 執行腳本. 您可以在運行該實例的機器上執行腳本 NAKIVO Backup & Replication,無論是在遠端 Windows 電腦、遠端 Linux 電腦、VMware 虛擬機器、Hyper-V 虛擬機器,還是 EC2 執行個體上。
  • 附加儲存庫. 您可以附加一個備份儲存庫。
  • 解除儲存庫關聯. 您可以解除已連接的備份儲存庫的連結。
  • 發送email. 您可以在執行完特定操作後發送email,例如,當虛擬機器故障移轉成功完成時。
  • 請稍候. 您可以在等待一段預設時間後,再進行下一項操作。
  • 檢查狀況. 在執行下一項操作之前,您可以檢查以下條件:資源是否存在、資源是否正在運行,以及 IP 位址/主機名稱是否可連通。

您可以靈活運用清單中的操作,針對不同的使用情境和使用案例建立各種站點還原工作。點擊"執行工作"按鈕後,所有操作將依照定義的順序自動啟動。站點還原工作可在生產環境和測試模式下手動執行,但當您將站點還原工作設定為按排程任務自動執行時,系統會以測試模式執行。

站點還原的優勢

站點還原是一項強大、便捷且直覺的特點。此特點不僅能簡化 VMware vSphere 虛擬環境的災難還原流程,還能讓您減少在 業務連續性.

總結站點還原的優勢:

  • 它能協助您在災難還原策略的框架下,落實複雜的站點還原計畫。
  • 它能自動化災難還原流程。
  • 這能縮短災難還原所需的時間。(因此,系統停機時間更短、服務中斷次數減少,並能降低成本。)
  • 可自動測試站點還原工作,以確認您的站點還原計畫是否為最新版本,以及能否滿足 RPO 和 RTO 的要求。
  • 站點還原並非獨立特點,而是內建於強大且通用的虛擬機器資料保護解決方案中,可透過單一管理介面進行管理。
  • 其定價政策相當實惠。如果您已擁有適用於該產品的授權,則無需為使用站點還原另行購買授權。 NAKIVO Backup & Replication 版本.

結論

VMware vSphere 虛擬環境的災難還原,是確保業務連續性的重要流程。VMware 災難還原的最佳實踐包括制定災難還原計畫,以及自動建立虛擬機器故障移轉所需的虛擬機器副本。建議在運用 vSphere 叢集特點之餘,同時採用虛擬機器備份與複製技術。 請定義您的虛擬機器還原順序、準備好災難還原站點(包括網路與儲存元件)、確保定期測試災難還原計畫,並採用支援主機層級虛擬機器備份、複製與還原的合適資料保護解決方案。

NAKIVO Backup & Replication 是一款支援 VMware 虛擬機器的通用虛擬機器資料保護解決方案。站點還原是其中內建的一項強大特點, NAKIVO Backup & Replication 自 8.0 版本起,站點還原允許您透過建立自動化站點還原工作來執行災難還原計畫。這項實用特點可協助您編排並自動化災難還原流程,快速還原虛擬機器資料,並確保資料獲得高度保護。

下載 NAKIVO Backup & Replication 透過站點還原,在您的 VMware vSphere 環境中試用此產品。

試試看 NAKIVO Backup & Replication

試試看 NAKIVO Backup & Replication

立即申請免費試用,全面體驗本解決方案的所有資料保護特點。15 天免費試用。無功能或容量限制。無需提供信用卡資訊。

People also read