VMware vSphere Replication 最佳實踐
虛擬機器複製(VM 複製)仍是確保在任何原因導致的故障或停機期間,能實現最短還原時間與系統可用性的最佳資料保護技術之一。 一旦發生災難,VM 複本可立即啟動,讓您在數秒內恢復 VM 並維持關鍵業務運作。
為避免執行 VM 複製軟體時可能遇到的各種陷阱——例如應用程式故障與錯誤、資料遺失、資源消耗過高等——請遵循本文所述的 VMware vSphere 複製最佳實踐,作為高效且可靠的 VM 資料保護策略的一部分。
什麼是 vSphere Replication 以及它是如何運作的
VMware vSphere 複製是指在指定位置(可以是 ESXi 主機或叢集)建立 VMware vSphere 虛擬機器的精確副本的過程。此虛擬機器副本稱為"虛擬機器副本",會維持在關機狀態,並定期或持續(持續複製)進行更新,以反映來源虛擬機器的最新變更與狀態。
註: VMware vSphere 中的複製功能常與 VMware 備份混為一談,但這兩種虛擬機器資料保護方法的目標不同,應互為補充而非相互取代(請參閱我們的部落格文章 虛擬機器備份與虛擬機器複製).
10 項 VMware 資料複製最佳實踐
請遵循以下最佳實踐,並將其應用於 VMware vSphere 複製以及其他環境中的虛擬機器複製。
1. 界定關鍵任務工作負載並為其設定優先順序。
請確定哪些虛擬機器和應用程式資料在發生停機或災難時,需要最高等級的保護以及最快的還原能力。 您無需複製所有內容,且並非所有內容都必須在相同的時間框架內恢復。
舉例來說,您的線上商店維持持續運作,並允許與客戶進行直接訂單及購買交易。若您的網頁伺服器發生故障,網站、庫存及 CRM 系統將是首要且必須盡快恢復的關鍵項目,以將網站停機對客戶的影響降至最低;而後台應用程式則可稍後處理。
2. 擬定資料保護計畫。
不做規劃,就是預謀失敗。規劃資料保護活動時,應考量業務連續性需求、關鍵任務工作負載、優先順序、個別資料保護技術、虛擬機器備份/複製工作的頻率與執行時間,以及所需資源(資料儲存容量、網路頻寬、虛擬機器備份/複製時段等)。
請確保您的資料保護計畫同時涵蓋人員職責、專用硬體與軟體元件,以及災難還原情境。
3. 採用適當的虛擬機器備份與複製比例。
雖然虛擬機器備份與虛擬機器複製看似功能相同,但兩者目標不同,無法互相替代。無論何種類型的虛擬機器備份,其設計目的皆在於長期保存虛擬機器資料;而虛擬機器複製則旨在實現快速還原,換言之,即確保虛擬機器的高可用性。
虛擬機器複製是資料保護計畫的重要組成部分,您應根據組織的需求與預算,找出定期執行虛擬機器備份與虛擬機器複製之間的高效組合方案。
4. 為虛擬機器資料複製序列建立可量化的標準。
在決定選擇哪種虛擬機器複製解決方案時,建立可量化的標準可能會有所幫助。關於在 VMware vSphere 中為高可用性進行複製,您主要需要考慮以下兩個方面:
- 速度。 您需要多快完成虛擬機器資料的還原?雖然虛擬機器副本是原始虛擬機器的完整複本,但您可能仍需一些時間才能存取它,例如重新掛載並恢復資料庫管理系統。
- 容錯能力 是指系統在一個或多個元件發生故障時,仍能維持良好效能的能力。請評估您的系統應達到何種容錯程度,以便在災難發生時仍能確保虛擬機器資料可供存取。在決定為實現容錯而執行虛擬機器複製的頻率時,也請一併考量您的硬體與網路容量。
根據您的業務連續性政策,確定還原點與故障點之間的最佳距離,也就是 還原點目標 (RPO)這是在將資料損失降至最低與額外資源成本之間的一種權衡。對某些企業而言,RPO 可能是 24 小時、7 天,甚至 1 個月;而對其他企業來說,RPO 可能只需 10 秒。
5. 擬定故障移轉與故障恢復的實施計畫。
為確保在生產環境虛擬機器發生故障時,服務與應用程式仍能以最小中斷程度持續運作,您應預先制定故障移轉與故障恢復程序。請針對各種不利情況,擬定應遵循的生產環境虛擬機器故障移轉與故障恢復處置方案。
根據既有的資料保護系統,無論是針對非預期的或預期的關機,故障移轉與故障恢復程序均可採用手動或自動方式執行。
6. 啟用虛擬機器複本的驗證功能。
定期驗證您的虛擬機器複本以確保其可用性,是一項良好的做法。這將有助於避免任何意外狀況。您的虛擬機器複本可能會出現損壞或損毀的情況。 無論故障原因為何,請定期驗證虛擬機器複本,並將驗證時程納入您的計畫中。
當使用第三方 VMware vSphere 複製解決方案時,建議您啟用虛擬機器複本的自動驗證特點(若該特點可用)。如此一來,所有虛擬機器複本的完整性都將自動獲得驗證。
7. 建立應用程式感知型複本。
現代資料保護解決方案提供一種特殊的"應用程式感知"複製模式,讓您能夠透過以下方式,為 Microsoft Active Directory、Microsoft SQL Server、Microsoft SharePoint、Microsoft Exchange Server 或 Oracle Database 等應用程式建立"應用程式感知"的虛擬機器複本: VSS 作者。
"應用程式感知型"或換言之,即"應用程式一致性"的虛擬機器複製模式,意指在複製過程中,會在建立快照之前,將記憶體中的資料及待處理的 I/O 操作寫入磁碟。因此,您的虛擬機器副本將包含一致的資料,應用程式也能順利恢復,且不會造成資料遺失。
8. 建立以還原工具為核心的自動化流程。
若在災難發生時需盡快恢復虛擬機器,透過還原工具建立自動化流程可避免不必要的延誤。請確保自動腳本得到妥善維護。另一方面,現代先進的資料保護解決方案提供了整合式的自動化特點。
9. 制定人員留任與輪調政策。
此政策規定了建立虛擬機器複本的頻率及其保留時間。虛擬機器複製資料的變更會持續新增至複製變更資料庫中。若未定期進行清理,該資料庫將急遽膨脹,直至佔用所有可用磁碟空間。兩次清理之間的這段期間稱為"複製清理延遲"。預設的複製清理延遲時間由您的資料保護軟體設定,範圍從一天到數天不等。
在建立保留與輪替政策時,請務必考量複製清理延遲。 超過清除延遲時間的變更將從複製變更資料庫中清除。請確保複製變更資料庫的備份頻率高於複製清除延遲週期;否則,部分變更可能會遺失。
10. 選擇合適的虛擬機器複製與災難復原解決方案。
如果您需要定期執行虛擬機器複製,應選擇適合的解決方案,以滿足您的 IT 基礎架構特定需求及組織預算。
在比較目前市面上可用的 VMware vSphere 複製產品時,您應從功能性與效能雙重角度,審視其具體特點。 例如,某些產品採用同步虛擬機器複製(持續複製),而其他產品則執行半同步或非同步虛擬機器複製。雖然同步 VMware 資料複製對於交易型應用程式的故障移轉似乎是較佳的選擇,但在網速較慢的環境中,完全同步可能會嚴重拖累效能。相較之下,非同步 VMware 複製在此情況下幾乎不會影響效能。 另一方面,若主伺服器發生故障,異步 VMware 虛擬機器複製可能會導致已提交資料的遺失。
另一項需考量的重點是虛擬機器複製與還原操作的速度,因為這可能需要高容量的硬體設備。
雖然將虛擬機器遠端複製至異地或雲端能確保資料安全——即使整個資料中心遭遇災難——但請務必確認您的基礎架構網路具備所需的頻寬。
VMware vSphere Replication 與 NAKIVO
NAKIVO Backup & Replication 提供許多實用特點,讓您的 VMware 複製,以及 Hyper-V 複製 甚至 AWS EC2 執行個體複製 簡單且快速。NAKIVO 解決方案支援 VMware 的"變更區塊追蹤"功能以進行增量複製,提供靈活的保留設定,並直接透過 VMware API 在主機層級執行 VMware 資料複製。
您可以使用透過 NAKIVO 建立的 VMware 複本,來執行虛擬機器故障移轉,以及處理複雜的主站點完整站點還原情境。
