執行災難還原複製:完整操作指南
在當今這個時代,客戶對於服務提供過程中的任何中斷都缺乏耐心,無論原因為何。舉例來說,如果您造訪 A 公司的網站尋找某項特定服務,而該服務無法提供,您很可能會轉而造訪 A 公司的競爭對手網站,以尋求能夠提供所需服務的替代方案。 在當今快節奏的世界中,重大的業務停機時間極可能損害客戶忠誠度。
換言之,停機時間可能導致以下後果:
- 利潤損失
- 對您品牌的損害
- 與客戶及合作夥伴的關係存在問題
- 供應鏈問題
- 法律問題等
這些結果可能是由於關鍵業務服務與資料無法取得所致,而這正是複製技術的用途——協助您完全避免系統停機,或至少將其影響降至最低。災難還原(DR)絕不僅僅是災難還原複製,同樣地,複製技術的應用也不僅限於災難還原,還包括資料同步、整合、彙整與遷移。
為了在災難發生後還原您的 IT 基礎架構,或至少還原其最關鍵的部分,您的組織需要一個備用位置,用以儲存已複製的資料,並可作為故障移轉站點。當災難威脅到主站點的運作狀態,甚至其實體存在時,便需要備用位置來進行災難還原。災難還原複製是指建立資料的精確副本,無論是在單一位置內,或是在主站點與一個或多個備用位置之間。 災難還原複製應為持續且不間斷的過程,因為一旦發生災難,您必須在可接受的時間內,將最新的業務關鍵 IT 流程切換至災難還原(DR)的軟硬體環境中。
雖然目前雲端複製日益普及,但使用替代實體站點的方式仍相當普遍。實體站點主要分為"熱站點"和"冷站點"兩種類型。 熱站點是您主要資料中心的複本,包含相同的設備、軟體和硬體,因此若主要位置無法運作,熱站點可立即成為故障移轉點。正如您所能想像的,其成本相對較高。另一方面,冷站點僅是一個未安裝任何硬體和軟體的空間,但仍具備必要的電源和通訊線路。
威脅企業營運連續性並有災難還原需求的因素
有數不盡的因素威脅著貴組織的 IT 基礎架構及其運作連續性。其中有些影響輕微且相對常見(例如基礎架構部分區段的非預定停機),有些則屬災難性事件,但將它們全都視為不同嚴重程度的災難,這樣的看法是合理的。讓我們試著將它們大致分類如下:
- 自然災害。 這些是天災,無人能掌控。 無論可預測與否,這些災害都具有壓倒性的威力,沿途造成慘重破壞與毀滅——而這條路徑,說不定就包含貴組織的實際位置。洪水、颶風、火山爆發、龍捲風和地震或許並非貴地區的風險因素,但極端天氣現象在任何地方都構成威脅。與文明相關的威脅時隱時現;我們必須時刻做好防範,以避免因自然災害而導致最嚴重的後果。
- 人為災害 包括破壞活動、恐怖主義、工業間諜活動、蓄意破壞等。疏忽和大意失誤也屬於這些威脅因素之一。
- 國內及國際活動 例如戰爭、罷工以及其他政治局勢動盪的表現,都可能導致貴組織的實體據點不復存在。
- 與技術及軟體相關的故障與威脅 包括停電、硬體故障和資料遺失,以及病毒、勒索軟體和網路攻擊等惡意因素。
在當今世界,IT 基礎架構正日益普遍地走向虛擬化,這有助於提升災難還原(DR)的整體效能。正因如此,當代的災難還原複製軟體比以往任何時候都更有效率且更具成本效益,讓您能夠建立並編排完全自動化的災難還原工作流程,並達成可接受的復原時間目標(RTO)與復原點目標(RPO)。
在眾多災難還原指標中,配置複製功能時應考量以下幾點:
- 還原時間目標 (RTO) 是用來衡量還原流程可接受的耗時長度,換言之,即在貴組織恢復提供服務之前,您能承受多少時間的損失。
- 還原點目標 (RPO) 這指的是您需要恢復的檔案必須有多新。如果您的關鍵任務應用程式非常動態,且其中發生了大量交易,那麼您就需要立即恢復這些應用程式。否則,您將面臨丟失大量交易,進而損失這些交易本應帶來的收益。
- 工作還原時間 (WRT) 表示公司驗證復原資料完整性所需的時間。
- 最大可容忍停機時間 (MTD) 衡量公司在不遭受重大損失及不利後果的情況下,能為災難還原預留多少時間。
以下列出了一系列複製特性,在為貴組織選擇災難還原複製解決方案時,應將這些特性納入考量。
同步與非同步複製
在……期間同步複製, 資料在寫入目標資料物件的同時,也會同步寫入對應的來源,讓您能夠達成最低的 RTO 和 RPO 目標。此類災難還原複製方式,特別適用於需要即時故障移轉的高階交易型應用程式和高可用性叢集。負責寫入資料的軟體客戶端,必須等到資料已提交至主儲存裝置和次要儲存裝置後,才會收到寫入確認。
雖然物件及其副本會保持同步,但這會導致同步中的應用程式產生延遲並減慢速度,同時佔用頻寬並造成整體開銷。若使用替代儲存位置,也存在該位置可能斷開連線的風險。然而,同步複製可讓您幾乎立即且無資料遺失地切換至次要站點。
在 非同步複製, 資料會在寫入對應來源後的一段時間,才會寫入目標資料物件。資料的災難還原複製會依照預設時程,在固定間隔(每分鐘、每十分鐘、每小時等)進行。若您的網路頻寬無法承受同步複製的負荷,也就是說,若關鍵業務資料的變更速率持續超過傳輸至故障移轉站點的速度,這將是理想的選擇。
基於檔案與基於區塊的複製
檔案系統會將檔案儲存於特定的磁碟區塊中。一個檔案可能分散儲存於磁碟各處的區塊中。因此,當基於檔案的複製程序讀取該檔案時,必須在磁碟上四處"奔波"以尋找該檔案的分散片段。這種"四處奔波"的過程會耗費相當多的時間。 透過區塊式複製可避免這種時間損失,因為它傳輸的不是已變更的檔案,而是已變更的區塊,並按照區塊在磁碟上的實際位置順序進行讀取。因此,在其他條件相同的情況下,選擇採用區塊式複製的災難復原(DR)解決方案會是較佳的選擇。
完整複製與增量複製
持續複製全部資料量既不合理也不切實際。然而,最初仍需進行一次完整複製。透過這次完整複製,將建立來源物件的精確副本。隨後即可開始增量複製,這意味著僅將資料變更部分複製到故障移轉站點(若採用區塊級複製,則為區塊層級的變更)。目前,所有進階 DR 解決方案,例如 NAKIVO Backup & Replication, 讓您能夠執行增量式災難還原複製。
應用程式感知型複製
如果災難還原複製具備應用程式感知能力,它便會擷取記憶體中應用程式資料的狀態以及 I/O 操作。這能讓您避免應用程式資料遺失。經複製的應用程式仍能維持交易一致性,這意味著當它們在災難還原站點執行時,不會發生當機。
使用災難還原複製 NAKIVO Backup & Replication
如果您正在尋找 最佳的 VMware 備份解決方案 針對您的環境,請嘗試 NAKIVO Backup & Replication. 我們的無代理資料保護解決方案提供基於映像檔且具有應用程式感知增量備份功能,以及 VMware 虛擬機的複製,以及 Hyper-V 虛擬機器和 AWS EC2 執行個體。如前所述,我們將以 VMware 虛擬機器為例,示範如何執行虛擬機器複製。對於 VMware 虛擬環境,複製在 NAKIVO Backup & Replication 具有以下特點(其中許多特點亦適用於 Microsoft Hyper-V 和 AWS EC2):
- 應用程式感知模式 確保 Microsoft Exchange、Microsoft Active Directory、Microsoft SQL 以及其他某些應用程式在災難還原複製開始之前,會將記憶體中的資料和 I/O 交易寫入磁碟。以此模式進行複製的應用程式屬於"崩潰不一致"狀態,這意味著若發生災難且必須啟動複本時,這些應用程式仍能無錯誤地運行。
- 方便 透過政策實現複製自動化. 透過政策,您可以完全自動化虛擬機器複製流程。政策由基於虛擬機器大小、標籤、名稱、位置等條件的規則組成。政策式工作會針對所有符合設定規則的虛擬機器進行操作,當這些虛擬機器出現在您的基礎架構中時,系統會自動偵測並將其加入複製工作中。
- 還原點的保留期限具有彈性,讓您擁有 30 個還原點,即所謂的虛擬機器快照。透過"祖父-父親-兒子"輪替方案,您可以建立每日、每週、每月及每年的還原點。
- 該 螢幕截圖驗證 此特點可讓您驗證複本是否處於運作狀態。多虧了這項特點,一旦發生災難,您就不會遇到諸如虛擬機器複本損毀且錯誤百出這類"驚喜"。
- 對於 RTO 要求不高的資料(也就是以非同步方式複製的資料),您可以複製的不是生產環境的虛擬機器,而是它們的 備份這有助於減輕您主要 IT 資源的負擔。
- 對於虛擬機器複本,您可以選擇建立 薄配置磁碟,無論生產環境中的虛擬機器使用何種磁碟。若為精簡磁碟,其佔用的空間僅包含資料與應用程式,不包含任何未使用空間。
- 本產品的複製特點可在以下情境中使用: 站點還原 此特點可讓您編排並自動化複雜的災難復原工作流程。透過站點還原功能,您可以將複製、預定或緊急故障移轉、故障恢復及其他操作整合為單一流程,只需輕點一下即可啟動!
- 可將交換資料(Windows 作業系統中的暫存檔,以及 Linux 作業系統中的暫存空間)從虛擬機器複本中排除,藉此提升複製速度並節省儲存空間。
LAN-Free Data Transfer此模式透過Hot Add以及Direct SAN Access如果 NAKIVO Backup & Replication 若在可存取虛擬機器資料存放區的伺服器上運行,則可透過Hot Add此特點會透過儲存 I/O 堆疊,從這些資料存放區讀取虛擬機器資料,並在此過程中繞過主機的 TCP/IP 堆疊。該Direct SAN Access此特點讓您能夠透過光纖通道(Fibre Channel)或 iSCSI 直接從 SAN 儲存裝置讀取資料,不僅能提升複製速度,還能減輕生產網路的部分負載。- 如果您使用 Microsoft Exchange 或 Microsoft SQL Server, NAKIVO Backup & Replication 可以 截斷伺服器的交易日誌,以免佔用伺服器過多空間。
- 透過 網路加速 透過此特點,您可以將複製速度提升多達 2 倍。若要使用此特點,您只需在本地或異地安裝額外的 Transporter 即可。
- 安裝額外的 Transporter 還能讓您 加密 在資料傳輸過程中以及抵達目標儲存庫時,資料會被複製。
- 透過 多租戶 透過這項特點,您可以提供"複製即服務"方案,最多可建立 100 個隔離的租戶,客戶可利用這些租戶自行執行複製及其他任務。
- 進階頻寬限制 此特點可讓您限制複製程序的頻寬,以避免其造成網路負載過重。
- 若需節省時間並減輕網路負載,您可以先將資料傳輸至(種子) 將虛擬機器副本複製到可移除媒體,然後將其移至新位置。之後,只需進行增量複製即可。 NAKIVO Backup & Replication 可使用內建的專有變更區塊追蹤功能,以及 VMware 的變更區塊追蹤功能,來執行虛擬機器的增量複製(備份)。
- 您可以安裝 NAKIVO Backup & Replication 在 NAS設備上,並在設備之間複製資料,從而享受更佳的效能與速度。
如何使用 VMware 建立複製工作 NAKIVO Backup & Replication
以下,我們將示範如何在 VMware 環境中建立虛擬機器複製工作 NAKIVO Backup & Replication. 這個流程簡單直觀,您很快就會親身體會到。
在主介面上 NAKIVO Backup & Replication,點擊 Create,然後選擇 VMware vSphere replication job (視您的環境而定,您也可以選擇 Amazon EC2 replication job 或 Microsoft Hyper-V 複製工作).
接著,請依照以下步驟操作。
1. 在 Source 步驟 New Replication Job Wizard for VMware vSphere, 選擇要複製的虛擬機器或整組虛擬機器容器,然後點擊 Next.

2. 在 Destination 下一步,針對複本,請選擇目標容器、目標資料存放區以及虛擬機器資料夾。接著,點擊 Next.

3. 關於 Networks 若位於目標(DR)站點,請啟用並設定網路對應,因為虛擬機器使用的網路與主站點不同。完成此步驟後,請按一下 Next. 或者,您可以跳過此步驟,直接點擊 Next 立刻。

4. 在 Re-IP 在此步驟中,若虛擬機器在目標(災難復原)站點使用的 IP 位址與主站點不同,您可以設定 IP 變更例行程序。您可以建立新的 Re-IP 規則,或使用現有的規則。完成後,請按一下 Next. 您也可以點擊此處跳過此步驟 Next 立刻。

5. 在 Schedule 在這個步驟中,您應該會發現一種非常方便的方式來排程您的複製工作。您可以查看 Do not schedule, run on demand 如果這是單次複製工作,或者您尚未確定排程的具體細節。在 Schedule #1,您可以選擇 Run daily/weekly (也就是每週的特定幾天), Run monthly/yearly (也就是說,一年中的某些月份), Run periodically 或 Run after another job. 如果您選擇 Run after another job,您應選擇,例如,工作 Z 並設定,例如,您是否希望當前工作在 Z 是否立即採取行動,以及是否應該啟動 After successful runs, After failed runs,或 After stopped runs. 您也可以 新增另一個排程 (第 2 項、第 3 項等)以及 顯示行事曆 為方便您使用。另一種設定方式是 Effective from,此設定決定複製工作排程何時生效。
請確保您的複製間隔符合您要複製之虛擬機器(VM)的最大 RPO。

6. 在 Retention 在此步驟中,您可以設定最多 30 個要保留的還原點(在完成複製工作後, NAKIVO Backup & Replication 應為複本虛擬機器建立一個還原點)。透過 NAKIVO Backup & Replication, 您可以採用傳統的"祖父-父親-兒子"保留方案,就災難復原(DR)而言,此方案非常適合用於儲存副本和備份。

7. 在 Options 在此步驟中,您可以設定所有剩餘的選項,以最大限度地自動化複製工作並為其增添細微調整。您可以為複製工作命名並設定為App感知模式,同時可調整追蹤設定、網路加速、加密、虛擬機器驗證、複本所使用的磁碟類型(精簡磁碟或複製虛擬機器所使用的磁碟)、日誌截斷、腳本使用、傳輸模式、頻寬限制等。

8. 完成所有選項的設定後,請按 Finish 或 Finish & Run (如果您希望該工作立即執行)。複本建立完成後,即可用於您的災難復原流程。
如何使用站點還原工作 NAKIVO Backup & Replication
您剛建立的複製工作可作為複雜自動化災難復原工作流程的一部分,該工作流程是透過 Site Recovery 特點。透過此特點,您可以將操作與條件組織成全面的災難復原 (DR) 演算法,以因應特定情境與目的(例如:停電、災難防範等)。
您可透過以下方式,將複製工作整合至災難復原工作流程中: Site Recovery 特點:
1. 在 NAKIVO Backup & Replication 主介面,點擊 Create,然後選擇 Site recovery job.

2. New Site Recovery Job Wizard 將會開啟。在精靈的 Actions 步驟,選擇 Run jobs.

3. 您可以看到 Run Jobs 視窗中,您可以選擇複製工作,包括您剛建立的工作。選擇工作並完成設定後,請按一下 Save.

4. 該 Actions 此步驟將再次開啟。在此步驟中,您可以選擇將其他動作加入複雜的災難還原工作流程,或點擊 Next. 之後,只需按照 New Site Recovery Job Wizard請按照指示操作,直到您建立好站點還原工作為止。
結語
我們的產品透過基於區塊且具備應用程式感知能力的災難還原複製與備份選項,能保護您的虛擬環境免於意外停機及重大災難。透過基於規則的政策,您可以自動化和編排災難還原複製流程,並將其整合至複雜且全面的作業流程中。您可以透過網路加速和變更追蹤功能來加快複製工作的速度,並透過虛擬機器驗證確保複本處於可運作狀態。功能性與價格 NAKIVO Backup & Replication 是市面上最頂尖的產品之一。
歡迎親自體驗並試用 NAKIVO Backup & Replication 在您的實體、虛擬或雲環境中,請下載 立即體驗功能性齊全的免費試用版!
