雲端災難還原:完整概覽

雲端服務在運行服務和儲存資料方面提供了多重優勢。與儲存於本地端的資料一樣,儲存於異地及雲端中的資料也應進行備份。 雲端儲存的資料並非天生無懈可擊,因為意外刪除及雲端特有的威脅仍可能導致資料遺失。與此同時,雲端對於災難還原也頗具助益。基於上述原因,建議您透過建立並保留資料的多份副本來保護資料。

這篇部落格文章探討雲端災難還原,內容涵蓋使用情境、資料保護策略以及實作建議。

透過 NAKIVO 確保系統可用性

透過 NAKIVO 確保系統可用性

滿足虛擬基礎架構中對服務可用性的嚴格需求。透過強大的災難復原編排與自動化特點,達成正常運作時間的目標。

什麼是雲端災難還原(Cloud DR)?

雲端災難還原是一套旨在透過將資料、應用程式及其他資產儲存於公有雲環境或專業服務供應商處,以保障其安全的解決方案與服務。一旦發生災難,受影響的資料、應用程式及資源可透過本地資料中心或雲端供應商進行還原,使企業得以迅速恢復正常營運。 在此語境下,災難可能包含自然災害、人為事故、硬體故障、軟體異常,或任何其他可能對組織 IT 基礎架構造成重大影響的干擾事件。

雲端災難還原的目標與傳統災難還原高度相似:保護關鍵業務資源,並確保受保護資產的可存取性與還原能力,以維持業務運作不中斷。 雲端災難還原的主要目標,在於透過維持或快速還原關鍵 IT 服務與資料,以確保業務連續性。傳統的災難還原方法通常涉及使用異地備份設施或冗餘資料中心,其部署與維護成本往往高昂且複雜。雲端災難還原原則利用雲端運算的可擴展性、靈活性與成本效益,提供更高效且易於存取的解決方案。

雲端運算中的災難還原類型

在雲端運算領域中,災難還原策略旨在保護資料、應用程式及 IT 基礎架構,使其免受各類災難所造成的潛在中斷影響。在雲端運算的背景下,災難還原方法主要有幾種。

備份與還原

最基礎且直觀的災難還原方案,涉及備份與還原的流程。在此情境下,應用程式的備份會儲存於還原站點的雲端中。 若發生災難導致主站點無法維持業務運作,系統將利用儲存的備份,在雲端基礎架構上重新配置並恢復應用程式。

儘管備份與還原方法被公認為具成本效益的資料還原方案,但此方法仍伴隨著顯著的停機時間及潛在的資料遺失風險。這是因為系統僅保留資料的週期性備份複製,且資源需在災後才進行配置。

  • 說明:這是一種基本的災難還原方式,其原理是將資料和應用程式的定期備份儲存於雲端。一旦發生災難,即可將備份資料還原以恢復運作。
  • 使用情境:適用於將資料遺失或損毀視為首要考量,且還原時間目標 (RTO) 允許採用較傳統的還原流程之情境。

指示燈 DR

災難還原的第二種方案是"Pilot Light"方法,該方法會複製部分 IT 基礎架構,以支援特定的一組關鍵服務。一旦發生災難,此架構便能讓雲端環境無縫接管運作。 此策略的核心在於維持基礎架構中一小部分持續運作並同步可變資料,而基礎架構的其他部分則保持停用狀態,僅用於測試目的。關鍵在於必須預先配置最關鍵的核心元件,並使其在雲中保持活躍運行。透過此策略,在還原階段便能圍繞這些關鍵核心元件,快速建置完整的生產環境。

  • 說明: 在此方法中,僅預先配置組織 IT 基礎架構中的必要組件,以便在發生災難時,能迅速在雲上進行縮放。
  • 使用情境:適用於擁有關鍵系統且無法承受長時間停機的組織。它在成本效益與快速還原之間取得平衡。

熱備援災難復原

第三種災難還原方案採用"溫備援"架構,即在雲端持續維持一個功能完備但規模較小的運作環境。此方法在"守護火苗"策略的基礎上進一步擴展,藉此縮短還原時間。之所以能達到這種效率,是因為某些服務會持續並行運作。透過溫備援,企業可以鎖定關鍵系統,並將這些系統完整複製到雲端,確保全天候持續存取資料與應用程式。

  • 說明:與 Pilot Light 類似,但有更大比例的基礎設施已在雲端預先配置並運行。雖然尚未完全投入運作,但在發生災難時,其縮放規模並恢復全面功能性所需的時間較短。
  • 使用情境:適合對停機時間容忍度中等,並希望在成本與還原速度之間取得平衡的組織。

熱備援災難復原

熱備援站點會進行持續的異步更新。這意味著主生產站點的資料會根據您指定的還原點目標 (RPO),以您選擇的間隔(例如每幾秒或幾分鐘)透過網路進行複製。此過程以即時方式進行,在目標系統上建立與生產站點高度相似的鏡像。熱備援站點的延遲通常僅有幾毫秒,因此在故障移轉期間,停機時間極短甚至完全沒有。

若目標是建置與生產環境幾乎完全相同的環境,選擇熱備援站點是理想的解決方案。當搭配適當的高可用性 (HA) 解決方案時,熱備援站點可確保無縫切換至幾乎完全相同的配置。

  • 說明: 在此方法中,IT 環境的完整且可完全運作的複本會持續在雲中運行。這使得在發生災難時,能夠近乎即時地進行故障移轉。
  • 使用情境: 非常適合對停機時間要求極低的關鍵任務應用程式與系統。它能提供最快的還原速度,但運作成本較高。

多站點(主動-主動)災難復原

多站點解決方案同時運行於雲端及您的本地基礎架構上,並採用主動-主動(active-active)配置。所選用的資料複製方法取決於所需的還原點,無論是 還原時間目標或還原點目標. 因此,此配置能將資料遺失與系統停機時間降至最低甚至完全消除,儘管這會導致成本增加及運作複雜度提升。

  • 說明:這涉及在地理位置分散的多個資料中心或雲端區域中,同時執行活躍的工作負載。若其中一個站點發生故障,其餘站點將無縫接續處理該工作負載。
  • 使用情境:適用於需要高可用性且停機時間極短的應用場景。它常被用於關鍵性的即時系統。

雲端爆發

雲端擴展的主要優勢在於能防止系統不堪負荷及潛在的停機狀況,這些情況可能造成龐大成本。此外,雲端擴展也是一種成本管理策略,因為採用此策略的組織可避免將預算用於維護閒置的雲端資源。

  • 說明:在雲端爆發(cloud bursting)模式下,組織會在需求高峰期間將工作負載暫時移轉至雲端。若主要資料中心遭遇災難,這些雲端資源即可用於維持營運。
  • 使用情境:透過分散工作負載位置,有效因應需求突增的情況,並提供某種程度的災難還原能力。

針對特定組織選擇合適的災難還原類型,取決於諸多因素,例如應用程式的關鍵性、還原時間目標、預算限制,以及期望達到的營運韌性水準。許多組織會根據其具體需求及 IT 環境的特性,採用這些方法的組合方案。

雲端災難復原的重要性

眾多組織曾面臨嚴重中斷,影響其營運,其中多數事件皆歸因於停電。在此類情況下,制定一套完善的災難還原策略至關重要。一旦發生停電,企業便能迅速還原資料並恢復正常營運。

除了應對停電外,災難還原策略在面對網路中斷、系統故障、天然災害、意外事故、網路攻擊及軟體更新等各類挑戰時,對於維持業務連續性亦扮演著關鍵角色。 然而,過度依賴本地資源的傳統災難還原方案,往往既複雜又昂貴。雲端災難還原原則成為一種更經濟實惠且簡便的解決方案。此方案通常具有簡單且易於使用的介面,可迅速部署。本質上,雲端災難還原提供了經濟性、靈活性與可擴展性。

相較於某些本地解決方案,基於雲端的災難還原原因其優勢而顯得至關重要,包括增強的可擴展性、更大的靈活性、更佳的可存取性以及更高的可靠性。此外,企業通常發現,與某些類型的本地災難還原相比,基於雲端的災難還原提供了一種更具成本效益的解決方案。

雲端災難還原之所以重要,原因眾多,主要聚焦於確保業務連續性、將停機時間降至最低,以及保護關鍵資料與應用程式。以下是組織認為雲端災難還原至關重要的關鍵原因:

  • 將停機時間降至最低. 雲端災難還原能讓企業在災難發生後迅速還原並重啟關鍵業務功能。這能將停機時間降至最低,確保營運順利持續,並降低對生產力的影響。
  • 資料保護. 當資料和應用程式儲存於雲端時,便能實現定期備份與高效的還原機制。一旦發生資料遺失、損毀或其他災難,組織便能迅速且可靠地恢復其資訊。
  • 無障礙功能. 基於雲端的災難還原解決方案提供對管理介面的遠端存取功能,讓組織能夠在任何有網際網路連線的地方監控並管理還原流程。這在無法實體進入資料中心的情況下尤為重要。
  • 安全措施雲端供應商實施了強健的安全措施,包括加密、存取控制及合規認證。實施這些措施有助於提升災難還原流程的整體安全防護能力。
  • 測試與驗證. 雲端災難還原解決方案通常能讓企業在不影響主要營運的情況下,定期對其還原計畫進行測試與驗證。這能確保還原流程既有效又可靠。
  • 自動故障移轉. 雲端災難還原解決方案通常包含自動故障移轉機制。這些機制能自動將流量和工作負載導向備份系統,從而減少人工介入的需求,並加速還原流程。
  • 編排工具雲端平台提供編排工具,讓組織能夠定義並自動化還原工作流程。這簡化了管理與執行複雜還原程序的過程。
  • 可擴展性與靈活性:
    • 資源縮放. 雲端災難還原能根據組織不斷變化的需求,動態縮放資源。這確保在還原情境下,能提供充足的資源以應對增加的工作負載。
    • 地理冗餘雲端供應商通常在不同的地理區域設有眾多資料中心。利用這些分散的位置,可提升系統的冗餘度與韌性,進而確保服務的可用性。
  • 成本效益:
    • 資本支出減少. 傳統的災難還原解決方案通常需要對實體基礎設施和場地進行大量前期投資。雲災難還原原則無需企業維護專用的異地設施,從而降低了資本支出。
    • 隨用隨付模式雲端服務通常採用隨用隨付的模式,讓企業能根據需求彈性縮放資源規模。相較於必須隨時維持冗餘基礎設施,這種靈活性有助於節省成本。

雲端災難還原與傳統災難還原

雲災難還原與傳統災難還原是確保業務連續性及從中斷中恢復的兩種主要方法。以下比較表列出了兩者的主要差異:

  • 基礎設施位置:
    • 雲端災難復原. 涉及利用雲端資源與服務來備份及恢復資料與應用程式。該基礎架構由第三方雲端供應商負責託管與管理。
    • 傳統的災難復原. 涉及維護專用的實體基礎設施,例如異地資料中心或備援設施,以支援備份與還原作業。
  • 資源配置:
    • 雲端災難復原. 提供根據需求動態縮放資源的靈活性。資源採用隨用隨付模式進行配置。
    • 傳統的災難復原. 此需求要求組織必須投資並維護冗餘基礎設施,這可能導致資本支出增加,且資源配置的靈活性降低。
  • 可擴展性:
    • 雲端災難復原. 具備高度縮放能力,讓組織能在還原情境中動態縮放資源。這可確保有足夠的資源可用,以應對增加的工作負載。
    • 傳統的災難復原. 縮放基礎架構可能需要耗費大量時間和精力。組織需要為其備用資料中心的峰值容量做好規劃。
  • 可存取性與遠端管理:
    • 雲端災難復原. 提供對管理介面的遠端存取功能,讓組織能夠透過任何具備網際網路連線的地點,監控並管理還原流程。
    • 傳統的災難復原. 可能需要實地進入備用資料中心或異地設施進行管理與維護。
  • 自動化與編排:
    • 雲端災難復原. 通常包含自動故障移轉機制與編排工具,以簡化還原流程。自動化可縮短災難還原所需的時間。
    • 傳統的災難復原. 自動化程度可能有限,且還原流程可能更依賴人工介入,這可能會延長還原時間。
  • 測試與驗證:
    • 雲端災難復原. 讓組織能夠在不影響主要營運的情況下,定期對還原計畫進行測試與驗證。此類測試通常較為簡單,且對營運造成的干擾較小。
    • 傳統的災難復原. 測試過程可能較為複雜,且可能需要安排系統停機時間,進而影響日常業務運作。
  • 安全措施:
    • 雲端災難復原雲端供應商會採用有效的安全技術(包括存取控制與加密)來保護資料。通常也具備相關的合規認證。
    • 傳統的災難復原. 安全措施是組織的責任,需要投資於實體安全、存取控制及其他相關措施。
  • 成本結構:
    • 雲端災難復原. 採用營運支出(OpEx)模式運作。此模式的核心理念在於,組織僅需為其實際消耗的資源付費。這種模式具有成本效益,對於小型企業而言尤為如此。
    • 傳統的災難復原. 涉及基礎設施的初期資本支出、設施維護費用以及持續的營運成本。
  • 地理冗餘:
    • 雲端災難復原雲端供應商通常在不同地理區域設有多個資料中心,藉此提升系統的冗餘度與韌性。
    • 傳統的災難復原. 冗餘機制仰賴次要資料中心的實體位置,而這些位置在地理多樣性方面可能有所限制。
  • 實施時間:
    • 雲端災難復原. 由於利用現有的雲基礎架構,因此能夠更快地實施。
    • 傳統的災難復原. 規劃、建置及維護實體基礎設施可能需要更長的準備時間。

雲端災難還原在靈活性、可擴展性及成本效益方面具有優勢;相較之下,傳統災難還原雖能提供對基礎設施的更高控制權,但可能涉及較高的前期成本及更長的實施時間。兩者之間的選擇取決於諸多因素,例如組織的具體需求、預算限制,以及對還原環境所需控制程度的期望。許多組織採用 混合式方法 結合雲端與傳統災難還原的元素,以達成符合其業務需求的平衡。

如何制定基於雲端的災難復原計畫

制定基於雲端的災難還原(DR)計畫,需經過仔細規劃、評估業務需求,並運用雲端資源,以確保在發生災難時營運能持續運作。請參閱這份逐步指南,協助您制定基於雲端的災難還原計畫。透過遵循這些步驟,您將能建立一套符合組織需求的完善計畫,並提供應對潛在中斷所需的韌性。

  • 風險評估. 識別潛在風險並偵測可能對您的 IT 基礎架構和營運造成負面影響的威脅。請考量自然災害、網路攻擊、硬體故障及其他潛在的中斷因素。
  • 業務影響分析. 評估潛在中斷對關鍵業務功能造成的影響。為每個應用程式和系統確定還原時間目標 (RTO) 及還原點目標 (RPO)。
  • 定義關鍵應用程式與資料. 識別並優先處理對業務運作至關重要的關鍵應用程式、資料庫及資料集。並非所有應用程式都需要相同的還原優先級。
  • 選擇解決方案. 選擇一家可靠且信譽良好、符合您業務需求的資料保護解決方案與雲端供應商。請考量諸如資料中心位置、服務水準協議(SLA)、安全措施及可擴展性等因素。
  • 資料備份與複製. 定期執行資料備份並將資料複製至雲端。確保您的關鍵資料儲存安全,並能在發生災難時迅速還原。使用基於雲端的備份服務。
  • 選擇一個災難復原模型. 選擇符合您需求的雲端災難還原模式,例如 Pilot Light、溫備、熱備或多站點(主動-主動)模式。具體選擇取決於您的預算、還原時間目標以及應用程式的關鍵性。
  • 自動故障移轉. 實施自動化故障移轉機制與編排工具,以簡化還原流程。自動化能縮短切換至備份系統所需的時間,並確保還原過程更為可靠。
  • 安全措施. 在備份、複製及還原過程中,實施有效的安全措施以保護資料。應採用加密技術、實施存取控制,並遵循最佳實踐,以確保傳輸中及儲存中的資料安全。
  • 網路連線. 請確保您的本地基礎架構與雲端之間的網路連線穩定可靠。建立安全且具冗餘的連線,以利資料傳輸與故障移轉。
  • 測試與驗證. 定期 測試與驗證 您的雲端災難還原計畫。進行災難模擬演練,以確保還原流程能如預期般運作。這有助於主動識別並解決潛在問題。
  • 文件. 完整記錄整個災難還原計畫,包括相關程序、聯絡資訊及還原步驟。確保相關人員熟悉該計畫,並清楚了解在還原情況下自身應扮演的角色。
  • 培訓與宣導. 為您的 IT 及營運團隊提供關於雲端災難還原計畫的培訓。確保所有員工都清楚了解自身角色,並知悉在災難還原情境下的職責。
  • 監測與報告. 實作 監控工具 持續監控您的雲端災難還原環境的運作狀況與效能。建立報告機制,並確保團隊能隨時掌握災難還原計畫的最新狀態。
  • 定期更新與維護. 定期檢視並更新災難還原計畫,以因應 IT 基礎架構、應用程式及業務需求的變動。對雲端災難還原環境進行例行維護,以確保其隨時處於待命狀態。
  • 溝通計畫. 擬定一份溝通計畫,闡明在災難發生期間應如何與員工、客戶及利害關係人進行溝通。確保有明確的管道用於發布最新資訊與指示。

選擇雲端災難還原解決方案

選擇雲端災難還原解決方案是一項關鍵決策,需評估各項因素,以確保所選方案符合您的業務需求,並提供必要的韌性。選擇雲端災難還原解決方案時,應考慮的關鍵特點與因素包括:

  • RTO 與 RPO. 了解貴組織對系統停機和資料遺失的容忍度。選擇能提供符合貴公司業務需求的 RTO(目標還原時間)和 RPO(目標還原點)的解決方案。不同的應用程式和資料可能有不同的還原需求。
  • 可擴展性. 確保解決方案能夠動態縮放資源,以因應還原情境下增加的工作負載。可縮放性對於處理需求高峰及不斷變化的業務需求至關重要。
  • 自動化. 請尋找具備自動故障移轉與編排功能的解決方案。自動化能簡化還原流程、降低出錯機率,並將停機時間降至最低。
  • 資料備份與複製. 評估該解決方案的備份與複製功能。確認資料的備份頻率、複製至雲端的效率,以及資料還原的便利性。
  • 地理冗餘. 請考慮採用具備地理分散式資料中心的雲端供應商或解決方案。地理冗餘透過在多個位置備份資料與應用程式,確保其受到保護,從而提升系統的韌性。
  • 安全措施. 評估該解決方案的安全特點,包括傳輸中及儲存中資料的加密措施。確認該解決方案符合貴組織相關的產業標準與法規。
  • 合規. 請確保雲端災難還原解決方案符合您所屬產業適用的法規遵循需求。這對於維持資料完整性及履行法律義務至關重要。
  • 成本結構. 了解該解決方案的成本結構,包括定價模式及任何隱藏費用。請考量總持有成本,並評估該解決方案是否符合您的財務能力,以及是否符合您的預算限制。
  • 測試與驗證工具. 請尋找能提供測試與驗證工具的解決方案。定期測試災難還原計畫對於確保其有效性至關重要。請選擇能進行受控測試,且不影響主要營運的解決方案。
  • 技術支援與服務水準協議. 評估災難復原解決方案供應商與雲端供應商所提供的支援選項,包括客戶支援的可用性及其團隊的回應速度。檢視支援條款與服務水準協議(SLA),以了解服務水準及供應商所作出的承諾。
  • 網路連線. 請確保該解決方案能支援您的本地基礎架構與雲端之間安全且可靠的網路連線。評估冗餘與高速連線的各種選項。
  • 供應商聲譽. 調查雲端供應商或解決方案供應商的聲譽。查閱相關評論、客戶反饋及案例研究,以評估曾採用該解決方案的組織所獲得的體驗。
  • 與現有系統的整合. 評估雲端災難還原解決方案與您現有 IT 基礎架構(包括應用程式、資料庫及其他系統)的整合程度。相容性對於順利實施至關重要。
  • 使用者介面與易用性. 請務必考量該解決方案是否具備友善的使用者介面及易用性。直覺的介面與易於操作的工具,能簡化災難還原計畫的管理工作。

NAKIVO Backup & Replication 符合前述的各項因素與建議。該產品的組件可部署於分散式環境中,包括本地伺服器、私有雲及公有雲環境。NAKIVO 解決方案支援備份至雲端、從雲端備份以及雲端實例的複寫,使其能廣泛支援各種環境。該 站點還原 此特點讓組織能夠在雲端和本地環境中,便捷且有效地執行災難還原。

託管服務供應商可以部署 NAKIVO Backup & Replication 在 多租戶模式 在公有雲中為客戶提供具成本效益的資料保護服務。這使客戶得以利用雲端供應商的雲端基礎架構,採用安全且經濟實惠的雲端災難還原解決方案。

結論

總而言之,雲端災難還原之所以重要,在於它提供了一種可擴展、經濟實惠且高效的解決方案,能保護您的基礎設施免受導致資料遺失的災難影響,減少停機時間,並在面臨不可預見的中斷時確保業務連續性。它讓組織能夠利用雲端運算的優勢,提升整體韌性並加強災難應變準備。 透過仔細評估各項特點與考量因素,您將能選定符合組織特定需求的雲端災難還原解決方案,確保在發生任何災難時,能採取可靠且高效的應對措施。

試試看 NAKIVO Backup & Replication

試試看 NAKIVO Backup & Replication

立即申請免費試用,全面體驗本解決方案的所有資料保護特點。15 天免費試用,無任何功能或容量限制,無需提供信用卡資訊。

People also read