AWS 災難還原最佳實踐

任何可能對企業在本地或雲端工作負載方面的業務連續性造成負面影響的事件,皆可稱為災難。企業必須投入時間與資源,以識別所有潛在風險並制定預防計畫——或至少採取相應措施來減輕任何負面影響。

為您的本地及 AWS 雲端基礎架構制定完善的災難還原(DR)計畫,是當務之急。 在本篇部落格文章中,我們將針對這兩種情況探討 AWS 災難還原規劃的最佳實踐,並特別著重於 AWS 工作負載。

Amazon EC2 的災難還原

Amazon EC2 的災難還原

透過在 AWS 各區域及帳戶間建立 Amazon EC2 執行個體的複本,強化 Amazon EC2 的資料保護。只需點擊幾下即可切換至複本,以實現低 RTO。

使用 AWS 進行災難還原的優勢

Amazon Web Services (AWS) 平台提供廣泛的服務,包括資料庫儲存、運算能力、內容傳遞及其他特點。在發生災難時,AWS 還能用於快速恢復在虛擬機器和 Amazon EC2 執行個體上運行的業務運作。AWS 讓您能夠建立複本,並為本地端和雲端環境配置災難還原方案。 將業務關鍵資料存放於 AWS 雲端,亦可免除建置次級實體儲存系統的必要性,此類系統通常會產生龐大成本。

事實上,您的備份與複製資料可安全且可靠地儲存於全球多個 AWS 區域中。作為其災難還原功能的一部分,AWS 讓您能夠執行並測試第三方災難還原解決方案,以檢查是否存在任何缺陷(執行 AWS 災難還原測試)。 接著,您可以使用 AWS CloudFormation 範本來定義最有效的災難復原實務,並將其儲存於 Amazon Virtual Private Cloud 中以供日後使用。

AWS 災難還原情境

Amazon 提供四種 AWS 災難還原策略。具體選擇取決於貴組織的需求與預算。您可以透過各種組合方式,以滿足任何特定虛擬基礎架構的需求。

  • 備份與還原。 重要資料可進行備份,並傳送至異地位置,例如 Amazon S3 儲存服務,該處具備完善的保護機制,並能根據需求迅速進行還原。透過 Amazon S3 的網頁使用者介面,您可從任何地點存取資料。您可以將資料直接複製到 Amazon S3,或建立備份並儲存於雲端。這是 AWS 中最常見的災難還原情境之一。
  • 指示燈。 此災難還原方案讓您能在雲端建立一個精簡版本的虛擬環境,並確保其持續運行且保持最新狀態。您可以快速還原並啟動基於 AWS 的基礎架構中最關鍵的組件。此方案運用了 Amazon 機器映像 (AMIs) 和 Amazon EBS 快照等服務。相較於傳統的"備份與還原"AWS 災難還原策略,"指示燈"方法更為便捷,因為它能大幅縮短還原所需的時間。
  • 熱備援。 在此災難還原情境中,您的生產基礎架構的縮減版會持續在雲端運行。當發生災難還原事件時,可迅速將其縮放,以將停機時間降至最低,並恢復關鍵作業與工作負載。
  • 多站點部署("熱備援")此方法涉及複製業務關鍵資料及基礎架構的核心元件,並將其分散部署於多個本地或雲位置。所有這些位置均處於活躍狀態,共同分擔流量與工作負載。若某個位置遭遇災難,您仍擁有完整的系統,可隨時切換至全面生產模式運作。 此流程透過 Amazon EC2 自動縮放功能來執行。透過熱備援,可實現最低的還原時間目標 (RTO) 與還原點目標 (RPO)。若您決定在 AWS 災難還原情境中採用熱備援,請注意同時運行多個虛擬系統可能造成相當高的成本。

在討論災難還原時,還應提及以下特點:

  • 複製. 為確保高可用性,若您的主要工作負載位於 AWS 雲端環境中,可實施跨區域複製。在此機制下,關鍵資料與系統元件將複製至您選擇的任何其他 AWS 區域。當主要資料庫發生任何變更時,資料可立即更新(同步複製),或稍有延遲後更新(非同步複製)。這兩種複製方式分別滿足不同的業務需求。
  • 故障恢復. 在災難復原 (DR) 過程中,受影響實例的工作負載會移至目標站點,並啟動複本實例(故障移轉)。一旦主站點恢復正常,即可恢復原始實例。若要儲存自故障移轉以來在災難復原實例中執行的所有資料變更,您需要將資料複製的流向逆轉回主站點(故障恢復)。
  • 多個 AWS 區域. 每個 AWS 區域都是獨立且相互分離的區域,旨在用於儲存執行個體或資料。為了確保災難還原順利進行,您可能選擇將資料儲存於兩個或更多 AWS 區域中,以減輕極大規模災難所造成的影響。

AWS 災難還原最佳實踐

以下是 AWS 災難還原的最佳實踐,在為您的環境制定 AWS 災難還原計畫時,請務必牢記這些要點。

  • AWS 災難還原測試. 安裝災難復原(DR)解決方案後,應進行測試。測試可按需執行,亦可排程執行。您可以進行"實戰測試",這是一種測試應用程式和執行個體的方法,用以確認災難復原計畫是否如預期運作,以及能否滿足復原時間目標(RTO)。 為此,可利用 AWS CloudFormation 在 Amazon EC2 上部署完整的環境。您可以建立資源範本,藉此建模並管理雲端環境中的基礎架構元件。透過定期測試,可驗證所有災難復原元件是否已妥善規劃與組織,並確保在關鍵時刻能達成您的 RTO 和 RPO 目標。
  • 監控與警示. 為防止任何潛在災難摧毀您的基礎架構,您需要迅速識別潛在問題。您可以定期監控系統的工作流程並檢查其完整性。這使您能夠迅速偵測到新興威脅,例如連線問題、伺服器故障或應用程式關閉。Amazon CloudWatch 會評估您的 AWS 資源效能。您可以設定警報和通知,當特定指標達到臨界值時,系統便會通知您。
  • 定期備份與複製在災難發生之前,務必做好系統準備,並定期執行備份與複製工作。如此一來,您便能建立完善的故障移轉目標。切換至災難還原環境後,您應持續執行定期的備份與複製工作。將這些備份與複本儲存於不同的遠端位置,可避免形成單一故障點的風險。AWS 可定期執行災難還原測試,以驗證您的災難還原基礎架構狀態。
  • AWS 工具與技術的應用. 為確保落實 AWS 災難還原的最佳實踐,您必須採用還原群組或應用程式堆疊。如此一來,您便能妥善安排基礎架構的還原順序——例如,應優先還原業務關鍵型應用程式,因為它們具有最高優先級。

AWS 災難還原服務

為此,AWS 提供多項服務:

  • AWS 彈性災難還原 這是一項專為在本地端及雲端運行的應用程式提供資料複製與還原的服務。您可以啟動雲端 AWS 執行個體的還原程序,將應用程式復原至這些執行個體。
  • AWS 匯入/匯出 此功能可讓您存取可攜式儲存裝置,以便將業務關鍵的資料和應用程式傳輸至 AWS 或從 AWS 移出。憑藉 Amazon 的高速內部網路,即使是大容量的資料也能快速且安全地傳送至目標位置。
  • Amazon 彈性雲端運算 (Amazon EC2) 讓您能夠按需使用運算資源,並在 AWS 雲端中建構完整的虛擬資料中心。EC2 執行個體可在數分鐘內建立,且在整個災難還原期間,您都能完全掌控其運作。
  • Amazon 簡易儲存服務 (Amazon S3) 旨在儲存與擷取最高優先級的資料。此服務將業務關鍵元件分散儲存於多個設施中的多台設備上,從而提供最高等級的可用性。AWS 透過身分與存取管理 (IAM)、儲存桶政策、多重因素驗證 (MFA) 以及物件版本控制,進一步確保資料安全。
  • Amazon 彈性區塊儲存 (Amazon EBS) 是一種用於雲端 Amazon EC2 執行個體的區塊級儲存服務。資料以快照形式儲存,並隨後傳送至 Amazon S3,從而為您的資料提供長期且可靠的儲存方案。
  • Amazon 關聯式資料庫服務 (Amazon RDS) 協助在 AWS 雲端環境中設定及管理關聯式資料庫。這是一套經濟實惠且靈活的解決方案,可用於執行多項資料庫管理任務。
  • Amazon Direct Connect 讓您能在本地網路與 AWS 雲端之間建立專用連線。這有助於您在無需負擔高昂成本的情況下,確保網路連線的安全性並提升連線速度。
  • 安全存取. 無論組織規模大小,在處理私人及/或業務關鍵資料時,提供高水準的安全性至關重要。為此,您可以採用 AWS 身分與存取管理 (IAM),以確保在災難復原 (DR) 環境中能安全地存取資源。透過 IAM,您可以建立基於角色和基於用戶的安全政策,藉此控制用戶對關鍵資料的存取權限。
  • 自動化. 災難還原自動化是 AWS 災難還原最佳實踐的重要環節。在災難還原事件發生時,完全掌控基於 AWS 的伺服器以及您的本地伺服器至關重要。然而,要手動監督每個應用程式和執行個體的還原過程,在實際操作上往往難以實現。為了有效管理,必須對災難還原流程進行編排與自動化。目前有多項 Amazon 管理服務可供此用途使用:
    • 一套包含在 AWS CloudFormation 讓您能夠以自動化方式配置基礎設施服務。
    • AWS OpsWorks 有助於自動化配置、部署和管理您在 Amazon EC2 執行個體以及本地端運算環境中的伺服器。
    • 縮放功能可根據您在 AWS CloudWatch這在災難還原過程中極具助益。該解決方案能自動縮放以應對伺服器上增加的工作負載,並在生產基礎架構流程恢復正常狀態後自動縮減規模。
  • 授權. 在您的 AWS 環境中安裝具備正確授權的應用程式,對於確保效能高效運作至關重要。AWS 提供多種授權類型,例如"內含授權"和"自備授權",以滿足您的特定業務需求。請注意,您的資料保護解決方案也應具備相應的授權 與 AWS 無縫整合.

NAKIVO 的 AWS 災難還原解決方案

Amazon EC2 是一項高度可靠且安全的雲端服務。然而,仍有許多威脅可能影響 EC2 執行個體的效能,並危及業務連續性。像這樣的專用整合式備份與災難還原解決方案 NAKIVO Backup & Replication 可確保最佳的可靠性與還原目標。

NAKIVO 解決方案可透過 Amazon EC2 執行個體備份來保護您的雲端環境,並 Amazon EC2 執行個體複製,讓您能夠遵循 AWS 災難還原的最佳實踐。此解決方案的災難還原特點包含自動故障移轉、故障恢復、站點還原(用於編排任何複雜度的災難還原流程)以及災難還原測試。

此產品讓您能夠建立並管理原始 EC2 執行個體的複本,並將其儲存於您選擇的目標位置。執行個體複本在災難復原站點中保持關機狀態,當發生災難復原事件且需要快速還原時,可輕鬆將其啟動。因此,無需因持續將執行個體複本置於待命狀態而產生額外費用。

1 年免費資料保護: NAKIVO Backup & Replication

1 年免費資料保護: NAKIVO Backup & Replication

2 分鐘即可部署,並保護虛擬、雲端、實體及 SaaS 資料。提供備份、複製及快速還原選項。

People also read