RTO so với RPO: Hiểu rõ những điểm khác biệt chính trong kế hoạch khôi phục sau thảm họa (DR)

Các tổ chức ngày càng phụ thuộc vào việc sao lưu để bảo vệ dữ liệu và đảm bảo tính liên tục của hoạt động kinh doanh trong trường hợp xảy ra thảm họa. Tuy nhiên, ước tính có tới hơn 72% doanh nghiệp không thể đáp ứng được các kỳ vọng về phục hồi hệ thống CNTT liên quan đến Mục tiêu Điểm Phục hồi (RPO) và Mục tiêu Thời gian Phục hồi (RTO).

Để giúp bạn xây dựng một kế hoạch phục hồi hiệu quả, điều quan trọng là bạn phải hiểu rõ về RTO và RPO cũng như nắm bắt được sự khác biệt giữa hai khái niệm này. Bài viết này giải thích tất cả những gì bạn cần biết về hai thông số này để xây dựng chiến lược phục hồi thảm họa đáng tin cậy. Hãy tiếp tục đọc để khám phá cách bạn có thể đạt được RPO và RTO chặt chẽ hơn nhằm giảm thiểu mất mát dữ liệu và khôi phục hoạt động kinh doanh bình thường nhanh nhất có thể sau thảm họa.

RTO là gì?

Mục tiêu thời gian phục hồi (RTO) đề cập đến khoảng thời gian ngừng hoạt động tối đa mà một tổ chức có thể chấp nhận sau một sự cố gián đoạn. Nói cách khác, RTO là khoảng thời gian từ khi thảm họa xảy ra đến khi các khối lượng công việc quan trọng bị ảnh hưởng được khôi phục.

Việc tính toán RTO thường phụ thuộc vào kế hoạch khắc phục thảm họa, các nguồn lực sẵn có và ngân sách của bạn. Trong khi cơ sở hạ tầng CNTT của bạn không khả dụng, bạn cần một khoảng thời gian để xác định nguyên nhân gây ra sự cố và thực hiện các hành động cần thiết để khắc phục vấn đề. Tuy nhiên, các bước khôi phục thảm họa cần được thiết lập sẵn để đảm bảo rằng các hệ thống và khối lượng công việc quan trọng vẫn có thể truy cập và sẵn sàng trong khi vấn đề sản xuất đang được giải quyết. RTO là khoảng thời gian từ khi xảy ra sự cố đến khi hệ thống được khôi phục thông qua bản sao lưu hoặc các tải công việc sao chép.

RPO là gì?

Mục tiêu điểm khôi phục (RPO) đại diện cho lượng dữ liệu tối đa mà tổ chức có thể chấp nhận mất mát trong thảm họa mà không gây hậu quả nghiêm trọng. Chỉ số này được đo bằng giờ/phút kể từ lần sao lưu/sao chép cuối cùng. Sử dụng nó để xác định tần suất cần tạo bản sao lưu và bản sao dữ liệu nhằm giảm thiểu mất mát dữ liệu sau sự cố gián đoạn.

Trong tình huống lý tưởng, công việc sao lưu hoặc sao chép sẽ hoàn tất ngay trước khi máy chủ gốc gặp sự cố. Tuy nhiên, điều này hiếm khi xảy ra trong thực tế, do đó sẽ có khoảng trống giữa thời điểm bản sao lưu thành công cuối cùng được tạo ra và thời điểm máy chủ gốc gặp sự cố. Trong khoảng thời gian này, máy ảo (VM) vẫn đang thực hiện các hoạt động và lưu trữ dữ liệu, và rất có thể dữ liệu này sẽ bị mất.

RTO và RPO là gì trong khôi phục thảm họa

Mục tiêu cuối cùng của việc bảo vệ dữ liệu là rõ ràng: Bạn muốn đảm bảo rằng dữ liệu quan trọng sẽ không bị mất nếu xảy ra sự cố và rằng bạn có thể đáp ứng các cam kết về mức độ dịch vụ (SLA) của tổ chức về thời gian hoạt động và tính sẵn sàng. Tuy nhiên, việc sao chép tất cả các thay đổi trong môi trường ảo của bạn sang một trang web phục hồi thảm họa (DR) theo thời gian thực là khá tốn kém. Đó là lý do tại sao bạn cần chấp nhận thực tế rằng bạn sẽ mất một phần dữ liệu và các dịch vụ CNTT của bạn sẽ bị gián đoạn trong trường hợp xảy ra sự cố. Do đó, nhiệm vụ của bạn là giảm thiểu những tổn thất và gián đoạn đó.

Hãy minh họa các khái niệm RPO và RTO qua một sơ đồ đơn giản:

rpo and rto in disaster recovery

Sơ đồ này thể hiện một tình huống phổ biến: Một máy ảo bị treo vì một lý do nào đó. Đường màu vàng đại diện cho RPO, tức là khoảng thời gian giữa lần sao lưu cuối cùng và sự cố. Đường màu cam là RTO và phản ánh thời gian cần thiết để khôi phục máy ảo.

Sự khác biệt giữa RTO và RPO

Để hiểu cách xác định RTO và RPO, bạn nên xem xét sự khác biệt giữa chúng và vai trò của chúng trong quy trình DR.

Đánh giá

  • RTO chủ yếu liên quan đến khoảng thời gian mà hoạt động kinh doanh được kỳ vọng sẽ được khôi phục trong trường hợp thảm họa. Các điểm cần xem xét là:
    • Đánh giá nhu cầu và ưu tiên của tổ chức, vì chúng là duy nhất đối với mỗi tổ chức.
    • Xem xét các ứng dụng nào là quan trọng nhất đối với các dịch vụ và ứng dụng thiết yếu cho sự tồn tại của tổ chức, cũng như những hậu quả có thể xảy ra nếu các ứng dụng này bị lỗi.
    • Xác định thứ tự khôi phục từng hệ thống/ứng dụng để đảm bảo quá trình phục hồi thảm họa thành công với mức tổn thất do thời gian ngừng hoạt động thấp nhất.
  • RPO tập trung nhiều hơn vào lượng dữ liệu có thể bị mất trong thời gian ngừng hoạt động mà không gây ra thiệt hại nghiêm trọng cho lợi nhuận của tổ chức. Các điểm cần xem xét là:
    • Xác định tần suất sao lưu/sao chép, và lượng dữ liệu có thể bị mất giữa lần sao lưu VM gần nhất và thảm họa thực tế.
    • Xem xét lượng dữ liệu mà tổ chức của bạn có thể chấp nhận mất cho từng loại tải công việc.

Chi phí

Sự khác biệt chính giữa RTO và RPO là RTO tính đến tất cả các khía cạnh của cấu trúc kinh doanh và quy trình DR nói chung, trong khi RPO chỉ xem xét mức độ quan trọng của dữ liệu và ứng dụng đối với tính liên tục của hoạt động kinh doanh. Do đó, việc đáp ứng các giá trị RTO có thể là một nhiệm vụ khó khăn và tốn kém để đảm bảo khôi phục nhanh chóng. Tương tự, việc đặt RPO ở mức thấp hơn có nghĩa là bạn cần thực hiện nhiều bản sao lưu hơn và tạo thêm các điểm khôi phục, điều này có thể làm tăng chi phí lưu trữ của bạn.

Tự động hóa

  • Như RPO tập trung vào dữ liệu và khả năng phục hồi của hệ thống trước rủi ro mất mát, bạn nên thực hiện sao lưu dữ liệu thường xuyên. Nhiều giải pháp sao lưu hiện đại cho phép bạn thực hiện tự động Sao lưu máy ảo, có nghĩa là các chiến lược sao lưu của bạn có thể được điều chỉnh để đáp ứng các mục tiêu RPO một cách hiệu quả và với sự can thiệp tối thiểu từ phía bạn.
  • Đạt được RTO là một quy trình phức tạp hơn để quản lý, vì nó xem xét tất cả các quy trình kinh doanh và thành phần hệ thống cần được khôi phục trong sự cố DR. Tuy nhiên, nên tự động hóa và điều phối toàn bộ quy trình DR từ đầu đến cuối để đảm bảo các mục tiêu RTO của bạn được đáp ứng.

Dễ tính toán

  • Chỉ số RPO dễ tính toán, vì nó chỉ bao gồm một khía cạnh của quy trình khôi phục – dữ liệu.
  • RTO xem xét tất cả các khía cạnh của tổ chức bạn, bao gồm tầm quan trọng của dữ liệu và dịch vụ, chi phí ngừng hoạt động, đầu tư vào các hoạt động DR, v.v. Khi tính toán RTO, bạn nên tính đến các loại khối lượng công việc và ứng dụng khác nhau vì chúng có thể có các quy trình khôi phục khác nhau. Nên tính toán RTO dựa trên kế hoạch liên tục kinh doanh, trong đó nêu rõ các rủi ro và mối đe dọa kinh doanh có thể xảy ra, đồng thời mô tả các bước cần thực hiện để khôi phục hoạt động kinh doanh.

Để xác định RTO phù hợp với các loại tải công việc khác nhau tại tổ chức của bạn, hãy trả lời câu hỏi sau:

Một ứng dụng/hệ thống/máy cụ thể có thể ngừng hoạt động trong bao lâu mà không gây ảnh hưởng đáng kể đến các hoạt động cốt lõi của tổ chức?

Sau khi trả lời câu hỏi này cho các máy khác nhau, hãy xem xét liệu kết quả dự kiến có đáp ứng được nhu cầu kinh doanh hiện tại của bạn hay không. Nếu không, hãy nghĩ đến cách cải thiện quy trình sao lưu và Các chiến lược DR để đảm bảo dữ liệu sao lưu luôn được cập nhật nhất có thể.

Cách đạt được RPO và RTO chặt chẽ hơn với NAKIVO

NAKIVO Backup & Replication cho phép bạn tạo bản sao lưu cho các máy ảo và máy vật lý thường xuyên hơn, từ đó cải thiện RPO. Chỉ cần lên lịch sao lưu định kỳ với khoảng thời gian không vượt quá mục tiêu của bạn. Giải pháp này cũng giúp giảm thời gian khôi phục (RTO) nhờ tính năng khôi phục máy ảo (VM) tức thì và hỗ trợ các nền tảng như Chức năng sao chép cho VMware vSphere, Microsoft Hyper-V và Amazon EC2. Hãy tích hợp các dịch vụ giám sát mạng của bạn và kích hoạt quy trình khôi phục ngay lập tức khi máy ảo (VM) không còn khả dụng. Bạn cũng có thể tạo các bản sao ngoài cơ sở (bản sao chính xác) của các máy ảo quan trọng. Nếu máy ảo gốc gặp sự cố, các bản sao sẽ được bật tự động. Nếu việc duy trì các bản sao đòi hỏi nhiều tài nguyên hơn mức bạn có thể chi trả, bạn có thể chọn tính năng khởi động máy ảo tức thì từ bản sao lưu.

Để đạt được RTO chặt chẽ nhất, NAKIVO Backup & Replication đã giới thiệu Chức năng điều phối khôi phục hệ thống. Tự động hóa hoàn toàn việc chuyển đổi dự phòng và khôi phục máy ảo cho các Các kịch bản DR khác nhau và thực hiện kiểm tra không gián đoạn để đảm bảo khôi phục trong khung thời gian dự kiến.

Hãy thử NAKIVO Backup & Replication

Hãy thử NAKIVO Backup & Replication

Đăng ký dùng thử miễn phí để khám phá toàn bộ các tính năng bảo vệ dữ liệu của giải pháp. 15 ngày miễn phí. Không có bất kỳ giới hạn nào về tính năng hay dung lượng. Không cần thẻ tín dụng.

People also read