Sao lưu toàn bộ dữ liệu tổng hợp là gì: Những điều mà mọi quản trị viên hệ thống nên biết
Có nhiều phương pháp sao lưu khác nhau, bao gồm sao lưu toàn bộ, sao lưu gia tăng và sao lưu chênh lệch. Việc tạo sao lưu toàn bộ thường xuyên có thể gây bất tiện và thậm chí là không khả thi về mặt kỹ thuật, vì sao lưu toàn bộ tốn thời gian và tiêu tốn tài nguyên phần cứng. Trong trường hợp này, các phương pháp sao lưu gia tăng và sao lưu chênh lệch ( synthetic full ) có thể rất hữu ích.
Trong bài viết blog này, chúng tôi sẽ giải thích sao lưu chênh lệch ( synthetic full ) là gì và nó khác biệt như thế nào so với các phương pháp sao lưu toàn bộ chủ động và sao lưu gia tăng ( forever-incremental).
Sao lưu tổng hợp ( Synthetic Full ) là gì?
Sao lưu tổng hợp ( synthetic full ) là một phương pháp sao lưu bao gồm việc tạo ra một bản sao lưu toàn bộ mới bằng cách sử dụng bản sao lưu toàn bộ trước đó và các bản sao lưu gia tăng liên quan. Điều này có nghĩa là giải pháp sao lưu không cần phải truyền toàn bộ lượng dữ liệu từ máy nguồn và có thể tổng hợp các bản sao lưu gia tăng mới nhất với bản sao lưu toàn bộ gần nhất để tạo ra bản sao lưu tổng hợp tiếp theo ( synthetic full ).
Sao lưu tổng hợp ( Synthetic Full ) hoạt động như thế nào?
Trước tiên, hãy xem xét các phương pháp sao lưu toàn bộ và gia tăng được sử dụng trong sao lưu tổng hợp ( synthetic full ). Chúng ta cũng sẽ đề cập đến các bản sao lưu forever-incremental , có một số đặc điểm chung với bản sao lưu tổng hợp.
Sao lưu toàn bộ
Một sao lưu toàn bộ bao gồm việc sao chép tất cả dữ liệu từ máy nguồn sang bộ lưu trữ đích. Ưu điểm của sao lưu toàn bộ là độ tin cậy cao cùng với sự dễ dàng và tốc độ khôi phục dữ liệu. Sao lưu toàn bộ sao chép toàn bộ dữ liệu trực tiếp từ máy nguồn được gọi là sao lưu active full .
Các giải pháp sao lưu hiện đại yêu cầu sử dụng phương pháp sao lưu truyền thống và do đó, thực hiện sao lưu toàn bộ định kỳ. Tuy nhiên, phương pháp chỉ dựa vào sao lưu toàn bộ của máy ảo hoặc máy vật lý có những nhược điểm:
- Sao lưu mất quá nhiều thời gian.
- Việc tạo sao lưu toàn bộ gây thêm tải cho cả tài nguyên hạ tầng (bộ xử lý, ổ đĩa, bộ nhớ) và mạng.
- Các tác vụ như máy ảo (VM) chạy trên máy chủ nguồn có thể bị chậm lại.
- Khi chuỗi sao lưu toàn bộ ngày càng dài theo thời gian, lượng dữ liệu sao lưu trở nên rất lớn và tiêu tốn nhiều không gian lưu trữ trong kho lưu trữ sao lưu.
Sao lưu gia tăng
Một sao lưu theo từng đợt bao gồm việc sao chép chỉ dữ liệu đã thay đổi kể từ lần sao lưu toàn bộ hoặc gia tăng gần nhất. Sao lưu gia tăng nhanh chóng và yêu cầu ít không gian lưu trữ cho các thay đổi dữ liệu hơn so với việc lưu trữ toàn bộ tập dữ liệu cho một lần sao lưu toàn bộ.
Việc khôi phục dữ liệu bằng cách sử dụng chuỗi sao lưu gia tăng mất nhiều thời gian hơn so với sao lưu toàn bộ vì bạn cần “phát lại nhật ký thay đổi” và lắp ráp lại dữ liệu bằng cách sử dụng chuỗi nhiều bản sao lưu gia tăng. Bạn cần phát lại càng nhiều bản sao lưu gia tăng để khôi phục dữ liệu, thì thời gian khôi phục càng lâu.
Một nhược điểm nữa là nếu một trong các bản sao lưu gia tăng trong chuỗi bị hỏng, bạn không thể khôi phục dữ liệu đã sao lưu bắt đầu từ bản sao lưu gia tăng đó. Đây là một trong những lý do tại sao thường được khuyến nghị tạo bản sao lưu toàn bộ theo định kỳ và sử dụng phương pháp sao lưu incremental-with-full để có chiến lược bảo vệ dữ liệu đáng tin cậy. Việc tạo bản sao lưu toàn bộ định kỳ vẫn gây ra tải cho các máy chủ sản xuất và mạng. Đây chính là lúc phương pháp sao lưu theo chuỗi ( synthetic full ) phát huy tác dụng. Phương pháp sao lưu theo chuỗi (
Synthetic full )
Synthetic full bao gồm việc sử dụng bản sao lưu toàn bộ gần nhất cùng chuỗi các bản sao lưu gia tăng tiếp theo để tổng hợp một bản sao lưu toàn bộ mới định kỳ. Trong trường hợp này, không có tải trên các máy chủ sản xuất hoặc máy chủ nguồn, đĩa và mạng vì không có dữ liệu nào được sao chép từ máy nguồn. Các bản sao lưu gia tăng trong kho lưu trữ sao lưu được sử dụng làm nguồn để tạo bản sao lưu này synthetic full . Chỉ có máy chủ sao lưu và các đĩa đích (nơi lưu trữ các bản sao lưu) mới bị tải.
Sử dụng synthetic full sao lưu là cách tối ưu để tạo các bản sao lưu đầy đủ định kỳ vì phương pháp này nhanh chóng và không phụ thuộc vào các máy chủ sản xuất. Bây giờ hãy xem xét một ví dụ về cách bản sao lưu synthetic full hoạt động.
Ví dụ về bản sao lưu full synthetic
Giả sử chúng ta có bốn khối (A, B, C, D) trên một đĩa, và một số khối trong số này thay đổi hàng ngày. Sau khi thay đổi, 1 được thêm vào tên khối. Ví dụ, nếu khối A thay đổi, tên của nó trở thành A1. Nếu khối A1 thay đổi lần nữa, nó được đổi tên thành A2, và cứ thế tiếp tục.
Chu kỳ sao lưu được cấu hình để tạo một bản sao lưu đầy đủ mỗi tuần vào Chủ nhật. Các bản sao lưu gia tăng được tạo mỗi ngày.
Chủ nhật là day 1 trong lịch trình sao lưu của chúng tôi, và chúng tôi tạo bản sao lưu đầy đủ hoạt động ban đầu như được hiển thị trong hình ảnh bên dưới. Tất cả dữ liệu được sao chép từ máy chủ nguồn sang máy chủ sao lưu đích.
Sau một tuần, một bản sao lưu synthetic full được tạo vào Chủ nhật (day 8) thay vì tạo bản sao lưu active full . Trong trường hợp này, bản sao lưu đầy đủ được tổng hợp từ các bản sao lưu gia tăng trước đó. Dữ liệu được tổng hợp bằng cách sử dụng bản sao lưu đầy đủ đầu tiên được tạo vào Chủ nhật (day 1) và chuỗi các bản sao lưu gia tăng tiếp theo (days 2 đến 7). Kết quả là, chúng ta có bản sao lưu synthetic full vào Chủ nhật (day 8) với các khối (A4, B4, C1, D1).
Bộ dữ liệu trong kho lưu trữ sao lưu vào Chủ nhật (day 8) giống như trên máy chủ nguồn (A4, B4, C1, D1). Tuy nhiên, chỉ dữ liệu của các khối đã thay đổi (B4, D1) mới được sao chép vào Chủ nhật (day 8) vào kho lưu trữ sao lưu bằng cách chạy sao lưu gia tăng thay vì sao chép toàn bộ dữ liệu bằng cách chạy sao lưu toàn bộ chủ động.
Kết quả là, chúng ta có một bản sao lưu toàn bộ vào Chủ nhật (8) sau khi thực hiện hai thao tác: tạo sao lưu gia tăng và tạo bản sao lưu full synthetic .
Hãy hình dung lượng dữ liệu được sao chép từ máy chủ nguồn sang máy chủ sao lưu bằng cách sử dụng sơ đồ sao lưu với sao lưu toàn bộ hoạt động một lần mỗi tuần và sao lưu gia tăng hàng ngày. Chúng tôi tạo bản sao lưu tổng hợp đầy đủ vào mỗi Chủ nhật, như trước đây. Để đơn giản hóa, chúng tôi giả định rằng dữ liệu được ghi vào máy chủ nguồn mỗi ngày nhưng không bị xóa.
Sau khi bản sao lưu synthetic full được tạo vào Chủ nhật (day 8), bản sao lưu gia tăng được tạo vào cùng ngày Chủ nhật đó có thể bị xóa vì chúng tôi có thể khôi phục dữ liệu cho điểm khôi phục của Chủ nhật (day 8) từ bản sao lưu synthetic full được tạo vào ngày đó.
Nếu bạn tạo bản sao lưu một lần mỗi ngày và tạo bản sao lưu tổng hợp đầy đủ một lần mỗi tuần, mô hình cho mỗi tuần là giống nhau. Nếu cài đặt lưu trữ yêu cầu lưu trữ tất cả bản sao lưu trong hai tuần, bạn có thể xóa các bản sao lưu (đầy đủ và tăng dần) cũ hơn hai tuần. Lưu ý rằng trong ví dụ này, bạn cần giữ lại ba bản sao lưu đầy đủ cho days 8, 15, và 22, vì chuỗi bản sao lưu tăng dần cho days 9-14 phụ thuộc vào bản sao lưu đầy đủ trên day 8.
Forever-incremental sao lưu
Forever-incremental chỉ bao gồm việc tạo một bản sao lưu toàn bộ ban đầu, và tất cả các bản sao lưu tiếp theo đều là sao lưu gia tăng. Dữ liệu sao lưu được sắp xếp thành các khối duy nhất dưới dạng danh mục trong kho lưu trữ sao lưu. Các mối quan hệ và phụ thuộc được theo dõi. Thông tin này cho phép bạn khôi phục dữ liệu cho điểm khôi phục cần thiết bằng cách ghép lại dữ liệu từ kho lưu trữ sao lưu.
Kho lưu trữ sao lưu ít bị quá tải hơn vì không cần phải tạo bản sao lưu hoạt động hoặc synthetic full theo định kỳ. Dữ liệu chỉ được ghép lại khi cần thiết cho việc khôi phục. Khi một điểm khôi phục hết hạn, bản sao lưu gia tăng cũ nhất này sẽ được hợp nhất với bản sao lưu đầy đủ dựa trên cài đặt lưu trữ (nơi bạn thiết lập số lượng điểm khôi phục cần giữ lại).
Forever-incremental sử dụng phương pháp lưu trữ sao lưu tổng hợp. Nguyên tắc của chế độ này là chúng ta chỉ cần tạo bản sao lưu đầy đủ một lần. Sau đó, chúng ta tạo các bản sao lưu forever-incremental theo lịch trình, và các bản sao lưu gia tăng này chỉ chứa các thay đổi được thực hiện trên máy nguồn kể từ bản sao lưu trước đó.
Để tạo bản sao lưu tổng hợp, giải pháp sao lưu sẽ đọc bản sao lưu đầy đủ ban đầu và tất cả các bản sao lưu gia tăng có chứa các thay đổi được lưu trữ trong kho lưu trữ sao lưu, sau đó tổng hợp dữ liệu này thành một bản sao lưu. Bản sao lưu tổng hợp này sẽ giống hệt với bản sao lưu đầy đủ đang hoạt động và sẽ phản ánh đầy đủ trạng thái của máy nguồn tại một thời điểm cụ thể.
Các giải pháp sao lưu hiện nay hỗ trợ cả sao lưu synthetic full và sao lưu forever-incremental . Đọc thêm về các phương pháp sao lưu khác trên blog của chúng tôi.
Tại sao nên sử dụng sao lưu tổng hợp?
Phương pháp tổng hợp để tạo bản sao lưu có một số ưu điểm. Đó là:
- Sao lưu tổng hợp giúp giảm tải cho máy chủ nguồn vì các bản sao lưu này được tạo trong kho lưu trữ sao lưu ( kho lưu trữ dự phòng ) thay vì thông qua máy chủ nguồn.
- Sao lưu tổng hợp giúp giảm tải cho mạng, do lượng dữ liệu được truyền từ máy chủ nguồn sang kho lưu trữ sao lưu giảm đáng kể. Việc sao chép ít dữ liệu hơn giúp tiết kiệm thời gian sao chép và có thể được sử dụng để cải thiện {55}.
- Các máy tính và các mục riêng lẻ có thể được khôi phục dễ dàng và nhanh chóng bất cứ khi nào bạn cần. Thời gian khôi phục dữ liệu ngắn cải thiện {56}.
Full Synthetic Lưu trữ dữ liệu sao lưu với NAKIVO Backup & Replication
Là một giải pháp hiện đại Giải pháp sao lưu máy ảo, NAKIVO Backup & Replication sử dụng phương pháp tổng hợp để tạo và lưu trữ bản sao lưu. Sau bản sao lưu đầy đủ ban đầu, tất cả các tác vụ đều là sao lưu gia tăng với các bản sao lưu đầy đủ định kỳ hoặc forever-incremental. Sử dụng các công nghệ Liệu pháp nhận thức hành vi (CBT) và Thử nghiệm ngẫu nhiên có đối chứng , sản phẩm theo dõi các khối dữ liệu đã thay đổi và chỉ chuyển các khối này đến kho lưu trữ sao lưu.
Khi sử dụng phương pháp forever-increment trong giải pháp NAKIVO, sau mỗi lần chạy tác vụ sao lưu, một điểm khôi phục được tạo ra, về cơ bản là một tập hợp các tham chiếu đến các khối dữ liệu được lưu trữ trong một kho chung trong kho lưu trữ sao lưu. Các điểm khôi phục này có thể được sử dụng để khôi phục máy ảo cần thiết tại một thời điểm cụ thể.
Do đó, việc tạo các bản sao lưu toàn bộ định kỳ là không cần thiết, vì dữ liệu trong kho lưu trữ sao lưu được lưu trữ bằng chế độ gọi là “chế độ tổng hợp toàn bộ”, loại bỏ nhu cầu chuyển đổi dữ liệu sao lưu.
Chế độ tổng hợp đầy đủ mang lại lợi thế cho NAKIVO Backup & Replication so với các sản phẩm áp dụng phương pháp sao lưu truyền thống vì:
- Tất cả các khối dữ liệu chỉ được lưu trữ một lần, là duy nhất và có thể được tham chiếu bởi nhiều điểm khôi phục.
- Sao lưu tổng hợp nhanh hơn đáng kể, vì bạn không cần chạy sao lưu đầy đủ, và mỗi điểm khôi phục “ghi nhớ” các khối dữ liệu cần thiết để khôi phục toàn bộ máy ảo.
- Sao lưu tổng hợp an toàn hơn nhiều so với sao lưu truyền thống. Nếu bạn mất một khối dữ liệu hoặc một bản sao lưu gia tăng trong chuỗi, giải pháp NAKIVO sẽ cung cấp cho bạn các bản sao lưu gia tăng có thể khôi phục.
- Vì mỗi điểm khôi phục đã “biết” các khối dữ liệu nào cần được sử dụng để khôi phục máy ảo, quá trình khôi phục sẽ diễn ra nhanh hơn nhiều.
Nếu bạn cần sử dụng phương án sao lưu với các bản sao lưu toàn bộ được tạo định kỳ, giải pháp NAKIVO có thể định kỳ tạo bản sao lưu active full hoặc synthetic full . Việc chọn chế độ sao lưu toàn bộ được hiển thị trong ảnh chụp màn hình bên dưới. 
Bạn có thể thiết lập tần suất tạo bản sao lưu toàn bộ, ví dụ: vào ngày thứ 7 hàng tuần, sau mỗi 5 tác vụ sao lưu, v.v.
Bạn có thể sử dụng các cài đặt lưu trữ linh hoạt và tính năng {62} chương trình giữ chân nhân viên , hoạt động rất hiệu quả với kho lưu trữ sao lưu NAKIVO.
Kết luận
Sao lưu tổng hợp là một giải pháp thay thế hiệu quả cho việc sao lưu dữ liệu máy ảo (VM) bằng các phương pháp sao lưu truyền thống. Giải pháp này giúp đơn giản hóa và tăng tốc quá trình sao lưu và khôi phục máy ảo, nâng cao {129} và {130}, giảm tải cho tài nguyên hạ tầng và mạng, đồng thời giúp tiết kiệm thời gian và chi phí.




