Sử dụng Amazon S3 và AWS EC2 làm kho lưu trữ sao lưu trên đám mây

Amazon cung cấp các dịch vụ tính toán và lưu trữ trên đám mây. Có thể sử dụng các dịch vụ AWS khác nhau để lưu trữ bản sao lưu trên đám mây và đảm bảo dữ liệu được bảo vệ, bao gồm Amazon EC2 và Amazon S3. Tuy nhiên, các dịch vụ này khác nhau về cách thức hoạt động, loại dữ liệu sao lưu có thể lưu trữ và phương thức lưu trữ.

Bài viết trên blog này giải thích cách sử dụng các khối lượng EBS được gắn vào các phiên bản Amazon EC2 và Amazon S3 để lưu trữ dữ liệu sao lưu.

Lưu ý: Bài viết này không phải là so sánh toàn diện giữa EC2 và S3, vì EC2 là nền tảng điện toán đám mây được sử dụng để chạy các tác vụ trên đám mây. Thay vào đó, bài viết tập trung vào Elastic Block Storage (EBS) được sử dụng để lưu trữ dữ liệu EC2 và so sánh nó với S3.

NAKIVO cho sao lưu AWS EC2

NAKIVO cho sao lưu AWS EC2

Sao lưu các phiên bản Amazon EC2 lên EC2, AWS S3 và tại chỗ. Các tùy chọn chống ransomware. Khôi phục nhanh các phiên bản và đối tượng ứng dụng.

Tại sao nên sử dụng AWS để sao lưu dữ liệu

Theo Quy tắc sao lưu 3-2-1, bạn nên duy trì ít nhất ba bản sao của dữ liệu quan trọng, trong đó một bản phải được lưu trữ ngoài cơ sở. Dịch vụ lưu trữ đám mây, bao gồm Amazon S3 và các khối lượng EBS trong các phiên bản Amazon EC2, có thể được sử dụng làm nơi lưu trữ ngoài cơ sở cho dữ liệu sao lưu. Nhưng làm thế nào và khi nào nên sử dụng chúng? Hãy bắt đầu bằng việc tìm hiểu những gì hai dịch vụ AWS này cung cấp.

  • Các instance Amazon EC2 (Elastic Cloud Computing) là các máy ảo chạy trên đám mây AWS, trên các máy chủ AWS và trong các trung tâm dữ liệu AWS. Container lưu trữ dữ liệu của instance được gọi là khối lượng EBS (Elastic Block Storage), tương đương với một đĩa ảo.

Khối lượng EBS được phân loại là lưu trữ khối vì đơn vị cơ bản của lưu trữ dữ liệu là một khối. Khối lượng EBS được kết nối với các instance và lưu trữ dữ liệu chính của các instance này. Bạn có thể chọn giữa ổ cứng (HDD) và ổ SSD (Solid-State Drive) cho các khối EBS.

  • Amazon S3 (Simple Storage Service) là dịch vụ lưu trữ đối tượng của AWS. Container dùng để lưu trữ dữ liệu được gọi là bucket. Dữ liệu được lưu trữ trong các bucket dưới dạng đối tượng chứ không phải khối. Lưu trữ dựa trên đối tượng cho phép sử dụng tính năng phiên bản, đây là tính năng hữu ích cho việc khôi phục dữ liệu.

Sử dụng Amazon EC2 để khôi phục khối lượng công việc

Các phiên bản Amazon EC2 có thể được sử dụng để khôi phục trên đám mây các máy ảo tại chỗ khi trung tâm dữ liệu sản xuất cục bộ không khả dụng. Để chuẩn bị cho tình huống như vậy, bạn nên di chuyển khối lượng công việc cục bộ lên đám mây bằng cách sử dụng bản sao lưu hoặc bản sao như một phần của kế hoạch khắc phục thảm họa.

Trong tình huống thảm họa, việc sao chép sang EC2 được ưu tiên hơn so với sao lưu. Việc khôi phục hoạt động của ứng dụng và máy chủ bằng bản sao mất ít thời gian hơn so với sử dụng bản sao lưu (tức là thời gian khôi phục thấp hơn RTO). Ví dụ, bạn có thể sao chép cơ sở dữ liệu từ máy chủ tại chỗ hoặc máy ảo sang các instance EC2 và thực hiện khôi phục gần như tức thì chuyển đổi dự phòng khi cần để khắc phục hậu quả của thảm họa.

Các khối lưu trữ EBS được các instance EC2 sử dụng cung cấp lưu trữ khối tốc độ cao. Dưới đây là một số ưu và nhược điểm của việc sử dụng khối lượng EBS để sao lưu và khôi phục.

  • Ưu điểm : EBS có thể được sử dụng cho các khối lượng công việc hiệu suất cao. Dữ liệu có thể được sao chép với tốc độ cao từ một khối lượng EBS sang khối lượng khác. Bạn cũng có thể đạt được hiệu suất cơ sở dữ liệu tốt hơn khi sử dụng các khối lượng EBS của các phiên bản EC2 so với lưu trữ Amazon S3.

Nếu bạn cần chuyển dữ liệu từ các máy chủ cục bộ (tại chỗ), tốc độ kết nối internet sẽ là điểm nghẽn, và trong trường hợp này, việc sử dụng Amazon S3 có thể là lựa chọn hợp lý hơn.

  • Nhược điểm : Ngoại trừ việc sử dụng các khối lượng EBS để sao lưu các khối lượng EBS khác, EBS quá đắt đỏ khi được sử dụng làm đích sao lưu chính, đặc biệt đối với các tải công việc không phải là các instance EC2.

Bảo vệ dữ liệu cho các instance EC2 trên AWS

Các instance EC2 và các khối lượng EBS kết nối với chúng không được sao lưu tự động trên AWS.  Dữ liệu chỉ được sao chép giữa các máy chủ trong cùng một vùng sẵn sàng (availability zone) tại các trung tâm dữ liệu của Amazon để đảm bảo tính dự phòng của trung tâm dữ liệu trong trường hợp ổ đĩa hoặc máy chủ bị hỏng (lỗi phần cứng).

Mặc dù chức năng sao lưu không có sẵn, AWS cung cấp ba phương pháp tích hợp để bảo vệ dữ liệu trong các instance EC2:

  • Tạo bản sao lưu (snapshot) EBS. Đây là cách đơn giản để tạo điểm khôi phục cho các khối lượng EBS (bao gồm cả các khối lượng EBS được mã hóa). Bản sao lưu có thể được sử dụng để khôi phục dữ liệu vào các khối lượng EBS mới. Khi sử dụng các trình quản lý khối lượng logic như LVM hoặc mdadm , hãy cân nhắc thực hiện sao lưu ở lớp trình quản lý khối lượng thay vì sử dụng bản sao lưu EBS để duy trì tính nhất quán và tính đồng bộ của các khối lượng thành phần. Lưu ý rằng khi khôi phục các khối lượng EBS bằng cách sử dụng bản sao lưu, các khối lượng EBS này phải được gắn vào một máy ảo EC2 đã được chuẩn bị sẵn.
  • Tạo Hình ảnh Máy Amazon (AMI). AMI là một hình ảnh chứa hệ điều hành, tất cả các thiết lập cấu hình và dữ liệu cần thiết để chạy máy ảo EC2. Sử dụng AMI, bạn có thể tạo một máy ảo EC2 mới dựa trên AMI này. Phương pháp này được sử dụng để khôi phục máy ảo EC2 và nhân bản chúng. Lưu ý rằng bạn nên dừng một instance EC2 đang chạy trước khi tạo AMI mới.

Ưu điểm của phương pháp này so với việc sử dụng bản sao lưu (snapshot) của khối lượng EBS là toàn bộ instance EC2 được khôi phục, chứ không chỉ các khối lượng EBS (cần được gắn thủ công vào instance EC2 mới sau quá trình khôi phục). Việc cấu hình các hình ảnh AMI để sử dụng cho việc khôi phục mất nhiều thời gian hơn nhưng hoạt động hiệu quả về mặt khôi phục và khả năng mở rộng.

  • Sao chép máy chủ EC2 vào S3. Sao chép dữ liệu được lưu trữ trên các khối lượng EBS vào các thùng Amazon S3 là một phương pháp thay thế để bảo vệ dữ liệu trong các máy chủ EC2. Vì Amazon S3 là dịch vụ lưu trữ dựa trên đối tượng còn Amazon EBS là dịch vụ lưu trữ khối, nên cần có FUSE (hệ thống tệp trong không gian người dùng) để đọc/ghi tệp vào các thùng S3. FUSE có thể được cài đặt trên hệ điều hành đang chạy trên một phiên bản EC2, máy ảo hoặc máy tính vật lý để truy cập các thùng Amazon S3.

Tuy nhiên, khi nói đến tính nhất quán của dữ liệu, việc sao chép các tệp đang được ứng dụng (chẳng hạn như cơ sở dữ liệu) sử dụng sang S3 có thể gây ra hỏng dữ liệu.

Sử dụng Amazon S3 để khôi phục dữ liệu

Amazon S3 cung cấp tính năng quản lý phiên bản cho các đối tượng được lưu trữ trong các bucket. Theo mặc định, tính năng quản lý phiên bản bị tắt trong Amazon S3, nhưng bạn có thể dễ dàng bật tính năng này. Khi tính năng quản lý phiên bản được bật, các phiên bản trước của đối tượng sẽ được lưu giữ sau khi ghi các thay đổi vào chúng. Các thay đổi được lưu dưới dạng một phiên bản mới của đối tượng, và các đối tượng bị xóa không bị xóa vĩnh viễn.

Sử dụng Amazon S3 để lưu trữ các phiên bản có những ưu và nhược điểm riêng.

  • Ưu điểm : Amazon S3 cung cấp các lớp lưu trữ khác nhau với các mức giá khác nhau tùy thuộc vào tần suất truy cập dữ liệu và thời gian truy xuất. Amazon cũng cung cấp chính sách giá linh hoạt cho việc sử dụng lưu trữ Amazon S3, giúp S3 trở nên hợp lý về chi phí cho nhiều người dùng. Đọc thêm về Amazon S3 để tìm hiểu Cách thức hoạt động của AWS S3.

Amazon S3 cũng hỗ trợ tính năng khóa đối tượng (object lock) để đảm bảo tính bất biến của lưu trữ và bảo vệ các đối tượng khỏi những thay đổi hoặc xóa bỏ không mong muốn. Cấu hình lưu trữ này còn được gọi là ghi một lần, đọc nhiều lần (WORM).

  • Nhược điểm : Cần có các công cụ chuyên dụng nếu bạn không muốn sao chép tệp thủ công thông qua giao diện web của AWS. Ngoài ra, AWS tính phí xuất dữ liệu cho việc chuyển dữ liệu từ Amazon S3 (các khoản phí này phụ thuộc vào lượng dữ liệu được chuyển ra khỏi AWS và cấp độ lưu trữ được sử dụng).

Các trường hợp sử dụng bảo vệ dữ liệu trên Amazon S3

Có rất nhiều trường hợp sử dụng Amazon S3 làm đích sao lưu. Hãy cân nhắc chọn loại lưu trữ này cho:

  • Bản sao dữ liệu được lưu trữ trên các khối lượng EBS. Như đã đề cập ở trên, bạn có thể sao chép các khối lượng EBS được sử dụng bởi các phiên bản EC2 vào bộ lưu trữ Amazon S3.
  • Sao chép dữ liệu giữa các thùng S3.
  • Sao lưu dữ liệu được lưu trữ trên các máy tính vật lý và máy ảo chạy tại chỗ.

Cách bảo vệ dữ liệu trong Amazon S3

Có thể sử dụng các công cụ AWS khác nhau để bảo vệ dữ liệu trong Amazon S3 khỏi bị mất mát. Bật và cấu hình tính năng quản lý phiên bản đối tượng để lưu trữ các phiên bản khác nhau của đối tượng trong các thùng S3 nhằm phục vụ việc khôi phục dữ liệu; hãy tham khảo các công cụ có sẵn dưới đây:

  • Công cụ dòng lệnh . Sao chép đối tượng từ thùng S3 này sang thùng S3 khác bằng AWS SDK hoặc các công cụ khác. Các công cụ dòng lệnh phổ biến khác dành cho Linux và Windows như s3cmd, s4cmdAWS CLI cũng có thể được sử dụng. Hãy cài đặt một trong các công cụ này để chuyển dữ liệu đến và đi từ các thùng S3. Bạn cũng có thể sử dụng các công cụ dòng lệnh này để sao chép dữ liệu giữa các bucket nhằm mục đích khôi phục.

    Sử dụng kịch bản để sao lưu vào S3 là một phương pháp phổ biến nhưng đòi hỏi nhiều công sức. Phương pháp này áp dụng cho việc sao lưu dữ liệu từ các bucket S3, các instance EC2 và các máy chủ vật lý và ảo.

    • Ưu điểm Các công cụ dòng lệnh và kịch bản có sẵn miễn phí.
    • Nhược điểm Việc cấu hình sao chép dữ liệu bằng kịch bản khá phức tạp. Ngoài ra, trước bất kỳ quá trình sao chép nào, bạn nên dừng các ứng dụng đang chạy và ngừng sử dụng các tính năng như bản sao lưu khối lượng (volume snapshots) trong hệ điều hành để đảm bảo tính nhất quán của dữ liệu.
  • AWS Storage Gateway . Bạn có thể sử dụng AWS Storage Gateway để chuyển dữ liệu từ các máy chủ vật lý và ảo tại chỗ sang các thùng chứa Amazon S3.

AWS Storage Gateway là dịch vụ lưu trữ lai được triển khai dưới dạng máy ảo (VM) và cung cấp các tùy chọn bộ nhớ đệm để truy cập tệp nhanh hơn. Có ba loại Cổng lưu trữ AWS: cổng tệp, cổng khối lượng và cổng băng từ.

Sau khi triển khai cổng lưu trữ, các giao thức chia sẻ tiêu chuẩn như SMB, NFS và iSCSI có thể được sử dụng để truy cập lưu trữ Amazon S3. AWS Storage Gateway được cung cấp dưới dạng thiết bị ảo cho các nền tảng VMware vSphere và Hyper-V và có thể tải xuống miễn phí nếu bạn có gói đăng ký sử dụng Amazon S3.

Giải pháp sao lưu dữ liệu trực tiếp lên AWS

Một cách hiệu quả và đáng tin cậy hơn để bảo vệ dữ liệu của bạn trên AWS là triển khai giải pháp bảo vệ dữ liệu của bên thứ ba tích hợp với AWS, chẳng hạn như NAKIVO Backup & Replication. Giải pháp NAKIVO là giải pháp bảo vệ dữ liệu toàn diện hỗ trợ:

  • Sao lưu Amazon EC2 . Sao lưu và khôi phục nhất quán các bản sao EC2 (vào EBS và S3). Bạn không cần phải tạo và cấu hình các phiên bản EC2 mới cũng như gắn các khối lượng EBS đã khôi phục theo cách thủ công. Bạn có thể bắt đầu khôi phục các tệp và đối tượng ứng dụng ngay khi cần.
  • Sao chép Amazon EC2 . Sao chép các phiên bản EC2 quan trọng trên AWS và sử dụng các bản sao EC2 phù hợp với các kịch bản khôi phục dữ liệu và kế hoạch khắc phục thảm họa của bạn, đảm bảo thời gian khôi phục (RTO) thấp.
  • Sao lưu lên Amazon S3 . Sao lưu các máy ảo Microsoft Hyper-V và VMware vSphere, các máy vật lý Windows và Linux, cũng như các phiên bản EC2 vào các thùng Amazon S3. Hỗ trợ sao lưu trực tiếp vào các thùng Amazon S3 mà không cần triển khai AWS Storage Gateway. Một kho lưu trữ sao lưu Amazon S3 đặc biệt được tạo trong một thùng S3.
  • Sao lưu vào Amazon EC2 . Bạn có thể tạo kho lưu trữ sao lưu trên một thực thể EC2, cấu hình kết nối mạng giữa trung tâm dữ liệu của bạn và mạng được sử dụng bởi các thực thể EC2, và sao lưu dữ liệu vào thực thể EC2.

NAKIVO Backup & Replication cung cấp một bộ tính năng hữu ích giúp việc cấu hình sao lưu lên AWS trở nên nhanh chóng, thuận tiện và đáng tin cậy hơn. Các tính năng này bao gồm:

  • Lưu trữ Amazon S3 với hỗ trợ tính bất biến có thể được sử dụng làm đích sao lưu để bảo vệ chống lại các thay đổi dữ liệu không mong muốn, dù là do vô tình hay do ransomware gây ra.
  • Site Recovery cho phép bạn tự động hóa và điều phối các quy trình phục hồi thảm họa cho các instance EC2 và các môi trường ảo khác dựa trên các điều kiện và hành động đã định. Các kịch bản khôi phục thảm họa phức tạp có thể được triển khai dễ dàng với tính năng Site Recovery.
  • Lập lịch công việc . Các công việc sao lưu có thể được lên lịch để chạy tự động. Các tùy chọn lưu trữ linh hoạt cho phép bạn lưu giữ nhiều điểm khôi phục cho các trường hợp khôi phục khác nhau.
  • Sao lưu dựa trên ứng dụng rất quan trọng đối với tính nhất quán của dữ liệu. NAKIVO Backup & Replication sử dụng các tính năng như VSS (Volume Shadow Copy) trên các máy chạy Windows để duy trì tính nhất quán của dữ liệu khi các ứng dụng (ví dụ: máy chủ cơ sở dữ liệu, Active Directory v.v.) thực hiện các thao tác ghi vào tệp.
Sao lưu trực tiếp lên AWS S3 | NAKIVO

Sao lưu trực tiếp lên AWS S3 | NAKIVO

Tránh tình trạng “điểm lỗi duy nhất” nhờ tích hợp Amazon S3 đơn giản và các tùy chọn chống ransomware với tính năng bất biến. Tính năng phân tầng sao lưu tự động và khôi phục tức thì.

People also read