10 tính năng hàng đầu trong Cụm chuyển đổi dự phòng của Windows Server 2019: Tổng quan chi tiết
Khi nhu cầu về hiệu suất hoạt động liên tục ngày càng gia tăng, các doanh nghiệp hiện đại đã bắt đầu tìm kiếm những phương pháp mới để đảm bảo mức độ sẵn sàng 99,999% cho các dịch vụ của mình. Thực tế là phần lớn các tổ chức không thể chấp nhận ngay cả thời gian ngừng hoạt động ngắn nhất, bởi vì rủi ro mất năng suất là quá lớn. Những hậu quả tiềm ẩn của sự cố hệ thống bất ngờ có thể bao gồm mất doanh thu, cơ hội kinh doanh, năng suất và niềm tin của khách hàng. Ngay cả khi bạn có thể khắc phục được những hậu quả nghiêm trọng như vậy, thời gian ngừng hoạt động vẫn có thể ảnh hưởng đến sự phát triển kinh doanh và tác động tiêu cực đến tương lai của tổ chức.
Để giảm thiểu rủi ro do thời gian ngừng hoạt động, bạn cần đảm bảo rằng doanh nghiệp của mình vẫn có thể cung cấp dịch vụ ngay cả khi hệ thống hoặc bất kỳ thành phần nào của hệ thống bị ngừng hoạt động. Cách tiếp cận tối ưu là xây dựng một môi trường có tính sẵn sàng cao, điều này có thể thực hiện được bằng cách đảm bảo tính dự phòng cho tất cả các thành phần hệ thống. Có nhiều cách để cung cấp tính sẵn sàng cao cho môi trường của bạn — ví dụ như với sự trợ giúp của sao lưu máy chủ Windows. Một lựa chọn phổ biến khác là Cụm chuyển đổi dự phòng (Failover Clustering).
Trong bài viết này, chúng tôi sẽ mô tả cách Cụm chuyển đổi dự phòng hoạt động trên Windows Server. Ngoài ra, chúng tôi sẽ thảo luận về cách tính năng Cụm chuyển đổi dự phòng đã được cải tiến với phiên bản Windows Server 2019. Đặc biệt, chúng tôi sẽ cung cấp tổng quan về 10 tính năng hàng đầu trong Cụm chuyển đổi dự phòng của Windows Server 2019.
Các khái niệm cơ bản về cụm chuyển đổi dự phòng Windows Server
Một cụm chuyển đổi dự phòng là một nhóm gồm 2 máy chủ (nút) trở lên, hoạt động cùng nhau để đảm bảo các vai trò và dịch vụ trong cụm luôn duy trì tính sẵn sàng cao và khả năng mở rộng trong mọi tình huống. Các nút trong cụm này chia sẻ tài nguyên mạng và lưu trữ thông qua kết nối bằng cáp vật lý, phần mềm hoặc ở cấp độ ứng dụng. Trong trường hợp một nút trong cụm gặp sự cố, các dịch vụ của nút bị lỗi sẽ được các nút dự phòng tiếp quản. Quá trình này được gọi là chuyển đổi dự phòng (failover), giúp giảm thiểu gián đoạn dịch vụ, giảm thời gian ngừng hoạt động và phản ứng nhanh chóng, hiệu quả trước sự cố máy chủ.
Hơn nữa, việc kiểm soát trạng thái của các nút trong mỗi cụm chuyển đổi dự phòng là vô cùng quan trọng. Sử dụng công cụ giám sát nội bộ, bạn có thể xác minh rằng tất cả các nút trong cụm chuyển đổi dự phòng đều hoạt động bình thường và có thể thực hiện tất cả các chức năng yêu cầu. Nhờ đó, bạn có thể xác định các nút không khỏe mạnh trong cụm và giảm thiểu rủi ro sự cố nút cụm.
Với Windows Server Failover Clustering, bạn có thể xây dựng nhiều cụm dự phòng để đảm bảo tính sẵn sàng cao cho các ứng dụng và dịch vụ của mình. Để tính năng này hoạt động, bạn cần có hai máy chủ (chủ động và bị động) chia sẻ cùng một lưu trữ cũng như mạng, đồng thời đáp ứng các yêu cầu phần cứng cụ thể.
Hai máy chủ có thể giao tiếp thông qua chức năng heartbeat, trong đó chúng gửi các tín hiệu ‘heartbeat’ cho nhau qua một mạng chuyên dụng. Có hai loại tín hiệu được phân biệt: heartbeat đẩy (push) và heartbeat kéo (pull). Tín hiệu heartbeat đẩy được gửi từ máy chủ hoạt động đến máy chủ dự phòng, trong khi tín hiệu heartbeat kéo được gửi từ máy chủ dự phòng đến máy chủ hoạt động. Các tín hiệu giao tiếp này được gửi/nhận theo các khoảng thời gian định kỳ. Do đó, nếu tín hiệu ‘heartbeat’ không đến được máy chủ vào thời điểm dự kiến, sự cố máy chủ sẽ được phát hiện và các tác vụ của máy chủ bị lỗi sẽ được máy chủ dự phòng tiếp quản.
Để tìm hiểu cách làm cho môi trường của bạn có tính sẵn sàng cao và khả năng phục hồi trước các sự cố hệ thống, bạn có thể đọc bài viết trên blog của chúng tôi tại Cách kích hoạt tính năng Tính sẵn sàng cao của Hyper-V về việc sử dụng cụm chuyển đổi dự phòng. Để có cái nhìn tổng quan chi tiết hơn về công nghệ này, bạn có thể truy cập Tải xuống sách điện tử của chúng tôi nơi mô tả cách triển khai cụm chuyển đổi dự phòng, các yêu cầu cần đáp ứng để tạo cụm chuyển đổi dự phòng, và cách NAKIVO Backup & Replication có thể đảm bảo bảo vệ liên tục cho các cụm Hyper-V.
Các tính năng mới nổi bật của Failover Clustering trên Windows Server 2019
Các nhà phát triển của Microsoft đã không ngừng nỗ lực trong từng phiên bản phát hành bằng cách bổ sung các tính năng mới và cải tiến các chức năng hiện có. Phiên bản Windows Server 2019 cũng không phải là ngoại lệ. Bên cạnh nhiều cải tiến khác như tích hợp đám mây lai, các lớp bảo mật nâng cao hay siêu hội tụ, hệ điều hành này còn đưa chức năng Failover Clustering lên một tầm cao mới. Dưới đây, bạn có thể xem danh sách đầy đủ các tính năng mới của Windows Server 2019 và cách chúng đã biến đổi chức năng Failover Clustering.
Di chuyển cụm giữa các miền
Quá trình di chuyển cụm giữa các miền trước đây là một công việc phức tạp và tốn thời gian. Các nút và cụm không thể đơn giản được di chuyển giữa các miền khác nhau. Quá trình này đòi hỏi phải cấu hình lại hoàn toàn các cụm Failover, dẫn đến gián đoạn dịch vụ không mong muốn và thời gian ngừng hoạt động đáng kể. Với Windows Server 2019, bạn cuối cùng có thể di chuyển cụm dự phòng từ một miền Active Directory sang miền khác. Bằng cách đảm bảo việc hợp nhất miền nhanh chóng và đơn giản, bạn có thể tiết kiệm thời gian, công sức và tài nguyên.
Cải tiến về Cluster-Shared Volumes
Bộ nhớ đệm của Cluster Shared Volume (CSV) cho phép phân bổ bộ nhớ hệ thống làm bộ nhớ đệm ghi qua (write-through), giúp lưu trữ các thao tác I/O chỉ đọc không đệm. Với tính năng này, bạn có thể nâng cao hiệu suất của các máy ảo Hyper-V, vốn tận dụng I/O không đệm khi truy cập các đĩa cứng ảo. Bộ nhớ đệm CSV có sẵn theo mặc định trong Windows Server 2019, đảm bảo năng suất cao hơn và hiệu suất nhanh hơn cho các máy ảo chạy trên Cluster Shared Volumes. Các cải tiến khác của CSV bao gồm logic được cải thiện để phát hiện các sự cố trong cụm cũng như sửa chữa kịp thời. Tính năng này hoạt động nhờ vào phát hiện đường dẫn mạng cụm và các nút được phân vùng.
Cụm nhận biết Azure
Windows Server 2019 được thiết kế để tích hợp liền mạch các khả năng hybrid trong trung tâm dữ liệu của bạn. Hơn nữa, các cụm chuyển đổi dự phòng Windows nhận biết Azure, có nghĩa là chúng có thể tự động xác định khi nào đang chạy trong Azure. Do đó, các cụm chuyển đổi dự phòng Windows có thể tự động tối ưu hóa, đảm bảo chuyển đổi dự phòng chủ động và ghi nhật ký các sự kiện bảo trì theo kế hoạch của Azure. Hơn nữa, bạn không còn phải trải qua quy trình nhàm chán là cấu hình lại bộ cân bằng tải với tên mạng động.
Chứng nhân chia sẻ tệp USB cho cơ chế quorum
Chức năng heartbeat được đề cập ở trên cho phép bạn kiểm tra trạng thái của từng nút trong cụm. Tuy nhiên, trong trường hợp xảy ra sự cố mạng bất ngờ, các nút trong cụm sẽ không thể giao tiếp với nhau. Điều này dẫn đến tình huống split-brain trong đó mỗi nút đều cho rằng mình là phiên bản duy nhất đang hoạt động trong cụm và chúng bắt đầu chạy cùng lúc. Thật không may, điều này có thể gây ra hỏng dữ liệu hoặc các loại xung đột dữ liệu khác nhau.
Công nghệ quorum được thiết kế để giải quyết vấn đề này. Cụm sẽ buộc một trong các nút ngừng hoạt động dựa trên đa số phiếu bầu. Tuy nhiên, nếu cụm có số lượng nút chẵn (ví dụ: cụm hai nút), các thành viên cụm có thể không đạt được quorum và không xác định được nút nào nên tiếp tục hoạt động. Kết quả là, cụm ngừng hoạt động hoàn toàn.
Với Windows Server 2019, bạn có thể sử dụng một ổ USB được kết nối với thiết bị mạng thông thường làm nhân chứng cho quorum của cụm failover. Trong trường hợp này, nhân chứng USB cũng có quyền bỏ phiếu và có thể cung cấp phiếu quyết định để tránh tình huống “split-brain” .
Nhân chứng chia sẻ tệp được nâng cấp cho các tình huống quorum
Với bản phát hành Windows Server 2019, cơ chế bỏ phiếu quorum đã trở nên chịu lỗi tốt hơn. Chứng nhân chia sẻ tệp được nâng cấp có thể mang lại lợi ích cho bạn trong các trường hợp sau:
- Khi bạn không thể truy cập chứng nhân đám mây do kết nối internet chậm hoặc không có.
- Khi không có ổ đĩa chia sẻ khả dụng cho chứng nhân đĩa.
- Khi cụm chuyển đổi dự phòng đang chạy trong vùng phi quân sự (DMZ), nơi kết nối máy chủ miền không khả dụng.
- Khi bạn có cụm nhóm làm việc hoặc cụm miền hỗn hợp mà không có đối tượng tên cụm Active Directory (CNO).
Trong tất cả các tình huống này, quy trình bỏ phiếu quorum có thể thất bại, dẫn đến việc cụm chuyển đổi dự phòng bị tắt. Với Windows Server 2019, những rủi ro tiềm ẩn này đã được giải quyết, cho phép bạn sử dụng chứng nhân chia sẻ tệp trong hầu hết mọi tình huống.
Bộ cụm
Một chức năng mới được thêm vào của Windows Server 2019 là bộ cụm. Bộ cụm bao gồm việc nhóm nhiều máy chủ cụm chuyển đổi dự phòng Windows Server (tính toán, lưu trữ và siêu hội tụ) thành một bộ cụm logic. Bộ cụm có thể đơn giản hóa đáng kể việc quản lý cụm chuyển đổi dự phòng trong cơ sở hạ tầng của bạn theo nhiều cách. Do đó, bạn có thể dễ dàng di chuyển các máy ảo (VM) giữa các cụm chuyển đổi dự phòng đang chạy trong cùng một bộ cụm. Ngoài ra, tính năng này giúp các cụm của bạn có khả năng chống lỗi tốt hơn vì giờ đây bạn có thể thực hiện chuyển đổi dự phòng giữa các cụm, đảm bảo gián đoạn dịch vụ ở mức tối thiểu.
Cập nhật nhận biết cụm (Cluster-Aware Updating) cho Storage Spaces Direct
Tính năng Cập nhật nhận biết cụm (Cluster-Aware Updating) lần đầu tiên được giới thiệu trong Windows Server 2012. Thực sự, tính năng này có thể làm được gì? Với Cập nhật Nhận biết Cụm, bạn có thể tự động cập nhật các máy chủ cụm với mức độ gián đoạn dịch vụ tối thiểu. Với phiên bản Windows Server 2019, tính năng này có thể được tích hợp với Storage Spaces Direct (S2D), cho phép đồng bộ hóa dữ liệu tự động trên từng nút trong quá trình cập nhật. Hơn nữa, Cluster-Aware Updating có thể phát hiện những bản cập nhật nào yêu cầu khởi động lại hệ thống. Do đó, việc khởi động lại chỉ được thực hiện khi cần thiết, giúp giảm đáng kể thời gian ngừng hoạt động của doanh nghiệp.
Xác thực cụm chuyển đổi dự phòng Windows Server 2019
Các cụm chuyển đổi dự phòng cũng phải đối mặt với nhiều mối đe dọa bảo mật. Trong các phiên bản Windows Server trước đây, xác thực NTLM yêu cầu bạn giải quyết vấn đề này. Với việc phát hành Windows Server 2019, nhóm Microsoft đã một lần nữa cải thiện cách tiếp cận bảo mật của mình. Thay vì xác thực NTLM, các nút cụm có thể giao tiếp với nhau thông qua xác thực dựa trên chứng chỉ và Kerberos. Bằng cách này, bạn có thể ngăn chặn việc đánh cắp lưu lượng mạng và làm cho các cụm chuyển đổi dự phòng trở nên linh hoạt hơn trước các cuộc tấn công bảo mật đột ngột.
Cụm chuyển đổi dự phòng tự phục hồi
Windows Server 2019 tăng cường khả năng phục hồi và tính sẵn sàng của mạng cụm bằng cách bổ sung chức năng tự phục hồi. Một cụm tự phục hồi có thể kiểm tra định kỳ trạng thái của các nút và sửa chữa (phục hồi) chúng ngay lập tức nếu phát hiện bất kỳ sự cố nào. Ví dụ: nếu một nút bị lỗi và không thể giao tiếp với phần còn lại của cụm, cụm sẽ tự động phát hiện sự cố, cố gắng sửa chữa nút bị lỗi và kết nối lại nó với cụm. Tính năng này có thể giảm đáng kể gánh nặng quản lý mà các quản trị viên hệ thống phải gánh chịu, đồng thời tăng cường khả năng sẵn sàng cao.
Tăng cường bảo mật cụm
Một tính năng bảo mật khác có sẵn trong Windows Server 2019 là tăng cường bảo mật cụm. Các nút trong cụm có thể giao tiếp qua giao thức Server Message Block (SMB) cho các khối lượng chia sẻ trong cụm (Cluster Shared Volumes) và Storage Spaces Direct bằng cách sử dụng xác thực dựa trên chứng chỉ. Điều này giúp nâng cao mức độ bảo mật cho giao tiếp nội bộ trong cụm.
Bảo vệ dữ liệu với NAKIVO Backup & Replication
Mục tiêu chính của cụm chuyển đổi dự phòng là đảm bảo mức độ sẵn sàng cao nhất cho hạ tầng. Cụm chuyển đổi dự phòng Windows có thể được coi là một công nghệ thiết yếu cho các trung tâm dữ liệu hiện đại, nơi được kỳ vọng cung cấp dịch vụ liên tục. Với chức năng này, bạn có thể tránh được thời gian ngừng hoạt động không mong muốn và duy trì cùng mức độ năng suất kinh doanh trong hầu hết mọi tình huống.
Tuy nhiên, bạn vẫn cần xây dựng một chiến lược bảo vệ dữ liệu toàn diện có khả năng ứng phó với các rủi ro bảo mật và ngăn chặn các thảm họa tiềm ẩn xảy ra. NAKIVO Backup & Replication là một giải pháp đáng tin cậy và chi phí hợp lý, có thể đảm bảo bảo vệ dữ liệu mạnh mẽ theo nhiều cách.
- Với giải pháp sao lưu NAKIVO, bạn có thể thực hiện sao lưu gốc, dựa trên hình ảnh và nhận biết ứng dụng cho các máy ảo VMware, Hyper-V, Nutanix AHV, các phiên bản AWS EC2, cũng như các máy chủ vật lý Windows và Linux.
- Tính năng Sao chép Bản sao lưu có thể bổ sung một lớp bảo vệ thêm chống lại sự hỏng dữ liệu bất ngờ, sự cố hệ thống hoặc thảm họa. Bạn có thể tạo bản sao của các bản sao lưu hiện có và gửi chúng đến các địa điểm ngoài cơ sở hoặc lên các đám mây công cộng. Ngoài ra, bạn có thể tạo bản sao gương của kho lưu trữ sao lưu hoặc tối ưu hóa toàn bộ quy trình sao chép sao lưu.
- Tự động hóa các hoạt động bảo vệ dữ liệu bằng cách sử dụng Bảo vệ dữ liệu dựa trên chính sách. Bạn có thể tạo nhiều quy tắc bảo vệ dữ liệu dựa trên tên máy ảo, kích thước, vị trí, cấu hình, trạng thái nguồn, thẻ hoặc kết hợp các thông số này. Các quy tắc chính sách này có thể quét định kỳ hạ tầng của bạn, xác định các máy ảo phù hợp với các quy tắc đã đặt và tự động thêm chúng vào các tác vụ bảo vệ dữ liệu tương ứng.
- Tự động hóa và điều phối quy trình phục hồi thảm họa từ đầu đến cuối với Quy trình khôi phục trang web. Bằng cách kết hợp các hành động và điều kiện khác nhau vào một thuật toán tự động, bạn có thể tạo nhiều tác vụ phục hồi site để giải quyết các tình huống thảm họa khác nhau. Hơn nữa, bạn có thể kiểm tra và cập nhật các tác vụ phục hồi site khi cần thiết mà không làm gián đoạn môi trường sản xuất.
- NAKIVO Backup & Replication cung cấp nhiều tùy chọn phục hồi, cho phép bạn khôi phục ngay lập tức các VM, tệp và đối tượng ứng dụng trực tiếp từ các bản sao lưu đã nén và loại trừ trùng lặp. Bạn cũng có thể khôi phục các máy ảo VMware sang môi trường Hyper-V và ngược lại bằng tính năng Khôi phục đa nền tảng. Hơn nữa, NAKIVO Backup & Replication cho phép bạn khôi phục các máy vật lý thành máy ảo VMware hoặc Hyper-V, giúp bạn có thể khôi phục trong hầu hết mọi tình huống.

