Windows Server 2019 故障移轉叢集的十大特點:完整概覽
隨著對無間斷運作的需求日益增長,現代企業已開始尋求新方法,以確保其服務達到 99.999% 的可用性。現實情況是,大多數組織甚至無法容忍最輕微的停機時間,因為生產力損失的代價實在太高。系統意外故障可能造成的後果包括收入損失、商機流失、生產力下降,以及客戶信任的喪失。 即使您設法從這些嚴重後果中恢復過來,停機時間仍可能影響您的業務成長,並對組織的未來造成負面影響。
為了降低停機風險,您必須確保當系統或其任何組件發生故障時,企業仍能持續提供服務。最根本的解決方案是建構高可用性環境,這可透過確保所有系統組件具備冗餘性來實現。 有各種方法可為您的環境提供高可用性——例如借助 Windows 伺服器備份。 另一種常見的選擇是故障移轉叢集。
在這篇部落格文章中,我們將說明故障移轉叢集在 Windows Server 中的運作方式。此外,我們將探討隨著 Windows Server 2019 的發布,故障移轉叢集功能性經歷了哪些變革。特別是,我們將概述 Windows Server 2019 故障移轉叢集的十大特點。
Windows Server 故障移轉叢集基礎知識
故障移轉叢集是由 2 台或更多伺服器(節點)組成的群組,這些節點協同運作,以確保叢集角色與服務在任何情況下都能維持高可用性與可擴展性。這些叢集節點透過實體線纜、軟體或應用程式層級相互連接,從而共享網路與儲存資源。當叢集節點發生故障時,其服務將由備用節點接管。 此過程稱為故障移轉,有助於將服務中斷降至最低、減少停機時間,並能快速且有效地應對主機故障。
此外,能夠控制每個故障移轉叢集中節點的狀態至關重要。透過內部監控工具,您可以驗證故障移轉叢集中的所有節點是否正常運作,並能執行所有必要的功能。如此一來,您便能識別叢集中任何狀態異常的節點,並降低叢集節點故障的風險。
透過 Windows Server 故障移轉叢集,您可以建立多個故障移轉叢集,以確保應用程式和服務的高可用性。要使此功能性正常運作,您需要兩台伺服器(主動與被動),這兩台伺服器必須共用相同的儲存裝置和網路,並符合特定的硬體需求。
這兩台機器可透過心跳功能進行通訊,藉此透過專用網路相互傳送"心跳"訊號。 心跳訊號分為兩種類型:推送式心跳與拉取式心跳。推送式心跳是由主動伺服器發送至被動伺服器,而拉取式心跳則是由被動伺服器發送至主動伺服器。這些通訊訊號會以固定間隔發送與接收。因此,若"心跳"未能在預期時間送達伺服器,系統便會偵測到伺服器故障,並由備用伺服器接管故障機台的工作負載。
若想了解如何讓您的環境具備高可用性並具有韌性,您可以閱讀我們的部落格文章: 如何啟用 Hyper-V 高可用性 使用故障移轉叢集。若要進一步了解這項技術,您可以 下載我們的電子書 該文件說明了如何部署故障移轉叢集、建立故障移轉叢集應滿足哪些需求,以及如何 NAKIVO Backup & Replication 可確保 Hyper-V 叢集獲得持續的保護。
Windows Server 2019 故障移轉叢集的主要新特點
微軟開發人員在每次版本發布時都孜孜不倦地投入心力,不斷新增特點並改進現有功能性。Windows Server 2019 的發布亦不例外。除了諸如混合雲整合、進階安全層級或超融合等眾多增強特點外,此作業系統更將"故障移轉叢集"功能提升至全新境界。以下將為您列出 Windows Server 2019 的完整新特點清單,並說明這些特點如何徹底改變了"故障移轉叢集"的機能性。
跨網域叢集遷移
跨網域叢集遷移的過程過去向來是一項複雜且耗時的任務。節點和叢集無法直接在不同網域之間移動。此過程需要對故障移轉叢集進行全面重新配置,導致不必要的服務中斷及相當長的停機時間。透過 Windows Server 2019,您終於能夠將故障移轉叢集從一個 Active Directory 網域遷移至另一個網域。藉由確保快速且簡單的網域整合,您可節省時間、精力和資源。
叢集共用卷的增強功能
叢集共用磁碟區 (CSV) 快取可將系統記憶體分配為直寫快取,從而支援對唯讀且未經緩衝的 I/O 進行快取。透過此功能性,您可以提升 Hyper-V 虛擬機器的效能,這些虛擬機器在存取虛擬硬碟時會利用未經緩衝的 I/O。 CSV 快取在 Windows Server 2019 中預設即為可用,可確保在叢集共用磁碟上運行的虛擬機器具備更佳的生產力與更快的效能。其他 CSV 增強功能包括改進的叢集問題偵測邏輯,以及其即時修復機制。此功能性得以運作,歸功於叢集網路路由偵測與區隔節點技術。
支援 Azure 的叢集
Windows Server 2019 的設計旨在讓您的資料中心無縫整合混合雲功能。此外,Windows 故障移轉叢集具備 Azure 感知能力,這意味著它們能夠自動識別自身是否正在 Azure 環境中運行。因此,Windows 故障移轉叢集可自動進行自我優化,確保主動執行故障移轉,並記錄 Azure 預定維護事件。更重要的是,您不再需要經歷重新配置動態網路名稱的負載平衡器的繁瑣流程。
用於達成法定人數的 USB 檔案分享見證
前述的心跳功能性可讓您檢查叢集中每個節點的狀態。然而,若發生意外的網路故障,叢集節點將無法相互通訊。這將導致 半腦分離 這種情況下,每個節點都會假設自己是叢集中唯一具有功能性的實例,並同時開始執行。 不幸的是,這可能會導致資料損毀或各種資料衝突。
多數決技術正是為了解決此問題而設計。叢集將根據多數票的結果,強制其中一個節點停止運作。然而,若叢集中的節點數量為偶數(例如雙節點叢集),叢集成員可能無法達成多數決,也無法決定應由哪個節點繼續運作。結果,叢集將完全停止運作。
在 Windows Server 2019 中,您可以將連接至通用網路裝置的 USB 隨身碟用作故障移轉叢集法定人數的見證者。在此情況下,USB 見證者也擁有投票權,並能提供決定性一票以避免 半腦分離 情境。
針對法定人數情境所升級的檔案分享見證機制
隨著 Windows Server 2019 的發布,法定人數投票機制已具備更強的容錯能力。升級後的檔案分享見證人可在以下情況下為您帶來好處:
- 當您因網路連線速度過慢或無法連線,而無法存取雲端見證時。
- 當沒有可供磁碟見證使用的共用磁碟時。
- 當故障移轉叢集在非軍事區 (DMZ) 中運行時,該區域無法連線至網域控制器。
- 當您擁有一個沒有 Active Directory 叢集名稱物件 (CNO) 的工作群組或混合網域叢集時。
在所有這些情況下,法定人數投票程序都可能失敗,導致故障移轉叢集關閉。Windows Server 2019 已解決了這些潛在風險,讓您幾乎在任何情況下都能使用檔案分享見證。
簇集
Windows Server 2019 另一項新增功能性是叢集集。叢集集是指將多個 Windows Server 故障移轉叢集主機(運算、儲存及超融合)群組化為一組邏輯叢集。 叢集集能透過多種方式,大幅簡化您基礎架構中的故障移轉叢集管理。因此,您可以輕鬆地在同一個叢集集內運行的故障移轉叢集之間遷移虛擬機器。此外,此特點還能提升叢集的韌性,因為您現在可以跨叢集進行故障移轉,確保服務中斷降至最低。
"儲存空間直連"的叢集感知更新
"叢集感知更新"特點最初於 Windows Server 2012 中推出。這項特點究竟能帶來什麼效益?透過"叢集感知更新",您可以以最低的可用性損失自動更新叢集伺服器。隨著 Windows Server 2019 的發布,此特點可與"直接儲存空間"(S2D)整合,使系統能在更新過程中自動對各節點進行資料重新同步。 此外,叢集感知更新還能偵測哪些更新需要系統重新啟動。因此,系統僅會在必要時才進行重新啟動,大幅減少業務停機時間。
Windows Server 2019 故障移轉叢集的驗證
故障移轉叢集同樣面臨各種安全威脅。在之前的 Windows Server 版本中,NTLM 驗證曾要求您處理此問題。隨著 Windows Server 2019 的發布,Microsoft 團隊再次強化了其安全策略。叢集節點不再使用 NTLM 驗證,而是透過基於憑證的驗證和 Kerberos 進行通訊。如此一來,您便能防止網路流量遭竊聽,並使故障移轉叢集具有更高的韌性,更能抵禦突發性的安全攻擊。
具有自我修復功能的故障移轉叢集
Windows Server 2019 透過新增自我修復功能性,強化了叢集網路的韌性與可用性。 具備自我修復功能的叢集可定期檢查其節點的狀態,並在偵測到任何問題時立即進行修復(自我修復)。例如,若某個節點發生故障且無法與叢集中的其他節點通訊,叢集將自動偵測到此問題,嘗試修復故障節點,並使其重新連線至叢集。此功能性不僅能提升高可用性能力,更能顯著降低系統管理員的管理負擔。
叢集強化
Windows Server 2019 提供的另一項安全性特點是叢集強化。叢集內的節點可透過基於憑證的驗證,透過伺服器訊息區塊 (SMB) 進行通訊,以支援叢集共用磁碟區和直接儲存空間。這使得叢集內的通訊能達到更高的安全性層級。
資料保護與 NAKIVO Backup & Replication
故障移轉叢集的主要目標在於確保基礎架構達到最高可用性。Windows 故障移轉叢集可被視為現代資料中心的關鍵技術,因為這些資料中心被期望能提供不間斷的服務。透過此功能性,您不僅能避免非預期的停機時間,更能確保在幾乎任何情況下,都能維持相同的業務生產力。
然而,您仍需建立一套全面性的資料保護策略,以因應安全風險並預防潛在災難的發生。 NAKIVO Backup & Replication 這是一套可靠且價格實惠的解決方案,能透過多種方式確保強大的資料保護。
- 透過 NAKIVO 備份解決方案,您可以對 VMware、Hyper-V、Nutanix AHV 虛擬機器、AWS EC2 執行個體,以及 Windows 和 Linux 實體伺服器執行原生、基於映像檔且支援應用程式感知備份。
- "備份複製"功能性可提供額外的保護層,以防範意外的資料損毀、系統故障或災難。您可以建立現有備份的副本,並將其傳送至異地或公共雲端。此外,您還能建立備份儲存庫的鏡像副本,或簡化整個備份複製流程。
- 透過以下方式,讓您的資料保護工作進入自動化運作模式 基於政策的資料保護. 您可以根據虛擬機器名稱、大小、位置、配置、電源狀態、標籤,或這些參數的組合,建立多項資料保護規則。這些政策式規則可定期掃描您的基礎架構,識別符合設定規則的虛擬機器,並自動將其加入對應的資料保護工作。
- 透過以下方式,從頭到尾自動化並編排災難還原流程: 站點還原工作流程. 透過將各種操作與條件整合至自動化演算法中,您可以建立多個站點還原工作,以因應各種災難情境。此外,您還可在需要時測試並更新站點還原工作,而不會中斷生產環境的運作。
- NAKIVO Backup & Replication 提供多種還原選項,讓您能直接從已壓縮且經過重複資料刪除的備份中,立即還原虛擬機器、檔案及應用程式物件。您亦可透過"跨平台還原"功能,將 VMware 虛擬機器還原至 Hyper-V 環境,反之亦然。此外, NAKIVO Backup & Replication 讓您能夠將實體機器還原至 VMware 或 Hyper-V 虛擬機器,使您幾乎能在任何情況下進行還原。

