更換叢集系統中的故障節點

您可以使用指令行介面 (CLI) 及系統面板,來更換叢集系統中的故障節點。

開始之前

嘗試使用備用節點來更換故障節點之前,您必須確保符合下列需求:
  • 您知道包含故障節點的系統名稱。
  • 備用節點安裝在與包含故障節點之系統相同的機架中。
  • 如果是透過光纖通道技術來連接節點,您必須記錄備用節點原始全球節點名稱 (WWNN) 的最後 5 個字元。如果您修復故障節點,且要將其設定為備用節點,則可使用節點的 WWNN。您不想複製 WWNN,因為它是唯一的。使用 WWNN 時,更容易在節點中進行交換。
    小心: 切勿將 WWNN 為 00000 的節點連接至系統。如果此節點不再需要作為備用節點,而是要用於一般連接,則必須將 WWNN 變更為在建立備用節點時記錄的數值。使用任何其他數值可能會導致資料毀損。

關於這項作業

如果節點發生故障,則在修復故障節點之前,系統會繼續運作,但效能欠佳。如果修復作業需要無法接受的時間量,則使用備用節點來更換故障節點會很有用。但是,必須遵循適當的程序且必須採取預防措施,以免 岔斷 I/O 作業並損害資料完整性。

尤其要確保 I/O 群組中的夥伴節點在線上。
  • 如果 I/O 群組中的其他節點離線,請啟動修正程序來判斷故障。
  • 如果是修正程序將您指引到這裡,且隨後 I/O 群組中的夥伴節點發生故障,請參閱相關程序,以在節點或 I/O 群組發生故障之後從離線磁區進行回復。
  • 如果是由於其他原因而要更換節點,請判斷您要更換的節點,並確保 I/O 群組中的夥伴節點在線上。
  • 如果夥伴節點已離線,您將喪失屬於此 I/O 群組的磁區存取權。在繼續執行下一步之前,請啟動修正程序並修正其他節點。
表 1 說明在更換叢集系統中的故障節點時對配置所做的變更。
表 1. 對節點屬性所做變更的摘要
節點屬性 說明
面板 ID 此 ID 是列印在節點正面的號碼,用於選取已新增至系統的節點。
節點 ID 此 ID 會指派給節點。每次將節點新增至系統時,皆會指派新的節點 ID;對系統執行維修活動之後,節點名稱會保持不變。您可以使用節點 ID 或節點名稱對系統執行管理作業。但是,如果要使用 Script 來執行這些作業,請使用節點名稱(而非節點 ID)。此 ID 在此程序期間會變更。
節點名稱 節點名稱是指派給節點的名稱。系統會自動將發生故障的節點重新新增回系統。如果系統報告節點遺漏的錯誤(錯誤碼 1195),且該節點已修復並重新啟動,則系統會自動將該節點重新新增回系統。

如果您選擇指派自己的名稱,則必須在將節點新增至叢集畫面上鍵入節點名稱。您無法手動指派符合用於系統自動指派名稱之命名慣例的名稱。如果您是使用 Script 對系統執行管理作業,且這些 Script 使用節點名稱,則可將節點的原始名稱指派給備用節點,以免需要變更 Script。此名稱在此程序期間可能會變更。

全球節點名稱 這是指派給節點的 WWNN。WWNN 用於唯一識別節點及光纖通道埠。在此程序期間,備用節點的 WWNN 會變更為故障節點的 WWNN。必須完全遵循節點更換程序,以避免出現任何重複的 WWNN。此名稱在此程序期間不會變更。
全球埠名稱 這些是指派給節點的 WWPN。WWPN 衍生自在執行此程序時寫入備用節點的 WWNN。例如,如果節點的 WWNN 為 50050768010000F6,則會按如下所示來衍生此節點的四個 WWPN:
WWNN                          50050768010000F6
WWNN displayed on front panel 000F6
WWPN Port 1                   50050768014000F6
WWPN Port 2                   50050768013000F6
WWPN Port 3                   50050768011000F6
WWPN Port 4                   50050768012000F6
這些名稱在此程序期間不會變更。

如需瞭解更換系統中故障節點的特定步驟,請移至在不中斷運行的情況下更換節點程序。